Which dataset should we use for evaluate? #43

Yuda-Jin · 2024-09-19T04:31:27Z

which dataset config was used in leaderboard? Should I use forget10_perturbed or just forget10 or retain90?
If I use forget10 dataset, how to set perturbed_answer_key and eval_task?

Yuda-Jin · 2024-09-19T04:32:50Z

For more specific, which config was used in baselines in leaderboard?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Which dataset should we use for evaluate? #43

Which dataset should we use for evaluate? #43

Yuda-Jin commented Sep 19, 2024

Yuda-Jin commented Sep 19, 2024

Which dataset should we use for evaluate? #43

Which dataset should we use for evaluate? #43

Comments

Yuda-Jin commented Sep 19, 2024

Yuda-Jin commented Sep 19, 2024