Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

请问你们的数据预处理代码能对外开放吗?想用代码处理点中间数据,谢谢大佬 #3

Open
zjj1333 opened this issue Oct 10, 2024 · 3 comments

Comments

@zjj1333
Copy link

zjj1333 commented Oct 10, 2024

No description provided.

@shinkungoo
Copy link
Member

您好,很高兴能够解答您的问题!

因为不同数据来源的原始数据格式不统一,我们很难提供一个统一的处理代码供您使用。许多情况下,我们也是分析了原本数据后,参考以往工作的惯例处理(即大部分的数据预处理方式都是去除学生交互少于15个的,保留第一次交互,且基本上都是使用客观题)。我们在datahub中已经提供了高度封装的数据,同时您也前往README的“List of Build-in Datasets”部分访问数据源重新处理。

希望可以解决您的疑惑。如果有任何问题,我们会及时回复您。

@zjj1333
Copy link
Author

zjj1333 commented Oct 10, 2024

好的谢谢,请问"graph": "graph.csv"和"hierarchy": "hierarchy.csv",这两个文件是怎么处理的?

@shinkungoo
Copy link
Member

好的谢谢,请问"graph": "graph.csv"和"hierarchy": "hierarchy.csv",这两个文件是怎么处理的?

您好,很高兴能够解答您的问题!

这两部分是我们直接收集的数据,这些数据的标注通常来自于专家先验。

希望可以解决您的疑惑。如果有任何问题,我们会及时回复您。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants