MLCE(Medical-LLMs-Chinese-Exam):医疗大模型中文考试评估,针对于中国各类医疗考试、相关比赛数据集进行收集整理,用于助力大模型评测自身专项能力并进行针对性训练,目的是促进医疗领域具有全方位能力的大模型开发。
[2024/7/7] 🆕 2017-2021年中国国家执业医师资格考试、中国国家执业药师资格考试、中国国家执业护士资格考试题目
[2024/7/7] 🆕 MLCE数据集首次开源
针对考题类型数据,采用下列格式:
{
"id": "", # 测试题相关信息组成的题目id
"question": "", # 测试题问题
"options": {}, # 选项键值对
"answer": "", # 标准答案
"question_type": "" # 选择题类型,单选/多选
}
例如:
{
"id": "2017-Unit1-1",
"question": "男,40岁,因劳累近2周自感头晕、头疼,连续三次测血压值为21",
"options": {
"A": "急进性高血压",
"B": "慢性肾炎",
"C": "甲亢",
"D": "原发性高血压",
"E": "SLE"
},
"answer": "D",
"question_type": "单项选择题"
}
数据集名称 | 样本数量 | 数据归属 | 数据源 |
---|---|---|---|
2017-2021physician.json | 3000 | 中国国家执业医师资格考试 | LLM-Chinese-NMLE |
2017-2021pharmacist.json | 2400 | 中国国家执业药师资格考试 | LLM-Chinese-NMLE |
2017-2021nurse.json | 1200 | 中国国家执业护士资格考试 | LLM-Chinese-NMLE |
总计 | 6600 |
感谢所有数据源的开源作者!,已处理完毕的数据可在data/
中获取
更多数据正在处理中~
若您对该工作感兴趣或有数据支持,以及相关问题可联系邮箱:[email protected]