Skip to content

📑MLCE-为大模型医学水平测试而总结的中文医学考试数据集

License

Notifications You must be signed in to change notification settings

jingnant/Medical-LLMs-Chinese-Exam

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 

Repository files navigation

医疗大模型中文考试评估

🔎 数据集介绍

MLCE(Medical-LLMs-Chinese-Exam):医疗大模型中文考试评估,针对于中国各类医疗考试相关比赛数据集进行收集整理,用于助力大模型评测自身专项能力并进行针对性训练,目的是促进医疗领域具有全方位能力的大模型开发。

🌈 数据集进展

[2024/7/7] 🆕 2017-2021年中国国家执业医师资格考试、中国国家执业药师资格考试、中国国家执业护士资格考试题目

[2024/7/7] 🆕 MLCE数据集首次开源

📃 数据样例

针对考题类型数据,采用下列格式:

    {
        "id": "",   # 测试题相关信息组成的题目id
        "question": "",  # 测试题问题
        "options": {},  # 选项键值对
        "answer": "",  # 标准答案
        "question_type": ""  # 选择题类型,单选/多选
    }

例如:

    {
        "id": "2017-Unit1-1",
        "question": "男,40岁,因劳累近2周自感头晕、头疼,连续三次测血压值为21",
        "options": {
            "A": "急进性高血压",
            "B": "慢性肾炎",
            "C": "甲亢",
            "D": "原发性高血压",
            "E": "SLE"
        },
        "answer": "D",
        "question_type": "单项选择题"
    }

🔬 数据细节

数据集名称 样本数量 数据归属 数据源
2017-2021physician.json 3000 中国国家执业医师资格考试 LLM-Chinese-NMLE
2017-2021pharmacist.json 2400 中国国家执业药师资格考试 LLM-Chinese-NMLE
2017-2021nurse.json 1200 中国国家执业护士资格考试 LLM-Chinese-NMLE
总计 6600

感谢所有数据源的开源作者!,已处理完毕的数据可在data/中获取

更多数据正在处理中~

💌 联系

若您对该工作感兴趣或有数据支持,以及相关问题可联系邮箱:[email protected]

About

📑MLCE-为大模型医学水平测试而总结的中文医学考试数据集

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published