400-9696-311 转1
400-9696-311 转2
400-9696-311 转3
400-9696-311 转4
ChiCTR2600126004
结束
/
/
/
2026-06-02
/
/
无
DeepSeek医学能力评估
利用OSCE题库及本院真实病例跨学科评估DeepSeek等LLM真实医学能力及其在临床服务中的价值的研究
本研究旨在通过客观结构化临床考试(OSCE)题库及本院真实病例,跨学科评估DeepSeek等大型语言模型(LLMs)在医学推理、诊断、治疗方案推荐等方面的实际能力,评估其幻觉等风险,并分析其在临床服务中的潜在应用价值。
连续入组
探索性研究/预试验
无
无
自选课题(自筹)
/
600
/
2025-01-01
2025-12-31
/
1. OSCE 题目入选标准 (1) 题目相关性:题目应与医学临床实践密切相关,能够有效评估 LLMs 的医学知识和临床技能。 (2) 题目多样性:题目应涵盖多个医学领域和临床场景,包括但不限于内科、外科、妇产科、儿科、急诊科等。 (3) 题目难度:题目难度应适中,能够区分不同水平的医学知识和临床技能。 (4) 题目质量:题目应经过专家审核,确保其科学性和合理性。 2. 实际病例入选标准 (1) 病例真实性:病例应为本院的真实病例,具有完整的病历记录和临床数据。 (2) 病例多样性:病例应涵盖多种疾病类型和临床场景,包括常见病、多发病和疑难病症。 (3) 病例完整性:病例应包括详细的病情描述、诊断结果、治疗方案和随访记录。 (4) 病例代表性:病例应具有代表性,能够反映临床实践中的常见问题和挑战。 (5) 病例时间范围:病例应涵盖过去 5 年内的数据,以确保其时效性和相关性。 具体说明 OSCE 题目:将从现有的 OSCE 题库中筛选出 600 例题目,确保其涵盖广泛的医学领域和临床场景。题目将经过专家审核,确保其科学性和合理性。 实际病例:将从本院的病例库中选取 600 例真实病例,涵盖多种疾病类型和临床场景。病例将经过严格筛选,确保其完整性和代表性。 通过上述样本量和入选标准,本研究将确保样本的代表性和多样性,为全面评估 DeepSeek 等 LLMs 的真实医学能力及其在临床服务中的价值提供科学依据。 1. OSCE 题目入选标准 (1) 题目相关性:题目应与医学临床实践密切相关,能够有效评估 LLMs 的医学知识和临床技能。 (2) 题目多样性:题目应涵盖多个医学领域和临床场景,包括但不限于内科、外科、妇产科、儿科、急诊科等。 (3) 题目难度:题目难度应适中,能够区分不同水平的医学知识和临床技能。 (4) 题目质量:题目应经过专家审核,确保其科学性和合理性。2. 实际病例入选标准 (1) 病例真实性:病例应为本院的真实病例,具有完整的病历记录和临床数据。 (2) 病例多样性:病例应涵盖多种疾病类型和临床场景,包括常见病、多发病和疑难病症。 (3) 病例完整性:病例应包括详细的病情描述、诊断结果、治疗方案和随访记录。 (4) 病例代表性:病例应具有代表性,能够反映临床实践中的常见问题和挑战。 (5) 病例时间范围:病例应涵盖过去 5 年内的数据,以确保其时效性和相关性。具体说明 OSCE 题目:将从现有的 OSCE 题库中筛选出 600 例题目,确保其涵盖广泛的医学领域和临床场景。题目将经过专家审核,确保其科学性和合理性。 实际病例:将从本院的病例库中选取 600 例真实病例,涵盖多种疾病类型和临床场景。病例将经过严格筛选,确保其完整性和代表性。通过上述样本量和入选标准,本研究将确保样本的代表性和多样性,为全面评估 DeepSeek 等 LLMs 的真实医学能力及其在临床服务中的价值提供科学依据。;
请登录查看无;
请登录查看香港大学深圳医院
/
Novabio赛尔欣2026-06-02
动脉网-最新2026-06-02
诺华集团2026-06-02
麓鹏制药2026-06-02
正序生物2026-06-02
传奇生物2026-06-01
ADC InsightsOnline2026-06-01
泽璟制药2026-06-01
良医汇肿瘤资讯2026-06-01
良医汇肿瘤资讯2026-06-01