四步完成病历数据采集
从一堆病历截图到可以直接进统计软件的Excel数据表
上传病历图片
拍照、截图或PDF,支持批量上传。HIS系统截图、扫描件、手机拍摄的纸质病历均可,不同来源可以混在一起。
定义提取字段
写下要提取的列名:性别、年龄、入院日期、主诊断、手术方式……与变量表对应,一次配置,批量复用。
AI批量识别
AI理解字段语义,从每份病历里定位并提取对应的值。字段没有记录的,标注为空,不猜测填写。
导出数据表
下载格式整洁的Excel文件,每行对应一份病历,列结构与变量表一致,可直接导入SPSS或R。
哪些人在用这个方式采集数据
从科研课题到临床质控,数据采集的瓶颈是一样的
研究生 / 住院医生
毕业课题做回顾性研究,需要从几十到几百份病历里提取变量。手工录入消耗大量时间,导师催进度,用AI批量采集可以把数据收集阶段压缩到原来的十分之一。
CRC / 临床研究协调员
同时负责多个项目的数据录入,病历版本不统一、EDC系统操作繁琐。用简录AI先批量提取到Excel,再统一录入EDC,减少重复核对。
科室质控 / 数据上报
定期从HIS系统截图或导出PDF,整理科室指标数据上报。字段固定、数量大,是批量提取最典型的应用场景。
检验 / 影像报告整理
收集患者检验报告截图(血常规、生化、肿瘤标志物)或影像报告,提取指定指标值,汇总成随访追踪表或对照分析表。
为临床数据采集设计的功能
解决回顾性研究数据采集中最实际的几个问题
格式不统一也能处理
不同医院的病历格式、不同科室的记录习惯,全部混传。AI理解字段含义,不依赖固定模板位置。
字段配置可复用
定义好变量列表后保存为模板,下次处理同一项目的新增病历时直接调用,不用重新配置。
缺失值标注清晰
某份病历里某个字段未记录时,提取结果中该格为空,不填默认值,不猜测。研究者可以根据实际情况决定如何处理缺失数据。
输出列名与变量表对齐
提取结果的列名就是你输入的字段名,直接与研究设计阶段定义的变量表对应,无需二次整理。
支持PDF病历
HIS系统导出的PDF病历、门诊总结PDF、检验报告PDF,直接上传,和图片文件统一处理。
不用于模型训练
上传的病历图片仅用于本次提取任务,不会被用来训练AI模型,处理完成后可手动删除文件。