用药记录数据怎么录入 Excel: 临床研究药物信息提取指南

你的研究需要知道每位患者用没用某种药、用了多大剂量、用了多久。HIS 里的长期医嘱和临时医嘱记录了这些信息,但格式不是为研究设计的:同一种药可能有十几种写法,剂量单位不统一,住院期间用药记录可能是几十条流水账,你需要从里面提炼出几个分析用的变量。

用药记录数据录入临床研究

商品名和通用名混用:同一种药的不同写法

用药记录里最大的挑战是药品名称不统一。医院 HIS 里的药品以采购的具体商品名存储,同一通用名的药可能有多个不同厂家的商品名,在用药记录里轮换出现。

以常见的 ACEI 为例,HIS 里可能出现:「依那普利片」「马来酸依那普利片」「依苏」(商品名)——三种写法指向同一个通用名。如果你要统计「使用 ACEI 的患者比例」,三种写法都要计入,但逐条对照太低效。

处理方式:

建一份药品对照表,在提取前准备好。把你研究里关注的所有药物类别,列出每类药的通用名和可能出现的商品名/缩写:

你研究的药物类别 通用名 HIS 里可能的写法
ACEI 依那普利、贝那普利、福辛普利… 马来酸依那普利片、依苏、洛汀新、蒙诺…
他汀类 阿托伐他汀、瑞舒伐他汀、辛伐他汀… 立普妥、可定、阿乐、冠爽、舒降之…
质子泵抑制剂 奥美拉唑、兰索拉唑、泮托拉唑… 洛赛克、奥克、达克普隆、泰美尼克…

在字段定义里,把每个药物类别的所有可能写法都列出来。工具做语义匹配时,能把「马来酸依那普利片」识别为「ACEI 类」。

剂量字段怎么设计

用药记录里的剂量信息通常写成这样:「阿司匹林肠溶片 100mg qd po」——药品名称+规格+频次+给药途径,一行文字。提取时需要把这行拆成几个独立字段:

  • 是否使用该药:1=是,0=否(最常用的变量,用于分析用药与否的差异)
  • 每次剂量(mg):100
  • 用药频次:qd(每天一次)
  • 给药途径:po(口服)
  • 日总剂量(mg):100×1=100(如果分析用剂量强度,这列有用)

不是每个研究都需要所有这些字段。如果你的研究只关心某类药物有没有使用(而不关心剂量),只需要「是否使用」这一列就够了,不要为了"完整性"多录没用的字段。

问自己:这个字段在统计分析里会用到吗?如果答案是"不确定,先录进来再说",通常意味着不需要。多录入一列意味着多提取、多核查、多清洗——额外工作量。

用药时长怎么算

回顾性研究里,「住院期间用药时长」通常从长期医嘱记录里提取:第一条开药医嘱的日期到停药或出院日期之间的天数。

几个常见的麻烦:

中途停药再重新开。患者可能因为不良反应临时停药,几天后重新开始。这种情况你需要决定:是录总用药天数(把间断时间排除),还是录首次开药到最后停药的时间跨度,还是分段录入。方法取决于你的研究问题,在方法部分说明清楚。

剂量中途调整。「美托洛尔 25mg bid」用了 2 周后调整为「美托洛尔 12.5mg bid」——如果你要的是出院时剂量,就取最后一条医嘱的剂量;如果要的是平均剂量,需要加权计算;如果只要是否用药,这个变化不影响结论。

院外用药(入院前就在用)。住院用药记录只覆盖这次住院期间。如果你的研究需要「入院前是否用某药」,数据来源是入院记录里的「目前用药情况」,不在用药医嘱里,要从病历文书里提取。

多药联用:联合用药怎么录

心衰患者同时用 ACEI + β受体阻滞剂 + 利尿剂,肿瘤患者用联合化疗方案——多药联用的数据要怎么存?

每种药一列,不要把多种药合并在一列。「ACEI(是/否)」、「β受体阻滞剂(是/否)」、「利尿剂(是/否)」各一列,后续可以灵活生成「RAAS 抑制剂使用(是/否)」「三联用药(是/否)」等组合变量。如果把「用药方案」录成一列文字(「ACEI+β受体阻滞剂+利尿剂」),统计分析时无法直接用。

化疗方案单独处理。标准化疗方案(如 FOLFOX、XELOX)通常有固定的方案名称,可以录入「化疗方案」一列存方案名,再用 0/1 编码列出各药物是否在方案里。具体怎么设计取决于你分析的问题——如果比较不同方案之间的疗效,方案名称列就够;如果分析某个单药的贡献,就需要逐药列出。

用药记录批量提取的操作流程

截图包含完整医嘱列表,不只是某一条

HIS 里用药医嘱通常是一个列表,每行一条医嘱。截图时把整个用药期间的医嘱列表完整截下来,不要只截你以为最重要的那条。批量提取时工具会从列表里匹配你定义的字段,漏截了条目就会漏掉信息。

字段定义里列出商品名变体

定义「是否使用他汀类药物」字段时,把你医院常用的他汀类商品名都列进去:阿托伐他汀、立普妥、阿乐、瑞舒伐他汀、可定、辛伐他汀、舒降之……。这份列表准备一次,整个课题通用。

先提取"是否用药",再按需提取剂量

如果你的研究主要关心用药与否,先完成这一列的提取和核查,再决定是否需要提取剂量和时长。分阶段比一次提取所有字段再全部核查省事——如果研究方向调整,损失的工作量也更小。

核查时重点查阴性结果

提取结果是「未使用该药」的行,随机选几例打开原始截图确认——是真的没有开该药,还是药品名没被识别到?这类漏识别的错误不会在统计时触发警报(和手工录入的漏字段问题一样),需要主动抽查。

院外用药:入院记录里的「目前用药」

如果你的研究需要「入院前用药情况」——比如「是否在院外长期使用抗血小板药物」——这个数据不在医嘱里,在入院记录或首次病程记录的「既往用药史」或「目前用药」一栏。

这类数据的录入准确性取决于病历书写的质量:如果接诊医生认真询问了既往用药并详细记录,这列数据是可靠的;如果病历里只写「目前用药:无」而患者实际在院外用着几种慢性病药,这列就有问题。

在方法部分注明数据来源是「入院记录中记录的院外用药情况」,说明这一数据可能受病历书写质量影响。这不是要你去核实每份病历,而是让读者了解数据的局限性。

用药记录的核心难点不是格式,是名称标准化——把几十种商品名映射回通用名和药物类别。这份映射表准备好了,后续无论是手录还是批量提取,执行层面就是按表匹配。

批量提取用药记录中的药物信息

上传 HIS 用药医嘱截图,按药物类别字段提取是否使用及剂量,直接导出 Excel 变量列。

开始免费使用