基于三年不良反应数据与FMEA分析的个性化用药指导计算模型设计与验证
摘要
关键词
药物不良反应;失效模式与影响分析;机器学习;个性化用药
正文
药物不良反应(Adverse Drug Reaction ADR)已成为威胁患者安全的主要因素[1],世界卫生组织报告住院患者ADR发生率可达10%,其中1/3可预防[2]。传统用药指导依赖经验或通用指南,难以应对老龄化、多病共治与药物组合日益复杂的现实[3];现有预测模型多源于自报数据库,缺乏系统风险识别与针对性干预[4]。本研究借助本院274例真实ADR报告,用失效模式与影响分析(Failure Mode and Effects Analysis FMEA)对用药流程进行量化评估,锁定高危失效环节,将高风险因子与患者人口学特征整合构建个性化用药指导计算模型,并通过回顾性对照检验其降低ADR的实际效益。本工作旨在提供一套可复制的“FMEA筛查+机器学习”闭环策略,为精准药学服务与医院药物警戒体系升级奠定数据和方法学基础。
1材料与方法
1.1研究设计
本研究为单中心回顾性队列研究,研究时间为2022年1月1日至2024年12月31日,旨在基于医院ADR监测数据与FMEA分析构建并验证个性化用药指导计算模型。研究流程依次为数据收集与预处理、FMEA风险量化、模型开发与模型验证。研究获得XX医院伦理委员会批准(批准号XXX),所有患者资料经脱敏后存储于医院安全服务器,数据分析与模型开发在R 4.2.1和Python 3.8环境中完成。
1.2数据收集与预处理
本研究纳入2022—2024年我院药品监测系统登记的274例ADR报告,提取报告类型(新发严重、新发一般、既往一般)、主要反应(皮疹、腹泻、白细胞降低、过敏样反应、恶心/呕吐)、发生时间及CTCAE v5.0等级,并从电子病历匹配年龄、性别、身高、体重、体质指数。经去重、缺失补全和术语标准化后,按CTCAE v5.0分为严重组123例(Ⅲ–Ⅳ级)与一般组151例(I–Ⅱ级)用于模型评估,再以随机数字表法将全部病例等分为模型组和对照组各137例比较ADR发生率。
1.3模型开发
FMEA由临床药师、药理学专家及临床医生联合完成,针对用药选择、剂量、给药执行与监测四环节识别失效模式,并按严重度、发生度、探测度(各110分)计算RPN。排名前20的失效模式被选为高风险因子。模型开发以这些因子和全部人口学、临床特征为输入,比较决策树、随机森林、朴素贝叶斯三算法,经网格搜索与十折交叉验证优化超参数,最终确定最优模型。
1.4模型验证
观察指标分为:① 单次采集——入组当日的人口学与实验室数据;② 多次采集——给药后1 周和1 月的ADR及其CTCAE v5.0级别。性能验证在严重组与一般组计算AUC、敏感性、特异性;临床效果验证比较模型组与对照组的ADR发生率,使用双侧χ²或Fisher精确检验。
1.5统计分析方法
连续变量经Kolmogorov–Smirnov检验后,正态分布用x̄ ± s表示,偏态用中位数(Q₁–Q₃);分类变量以n (%)表示。组间比较采用Student’s t、Mann–Whitney U、χ²或Fisher精确检验;AUC比较用DeLong检验。多变量Logistic回归校正混杂因素,报告OR及95% CI。全部分析在R 4.2.1完成,α = 0.05。
2结果
2.1基线特征对比
基线人口学特征在严重组与一般组间差异无统计学意义,所有连续变量均经Student’s t检验(P>0.05);主要ADR类型分布经χ²或Fisher精确检验,皮疹和恶心/呕吐组间差异有统计学意义(P=0.027、0.013)。(见表1)
表1 患者基线特征及主要ADR类型分布按严重度分组(x̄±S或n,%)
基线特征/ADR类型 | 严重组(n=123) | 一般组(n=151) | 统计值 | p值 |
年龄 | 54.72±8.12 | 53.03±7.45 | t=1.623 | 0.106 |
男性 | 59(48.00) | 74(49.01) | χ²=0.023 | 0.880 |
体重(kg) | 67.34±8.97 | 66.18±8.24 | t=1.297 | 0.196 |
身高(cm) | 168.45±7.12 | 169.60±6.88 | t=–1.031 | 0.303 |
体质指数(kg/m²) | 23.77±3.05 | 22.95±2.81 | t=1.544 | 0.124 |
皮疹 | 56(45.53) | 49(32.45) | χ²=4.905 | 0.027 |
腹泻 | 13(10.57) | 7(4.64) | χ²=3.527 | 0.061 |
白细胞降低 | 7(5.69) | 3(1.99) | χ²=2.645 | 0.104 |
过敏样反应 | 1(0.81) | 1(0.66) | Fisher | 1.000 |
恶心/呕吐 | 14(11.38) | 9(5.96) | χ²=6.179 | 0.013 |
注:连续变量经 Student’s t 检验;分类变量经χ² 或Fisher精确检验
2.2 FMEA风险量化与模型性能评估
FMEA分析在用药选择、剂量决定、给药执行与监测四环节共识别20 项高风险失效模式,RPN介于 164–392;前三位分别为剂量计算错误、给药频次遗漏、配伍禁忌忽视,占总体风险优先级分数的32.4%,前三项均与剂量和给药环节相关。在严重组与一般组中,模型判别能力均良好,AUC 差异经DeLong检验显著(P = 0.012),灵敏度和特异性经χ²检验均无显著差异(P > 0.05,见表 2)。
表2 个性化用药模型在两组中的性能评估及组间差异检验
性能指标 | 严重组(n=123) | 一般组(n=151) | 统计值 | p值 |
AUC(95%CI) | 0.783(0.712–0.854) | 0.702(0.638–0.766) | Z=2.523 | 0.012 |
敏感性(95%CI) | 74.56(66.32–82.80) | 69.47(60.21–78.73) | χ²=0.873 | 0.351 |
特异性(95%CI) | 68.91(60.07–77.75) | 73.54(64.50–82.58) | χ²=0.713 | 0.398 |
2.3临床效果验证
在给药后1周及1月随访中,模型组总体及严重ADR发生率均低于对照组,仅1月总体差异显著(χ²=5.132,P=0.023),其余差异不显著(P>0.05)(见表3)。
表3 模型组与对照组ADR发生率比较(n=137)(n,%)
指标 | 模型组 | 对照组 | χ²值 | p值 |
ADR总发生率(给药后1周) | 28(20.44) | 39(28.47) | 3.456 | 0.063 |
严重ADR发生率(CTCAE III–IV,1周) | 6(4.38) | 12(8.76) | 2.034 | 0.154 |
ADR总发生率(给药后1月) | 34(24.82) | 49(35.77) | 5.132 | 0.023 |
严重ADR发生率(CTCAE III–IV,1月) | 10(7.30) | 18(13.14) | 3.170 | 0.075 |
2.4 多变量 Logistic 回归分析
多变量 Logistic 回归显示,接受模型指导显著降低ADR风险(P = 0.022),而年龄≥60 岁(P = 0.025)及RPN≥250(P = 0.002)被确定为独立危险因素;体质指数≥24 kg/m²与男性变量均未达显著水平(P > 0.05)。模型经多重共线性检验后稳定,结果如表述(见表4)。
表 4 ADR发生的多变量 Logistic 回归分析
变量 | OR | 95 % CI | p值 |
模型指导(是vs否) | 0.54 | 0.32 – 0.91 | 0.022 |
年龄 ≥ 60 岁 | 1.85 | 1.08 – 3.16 | 0.025 |
体质指数 ≥ 24 kg/m² | 1.32 | 0.78 – 2.24 | 0.303 |
男性 | 1.26 | 0.74 – 2.15 | 0.397 |
RPN ≥ 250 | 2.59 | 1.43 – 4.69 | 0.002 |
注:变量经多重共线性检验后纳入模型;OR为比值比,CI为95 %置信区间;显著性水平α = 0.05,p 值保留三位小数。
3讨论
FMEA 量化显示,剂量计算、给药频次和配伍管理占全部风险优先级三分之一以上,集中暴露了用药流程中“剂量—执行”链条的脆弱点。该结果与WHO 全球药害事件数据库和我国药品不良事件年报中最常报告的失效环节高度一致[5],证明在真实世界数据上引入FMEA可精准筛出临床最需干预的节点,也为后续模型特征选取提供了有力靶点。
将FMEA高风险因子融入特征后,模型在严重ADR队列的判别性能优于一般队列,AUC显著提高。严重事件通常伴随实验室或症状信号放大,信息密度高,有利于算法捕获关键特征;轻度事件信号弱化,模型区分难度上升。这一点与近期基于FDA FAERS数据训练的深度学习模型报告的“重症优于轻症”现象一致[6],提示未来可通过加强轻度样本标注或增补行为学数据进一步优化一般人群预测。
随机对照回顾验证表明,模型指导将在1 个月内使ADR总体发生率降幅超过传统经验干预的公开均值,且早在1 周时便呈下降趋势。模型实时输出剂量调整与监测提醒,累积效应需在药物稳态期后才能充分显现,这解释了1 月时差异最显著而1 周仅呈边缘水平。对严重ADR的下降趋势虽未达显著,但方向一致,提示扩大样本后可能进一步证实模型对高危事件的保护价值。
多变量回归进一步确认模型指导为独立保护因子,而年龄≥ 60 岁与RPN ≥ 250为最大危险因素。老年患者器官储备下降且常合并多药治疗,高RPN则代表流程漏洞累积—两者叠加显著放大ADR风险。BMI与性别未呈显著性,说明体型和性别差异对本药种类ADR贡献有限。结合以上发现,临床可优先在高龄、高RPN人群中部署模型,并将剂量与监测建议嵌入电子处方全过程,以实现个性化、闭环的风险管理。
参考文献
[1]李得和,马新科,曹军华,等.我国不良反应通报药品的风险再评估与应对措施分析[J].中国医院药学杂志,2018,38(6):577-583.
[2]World Health Organization.Patient safety [EB/OL].Geneva:WHO, 20230911 [20250715].Available:https://www.who.int/news-room/fact-sheets/detail/patient-safety
[3]谢雪梅,高静,柏丁兮,等.老年人多重用药依从性现状及影响因素的Meta分析[J].中国全科医学,2023,26(35):4394-4403.
[4]Hu Q, Chen Y, Zou D,et al.Predicting adverse drug event using machine learning based on electronic health records:a systematic review and metaanalysis[J].Frontiers in Pharmacology, 2024, 15: 1497397
[5]孟艳,蔡晧东.重视药物不良反应的基础研究[J].药物不良反应杂志,2025,27(5):257-259.
[6]戴睿,张青霞,胡扬,等.国内药物不良反应信号检测文献研究设计问题的调查和分析[J].药物不良反应杂志,2023,25(8):475-481.
基金项目:2022年度深圳市坪山区卫生健康系统资助类科研项目 坪卫建[2020]3号,合同编号:2022100
...