人工智能与临床恶化_数字重症 ICU.CN

引言

本综述概述了用于识别和预测住院患者临床恶化的系统，重点介绍了人工智能目前和未来的作用。

人工智能

AI被定义为机器显示的智能。人工智能可分为强人工智能(AGI)和弱人工智能(ANI)。AGI在解决问题时通过论证理性来模仿人类，ANI执行单个或高度受限的任务，例如在大型数据集中识别模式。机器学习(ML)是ANI的一种形式，其从大型数据集中提取知识。ML有两个主要子群—监督学习和非监督学习。监督ML通常采用多个输入变量(如从电子病历中提取的数据)来预测一个预定义的结果(如非计划性的入住重症监护病房)。为保证通用性，ML在独立但具有可比性的数据集上进行测试。监督ML常用于临床恶化的研究，并以各种形式出现(决策树模型、K最近邻分类算法和神经网络是三种著名的形式)。非监督ML使用未标记的数据并在该数据中找到模式(如聚类)，它不常用于临床恶化的研究，但有着相关的应用。

临床恶化

“患者病情恶化”没有国际公认的定义。Jones等人将“病情恶化的患者”定义为“从一种临床状态转移到另一种更糟糕的临床状态，从而增加了个人发病和死亡的风险”。研究的重点是反映终末期恶化的不良结局，也称为院内不良事件，这些都是由院内死亡、非计划性入住ICU和心脏骤停定义的。在研究中，也偶尔使用医疗应急响应来表征病情恶化的患者群体。当作为预测恶化的算法的结果度量时，每一个结果都有它的优点和缺点。但是，应针对最容易改变患者结局的早期恶化阶段。

快速响应系统和早期预警评分

快速响应系统(RRS)和早期预警评分(EWS)是30年前为改善患者病情恶化的管理而发展起来的，其支持的一项分析显示，院内心跳呼吸骤停(IHCA)的发生通常早于未注意到的生理不稳定时期。与之挂钩的RRS/EWS系统旨在向最需要的人分配专科临床资源，从而减少IHCA，预防普通病房的病人死亡。

在英国，尽管RRS有所改善，但住院患者未经治疗的临床恶化仍持续存在。此外，尽管每年有成千上万的患者触发RRS警报，但只有少部分患者发生不良事件或需要大幅提升治疗水平。由于相关不良事件的减少，以牺牲较低的特异性为代价，强调高敏感性已被容许。然而，在前EPR (纸质化)时代发展起来的现有系统却揭示了医院资源可得性与患者需求之间的不匹配。提高对早期恶化征象的认识，可能会降低可避免的死亡率、不必要的入住ICU和住院时间。

晚期才认识到住院患者病情恶化会导致更糟糕的结局，包括更高的死亡率。在英国，每年约有4.5万名住院患者病情恶化到需要紧急入住ICU的程度。英国重症监护国家审计与研究中心数据库的分析显示，尽管在75 %以上的国家卫生服务医院实施了早期预警评分，但在这些非计划性ICU入院患者中，高达80%的患者存在未治疗的临床恶化前期。最近澳大利亚的数据也表明，无论诊断、年龄和住院时间如何，入院72小时内的临床病情恶化都会增加治疗费用。

电子病历及算法

自2005年以来，越来越多的医院开始实施EPR，这为开发先进的数字风险算法创造了机会，这些算法使用了丰富的同期患者数据集，包括生命体征、实验室结果、人口统计学、合并症、医院行政数据。2008年，Tam等人根据现有的行政病人数据编制了诺模图，以预测非计划性的入住ICU，但他们既未对诺模图进行验证，也未发表任何后续分析。Bailey等人推导并实施了基于EPR的预后风险评分，他们发现有警报呈阳性的患者需要ICU入院的可能性高5.3倍，并且住院时间明显更长。然而，干预组(基于EPR的预警病房患者)和对照组(标准 RRS病房患者)的临床结果没有差异。2013年，Alvarez等人开发并验证了一个自动化模型，该模型比当时的系统更敏感、更具体，并且在ROC曲线下面积更大。该模型还显示，注定发生不良事件的患者在平均16h左右发病。

高级警报监测器(AAM)

美国奥克兰的Escobar等人是在实际部署预测算法方面最先进的团队，在他们的医院被称为高级警报监测器(AAM)。AAM是一个包含实验室数据、生命体征、合并症的非线性logistic回归模型。他们制定了一项干预方案，护士远程审查医疗记录，并对被AAM确定为高风险的患者实施一项护理计划。这一制度在美国19家医院交错实施，并显示出死亡率降低(调整相对危险度0.84,95% CI 0.78-0.90;P<0.001)。本研究是描述AAM开发、验证、实施的多个序贯研究的总结。

电子心脏骤停危险分级

美国芝加哥的Churpek等人开发了一种被称为电子心脏骤停危险分级(eCART)的预测算法。eCART是一个非线性logistic回归模型，它包括实验室数据、生命体征，作者还开发了一个随机森林模型，尽管它似乎并没有被应用到实时的临床系统中。eCART已在多项针对广泛使用的EWS的回顾性验证研究中进行评估，包括BTF、NEWS、MEWS，并被证明其能更好地预测IHCA、非计划性ICU入住ICU和死亡。目前eCART检出IHCAs的次数是快速响应系统的4倍，ICU入住人数比快速响应系统多50%。eCART在标准RRS激活阈值前8h显示出检测到恶化。它已在一个前瞻性的可行性研究中进行了测试，但这并不涉及到使用该算法改变目前的RRS临床工作流程。

全院通过电子公告栏发出警报

HAVEN是由牛津大学与两个国家卫生服务信托基金合作研发的，它使用监督ML模型(梯度提升)来处理76个常规的基于EPR的变量。这些数据分为两类：在入院期间不发生改变的静态变量(如年龄、既往病史等)和在入院期间发生改变并反复更新的动态变量(如生命体征、实验室检查结果等)。从这些数据中得出了未来24h病情恶化的风险评价值，然后利用风险评价值将病房患者按照未来24h内发生病情恶化的可能性从高到低进行排序。根据IHCA和非计划性入住ICU的综合结果，HAVEN的C统计量为0.901，准确率为10%，能够提前48小时识别42%的心脏骤停。算法的开发过程是彻底的，但其还有待于在临床工作流程中实现。

梅奥诊所早期预警评分

梅奥诊所早期警告评分(MCEWS)是一种梯度提升，它包括实验室数据、生命体征、人口统计学和护理评估。该算法是在三家医院共计近132000个住院数据集上发展起来的。使用复合结局心脏骤停呼叫，RRS团队激活非计划性入住ICU，该算法的C统计量为0.937，敏感性为73%，产生的警报比NEWS少45%。在一项作为预印本出版的试点研究中，作者发展了床边病人抢救(BPR)，它是MCEWS和“护士忧虑因素”(由护士在床边记录生命体征时录入)的加权组合。

罗斯曼指数

罗斯曼指数(RI)结合了生命体征、实验室检查、心律和护理评估。RI将每个输入变量转换为一个“风险函数”，量化一年死亡率的超额风险，然后将个人风险函数组合成加权评分，这也说明了最近的实验室测试是如何测量的。

这些系统都符合图1所示的一般方法。

时间和动作研究

时间和动作研究显示医院工作人员在为患者提供治疗时的动作和活动。医院工作人员根据病人的需求(由于需要管理病情恶化而增加身体接近度)改变自己的行动和活动。这些数据可以假设地独立使用，或与现有模型结合，以帮助预测患者的病情恶化。迄今为止，还不存在这种研究，但已经在尝试开发能够使之成为可能的方法。传统上，数据是由外部观察者人工采集的，但最近出现了自动化的计算机系统。分析显示，与其他医疗和外科病房相比，ICU的工作模式存在显著差异。同样，压力对ICU工作流程的影响可能会影响患者的治疗。ICU人员在单位外的活动通过实时定位设备自动量化，并可以代表与病情恶化患者相关的活动。时间和动作研究也已应用于患者的医疗路径。

自然语言处理

EPR中对自由文本的分析依赖于自然语言处理(NLP)。NLP也是人工智能的一种形式，可以模拟出一系列与临床相关的数据(如症状、检查结果、临床诊断等)，进而可以被纳入预测临床恶化的模型中。该过程结合了两种人工智能形式：NLP和ML。Korach等研究表明，非监督ML方法能够成功地识别自由文本护理记录中有意义的内容。他们演示了在护理记录NLP的增强下，使用人口统计学和生命体征的模型能更好地预测死亡率。在ICU患者中，NLP也会增强死亡率模型的预测性能和持续住院时间的预测性能。然而，尽管这些发现是有前景的，NLP仍未在针对恶化患者的实时临床工作流程中实现。

患者子群

脓毒症是病情恶化患者群体的一个大而重要的亚群。最近的两篇综述提及，目前正在测试的脓毒症算法有130多个。两篇综述都发现了方法上的不一致性和群体上的异质性，人工智能算法的创建和它们在临床实践中的实施之间还有很大差距。2021年Wong等人对外验证了美国数百家医院实施的Epic Sepsis模型(ESM)，他们发现与目前的临床实践相比，ESM敏感性较低，在预测脓毒症发病时的区分度和校准度较低。

COVID-19带来了不寻常的挑战，特别是在预测和管理ICU资源需求方面，AI应用于COVID-19的多个领域，包括机构水平预测、诊断和预后。此前对COVID-19应用的ML策略进行了系统评价。在预测病例数和ICU床位的可供性时，可以使用AI，如自回归模型和时滞人工神经网络。关于个人层面的病情恶化预测，已经开发了旨在预测转入ICU、插管和死亡率的模型。这些模型对受COVID-19影响的大部分人存在潜在的应用，这凸显了谨慎使用这些模型的重要性，以尽量减少偏移并最大化公益。

其他相关研究

病情恶化的患者参与临床决策具有高风险，这强调了建立和实施人工智能模型的伦理框架是重要的。与医学AI模型相关的非预期伦理后果可能会导致多个领域的迫切关注，包括偏移、机密性和信义激励。潜在的偏倚来源包括：偏倚数据集、正在开发的反映人为偏倚的模型和负面影响人类决策的自动化偏倚。可以采用多种策略来减小偏差，如提高AI模型的可解释性和授权后监测。为了维护和支持医疗人工智能应用的公信力，对此类模型进行透明化研究和应用势在必行。最后，AI应用于穿戴式的远程生命体征监测设备有望在未来的医疗保健系统中发挥重要作用，但此仍有待试验研究。

实际应用

人工智能在个人银行、投资、制造业和新闻媒体等领域取得了革命性进展，但在健康领域没有取得可比的进展。尽管近10年来与AI相关的临床研究大量增加，但很少有算法和/或AI临床应用进展到实时临床实施的水平，这在医学文献、FDA的申请和批准中都有体现。截至2020年，仅有29项医疗AI/ML的具体应用，其中没有任何与临床恶化有关的应用(几乎所有的应用都与放射学或心脏病学有关)，这表明AI在健康领域还远未普及。

结论

AI驱动的预测临床恶化的系统在研究中日益得到发展，但其很少被实施到临床工作流程中。Escobar等人为稳健的模型开发和实施方法提供了金标准。虽然多种技术显示出希望，有意义地影响患者结局的途径仍然具有挑战性

本文荟萃自，只做学术交流学习使用，不做为临床指导，本文观点不代表数字重症 ICU.CN立场。