摘要
目的 利用东莞市大朗镇社区老年衰弱随访队列,构建基于常规体检血液检测指标和衰弱指数的社区老年人群死亡风险预测模型。方法 以基线衰弱评估结果和血液实验室检测结果为预测变量、以随访期内死亡为结局变量,采用Cox回归分析构建风险预测模型,Kaplan-Meier生存曲线、ROC曲线下面积(AUC)进行模型评价并生成在线风险评分计算工具。结果 多因素Cox分析结果显示存活组和死亡组的白细胞、血红蛋白、血小板分布宽度、中性粒细胞百分比、红细胞分布宽度标准差、淋巴细胞百分比、总胆红素、谷丙转氨酶、葡萄糖、肌酐、甘油三酯、谷草转氨酶 12 项基线血液检测结果差异均有统计学意义(P<0.05)。在测试集中,以此 12 项血液检测结果构建的FI-lab 6 年平均AUC为 0.826,基于衰弱指数量表自我报告的FI-self-report 6 年平均AUC为 0.809,联合两者的FI-combined 6 a平均AUC为 0.834。结论 基于常规体检血液检测结果和衰弱指数构建的风险预测模型能够有效预测老年人死亡发生风险,在线风险评分计算工具便于临床应用。
Abstract
Objective To constructe a mortality risk predictive model for community elderly population based on routine physical examination blood test indicators and frailty index using a community-based geriatric frailty follow-up cohort in Dalang Town, Dongguan City. Methods A frailty risk score model was constructed using Cox regression analysis with baseline frailty assessment results and blood laboratory test results as predictor variables and survival status during the followup period as an outcome variable. Kaplan-Meier survival curves, and the area under the receiver operating characteristic curve (AUC) were used to evaluate the model, and generate an online risk score calculation tool. Results The results of multifactorial Cox analysis showed significant intergroup differences (P<0.05) between the surviving and dying groups for the 12 baseline blood test results for leucocyte, haemoglobin, platelet distribution width, neutrophil percentage, standard deviation of erythrocyte distribution width, lymphocyte percentage, total bilirubin, ghrelin, glucose, creatinine, triglyceride, and azelaic acid aminotransferase levels. In the test set, the 6-year mean AUC of the FI-lab constructed from these 12 blood test results was 0.826, the 6-year mean AUC of the FI-self-report based on self-report of the Frailty Index scale was 0.809, and the 6-year mean AUC of the FI-combined combining the two was 0.834. Conclusion The frailty risk prediction model constructed on the routine physical examination blood test results and frailty index can effectively predict the risk of mortality in the elderly, and an online risk score calculation tool facilitates clinical implementation.
衰弱综合征被视为是一种因年龄增长而导致的以机体储备能力下降、疾病易感性增加、日常生活能力或抗应激能力减退为主要特征的临床状态[1],不仅涉及身体机能[2],还涉及认知、情绪和心理健康[3-4]等多方面功能的下降。衰弱综合征将导致跌倒、失能、残疾、住院和死亡等一系列严重不良健康结局的发生[5]。研究表明衰弱程度与不良健康结局的发生风险存在着密切关系,衰弱程度越高的个体出现不良健康结局的风险将越高[6],同时也将造成更高的医疗花费、医疗资源的消耗和家庭社会负担的加重[7]。早期发现衰弱高风险个体并延缓其进展,将有望降低该人群严重不良健康结局的发生及因衰弱导致的额外医疗花费。
自 2001 年衰弱累计缺陷模型 [8] 和衰弱表型模型[5]及 2005 年衰弱指数量表[9]的提出以来,众多衰弱评估工具在全球范围被广泛开发用于衰弱研究,然而如何在日常诊疗中开展标准化、具有明确衡量标准的衰弱评估工作至今尚未达成完全的共识。老年人健康体检工作在全球范围内广泛开展,电子健康档案记录着居民大量的健康管理信息,基层医务人员能轻松地查阅老年人的健康管理信息,因此基层医疗机构被认为是开展老年人衰弱综合征筛查的理想场所[10-11],然而在老年人体检中开展额外的老年衰弱评估工作又将耗费大量的人力物力等资源。电子健康档案的大量收集使得通过常规体检资料构建衰弱指数(FI)开展衰弱评估成为可能,英国学者Clegg等[12]首先提出利用初级保健的电子健康档案资料构建电子衰弱指数(e-FI),随后澳大利亚、加拿大等国家参照相似方法使用电子健康档案资料构建 e-FI 开展了相关探索性研究[13-14]。然而目前尚有诸多国家、地区暂未充分利用老年人健康体检的电子健康档案资料开展 e-FI 的构建工作,这也就限制了基层医疗机构的医务人员通过 e-FI早期发现衰弱高风险个体的机会,加大了衰弱高风险个体不良健康结局事件的发生概率。
当前越来越多的研究开始探索衰弱早期的血液生物标志物、尿液生物标志物、组学生物标志物等亚临床指标[15-16],而实验室衰弱指数(FI-lab)主要由常规体检信息中方便易得的血液实验室检测结果根据标准方法来构建[17]。FI-lab得分的构建和应用将有利于进一步理解血液实验室检测指标的异常与死亡风险之间的关系,同时对不良健康结局高风险人群的亚临床发病机制提供人群流行病学证据。近年的研究表明:基于自我报告、血液实验室检测结果构建的FI能够单独或联合使用对不良健康结局的发生起到一定的预测效果[18-19]。因此,本研究将利用东莞市大朗镇社区老年衰弱随访队列,构建基于常规体检指标和衰弱指数的社区老年人群死亡风险预测模型。
1 对象和方法
1.1 研究对象
研究对象为东莞市大朗镇社区老年衰弱随访队列 2018-2023 年现场调查中具有完整衰弱评估信息和血液检测指标的 65 岁以上老年人。最终纳入研究者有 7 417 人。
1.2 方法
1.2.1 基线调查和生存状态随访
(1)基线调查:基线调查内容包括衰弱评估信息和血液检查指标。衰弱评估信息基于本课题组前期开发的衰弱指数(Frailty Index)量表,包含一般健康状况、日常生活活动能力、功能性活动、症状体征、认知功能、社会支持和心理状态 7 个维度共 33 个条目[20]。对于二分类变量,存在缺陷编码为“1”,不存在缺陷编码为“0”;对于三分类变量,0.5 表示中间反应水平。FI得分范围为 0 至 1,以 0.22 为界值,FI<0.22 评价为健康,FI≥ 0.22 评价为衰弱。本研究纳入 23 项老年人常规体检中既往研究曾被用于构建 FI-lab 和 FI-blood 的血液检测指标[18–19,21–23]:白细胞(WBC)、红细胞(RBC)、血红蛋白质量浓度(HGB)、红细胞压积(HCT)、平均红细胞体积(MCV)、血小板(PLT)、平均红细胞血红蛋白(MCH)、血小板分布宽度(PDW)、中性粒细胞百分比(NEUT)、中间细胞百分比(MID)、红细胞分布宽度标准差 (RDW-SD)、平均血小板体积(MPV)、淋巴细胞百分比(LYM)、总胆红素(TBIL)、谷丙转氨酶(ALT)、葡萄糖(GLU)、尿素氮(BUN)、肌酐(Cr)、总胆固醇(TC)、甘油三酯(TG)、低密度脂蛋白(LDL)、高密度脂蛋白(HDL)、谷草转氨酶(AST)。(2)生存状态随访: 2024 年 4 月 1 日通过东莞市死因监测系统查询研究对象死亡情况,按死亡情况分为存活组和死亡组。
1.2.2 模型构建
(1)变量选择:对纳入本研究的血液检测指标进行等比例风险(PH)假设和多重共线性诊断。PH假设采用Schoenfeld残差法判断,排除具有严重多重共线性的指标[容忍度(Tolerance)<0.1、方差膨胀因子(VIF)>10]。按照 7∶3 的比例将原始数据集拆分为训练集和测试集,训练集 5 191 人,测试集 2 226 人,以随访期内死亡为结局变量,在训练集中开展单因素Cox回归分析(检验水准 α=0.10)和多因素 Cox回归分析(检验水准 α=0.05),选择组间差异有统计学意义的变量进行模型构建。(2)模型构建:以多因素Cox回归分析差异有统计学意义的指标构建死亡风险评分模型,风险评分模型计算公式为:riskScore = baselineHazard *exp(beta * x1+beta2 *x2 +···+betap *xp)。分别构建:
FI-self-report:以基线FI、年龄、性别为模型变量;
FI-lab:以多因素Cox回归分析筛选的血液检测指标、年龄、性别为模型变量;
FI-combined:包含 FI-self-report 和 FI-lab 中的所有变量。
以中位数为截断值区分死亡高、低风险研究对象。
1.3 模型评价
1.3.1 Kaplan-Meier生存曲线
分别在训练集和测试集按死亡高、低风险研究对象分组绘制FI-self-report、 FI-lab、FI-combined生存曲线,比较 3 种评分模型的累积死亡风险。
1.3.2 模型区分度
分别在训练集和测试集以FI-selfreport、FI-lab、FI-combined 计算的死亡风险评分为预测变量、1~6 a 随访期内死亡为结局变量绘制受试者工作特征(Receiver Operating Characteristic,ROC) 曲线,根据时间依赖的受试者工作特征曲线(timeROC) 和受试者工作特征曲线下面积(Area Under the Curve,AUC)分别评价 FI-self-report、FI-lab、FI-combined 对 1~6 a随访期内研究对象生存结局的区分能力。
1.4 模型应用
使用 DynNom 包生成在线风险评分计算工具应用于临床。
1.5 统计学处理
采用SPSS 25.0 和R 4.4.1 软件,定量自变量均采用连续性变量纳入,经正态性检验均不服从正态分布,采用M(Q1,Q3)描述,组间比较采用秩和检验。分别采用 survival 包中的 Surv 函数创建生存对象、Coxph 函数拟合 Cox 回归模型、survfit 函数拟合生存曲线, stats 包中的 predict 函数计算风险评分,timeROC 中的 timeROC 函数计算多时间点的 ROC 曲线参数, graphics包中的plot函数和ggplot2 包中的ggplot函数进行相关曲线和图形的绘制。P<0.05 为差异有统计学意义。
2 结果
2.1 基线特征
7417 名研究对象的基线特征分布如下:男性有 2 993 名(40.35%),平均年龄为 70(67,75)岁;女性 4 424 名(59.65%),平均年龄 70(67,75)岁;使用FI 量表评估的 65 岁以上老年人衰弱发生率为 13.43% (996/7 417)。研究对象按生存状态分组的血液检测指标组间差异性分析结果显示:除MCV、PDW、AST3 个血液检测指标在存活组和死亡组两组间的差异无统计学意义,其余血液检测指标在两组间的差异均有统计学意义。如表1所示。
2.2 模型构建
2.2.1 变量选择
等比例风险(PH)假设检验结果显示: HCT 不服从 PH 假设; 多重共线性诊断结果显示: RBC、HGB、MCH 三者存在严重多重共线性 (Tolerance<0.1 或VIF>10)。将HCT、MCH剔除后,再次进行PH假设和多重共线性诊断,其余血液检测指标均服从该条件。
训练集和测试集组间均衡性比较结果如表2所示,组间差异分析结果显示:除RBC、BUN、TC3 个血液检测指标在训练集和测试集的差异有统计学意义外,其余血液检测指标在两数据集间的差异无统计学意义,可视为两数据集均衡性良好。
单因素和多因素Cox 回归分析结果如表3、4所示。通过多因素Cox回归分析,筛选出WBC、HGB、 PDW、NEUT、RDW-SD、LYM、TBIL、ALT、GLU、 Cr、TG、AST12 个血液检测指标,用于死亡风险评分构建。HGB、LYM、TBIL、ALT、TG 为保护因素 (HR<1),回归系数绝对值大小排序为:TG >ALT >TBIL>HGB = LYM;WBC、PDW、NEUT、RDW-SD、 GLU、Cr、AST为危险因素(HR>1),回归系数绝对值大小排序为:GLU >RDW-SD >WBC = PDW >AST >NEUT >Cr。
2.2.2 模型构建
FI-self-report评分模型变量包含:基线FI、年龄、性别(男性编码为 1,女性编码为 2); FI-lab评分模型变量包含:Cox回归分析筛选的 12 个血液检测指标(WBC、HGB、PDW、NEUT、RDWSD、LYM、TBIL、ALT、GLU、Cr、TG、AST)、年龄、性别;FI-combined评分模型变量包含了FI-self-report 和FI-lab中的所有变量。由模型系数可见:3 个评分均随年龄增加而增加,女性高于男性。3 个死亡风险评分计算方式如下:
表1随访时存活组和死亡组血液检测指标组间差异性分析结果

表2训练集和测试集血液检测指标组间均衡性比较结果

表3基线血液指标与随访生存状态单因素Cox回归分析结果

表4基线血液指标与随访生存状态多因素Cox回归分析结果

表达式(1):
FI-self-report=0.0009*exp(2.9857*FI-0.8130*sex+0.1034*age)
表达式(2):
FI-lab=0.00002*exp(0.0536*WBC-0.0114*HGB+0.0343*PDW+0.0211*NEUT+0.0521* RDW_SD-0.0026*LYM-0.0150*TBIL-0.0171*ALT+ 0.0930*GLU+0.0046*Cr-0.1386*TG+0.0206*AST-0.6413*sex+0.1080*age)
训练集样本 FI-lab 评分中位数为 0.61,以中位数 0.61 为截断值,FI-lab≤0.61 视为死亡低风险,FI-lab>0.61 视为死亡高风险。
表达式(3):
FI-combined=0.0001*exp(0.0541*WBC-0.0111*HGB+0.0293*PDW+0.0182*NEUT+0.0478*RDW_SD-0.0021*LYM-0.0123*TBIL-0.0173*ALT+ 0.0956*GLU+0.0038*Cr-0.1478*TG+0.0202*AST-0.8071*sex+0.0875*age+2.5350*FI)
训练集样本FI-combined评分中位数为 0.55,以中位数 0.55 为截断值,FI-combined≤0.55 视为死亡低风险,FI-combined>0.55 视为死亡高风险。
研究样本的 FI-self-report、FI-lab 和 FI-combined 评分分布情况和单因素 Cox 回归分析结果如表 5 所示。结果显示:死亡发生风险均随死亡风险评分的增加而增加(HR>1);相较于FI-self-report,FI-lab具有更高的风险评分和更低的死亡风险比。
2.3 模型评价
2.3.1 Kaplan-Meier生存曲线
上述 3 种评分通过绘制KM生存曲线得到进一步验证,KM生存曲线结果显示:在训练集和测试集中以 3 种评分中位数分级的衰弱高风险研究对象均表现出更高的累积死亡风险,如图1所示。
2.3.2 模型区分度
FI-self-report、FI-lab、FI-combined 预测研究对象 1~6 a随访期内死亡率的ROC曲线结果显示 3 种风险评分对研究对象死亡结局均具有良好的区分度,按不同随访时间划分的ROC曲线如图2所示。训练集:FI-self-report平均AUC为 0.789,FI-lab平均AUC为 0.803,FI-combined平均AUC为 0.823;测试集:FI-self-report 平均 AUC 为 0.809,FI-lab 平均 AUC 为 0.826,FI-combined平均AUC为 0.834。
2.4 模型应用
基于 FI-lab 构建的在线风险评分计算工具如图3、4所示,计算工具网址为:https://tangxinming. shinyapps.io/DynNomapp/。通过在网页左侧录入性别、年龄和本研究用于构建FI-lab的 12 项血液检测指标,并选择预测的时间节点,计算工具将根据录入的信息运用FI-lab评分模型计算受试者随时间变化的生存概率曲线(图3)和所选时间节点的生存概率及其 95% 置信区间(图4)。
3 讨论
本研究结果显示 FI-self-report、FI-lab、FI-combine评分的增加均与死亡风险的增加相关,相较于 FI-self-report 来说,FI-lab 表现出更高的平均得分和更小的死亡风险比,这可能与FI-lab捕捉的是衰弱发生更早期的细胞、分子等微观水平的亚临床改变相关,这与近年来国内外报道的基于自我报告和血液实验室检测结果构建的衰弱指数计算结果相类似[18-19,24]。既往相关研究结果显示:基于加拿大老龄化纵向研究(Canadian Longitudinal Study on Aging,CLSA) 构建的 FI-self-report、FI-lab、FI-combine 预测研究对象死亡风险的OR值分别为 1.08、1.05、1.13,AUC值分别为 0.793、0.787、0.805[18];基于北京老龄化纵向研究(Beijing Longitudinal Study of Aging,BLSA)的FI-self-report、FI-lab、FI-combine 预测研究对象 5 年死亡风险的HR值分别为 1.04、1.02、1.05,AUC值分别为 0.79、0.77、0.81[19]。而本研究测试集FI-self-report、 FI-lab、FI-combine预测死亡发生风险的HR值分别为 1.13、1.04、1.01,6 a平均AUC值分别为 0.809、0.826、 0.834;本研究通过 3 种FI评分对老年人群死亡发生风险的预测准确性均略高于CLSA 和BLSA研究构建的 FI。FI-combine 评分的平均 AUC 值高于单独使用 FI-self-report或FI-lab评分时的平均AUC值,然而目前尚不清楚这一结果是由于增加的条目本身性质能够提高评分模型区分度,从而提高对死亡等不良健康结局的预测准确度,还是仅仅只是由于条目数量增加所导致的。
本研究结果显示以下 7 种血液检测指标(WBC、 PDW、NEUT、RDW-SD、GLU、Cr、AST)的升高将增加死亡发生风险。既往研究显示: PDW 的升高与老年人冠状动脉综合征的病变程度呈现正相关关系 [25]; WBC 和 NEUT 的升高与感染、炎症相关; RDW的升高与慢性炎症反应、营养不良和骨髓抑制等改变相关[26]; GLU水平的升高与糖尿病、营养状态、代谢异常等改变相关; Cr、AST水平的升高与影响肝肾功能的疾病密切相关[27]。增加死亡发生风险的 7 种血液检测指标的异常都与潜在健康问题的发生存在一定关系,这一结果表明该研究分析所得的风险评分模型存在一定的生物学合理性,这也为相关疾病的生物标志物研究提供了充分的人群流行病学证据。
表53 种死亡风险评分单因素Cox回归分析结果


图1训练集和测试集高、低风险分级的死亡风险评分KM生存曲线
既往研究构建的 FI-lab 多参照标准的构建方法[17],采用疾病诊断标准将血液检测指标按正常和异常进行二分类,而应用于疾病诊断的界值是否真正适用于 FI-lab 的构建仍不清楚。Stubbings 等 [28] 提出将纳入FI的累积缺陷条目进行多分类的方法来避免选择不恰当的界值对缺陷进行的“正常”“异常”二分类。然而不同的缺陷条目对FI的贡献可能并不相同,即使是将缺陷条目进行二分类或多分类纳入模型构建 FI,却并未考虑各个缺陷的不同权重。本研究采用Cox 回归模型,以模型系数作为权重赋予模型中的各个变量,从而避免了不同缺陷完全统一权重进行分类的不合理性。
衰弱将导致严重不良健康结局的发生,在临床诊疗中准确识别衰弱高风险个体将有效降低其不良健康结局的发生概率。大规模开展标准的衰弱评估工作将耗费大量的人力物力,理想的衰弱筛查工具应当是可直接利用电子健康档案的现有信息开展的。随着电子健康档案的不断完善和老年人健康体检工作的广泛开展,使用电子健康档案信息开展大规模的衰弱筛查成为可能。既往研究多基于国外人群资料开展,纳入FI-lab构建的血液检测指标也各不相同,这可能与不同国家间社会文化经济、就医行为和医疗保健需求等的差异相关[29-31],基于国外人群资料构建的衰弱筛查工具是否适用于不同国家和地区仍需进一步开展更多验证工作。早期开展衰弱筛查降低严重不良健康结局的发生概率等现实情况也表明开发一个基于中国人群的衰弱发生风险快速筛查工具是非常有必要的。本研究基于中国人群筛选得到的血液检测指标均为老年人常规体检的检测指标,将此在线风险评分计算工具嵌入健康档案系统即可在日常诊疗中快速判断出研究对象的死亡发生风险,进一步完善老年综合评估工作。
本研究基于长期随访的中国人群老年人常规体检血液检测指标构建了死亡风险预测模型,为大规模的老年综合评估提供了方便实用的临床工具,早期识别高风险个体,开展针对性干预措施,延缓不良健康结局的发生进程。该研究仅在单一地区开展,研究结果在推广至更大范围人群中是否适用仍需更多证据支持,工具的有效性有待进一步在更广泛的人群中验证。
图2研究对象 1~6 a死亡风险评分模型ROC曲线

图3在线风险评分计算工具截图1

图4在线风险评分计算工具截图2








