中国血吸虫病防治杂志 ›› 2024, Vol. 36 ›› Issue (3): 251-258.
郭照宇1,邵菊萍2,邹小青2,赵琴平3,钱沛君1,王文雅1,黄璐璐1,薛靖波1,许静1,杨坤4, 周晓农1, 5,李石柱1, 5*
GUO Zhaoyu1, SHAO Juping2, ZOU Xiaoqing2, ZHAO Qinping3, QIAN Peijun1, WANG Wenya1, HUANG Lulu1, XUE Jingbo1, XU Jing1, YANG Kun4, ZHOU Xiaonong1, 5, LI Shizhu1, 5*
摘要: 目的 探索基于B型超声影像与临床实验室指标构建血吸虫病肝纤维化分级诊断模型的可行性。方法 收集2018—2022年江西省都昌县第二人民医院血吸虫病患者超声影像及临床实验室数据。以血吸虫病肝纤维化Ⅰ级病例为第1组,Ⅱ级和Ⅲ级病例为第2组;选取2018—2021年病例数据为训练集、2022年病例数据为验证集,构建机器学习二分类模型。采用ITK⁃SNAP软件标记影像特征,采用Python 3.7编程语言和PyRadiomics工具包提取影像特征。采用t检验或Mann⁃Whitney U检验比较两组样本间影像特征差异,并采用套索算法(least absolute shrinkage and selection operator,LASSO)进行关键影像特征筛选。采用Scikit⁃learn机器学习库进行机器学习建模,包括支持向量机(support vector machine,SVM)、随机森林(random forest,RF)、线性回归(linear regression,LR)和极端梯度提升(extreme gradient boosting,XGBoost)等4种模型。采用受试者工作特征曲线(receiver operating characteristic curve,ROC)进行最优机器学习模型筛选,并使用沙普利加和解释(SHapley Additive exPlanations,SHAP)评估对机器学习模型中超声影像鉴别特征贡献度最高的特征。结果 2019—2022年,累计将491例血吸虫病患者超声影像和临床实验室检查数据纳入研究。累计提取了851项影像组学特征和54项临床实验室指标,经统计学检验(t = -5.98 ~ 4.80,U = 6 550 ~ 20 994,P均< 0.05)及LASSO回归特征筛选,纳入44项特征或指标进入下一步研究。临床实验室指标SVM机器学习模型训练集和验证集ROC曲线下面积(area under curve,AUC)分别为0.763和0.611,超声影像组学SVM机器学习模型训练集和验证集AUC分别为0.951和0.892,多模态SVM机器学习模型训练集和验证集AUC分别为0.960和0.913。机器学习模型中贡献度居前10位的特征或指标包括2项临床实验室指标和8项影像组学特征。结论 超声影像组学和临床实验室指标相结合的多模态机器学习模型可用于血吸虫病肝纤维化智能识别,并可提升单类数据模型的分类效果。
中图分类号: