|
本帖最后由 kexue 于 2024-4-21 16:42 编辑
通过大量阅读临床预测模型相关文献,提炼了一下该文章类型写作套路,主要以列线图为例:
1.文章标题
一般就是包含研究人群,要预测的结局变量,以及列线图(模型)
2.Abstract
1)Background:一般就是该疾病或并发症等的研究现状,缺乏预测手段,本研究旨在创建一个预测什么的模型
2)Method:纳入人群的来源(哪个医院或哪个数据库,哪个时间段,什么疾病人群),有没有划分数据集,变量筛选的方法(单+多,lasso+多,单+lasso+多,或者加入VIF,MDG等),构建的模型是什么(列线图,还是决策树等等),模型评价用了什么,结果怎么样(C指数,ROC,校准曲线,DCA曲线)
3)Results:研究纳入了多少人,通过什么方法筛选了变量,最后用哪些筛选好的变量构建了模型,以及模型评价和验证的结果展示一下(C指数,AUC,校准曲线等等)
4)Conclusions:一般就是本研究构建了一个什么模型,这个模型有很好的区分度和校准度,能为临床的决策提供指导等等
3.Introduction
一般就是介绍一下所研究疾病的一些背景知识等等,然后要延伸到你想研究的结局变量上,为什么要构建这个结局变量预测模型等等(难以辨别,发生快,进展迅速等等),比如临床预测模型Day 14 这篇文章大家可以看一下他是怎么提到结局变量的,然后也可以介绍介绍列线图这个模型的一些优点,最后我们打算干什么(概述一下自己的研究内容)
4.Methods
1)实验设计:纳入了哪些人群(内部数据集+外部数据集都要介绍),在纳入过程中有哪些纳入排除标准,比如年龄有没有限制,只纳入老年人还是只纳入儿童还是都纳入等
2)数据的收集:介绍一下文章收集了哪些数据,纳入了哪些自变量以及因变量,并对于一些比较专业性的变量要进行充分的解释
3)统计分析
(1)用的什么软件(R,spss,python等等)
(2)连续性变量以及分类变量的表现形式(百分比,median(IQR),mean(sd))以及不同数据类型的统计检验方法
(3)介绍一下用了什么方法进行了变量筛选(单+多,lasso+多等),或者变量共线性等问题是怎么解决的等等
(4)构建了什么模型(nomogram,评分量表,评分网站,亦或者app)
(5)模型评价方法(C指数,ROC,DCA曲线,校准曲线,临床影响曲线等等)
(6)内部验证(划分数据集还是bootstrap,亦或者交叉验证法),外部验证怎么做的
(7)是否进行了模型比较,怎么比较的(和既往模型或标准,亦或者新模型里的变量,或者是文章中用另一个方法构建的模型)(比较方法:ROC曲线,校准曲线,DCA曲线,NRI,IDI)
(8)有没有根据总分进行危险分层
5.Results
1)流程图的描述,一开始收集了多少病人的数据,根据纳入排除标准剔除了多少,最后纳入了多少病人进行了研究
2)基线特征的描述:描述不同组之间的患者基本信息的比较(训练集 vs. 验证集:一般组间数据没有统计学差异 or 有 vs. 无结局事件:一般部分变量存在统计学差异等等)
3)变量筛选过程的描述(以Day 14这篇文献为例:展示了单因素logistic回归结果,并将p大于0.2的变量纳入多因素logistic回归分析,并展示了多因素logistic回归的结果)
4)然后就是描述模型的构建,哪些变量纳入了列线图,并对列线图进行解释
5)模型评价和验证部分:描述训练集以及验证集的C指数,ROC曲线,AUC值,校准曲线,DCA曲线等
6)如果与旧模型或者旧指标比较的话,还要描述与什么模型比较了,比较结果怎么样(C指数,IDI,NRI,校准曲线,DCA曲线)等指标
7)进行了危险风层的话,描述一下怎么划分的以及危险风层的结果,比如多少分是高风险,多少是低风险等等
6.Discussion
1)对自己研究的总结,比如疾病的背景,结局变量预测的重要性,然后我们构建了一个模型,纳入了什么,具有较好的预测价值
2)对于纳入变量逐个进行阐述,既往的研究的阐述,我们研究的发现等等
3)阐述一下自己构建的模型能提供怎样的临床指导意义,对于临床决策等方面的作用
4)自己文章的不足之处以及优点(不足比如是单中心的,不是多中心的;是回顾性研究,需要更多的前瞻性研究;样本量不大,需要更大的样本量;没有外部验证,需要进行外部验证;有些重要的变量因为某些原因没有纳入,基本也是套话)
7.Conclusion
对自己研究结果总结一下
8.后面一般就是一些投稿的申明了,什么data availability statement,conflict of interest,author contribution,acknowledgement,funding等等
9.References 参考文献
来源:木天sy 木天琳neuron
|
|