国际肝病 发表时间:2026/6/17 20:52:10 浏览量:112
编者按:临床研究的设计与统计分析质量,直接影响研究结论的可靠性和临床指南的制定。在“2026年世界华人医师协会肝脏病学专业委员会病理专题会暨第十届病理大师班”上,英国利物浦热带医学学院生物统计学教授、《柳叶刀》(The Lancet)期刊统计顾问王多劳教授分享了肝脏疾病中不同类型的临床研究及其统计学要点。《国际肝病》特邀王多劳教授,围绕临床研究中最常见的统计学缺陷、真实世界研究与随机对照试验的本质区别以及竞争风险数据的处理方法展开深度对话。
《国际肝病》
作为《柳叶刀》期刊的统计顾问,您在审稿过程中发现肝脏疾病领域的临床研究在统计学设计上最常见的缺陷或不足有哪些?能否给中国的临床研究者一些建议?
王多劳教授:我作为统计评审与《柳叶刀》合作已约有25年,评审过众多文章。我想列举统计学常见的三方面错误。
第一个方面是统计方法或模型选择的错误。 任何统计模型或统计方法的使用都有一定的条件或假定(assumption)。如果条件不满足,即使算出结果也没有意义。例如,做一个简单的t检验(t-test),它必须符合三个基本条件:正态性(normality)、方差齐性(homogeneity of variance)和样本独立性(independence)。任何一个条件不满足,算出的结果都是毫无意义的。所以在使用统计方法之前,一定要先了解数据的分布特征,根据数据分布选择合适的统计方法,而不是看到数据就直接套用方法。
第二个方面是对统计结果解读的问题。 很多人把统计显著性(statistical significance)解读为临床显著性(clinical significance),这是两个完全不同的概念。统计显著性往往可以通过增加样本量来达到,而临床显著性则不然。例如,某种药物降低体重,如果降低0.5公斤,只要增加样本量,结果在统计上会有显著性;但从临床角度看,用了半年或一年时间只降0.5公斤,临床意义并不大。
第三个方面是统计计算错误。 例如计算95%置信区间(confidence interval,CI)时,明显需要进行验算。如果95%置信区间包含0,那么P值(p-value)肯定大于0.05;如果不包含0,P值小于0.05。这是互为矛盾的判断。
《国际肝病》
随着真实世界研究(RWS)和注册登记研究在肝脏疾病领域的兴起,您认为这些研究类型与传统随机对照试验(RCT)在统计学方法上最主要的区别是什么?研究者应如何避免常见的方法学偏倚?
王多劳教授:我在本次会议上的演讲中介绍了不同的研究类型及其提供的医学证据质量。随机对照试验(randomized controlled trial,RCT)提供的医学证据级别最高,这也是为什么多数医学指南的制定都基于RCT的结果。其次是队列研究(cohort study)、病例对照研究(case-control study)、横断面研究(cross-sectional study)和病例报告(case report)。对于编辑来说,从研究设计阶段就已经对文章进行了归类。如果看《新英格兰医学杂志》和《柳叶刀》,每期发表的原创文章多数都是RCT研究。所以RCT永远是提供证据级别最高的研究方法。
近几年大家都在做所谓真实世界研究(real-world study,RWS),其实真实世界研究本质上就是一个队列研究或注册研究。既然是注册研究,它与RCT最本质的区别就是没有随机化(randomization)——随机化是RCT的灵魂。对于队列研究或其他观察性研究(observational study),如果要进行两组比较(比如一组用药、一组未用药),我们无法保证两组之间的均衡性(balance),比如平均年龄可能不一样,女性比例可能也不一样。这些都是影响结局指标的重要混杂因素(confounder)。所以,没有随机化是观察性研究(包括真实世界研究)与RCT最本质的区别。
2019年,《柳叶刀》发表了一篇题为“真实世界研究不能替代RCT来确立疗效”(Real-world studies no substitute for RCTs in establishing efficacy)的文章。其核心观点是,不要误以为真实世界研究作为一种新方法,能够替代RCT,实际并非如此。它本质上依旧属于观察性研究、队列研究。既然是队列研究,其关键局限性就在于无法有效控制混杂因素。
《国际肝病》
肝脏疾病(尤其是肝硬化和肝癌)的临床研究常面临竞争风险事件(如肝移植、肝相关死亡与非肝相关死亡)的问题。您在处理竞争风险数据方面有哪些建议?哪些统计方法更适合这类数据?
王多劳教授:在肝脏病研究中,我们常使用复合终点(composite endpoint)指标,例如死亡或肝移植。那么什么是竞争风险(competing risk)呢?如果我们关注的是肝移植这一终点,但患者在观察期内可能死亡。如果我们简单地把死亡当作删失(censoring)处理,一定会引起偏倚(bias),因为死亡与我们感兴趣的移植终点是互为竞争的关系,而不能简单地将其剔除——剔除是常规做法,但可能引起偏倚。
那么应该怎么办?统计上有竞争风险模型(competing risk model)可以处理这类数据。我们可以用统计上的一些模型,例如竞争风险的Cox模型(competing risk Cox model)等,来处理这类互为竞争的事件。
近年来,我们在方法学上做了一些工作,赢率(Win ratio)方法就是一个比较新的统计方法,专门用于处理复合结局指标的统计分析。具体做法是:将死亡和移植等结局指标按临床重要性进行分层(hierarchical)——先比较死亡,再比较移植,形成所谓分层式复合终点分析法。如果还有其他生物化学指标或生活质量评分,也按照先重要后次要的顺序进行排序比较。这个方法提出后,《新英格兰医学杂志》和《柳叶刀》上已经发表了一些应用该方法的文章。Win ratio方法也可以用来分析肝脏病研究中的复合结局指标。
王多劳 教授
英国利物浦热带医学学院
统计学博士,现任英国利物浦热带医学学院生物统计学教授、生物统计室主任,Journal of Biopharmaceutical Statistics 编辑及 The Lancet 统计学顾问。其研究主要聚焦于临床试验及观察性研究的设计、分析与报告,兼顾方法学创新与跨学科应用合作。
迄今已在SCI期刊发表论文450余篇,其中包括多篇发表于国际顶级医学期刊,如 New England Journal of Medicine(11篇)、The Lancet(11篇)、JAMA(11篇)、BMJ(2篇)及 Nature Medicine(1篇)。研究领域涵盖慢性病、传染病、精神健康及妇幼健康等多个方向。其研究成果累计被引用超过50,000次,H-index 为87。
在统计方法学研究方面,围绕大数据分析、机器学习、数据挖掘、贝叶斯分析、多水平模型、非参数回归及计算机模拟等方向发表论文30余篇。其提出的 Win Ratio 统计分析方法已被 New England Journal of Medicine、The Lancet、JAMA、BMJ 等权威医学期刊中的多项研究广泛应用。
此外,合著统计学教材 Clinical Trials: A Practical Guide to Design, Analysis, and Reporting,该书已被欧美多所高校选为研究生教材,并在国际临床研究领域得到广泛应用。
(来源:《国际肝病》编辑部)
声明:本文仅供医疗卫生专业人士了解最新医药资讯参考使用,不代表本平台观点。该信息不能以任何方式取代专业的医疗指导,也不应被视为诊疗建议,如果该信息被用于资讯以外的目的,本站及作者不承担相关责任。