撰文 | 蔡维嘉(医学病毒学方向博士)
这两天,就在全国人民为新型冠状病毒肺炎的传播而揪心时,有两篇来自英国大学的流行病学预测论文给大家的心上又压上了两块大石头。
一篇来自Lancaster大学【1】,一篇来自伦敦帝国学院【2】。他们运用两种不同的方法分别预测新型病毒的感染人数,但两个结果都是远远高出了中国政府的披露值。这一方面让人怀疑是不是各个地方政府存在大量的瞒报现象,另一方面让人质疑现在的封锁措施还有作用吗?这两篇文章又通过各种途径影响到国内舆论,这进一步加剧了公众对政府的不信任和恐慌。
但是,值得商榷的是:他们的结果是否可信?
我们来看看这篇来自Lancaster大学预言近两周后超19万的文章【1】,(以下简称文章一)里面就说了:
文章中他们自己也认为 “我们自己也知道自己不靠谱,别乱用我们的结果!”
关于数学模型:如何获得R0值
数学模型预测看起来是很高大上的东西,其实本质上跟我们在初中物理学习中遇到的问题差不多。比如说从高塔上丢一个铁球,问过几秒后速度是多少?这其实就是一个典型的数学模型预测问题。简单来说,我们可以忽略掉空气阻力,那就是用公式v=gt。把g值和t值分别代入公式进行计算,我们就可以预测过几秒后速度是多少。
但是,真实的世界不会这么简单的,即使是在初中物理的世界里。比如有的题目里会有赤道和极地的g值差别,有的题目里会有一个初速度,有的题目里高塔不够高,5秒的时候铁球就落地停止了,题目里非要问你6秒的速度是多少?总之一切都得根据实际情况(题目)进行调整。
破除了数学模型高大上的迷信,我们就来看看他们的文章有没有问题。
比较低级的问题出现在文章一中。作者在学术预印本网站medRxiv上放出了他们的论文【1】,他们论文的核心数据是一个被称作R0的参数。它又被称为基本传染数,表示一个病人平均可以传染几个新病人。你可以把它想象成上面物理公式里面的重力加速度g。但是这样一个重要的参数,他们是怎么得出来的呢?作者告诉我们是估算出来的:
可是我翻遍了整篇文章,没有找到作者是怎么算出这个R0的。他们甚至没有放上所有的估算过程,只放上了结果。
国外科学家们也纷纷表示迷惑,篇幅所限,放上一个典型例子:
这位留言的兄弟最后表示我不愿意称这个为研究。。。
特别的是:世界卫生组织WHO在1月23日的发布会【3】表示:
划重点:WHO估计R0在1.4到2.5之间。不是说WHO就一定正确,但是你是愿意相信WHO还是这样一篇文章?还有,如果隔离管控得力,患者感染不到其它人,反映到模型里R0自然就降下来了。把如此夸大的一个R0,代入到一个类似于指数扩增的模型里计算,自然得到一个大得可怕的结果。
另外一个重要的问题是他们传染病的数学模型用的是SEIR模型。但是这个模型有一个重要的前提就是染病个体的传染能力没有显著差别。问题是冠状病毒根据SARS的经验并不是传统的传染病,而是存在着超级传播者(super-spreader events)的传染病。有的患者一个人可能传十几个人,有的患者连亲密接触者都不传播。武汉这次的早期病例里也是这样,海鲜城商户患者基本上不传染亲属,可一个在协和做外科手术的病人把医生护士感染了十四个。这使得这类模型不准确,估算变得相当困难。你可以想象成上面的物理公式里丢出的不是一个实心铁球,而是一架纸飞机,而且这纸飞机飞得很不平稳,滑翔一阵子突然一个俯冲,然后又一个滑翔。你再想用v=gt来预测它的速度不管用什么g值都不可能精准。
有趣的是文章一的作者们知道自己的问题所在,他们却仍然用假定人传人能力基本一致来预测。
事实上,针对超级传播者和其它的现实问题,大家也有很多方法改进SEIR模型,但是这些作者一概不用。总之,在Lancaster 大学的这篇文章中,模型的假定错误,估算的重要参数R0不准,最后预测出什么样离谱的数值我都不奇怪。国内的硕士论文给SARS传播建模【4】,虽然也是用的类似模型会导致问题,好歹参数也会尽量选得更准一点不是么?
取样的标准,样本决定预测
第二篇来自伦敦帝国学院的文章(以下称文章二)【2】就在模型上有所创新了。他们的方法相当于是有个口袋,里面有一千多万个小球,里面有白球和红球两种球。抓一把有几百个球,里面发现1个红球,再摸一把几百个发现全白球没有红球,再摸一把几百个球里有2个红球,从而估算这袋子里有几个红球。的确是有一些道理的。
但是这个方法里隐含着一个重要的逻辑前提:白球和红球在袋子里的分布都是比较均匀的。刚才提到了超级传播者这个概念,这就会导致红球(病人)在空间上围绕超级传播者的行进路线出现一定的聚集。假如抓的几把都是只在袋子里一个红球比较多的小区域里抓来抓去,自然就估得偏高了。作者估算的数据来源全部都是从武汉国际机场飞出国的航班和乘客,只要有一个超级传播者曾经往那里走一趟,马上就能造成所有结果严重偏高。
此外,这个方法是抓得越多估得就越准。可是武汉封城后没有后续航班了所以作者只能基于前期的少量数据作估计,所以估算值的不确定范围也很大。作者倒是在文章中把这些不确定因素都坦诚的说出来了,的确是在比较认真的作学术。
鉴别、传播
目前看来大众和媒体更愿意只传播他们的估测数值,没几个人管他们是怎么算出来的?数据可靠不?更有趣的是伦敦帝国学院这样一篇(文章二)比较严谨的估算文章因为估的数值没有Lancaster大学文章(文章一)高,就没有它那么吸引眼球。海外一些媒体比如美国之音就不用说了,人家是“有态度”的,选择性传播文章一。
就连同样是中国自己的学术公众号上,差别也很明显。至北京时间1月26日12:45,阅读都是10万+无从区分,转载第一篇的在看是2496也是明显高于第二篇的1770。尽管两个公众号本身的影响力可能是反过来。前一段时间有个德国华人经济学家用一个比文章一还要不准确的SIR模型估的感染人数也是吓死人的高,影响力也是杠杠的。
在本文的写作过程中,bioRxiv又发表了两篇模型预测论文【5,6】,其中他们用各种不同的方式预测分别得到了不同的并且较低的病毒感染数值。这里我要强调的是:实践是检验真理的唯一标准,任何模型都有缺陷,它们的预测结果只能作为参考。要是拿着一个模型的预测值就去怀疑政府瞒报,去恐慌,那就是削自己的足去适别人的履,简称被卖拐。
基于多年的学术经历,我一向是不惮于以最坏的恶意去揣测某些专家的。多年的海外经历也让我看到了有些人确实就是唯恐中国不乱,生怕他们自己吃不到人血馒头。目前大家的情绪都很紧张,再用这样有误导性的预测结果去刺激,无论是加剧不信任还是加剧恐慌都对抗击疫情没有半点好处。加上它们又有学术背景,更能迷惑人,你还不能说它们是谣言来封禁。毕竟人家举着学术自由的大旗,号称只是学术讨论!要是决策受这些不靠谱的预测影响,悲观失望,放弃对抗SARS曾行之有效的封锁隔离措施,那更是罪莫大焉!我的同学们和前同事们现在大多在夜以继日的工作,投身于对抗病毒的斗争中,没有时间跟他们开展“学术讨论”。希望我也能用此文为这场斗争尽一些我的微薄贡献。
本文作者蔡维嘉毕业于武汉大学生命科学学院获医学病毒学方向的博士学位,现在从事癌症研究工作。文章的写作得到了微信公众号西雅图雷尼尔Rainer的大力帮助和最后审阅,文章中袋子红白球的比喻是他的原创。非常感谢!
参考文献
1. Jonathan MR et al. Novel coronavirus 2019-nCoV: early estimation of epidemiological parameters and epidemic predictions. medrxiv.1.24.2020. doi.org/10.1101/2020.01.23.20018549
2. Imai N, et al. Estimating the potential total number of novel Coronavirus cases in Wuhan City, China. Imperial College. https://www.imperial.ac.uk/media/imperial-college/medicine/sph/ide/gida-fellowships/2019-nCoV-outbreak-report-22-01-2020.pdf https://www.imperial.ac.uk/media/imperial-college/medicine/sph/ide/gida-fellowships/2019-nCoV-outbreak-report-22-01-2020.pdf
3. Mission summary: WHO Field Visit to Wuhan, China 20-21 January 2020. https://www.who.int/china/news/detail/22-01-2020-field-visit-wuhan-china-jan-2020
4. 徐宝春 基于SIR模型的SARS传染病研究http://cdmd.cnki.com.cn/Article/CDMD-10422-1019081450.htm
5. Chen Z, et al. From SARS-CoV to Wuhan 2019-nCoV Outbreak: Similarity of Early Epidemic and Prediction of Future Trend.https://www.biorxiv.org/content/10.1101/2020.01.24.919241v2
6. Shen M, et al.Modelling the epidemic trend of the 2019 novel coronavirus outbreak in China.https://www.biorxiv.org/content/10.1101/2020.01.23.916726v1
本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.sosokankan.com/article/2372426.html