侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

辟謠:新型冠狀病毒死亡數(shù)據(jù)是根據(jù)公式造假?

從1月23日武漢開始封城以來,已經(jīng)歷時(shí)半個(gè)多月。目前,沿海各大城市返工也基本結(jié)束,但疫情的控制情況似乎與預(yù)期仍有一些差距,并沒有完全受到遏制,每日確診病例和疑似病例仍在大幅增加,新增的勢(shì)頭也是一波三折,沒有實(shí)現(xiàn)持續(xù)的下降。

民眾受經(jīng)濟(jì)停滯的影響,也越來越產(chǎn)生焦慮的心態(tài)。在這種焦慮的心態(tài)的作用下,一些無中生有看似合理的質(zhì)疑也就慢慢浮現(xiàn)在人們的視野之中。近期,就有一些略知統(tǒng)計(jì)學(xué)基本原理的人運(yùn)用excel整理了一下從封城之后的每日統(tǒng)計(jì)新型冠狀病毒感染者死亡數(shù)據(jù),然后得出結(jié)論:每日的死亡人數(shù)非常準(zhǔn)地吻合一個(gè)多項(xiàng)式公式,這幾乎不太可能是一個(gè)自然現(xiàn)象。于是陰謀論又來了:官方是用一個(gè)不至于造成人們心理恐慌的公式,每天算出應(yīng)該公布的死亡人數(shù)進(jìn)行公布

我來給大家演示一下這個(gè)分析:

首先在excel或wps里面輸入從23號(hào)以來的每天公布的新型冠狀病毒感染者死亡人數(shù)。

然后依次編上序號(hào)。

選中某一個(gè)時(shí)間段的序號(hào)和死亡人數(shù),選擇插入散點(diǎn)圖(X,Y),在“圖表元素”中勾中“趨勢(shì)圖”并再勾中“多項(xiàng)式”“顯示公式”“顯示R平方值”,就可以得出一個(gè)擬合的曲線多項(xiàng)式和R平方值。R平方值代表這些統(tǒng)計(jì)的散點(diǎn)和擬合的曲線吻合度有多高,這個(gè)數(shù)值越大越好,但不能超過1。

比如如果我們把1月24日到2月5日的數(shù)據(jù)進(jìn)行擬合,得出的R平方值為0.9998。

再用這個(gè)公式去推算2月6日和2月7日的死亡人數(shù),你還會(huì)驚奇地發(fā)現(xiàn),和實(shí)際的數(shù)據(jù)誤差不超過4人!

由于大多數(shù)人在生活中也不會(huì)用到統(tǒng)計(jì)學(xué),因此即使是高中學(xué)過統(tǒng)計(jì)學(xué)的基礎(chǔ),基本上畢業(yè)以后大家也都還給老師了。一看到有人居然能用公式來預(yù)測(cè)每天的死亡人數(shù),也就將信將疑地認(rèn)可了這種說法。

那么,事實(shí)上官方公布的死亡數(shù)字真的是用公式計(jì)算造假的嗎?

其實(shí),用統(tǒng)計(jì)學(xué)質(zhì)疑官方數(shù)據(jù)造假早就不是什么新鮮的事了。在微博上搜索“淘寶雙11騙局”你也能找到一位名叫“尹立慶”的博主通過同樣的方式分析歷年天貓雙十一的銷售額數(shù)據(jù),得出一個(gè)公式,和現(xiàn)實(shí)數(shù)據(jù)擬合度高達(dá)99.94%,也引起了眾多網(wǎng)友質(zhì)疑淘寶數(shù)據(jù)造假的熱點(diǎn)。

在解釋這個(gè)問題時(shí),我們先要理解一個(gè)現(xiàn)象:多項(xiàng)式函數(shù)的擬合度接近1是小概率事件嗎?

在數(shù)學(xué)上,關(guān)于擬合度的定義:

R的平方值= SSR / SST = 1 - SSE / SST

SSR叫歸平方和(Sum of Squares for Regression),它的定義是每一點(diǎn)的擬合值與平均值的差值的平方和;SSE叫殘差平方和(Sum of Squares for Error),它的定義是每一點(diǎn)的真實(shí)值與擬合值的差值的平方和;SST叫總離差平方和(Sum of Squares for Total),它的定義是每一點(diǎn)的真實(shí)值與平均值的差值的平方和,同時(shí)SST=SSE + SSR。如果一組數(shù)據(jù)有n個(gè)點(diǎn),那么我們就有n個(gè)真實(shí)值和n個(gè)擬合值,而平均值總是只有一個(gè)。所以只要這組數(shù)據(jù)不是太畸形,那么在每一個(gè)點(diǎn)上,真實(shí)值跟擬合值的差別都可以做到比較小。這些差別的平方和就是殘差平方和SSE,顯然它比總離差平方和SST小得多,因此 1 - SSE / SST自然也就非常接近于1,不接近才不正常。

其次,一個(gè)病毒疫情死亡人數(shù)符合一個(gè)多項(xiàng)式函數(shù)屬于非自然現(xiàn)象嗎?

這個(gè)問題能夠成為一個(gè)讓大家感到意外的問題,只能說是我們大多數(shù)人的數(shù)學(xué)水平連高中數(shù)學(xué)教育水平都不如造成的結(jié)果,事實(shí)上生活中太多的現(xiàn)象可以用數(shù)學(xué)來“預(yù)測(cè)”了。如果讀者更有興趣,也可以去找來中國、美國的GDP歷年數(shù)據(jù),通過同樣的方式來進(jìn)行擬合,你也會(huì)發(fā)現(xiàn)原來不僅社會(huì)主義的國家經(jīng)濟(jì)數(shù)據(jù)可能“造假”,資本主義國家的經(jīng)濟(jì)數(shù)據(jù)也是可以“神預(yù)測(cè)”的。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點(diǎn)?帽菊靖寮,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)