欧美精品亚洲精品日韩专,姐姐韩剧在线播放免费全集

實(shí)現(xiàn)AGI道路上，數(shù)據(jù)科學(xué)家防不勝防的9大陷阱

2019-08-01 09:49

最近幾個(gè)月，科技研發(fā)的速度也越來(lái)越快。微軟宣布將投資10億美元，與科研實(shí)驗(yàn)室OpenAI聯(lián)手打造通用人工智能（AGI），也就是人工智能的最高目標(biāo)。OpenAI的首席執(zhí)行官Sam Altman表示，AGI將成為人類歷史上最重要的技術(shù)。

對(duì)于某些特定的任務(wù)，計(jì)算機(jī)能做得比人類好很多。但他們不具備智慧、常識(shí)和批判性思維，因此它們無(wú)法像人類那樣去應(yīng)對(duì)一些特殊情況（比如一些未定義的情形、模糊的規(guī)則、模棱兩可甚至自相矛盾的要求）。隨著技術(shù)的發(fā)展，計(jì)算機(jī)也許能做到人類大腦能夠完成的任何事情，但之前微軟的表現(xiàn)并不讓人滿意。

2016年，微軟發(fā)布了聊天機(jī)器人Tay，這家公司稱“它能與人類在線交流，語(yǔ)言隨和風(fēng)趣”。Tay的編程語(yǔ)言讓它表現(xiàn)得像一位千禧一代的女性，在學(xué)習(xí)訓(xùn)練過(guò)程中，它就是在模仿千禧一代的講話方式。微軟表示，“你和Tay聊得越久，那么它就會(huì)越聰明。”在不到一天的時(shí)間里，Tay發(fā)送了9．6萬(wàn)條推特，擁有超過(guò)5萬(wàn)名關(guān)注者。但這個(gè)問(wèn)題最終出在Tay自己身上，它講的內(nèi)容越來(lái)越令人厭惡。“元首是對(duì)的，我討厭猶太人�！薄�911事件是有內(nèi)幕的。”“我非常討厭那些女權(quán)主義者�！盩ay非常善于利用它接收到的詞匯和詞組，但它無(wú)法根據(jù)語(yǔ)境來(lái)說(shuō)話，也不理解自己發(fā)送的推特到底是什么意思。因此微軟在16個(gè)小時(shí)后就關(guān)閉了Tay，但不到一周，它又重新上線。后來(lái)微軟稱第二次上線是個(gè)意外，并再次關(guān)閉了Tay。

AGI也許是一個(gè)美好的夢(mèng)想，而數(shù)據(jù)科學(xué)讓我們有機(jī)會(huì)去利用大數(shù)據(jù)和強(qiáng)大的計(jì)算機(jī)，作出基于現(xiàn)實(shí)而非空想或偏見的決策。但不幸的是，在數(shù)據(jù)大規(guī)模出現(xiàn)之后，企業(yè)和政府仍然在重復(fù)之前犯過(guò)的一些錯(cuò)誤，而且重復(fù)的速度更快。將重要的決策交給機(jī)器，只是實(shí)現(xiàn)了“犯錯(cuò)的自動(dòng)化”。

數(shù)據(jù)科學(xué)不僅僅是數(shù)學(xué)證明、統(tǒng)計(jì)計(jì)算和計(jì)算機(jī)編程。真實(shí)的人類智能也必不可少：比如實(shí)驗(yàn)設(shè)計(jì)、智慧、常識(shí)、懷疑和批判思維等。數(shù)據(jù)科學(xué)家并不是要成為一臺(tái)機(jī)器，不斷地嘗試新模式，不斷地進(jìn)行曲線擬合；他們更應(yīng)該成為一位科學(xué)家。

如果數(shù)據(jù)科學(xué)家想要充分挖掘數(shù)據(jù)科學(xué)的潛力，他們應(yīng)該避免以下九種常見的錯(cuò)誤。

1．使用劣質(zhì)的數(shù)據(jù)

第一代機(jī)械計(jì)算機(jī)的投資者Charles Babbage曾被國(guó)會(huì)成員兩次提問(wèn)：“Babbage先生，如果我們給計(jì)算機(jī)輸入錯(cuò)誤的數(shù)據(jù)，那么它會(huì)得到正確的答案嗎？”顯然優(yōu)質(zhì)的數(shù)據(jù)必不可少，而非可有可無(wú)。

芝加哥醫(yī)院對(duì)一批膿毒癥患者進(jìn)行過(guò)一次研究，它發(fā)現(xiàn)，血液pH值較低的患者在出院后，重新回醫(yī)院治療的可能性更低。兩者的相關(guān)系數(shù)達(dá)到了0．96。但是這些數(shù)據(jù)還包含了一些在住院期間死去的患者，也就是說(shuō)這些患者通過(guò)太平間離開了醫(yī)院，是絕對(duì)不可能回來(lái)重新治療的。最后將這些死者的數(shù)據(jù)去掉，就會(huì)發(fā)現(xiàn)血液pH值較低的患者反而是更加危險(xiǎn)的。

2．將數(shù)據(jù)的地位放在理論之上

一些數(shù)據(jù)科學(xué)家在沒(méi)有理論和常識(shí)的指導(dǎo)下，為了模型搜索大量數(shù)據(jù)。他們認(rèn)為對(duì)于一個(gè)問(wèn)題的定向思維會(huì)影響新的發(fā)現(xiàn)。然而不幸的是，大多數(shù)時(shí)候泛濫的數(shù)據(jù)都是沒(méi)什么意義的。大數(shù)據(jù)領(lǐng)域的一個(gè)悖論就是，我們?yōu)橐粋€(gè)模型輸入的數(shù)據(jù)越多，最后發(fā)現(xiàn)它無(wú)用或錯(cuò)誤的可能性越大。

一位互聯(lián)網(wǎng)營(yíng)銷人員在大約100個(gè)國(guó)家測(cè)試過(guò)三種可選的登錄頁(yè)面顏色（黃色、紅色和藍(lán)綠色）與它傳統(tǒng)的藍(lán)色之間的對(duì)比，從理論上講，他應(yīng)該會(huì)發(fā)現(xiàn)某些國(guó)家采用特定的顏色，會(huì)帶來(lái)更高的收入。比如他認(rèn)為英格蘭更喜歡藍(lán)綠色，但實(shí)際上并不是。

3．盲目崇拜數(shù)學(xué)

數(shù)學(xué)家熱愛數(shù)學(xué)，非數(shù)學(xué)專業(yè)的人懼怕數(shù)學(xué)。這兩者的組合可能會(huì)催生大量不切實(shí)際的模型。

在經(jīng)濟(jì)大蕭條時(shí)期，由于假定違約事件的發(fā)生是獨(dú)立分布的，許多按揭貸款違約的數(shù)學(xué)模型都失效了。這些人低估了極端事件的可能性，同時(shí)也沒(méi)有考慮在經(jīng)濟(jì)大蕭條的背景下，無(wú)法按期償還貸款的可能性本身就更高。

4．盲目崇拜計(jì)算機(jī)

常常有人認(rèn)為，計(jì)算機(jī)做某些事情做得很好，所以它們一定有非常高的智能，但要知道適用于特定任務(wù)和普遍適用多項(xiàng)任務(wù)之間還有很大的差別（甚至這些任務(wù)還可能完全不一樣）。我們對(duì)計(jì)算機(jī)的依賴并非百利而無(wú)一害。如果認(rèn)為計(jì)算機(jī)比我們更聰明，從而將所有決策交給計(jì)算機(jī)，可能會(huì)帶來(lái)災(zāi)難性的后果。

5．反復(fù)搗騰數(shù)據(jù)

為了尋找數(shù)據(jù)之間的隱藏關(guān)系，有些人會(huì)把數(shù)據(jù)按照多種方式進(jìn)行分類。諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主羅納德·科斯就說(shuō)過(guò)：“如果你不停地操作一些數(shù)據(jù)，機(jī)器自己都會(huì)糊涂�！钡髷�(shù)據(jù)和強(qiáng)大的計(jì)算機(jī)卻助長(zhǎng)了這種行為。

一位著名研究員曾在他的助手分析數(shù)據(jù)時(shí)，告訴后者“盡可能多地從數(shù)據(jù)中榨取信息”。當(dāng)時(shí)他的助手試圖通過(guò)機(jī)器視覺(jué)將一間意大利自助餐廳的客人分為“男性、女性、吃中飯的、吃晚飯的、單獨(dú)吃飯的、兩人吃飯的、兩人以上一起吃飯的、點(diǎn)了酒精飲料的、點(diǎn)了軟飲料的”等。最后這些“榨取的信息”變成了四篇“披薩論文”，其中最著名的一篇稱“男性在女性一起吃飯時(shí)，會(huì)多吃93％的披薩”。如今他的十幾篇論文都被退回，人也被大學(xué)辭退。

6．自我欺騙

諾貝爾物理學(xué)獎(jiǎng)得主理查德·費(fèi)曼曾向科學(xué)家們提出過(guò)一條建議：“首要原則就是不要欺騙你自己——因?yàn)槟阕约菏亲钊菀妆缓摹！闭嬲目茖W(xué)家是分享自己的理論、質(zhì)疑自己的假設(shè)，然后尋找機(jī)會(huì)做實(shí)驗(yàn)來(lái)驗(yàn)證或推翻假設(shè)。而擺弄數(shù)據(jù)的人只會(huì)看到自己想看的東西。

曾有一份研究要求一所高校的學(xué)生預(yù)測(cè)自己的數(shù)學(xué)測(cè)驗(yàn)成績(jī)。結(jié)果預(yù)測(cè)的平均分?jǐn)?shù)比實(shí)際分?jǐn)?shù)要高，但兩組數(shù)據(jù)之間的相關(guān)系數(shù)高達(dá)0．70。因此作者得出兩條結(jié)論。第一，這些學(xué)生高估了自己的能力。第二，為提高學(xué)生的自信心，打分可以適當(dāng)高一些。對(duì)于第一條，可能是學(xué)生低估了測(cè)驗(yàn)的難度。對(duì)于第二條，較高的相關(guān)系數(shù)表明學(xué)生其實(shí)對(duì)自己的數(shù)學(xué)水平很有信心，少數(shù)認(rèn)為自己考不好的，也只是不太熟悉材料。他們并不是太過(guò)于悲觀，而是非�，F(xiàn)實(shí)。

7．把相關(guān)性當(dāng)作誘因

不論被告知多少遍“存在相關(guān)性并不一定是誘因”，但研究人員總是會(huì)不自覺(jué)地忽略這條重要的建議。

2011年，谷歌創(chuàng)建了一個(gè)人工智能項(xiàng)目Google Flu，它用搜索請(qǐng)求來(lái)預(yù)測(cè)流感的爆發(fā)。當(dāng)時(shí)他們夸下�？冢骸拔覀兡芫珳�(zhǔn)地預(yù)測(cè)出美國(guó)各個(gè)地區(qū)未來(lái)一周的傳染狀況，每天更新一次�！彼麄兎Q模型的精準(zhǔn)度已經(jīng)達(dá)到97．5％，也就是模型預(yù)測(cè)結(jié)果和實(shí)際流感案例的相關(guān)系數(shù)已達(dá)到0．975。谷歌是怎么做到的呢？它的數(shù)據(jù)挖掘項(xiàng)目瀏覽了5000萬(wàn)條搜索請(qǐng)求，并確定了其中45條請(qǐng)求最有可能和流感相關(guān)。由于流感的爆發(fā)具有高度的季節(jié)性，Google Flue更像是一個(gè)季節(jié)檢測(cè)器，它會(huì)挑選季候性的搜索詞匯（如圣誕節(jié)、寒假和情人節(jié)等）。當(dāng)離開了歷史數(shù)據(jù)，開始真刀真槍地預(yù)測(cè)時(shí)，Google Flu的準(zhǔn)確率就大大地下降。在發(fā)布報(bào)告后，Google Flu誤報(bào)了未來(lái)108周內(nèi)的100起流感案例。從此，Google Flu再也不去預(yù)測(cè)流感了。

8．不要對(duì)平均值的回歸過(guò)于驚訝

當(dāng)數(shù)據(jù)波動(dòng)時(shí)，預(yù)測(cè)值可能會(huì)高于檢測(cè)值，但隨后就會(huì)繼續(xù)趨于平均值。比如一位高爾夫選手贏了大師錦標(biāo)賽冠軍，不代表下一次他也能贏。并不是說(shuō)他下次會(huì)倒霉，或者技術(shù)會(huì)退步，也許這次勝利本來(lái)就是超水平發(fā)揮。

數(shù)據(jù)也會(huì)在未來(lái)回歸平均值，這有點(diǎn)類似于防止一次“發(fā)揮失�；虺０l(fā)揮”。例如一家數(shù)據(jù)科學(xué)公司做過(guò)一個(gè)實(shí)驗(yàn)，它將一位客戶的網(wǎng)頁(yè)布局和100多萬(wàn)域名中20個(gè)常用的布局進(jìn)行比較�？蛻魝兘�(jīng)常會(huì)抱怨自己的網(wǎng)站表現(xiàn)不佳，認(rèn)為網(wǎng)站本來(lái)還能賺更多的廣告營(yíng)收。因此它給一位數(shù)據(jù)分析師一系列網(wǎng)站域名，這些網(wǎng)站在過(guò)去三個(gè)月的營(yíng)收都在下降，分析師可以根據(jù)它來(lái)調(diào)整網(wǎng)頁(yè)布局，看看能否提高營(yíng)收。結(jié)果他成功了，第二天的營(yíng)收數(shù)額上漲了20％，當(dāng)時(shí)他就仿佛一位萬(wàn)眾矚目的搖滾歌手。但直到某一天他太忙了，來(lái)不及做任何改變，營(yíng)收就開始下降。所以這些網(wǎng)站仍然屬于那些表現(xiàn)不佳的一類，他們的營(yíng)收最終會(huì)回歸平均值。

9．不要傷害用戶

不幸的是，在大數(shù)據(jù)時(shí)代，企業(yè)和政府為了預(yù)測(cè)和影響我們的行為，都在時(shí)時(shí)刻刻搜集我們的數(shù)據(jù)。優(yōu)秀的數(shù)據(jù)科學(xué)家會(huì)很謹(jǐn)慎地處理這個(gè)過(guò)程，充分尊重我們的權(quán)利和隱私。數(shù)據(jù)科學(xué)的黃金法則：對(duì)待別人就像對(duì)待你自己那樣。

一家互聯(lián)網(wǎng)約會(huì)網(wǎng)站做過(guò)三個(gè)實(shí)驗(yàn)。實(shí)驗(yàn)一，他們暫時(shí)移除了網(wǎng)站上所有的照片，結(jié)果發(fā)現(xiàn)很少有人愿意主動(dòng)發(fā)信息，這證明了愛情不是“盲目”的。實(shí)驗(yàn)二，他們隨機(jī)隱藏了人們的部分簡(jiǎn)介，結(jié)果發(fā)現(xiàn)對(duì)用戶的評(píng)價(jià)沒(méi)有太大影響，這證明了愛情是“不會(huì)仔細(xì)閱讀”的。實(shí)驗(yàn)三，他們對(duì)調(diào)了匹配程度評(píng)級(jí)，例如將最匹配的人貼上“最不匹配”的標(biāo)簽，反之亦然。第一和第二個(gè)實(shí)驗(yàn)對(duì)用戶沒(méi)有太大的傷害，但第三個(gè)就有問(wèn)題了。因?yàn)橛脩舨幌Ｍ约旱纳畋徊缓线m的人打擾。約會(huì)時(shí)遇到一個(gè)錯(cuò)誤的對(duì)象還只是痛苦一時(shí)，錯(cuò)過(guò)一個(gè)合適的對(duì)象可能會(huì)影響一生。

要避免這些陷阱，必須時(shí)刻留意。為了將數(shù)據(jù)融入科學(xué)，我們更應(yīng)該表現(xiàn)得像一位科學(xué)家，而非一臺(tái)機(jī)器。

本地收藏打印推薦給朋友

聲明： 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載，目的在于信息傳遞，并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)，如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的，請(qǐng)聯(lián)系我們。