訂閱
糾錯
加入自媒體

看IBM的AI辯論家項(xiàng)目(Project Debater)有多可怕

部署辯論家項(xiàng)目的基礎(chǔ)設(shè)施

為了保證項(xiàng)目進(jìn)展的彈性,“辯論家”有兩個同時運(yùn)行的完整運(yùn)行時基礎(chǔ)設(shè)施。

現(xiàn)場辯論系統(tǒng)使用了IBM云和以色列海法實(shí)驗(yàn)室中運(yùn)行的基礎(chǔ)設(shè)施的混合體;

備份實(shí)例完全部署在IBM云中。

IBM研究院的運(yùn)行時“辯論家”系統(tǒng)由以下部分組成:

主服務(wù)器是一個雙插槽的IBM/聯(lián)想系統(tǒng)System x3650 M5服務(wù)器。該服務(wù)器內(nèi)置兩個14核英特爾Xeon E5-2600 v4處理器和768 GB系統(tǒng)內(nèi)存。一個實(shí)例部署在本地,一個實(shí)例部署在IBM  Cloud的達(dá)拉斯數(shù)據(jù)中心。

一個Elasticsearch集群。該集群包含四臺裸機(jī),每臺機(jī)器具有64 GB內(nèi)存、12個內(nèi)核和兩個960 GB的SSD磁盤。該集群同樣部署了兩個實(shí)例,一個部署在達(dá)拉斯的IBM Cloud中,一個本地部署在以色列海法。

一個Cassandra數(shù)據(jù)庫集群。該集群包含四個Linux VM,每個VM具有32 GB內(nèi)存和4個內(nèi)核。該集群同樣部署了兩個實(shí)例:一個在達(dá)拉斯的IBM Cloud中,另一個本地部署在海法。

這些服務(wù)器使用IBM Cloud網(wǎng)絡(luò)基礎(chǔ)架構(gòu)以10 Gb/秒的速度聯(lián)網(wǎng)到一起。對于舊金山的現(xiàn)場辯論,IBM僅使用了10 Mb/秒的互聯(lián)網(wǎng)連接將其現(xiàn)場控制筆記本電腦連接到IBM Cloud和海法的IBM研究實(shí)驗(yàn)室。

IBM Watson基于商業(yè)云的語音到文本服務(wù)和文本到語音服務(wù)。使用IBM Cloud Kubernetes群集上的女性語音運(yùn)行文本到語音服務(wù)。

IBM Cloud上的Kubernetes集群上運(yùn)行了其他服務(wù),用于處理投票、事件流管理和后臺屏幕呈現(xiàn)。

IBM為“辯論家”項(xiàng)目的舞臺展示打造了一個自助服務(wù)終端,該中端只有兩個扁平的屏幕,用于顯示它的頭像。

IBM沒有在“辯論家”系統(tǒng)中使用GPU或者FPGA這些計(jì)算加速器。

IBM指出,“辯論家”項(xiàng)目的開發(fā)團(tuán)隊(duì)優(yōu)化了其運(yùn)行時模型,以滿足辯論對手開場演講和反駁發(fā)言時的一到兩分鐘的時間延遲。

令我們印象深刻的是,IBM的“辯論家”運(yùn)行時系統(tǒng)部署在舊的主流服務(wù)器上,卻依然表現(xiàn)良好。如果該系統(tǒng)使用當(dāng)今最先進(jìn)的服務(wù)器和存儲系統(tǒng)的話,它的尺寸可能會顯著降低,整個系統(tǒng)可能用6U機(jī)架高度就能部署完畢。

實(shí)時性挑戰(zhàn)

“辯論家”不是那種蹦出一句短句快速響應(yīng)的會話系統(tǒng)。它也沒有設(shè)計(jì)成那種開始時幾乎沒有任何背景信息、需要在對話運(yùn)行時構(gòu)建上下文的對話系統(tǒng),相反,每次辯論開始時,都已經(jīng)以“決議”的形式給出了背景。這種辯論性質(zhì)的會話由一系列短語和句子組成。“辯論家”要想?yún)⑴c活躍且響應(yīng)迅速的對話,它的響應(yīng)延遲應(yīng)該控制在一到兩秒的量級。

“辯論家”現(xiàn)在只注意捕捉對手的麥克風(fēng)信息,它并不會傾聽和觀察觀眾的反饋。在現(xiàn)場辯論中,人類辯手會觀察觀眾以評估觀眾對自己的論述的實(shí)時反映。請注意,是這些觀眾給辯手打分,辯手需要給這些觀眾留下深刻印象,而不是主持人。原則上,我們相信“辯論家”的繼任者會增加一個全新的模型集合,以在視覺上評估觀眾(點(diǎn)頭、無聊、興奮等)的反應(yīng),以及在聽覺上評估觀眾(拍手、喘氣、輕笑等)的反應(yīng)。但是,IBM最初并沒有規(guī)劃這一些,因?yàn)檗q論并不是IBM在商業(yè)上所關(guān)注的點(diǎn)。沒有人類觀眾參加的辯論賽寡淡無味,所以添加上這些反饋能力能夠使得“辯論家”在演講中改變論述的方向。此外,辯論家這一類的系統(tǒng)必須提前創(chuàng)建幾種論述備選,以根據(jù)觀眾的反應(yīng)動態(tài)地選擇。

對于通過智能手機(jī)、網(wǎng)絡(luò)攝像頭等進(jìn)行的群組發(fā)言和一對一聊天來說,解決掉觀察觀眾反應(yīng)問題將使得會話系統(tǒng)看起來更加人性化。21世紀(jì)AI的圖靈測試應(yīng)該更多地考慮人性化的影響。
拓展人類的知識

IBM的“辯論家”團(tuán)隊(duì)開發(fā)了20個基準(zhǔn)數(shù)據(jù)集,所有的數(shù)據(jù)集都根據(jù)Creative Commons License(CC BY-SA 3.0)或GNU免費(fèi)文檔許可(GFDL)發(fā)布,包括:
19,276對維基百科概念;

5000個注釋了情感的習(xí)語;

帶注釋的3,000個句子;

有關(guān)55個主題的2,394個標(biāo)簽聲明;

由專業(yè)辯手錄制的60篇關(guān)于爭議話題的演講。

IBM Research發(fā)表了32篇論文,描述了其在設(shè)計(jì)和訓(xùn)練Project Debater方面的大部分工作,IBM還在偏置檢測方面做了大量工作,包括檢測數(shù)據(jù)集中的偏差和檢測訓(xùn)練模型中的偏差。 它還發(fā)布了一些描述性的文本片段,這些內(nèi)容可以回溯到它的研究論文里面。

不過,分享研究論文和數(shù)據(jù)集是一回事,分享訓(xùn)練模型就是另外一回事了。如上所述,IBM研究院僅僅披露了其硬件的一些高層級的詳細(xì)信息,但是并沒有詳細(xì)介紹軟件框架、運(yùn)行時模型集合中部署的特定訓(xùn)練模型。IBM發(fā)布了訓(xùn)練數(shù)據(jù)集,但是并沒有公布特定模型的訓(xùn)練代碼,也沒有給出和其訓(xùn)練模型有關(guān)的任何權(quán)重數(shù)字。我們只能對其運(yùn)行時軟件架構(gòu)有一個粗略的了解。當(dāng)然,IBM已經(jīng)明確表示過,當(dāng)該技術(shù)商業(yè)化后將發(fā)布更多細(xì)節(jié)信息。

考慮到IBM正在通過其Crowd產(chǎn)品將“辯論家”技術(shù)商業(yè)化到其Speech服務(wù)中,所以它至今沒有給出關(guān)于模型訓(xùn)練的詳細(xì)信息也在情理之中。

這和OpenAI的套路實(shí)際上很相似。OpenAI也發(fā)布了不少博客和有據(jù)可查的論文,描述了帶有15億個參數(shù)的GPT-2“Transformer”模型背后的多任務(wù)學(xué)習(xí)算法,但是OpenAI也沒有發(fā)布數(shù)據(jù)集、訓(xùn)練代碼或者GPT-2模型的權(quán)重,只是發(fā)布了一些較小、功能較少的訓(xùn)練模型。

OpenAI在決定不發(fā)布模型時表示了這些模型可能會被濫用的可能性。但是,在它宣布不發(fā)布模型一個月后,它就宣布將通過一家剝離出來的公司將這些模型商業(yè)變現(xiàn)。

看來,人工智能剛開始都是瞄準(zhǔn)一些有趣的事情和游戲,然后再用它做一些真正有利可圖的事情。

監(jiān)管AI

AI取得了難以置信的快速進(jìn)步,但是人們還沒有建立合適的文化反對人工智能的濫用。最近的SXSW互動會議上就有一個“智能未來”的議題,追蹤了許多會議上凸顯的對AI和道德的爭論。

我們于今年3月11日參加了由歐盟贊助的小組會議:“該上法學(xué)院的算法們:人工智能的倫理”。該會議討論的主題之一就是歐盟委員會即將出臺的“值得信賴的AI應(yīng)該遵守的道德準(zhǔn)則”。該指南的最終版本將于4月9號或之前提交給歐盟委員會。

不過,在會議小組討論之后的問答環(huán)節(jié)中,有一位記者斷言人工智能將會成為一種過于危險的技術(shù),并且聲稱“所有人工智能研究工作都應(yīng)該停止”。這種論調(diào)本身并不令人震驚,真正讓人震驚的是居然有大約三分之一的觀眾對此表示認(rèn)同。

SXSW上關(guān)注的技術(shù)驅(qū)動的社會性問題通常領(lǐng)先大眾一兩年。目前SXSW對人工智能的道德倫理的強(qiáng)烈興趣表明,未來幾年內(nèi)這一問題將進(jìn)入社會大眾的視野。我們的行業(yè)需要變得更加透明,以贏得更多公民和消費(fèi)者的信任。

結(jié)論

IBM在2月11日舉行的Think活動中進(jìn)行了“辯論家”最后一次演示,“辯論家”輸?shù)袅诉@場辯論。但是,在辯論進(jìn)程的過程中,IBM研究院通過“辯論家”向世人展示了一個可以可信地進(jìn)行對上下文敏感、可達(dá)人類辯手水平的辯論系統(tǒng)。

IBM設(shè)計(jì)的“辯論家”和人類辯手展開了有意義的辯論,但是人類辯手和觀眾都清楚地知道它就是一個人工智能。在這個系統(tǒng)設(shè)計(jì)中,IBM研究院向論述中添加了一些笑話,并為之提供了根據(jù)紐約一位女演員構(gòu)建的聲音。不過,IBM研究院做了一些處理,使之成為一個明顯的合成聲音,但是該聲音聽起來并不單調(diào),表現(xiàn)力還不錯,這對于辯論來說很重要。

“辯論家”的開場比我們預(yù)期的要好得多,它挑戰(zhàn)了我們對于自然語言處理(NLP)當(dāng)前能力的假設(shè)。不過,在反駁和總結(jié)性陳詞中,它沒有分辨出人類辯手論點(diǎn)中的幾個細(xì)微差別,也沒有表現(xiàn)出對人類觀眾的同情心。正是在理解能力和同理心上面的差距使得“辯論家”進(jìn)入了不可思議的“恐怖谷”。

顯然,無論從哪個方面來看,創(chuàng)建一個可以參與這種開放性主題辯論的人工智能都是一個巨大的挑戰(zhàn)。

當(dāng)然,有人可能會爭辯說,創(chuàng)建一個可以在隨機(jī)主題上與人類辯手展開辯論(無論是贏了還是輸了)的人工智能就等于通過了圖靈測試。圖靈測試是什么?“通過圖靈測試”意味著什么。21世紀(jì)的AI的圖靈測試也需要現(xiàn)代化,簡單地說,我們對會話系統(tǒng)的人工智能測試需要更多地涵蓋人文環(huán)境。

雖然IBM的“辯論家”令人印象深刻,但是,它想在未來的幾年內(nèi)走過“恐怖谷”依然非常困難。不過,IBM證明了此事可行,就已經(jīng)贏得了戰(zhàn)斗的一半。IBM在舊硬件上拼湊實(shí)現(xiàn)了對“辯論家”的訓(xùn)練是一項(xiàng)驚人的研發(fā)壯舉!稗q論家”能夠使用更新的硬件進(jìn)行更快的訓(xùn)練和部署呢?現(xiàn)在還很難說,但是我們相信,其它人可能會在IBM的啟發(fā)下,針對人工智能會話系統(tǒng)投入更多資源,我們將看到這個領(lǐng)域的快速發(fā)展。

可以肯定的是,會話系統(tǒng)將變得更加出色,更加復(fù)雜,這將影響未來的工作機(jī)會和社會結(jié)構(gòu),現(xiàn)在是時候?qū)ψ匀徽Z言處理的未來進(jìn)行認(rèn)真討論了。

<上一頁  1  2  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號