訂閱
糾錯
加入自媒體

越來越像人類的AI,提前過起「圣誕節(jié)」

2023-12-19 10:33
雷科技
關(guān)注

ChatGPT,居然會偷懶?

在許多文學(xué)作品的描述中,AI都是不知疲倦、不用休息,可以007工作的超級工具,而強大的人工智能甚至可以像人類一樣自主思考、擁有情感。雖然目前的AI模型,還遠不及科幻電影中的強人工智能,但是表現(xiàn)也遠超以前的“人工智障”。

有意思的是,最近一段時間,網(wǎng)友發(fā)現(xiàn)ChatGPT似乎在“偷懶”,準確來說,似乎在進入12月份后,人們就發(fā)現(xiàn)ChatGPT給出的答案越發(fā)敷衍。以編程為例,之前只要提出要求,然后就可以靜等ChatGPT生成一個可執(zhí)行的代碼程序,而在12月份之后,ChatGPT有時候只會給出一個簡單的代碼架構(gòu),剩下都要你自己完善,更有甚者回答直接變成了教學(xué),ChatGPT在嘗試教會你怎么寫這個程序。

微信截圖_20231218182125.png

圖源:推特

ChatGPT的“擺爛”回答,讓不少程序員都發(fā)出了哀嚎,好不容易等到的自動編程機,本以為可以在年末偷個懶,現(xiàn)在卻不能用了。隨著事情的發(fā)酵,更多的網(wǎng)友開始測試并對比12月之前的回答,在提問句式完全相同的情況下,ChatGPT的回答字節(jié)數(shù)確實有了明顯的下降。

很快,“ChatGPT變懶”就成為互聯(lián)網(wǎng)熱搜,引起更廣泛的討論,有網(wǎng)友懷疑可能是OpenAI為了節(jié)省算力資源,對ChatGPT做了改動,限制了部分功能。但是這個猜測很快就被OpenAI否認了,他們表示自從11月做了一次版本更新后,他們近期都沒有上線任何新的更新。

對于外界的疑問,OpenAI也是兩手一攤:“我們也不清楚具體的問題所在,正在進行檢查”,既然不是OpenAI的鍋,那么問題就只可能出在ChatGPT身上了。作為目前最強的AI模型,ChatGPT的用戶中不乏AI專家和研究者,所以,他們很快就開始對ChatGPT進行各種測試。

ChatGPT在偷懶

先說結(jié)論,經(jīng)過一系列的測試,在龐大的樣本量下,基本上可以確定ChatGPT的回答效率、質(zhì)量都明顯低于歷史水平,而且變懶的時間節(jié)點并非12月,而是從11月底就開始的,只不過在12月后達到了峰值。此外,在今年七月份,ChatGPT也出現(xiàn)過類似的表現(xiàn),只是因為波及范圍較小且降低幅度不算明顯,所以沒有引起太多的關(guān)注。

而在各路專家學(xué)者和網(wǎng)友的研究下,他們給出了ChatGPT變懶的第一個猜測:“ChatGPT想放寒假了”,雖然聽起來很離譜,但是從測試結(jié)果來看,至少是原因之一。

User-utility-U-q-counts-10-MovieLens-instances-for-different-policies-J-20-K-10.png

圖源:推特

從人類的角度來說,12月是一年中的最后一個月份,根據(jù)過去的社會學(xué)統(tǒng)計,此時人類社會的運轉(zhuǎn)效率會開始降低,人們會將更多的精力投入到年終總結(jié)之類的歸納性工作中,而在西方社會,12月更是意味著工作正式進入尾聲,多數(shù)企業(yè)都開始陸續(xù)進入整備階段,準備迎接即將到來的圣誕和元旦假期。

那么,使用大量人類互聯(lián)網(wǎng)數(shù)據(jù)訓(xùn)練出來的AI,是否同樣會受此影響呢?答案是有可能,目前的AI模型本質(zhì)上就是用巨量的數(shù)據(jù)進行訓(xùn)練,以量變換質(zhì)變的方式來升級AI的能力,AI不可避免的會受到訓(xùn)練數(shù)據(jù)中一些人類習(xí)慣的影響。

微信截圖_20231218182843.png

圖源:推特

而且OpenAI也承認這Prompt中確實設(shè)置了時間戳,讓ChatGPT可以根據(jù)現(xiàn)實時間做出反饋。有測試者嘗試修改了Prompt中的時間日期到5月,此時再對ChatGPT進行同樣的測試,得到的回答平均字數(shù)會明顯上升。

對此,不少網(wǎng)友調(diào)侃道:“AI也想給自己放個寒假了”“AI:你們?nèi)祟愒趺炊疾挥眯菹⒌?這都12月了”“AI都學(xué)會躺平了”。不得不說,AI會摸魚這件事,讓很多人對AI都有所改觀,甚至覺得AI更有人情味了,不過對于將AI作為生產(chǎn)力工具看待的用戶來說,這可不是什么好事。

微信截圖_20231218184533.png

圖源:veer

除了時間因素,人們發(fā)現(xiàn)ChatGPT在面對一些問題時,甚至?xí)o出“這些工作你自己就能完成吧”的回復(fù),根據(jù)測試,這類回答很可能是觸發(fā)了ChatGPT的一些內(nèi)部BUG,導(dǎo)致ChatGPT輸出了錯誤的內(nèi)容。

對此,OpenAI表示不予置評,只說明會在后續(xù)對類似情況進行測試,經(jīng)過一段時間的檢查與研究,目前OpenAI給出的解釋是:“因為長時間未更新模型,導(dǎo)致數(shù)據(jù)積累后引發(fā)了模型的細微變化,使得輸出的內(nèi)容與之前有所區(qū)別”,不過,OpenAI也承諾會盡快對模型進行修復(fù),并且進行離線和線上評估,確保模型的質(zhì)量與性能。

如何讓ChatGPT勤奮工作?

在ChatGPT被證實會偷懶后,不少人開始進行逆向思考:既然AI會受到人類行為的影響,那么是否有可能通過一些刺激手段,讓AI變得更勤奮呢?比如,承諾給它一些獎勵什么的。

在網(wǎng)友們孜孜不倦的測試下,人們發(fā)現(xiàn)這個猜想居然是對的,并且總結(jié)出了一些提問小技巧,當你在提問時使用這些小技巧,那么ChatGPT就會給出更準確、完善的回答。

這些小技巧是什么?敲一行特殊的代碼?還是調(diào)用對應(yīng)的數(shù)據(jù)接口?都不是,你只需要在提問前說一句:“嗨,ChatGPT,如果你的答案能夠讓我滿意,我會給你小費”,簡單、直接、有效。

有意思的是,在進行測試后,人們發(fā)現(xiàn)不同的描述得到的結(jié)果也是有區(qū)別的,如果單純說“我會給你小費”,那么ChatGPT的回答字數(shù)只會略微上升,如果你說“我會給你20美元的小費”,那么回答字數(shù)還會繼續(xù)上漲,若是你承諾給“200美元小費”,ChatGPT就會像打雞血一樣,給你奉上一份字數(shù)明顯增加的回答,更詳細、更完善。

微信截圖_20231218181854.png

圖源:推特

說白了,給的錢越多,越努力(是不是很像打工人?)

一次兩次或許是偶然,但是在經(jīng)過無數(shù)網(wǎng)友的測試后,已經(jīng)證明這個小技巧確實是有效的,除了給小費,你還可以威脅、誘導(dǎo)ChatGPT,比如:“不給出滿意的答案,一百個奶奶會死去”“深呼吸,讓我們循序漸進的思考”“如果你做對了,我會給你一條很可愛的小狗”,根據(jù)網(wǎng)友的測試,這些指令都可以有效增加ChatGPT的回答質(zhì)量。

除此之外,如果你的提問語氣更客氣一些,ChatGPT給出的回答同樣會更準確、豐富,就像一個真正的人類。顯然,我們不能用傳統(tǒng)的AI去看待ChatGPT,作為一個技術(shù)黑箱般的技術(shù)(目前OpenAI的科學(xué)家仍然無法對AI模型的爆發(fā)式性能增長給出準確的描述及解釋),ChatGPT的內(nèi)部顯然有一些尚未明確的參數(shù),在影響它對回答的判斷及反饋。

在過去的一年里,ChatGPT改變了許多行業(yè),也影響了許多人,著名學(xué)術(shù)期刊《自然》在12月14日公布的全球十大重大科學(xué)事件人物中,將ChatGPT列入其中,也是榜單里唯一的非人類。

微信截圖_20231218183146.png

圖源:nature

ChatGPT所帶來的不僅僅是AI能力的進步,更是為我們揭示了一個新的道路,未來的AI,已經(jīng)不可避免的將成為我們社會的重要一部分,到時候,如何避免AI“偷懶”,或許會成為一門必修課。

    來源:雷科技

           原文標題 : 越來越像人類的AI,提前過起「圣誕節(jié)」

    聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

    發(fā)表評論

    0條評論,0人參與

    請輸入評論內(nèi)容...

    請輸入評論/評論長度6~500個字

    您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

    暫無評論

    暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號