訂閱
糾錯(cuò)
加入自媒體

大模型時(shí)代來臨,基于LLM的生成式AI正在快速變革RPA人機(jī)交互

2023-05-31 16:47
王吉偉
關(guān)注

▲ 圖片由AI生成

從“人+RPA”到“人+生成式AI+RPA”,LLM如何影響RPA人機(jī)交互?

換個(gè)角度,從人機(jī)交互看LLM如何影響RPA

影響程序開發(fā)與流程自動(dòng)化人機(jī)交互的RPA,現(xiàn)在也要被LLM改變了

LLM如何影響人機(jī)交互?生成式AI怎么改變RPA人機(jī)交互?一文看明白

大模型時(shí)代來臨,基于LLM的生成式AI正在快速變革RPA人機(jī)交互

生成式AI重新定義人機(jī)交互,LLM正在影響RPA軟件架構(gòu)變遷

文/王吉偉

如果問RPA對(duì)程序開發(fā)以及自動(dòng)化有哪些貢獻(xiàn),其中一個(gè)答案便是它改變了人機(jī)交互(HCI,human-computer interaction)。

在傳統(tǒng)工作流自動(dòng)化工具中,軟件開發(fā)人員不得不生成一個(gè)操作列表,使用內(nèi)部應(yīng)用程序編程接口(API)或?qū)S媚_本語言自動(dòng)執(zhí)行任務(wù)和與后端系統(tǒng)的接口。

RPA系統(tǒng)則通過觀察用戶在應(yīng)用程序的圖形用戶界面(GUI)中執(zhí)行該任務(wù)來開發(fā)操作列表,然后通過直接在GUI 中重復(fù)這些任務(wù)來執(zhí)行自動(dòng)化,并且能夠給在多個(gè)應(yīng)用程序之間處理數(shù)據(jù)。

這個(gè)看似簡(jiǎn)單并被稱作“外掛”的形式,有效降低了產(chǎn)品中使用自動(dòng)化的障礙,并進(jìn)一步讓更多組織的端到端自動(dòng)化成為可能。作為一種改變數(shù)字工作者工作形式的業(yè)務(wù)流程自動(dòng)化技術(shù),二十多年來它不僅將人力資源從簡(jiǎn)單重復(fù)的工作解放出來,還讓程序開發(fā)變得更加簡(jiǎn)單。同時(shí)它還締造了一種“人+RPA”的人機(jī)交互模式,讓廣大組織能夠更簡(jiǎn)單地實(shí)現(xiàn)人機(jī)協(xié)同。

尤其是近些年足夠成熟、有彈性、可擴(kuò)展和可靠性強(qiáng)的RPA平臺(tái)出現(xiàn)后,很多大型組織都可以RPA改善與優(yōu)化其業(yè)務(wù)流程和開發(fā)模式,實(shí)現(xiàn)增效降本。

以上這些的實(shí)現(xiàn),皆因RPA不斷改善和優(yōu)化業(yè)務(wù)流程自動(dòng)化以及程序開發(fā)中的人機(jī)交互。

沒錯(cuò),得到眾多技術(shù)加持的RPA在不斷滲透到更多行業(yè)的同時(shí),也在持續(xù)改變不同領(lǐng)域多種業(yè)務(wù)場(chǎng)景的人機(jī)交互。

尤其是近幾年RPA的再次火爆,正是因?yàn)樗疃热诤狭薃I技術(shù)。以RPA為核心的超自動(dòng)化技術(shù)合集更是囊括了所有與自動(dòng)化相關(guān)的技術(shù),讓端到端自動(dòng)化的人機(jī)交互體驗(yàn)持續(xù)增強(qiáng),進(jìn)而受到更多組織的青睞。

現(xiàn)在,AI大模型時(shí)代到來,不斷進(jìn)化的RPA同樣也在融合生成式AI技術(shù)。當(dāng)前融合LLM(Large Language Model,大型語言模型)的RPA,可以說在人機(jī)交互上是一次巨大進(jìn)步,甚至是一種對(duì)以往RPA模式的顛覆。

既然要聊LLM對(duì)RPA人機(jī)交互的影響,自然要從人機(jī)交互談起。到底LLM對(duì)人機(jī)交互有什么影響?RPA是如何改善人機(jī)交互的?LLM又對(duì)RPA有什么影響?

本文,王吉偉頻道就跟大家聊聊這些。

從人機(jī)交互談起

上世紀(jì)70年代,大多數(shù)辦公室的業(yè)務(wù)運(yùn)行仍舊使用金屬文件、打字機(jī)和大量紙張。而體積龐大的計(jì)算機(jī),只能存放在只有少數(shù)人可以操作的冷藏室中。

為了解決這些問題,一些公司開始研發(fā)個(gè)人計(jì)算機(jī)。施樂公司于1973年開發(fā)了施樂Alto,雖然因?yàn)樵靸r(jià)太高等問題該產(chǎn)品始終未能上市,但它卻成了GUI的第一個(gè)草圖,成為了Macintosh(麥金塔電腦)和Windows的靈感來源。

受到一系列研究和相應(yīng)研發(fā)的影響,以及當(dāng)時(shí)市場(chǎng)對(duì)于小型計(jì)算機(jī)的強(qiáng)烈需求,作為研究如何以及為什么使計(jì)算機(jī)對(duì)用戶更加友好的一種手段,人機(jī)交互這個(gè)概念以及全新學(xué)科便出現(xiàn)于70年代末80年代初。

從那時(shí)起,HCI領(lǐng)域不斷發(fā)展,主要用于剖析人類行為以解決社會(huì)最復(fù)雜的問題,研究人們?nèi)绾闻c計(jì)算機(jī)交互以及用戶能夠在多大程度上與計(jì)算機(jī)交互,目標(biāo)是在計(jì)算機(jī)和用戶之間進(jìn)行成功的交互,并探索哪些領(lǐng)域需要更多的相關(guān)開發(fā)。

由于能夠解決當(dāng)時(shí)社會(huì)生產(chǎn)力的尖銳矛盾,HCI的研究領(lǐng)域在很短時(shí)間內(nèi)就擴(kuò)展到所有IT領(lǐng)域。

同時(shí)研究人員意識(shí)到,他們必須將與計(jì)算機(jī)的交互擴(kuò)展到每個(gè)人,而不僅僅是信息技術(shù)專業(yè)人員。因此在幾年之內(nèi),HCI就快速擴(kuò)展到幾乎所有信息技術(shù)設(shè)計(jì)的變化。

在史蒂夫喬布斯等人的努力之下,蘋果公司在1984年推出了Macintosh個(gè)人計(jì)算機(jī),人機(jī)交互形式由此徹底改變了。它使得計(jì)算機(jī)的使用變得更加容易,使通信變得更加簡(jiǎn)單,鍵盤、鼠標(biāo)和基于圖標(biāo)的用戶界面開始流行。

后來,蘋果公司成為個(gè)人PC先驅(qū),微軟推出了windows系統(tǒng),這些產(chǎn)品和軟件完全改變并顛覆了全球的業(yè)務(wù)流程與辦公的人機(jī)交互形式。

這些大家都熟悉,這里就不用多介紹了。

直到今天,IoT已成為網(wǎng)絡(luò)連接基礎(chǔ),人工智能也已無處不在,而人機(jī)交互仍舊是各種技術(shù)、產(chǎn)品及解決方案的重點(diǎn)。

通過前面的發(fā)展簡(jiǎn)史,相信大家應(yīng)該已經(jīng)對(duì)人機(jī)交互有一個(gè)大體認(rèn)知。那么到底什么是人機(jī)交互呢?且看下一節(jié)。

人機(jī)交互的四要素、六目標(biāo)和七原則

通用定義認(rèn)為,人機(jī)交互技術(shù)(Human-Computer Interaction Techniques)是指通過計(jì)算機(jī)輸入、輸出設(shè)備,以有效的方式實(shí)現(xiàn)人與計(jì)算機(jī)對(duì)話的技術(shù)。

人機(jī)交互技術(shù)包括機(jī)器通過輸出或顯示設(shè)備給人提供大量有關(guān)信息及提示請(qǐng)示等,人通過輸入設(shè)備給機(jī)器輸入有關(guān)信息,回答問題及提示請(qǐng)示等。因此,人機(jī)交互技術(shù)是計(jì)算機(jī)用戶界面設(shè)計(jì)中的重要內(nèi)容之一。

在學(xué)術(shù)上,人機(jī)交互是一門與人類使用的交互式計(jì)算系統(tǒng)的設(shè)計(jì),評(píng)估和實(shí)施有關(guān)的,以及研究圍繞它們的主要現(xiàn)象的學(xué)科。

人機(jī)交互關(guān)注人(用戶)與計(jì)算機(jī)之間接口(交互界面),關(guān)注計(jì)算機(jī)技術(shù)的設(shè)計(jì)和使用。人機(jī)交互涵蓋多門學(xué)科,包括計(jì)算機(jī)科學(xué),心理學(xué),社會(huì)學(xué),圖形設(shè)計(jì),工業(yè)設(shè)計(jì)等,是一門綜合性非常強(qiáng)的現(xiàn)代科學(xué)。

維基百科認(rèn)為,人與計(jì)算機(jī)之間的接口對(duì)于促進(jìn)這種互動(dòng)至關(guān)重要。桌面應(yīng)用程序,互聯(lián)網(wǎng)瀏覽器,掌上電腦等利用了當(dāng)今流行的GUI。語音識(shí)別和合成系統(tǒng)利用了語音用戶界面(VUI)。新興的多模態(tài)和圖形用戶界面,則允許人們以其他界面無法實(shí)現(xiàn)的方式與具體的角色和智能體交互。

所以,人機(jī)交互領(lǐng)域的發(fā)展導(dǎo)致了交互質(zhì)量的提高,并導(dǎo)致了許多新的研究領(lǐng)域。不同的研究分支不是設(shè)計(jì)常規(guī)接口,而是專注于多模態(tài)而不是單模態(tài)的概念、智能自適應(yīng)接口而不是基于命令/操作的接口以及主動(dòng)接口而不是被動(dòng)接口的概念。

從人機(jī)交互的名字中,我們可以推導(dǎo)出它由三部分組成,即用戶,計(jì)算機(jī)本身以及它們協(xié)同工作的方式。

后來這三部分?jǐn)U展為四個(gè)基本要素,也就是用戶、任務(wù)、工具/界面和背景。

用戶,即在項(xiàng)目上一起工作的個(gè)人或一組個(gè)人稱為用戶組件。HCI研究用戶的需求,目標(biāo)和交互方式。

任務(wù),即以目標(biāo)為導(dǎo)向的任務(wù),使用計(jì)算機(jī)時(shí),用戶總是有一個(gè)目的或目標(biāo)。為了實(shí)現(xiàn)這一點(diǎn),計(jì)算機(jī)呈現(xiàn)事物的數(shù)字表示。

界面,也就是可以提高用戶交互質(zhì)量的基本HCI元素是界面。需要考慮許多與界面相關(guān)的因素,包括交互類型、屏幕分辨率、顯示尺寸,甚至顏色對(duì)比度。

背景,HCI不僅涉及在用戶和計(jì)算機(jī)之間提供更好的通信,還涉及考慮訪問系統(tǒng)的上下文和環(huán)境。

同時(shí)HCI具備六個(gè)目標(biāo),分別是高效使用(效率)、 安全使用(安全)、 具有良好的效用(實(shí)用性)、 易于學(xué)習(xí)(可學(xué)習(xí)性)以及易于記憶如何使用(可記憶性)。

在此基礎(chǔ)上,也衍生出了HCI的7個(gè)設(shè)計(jì)原則,如下:

原則1:公平使用;

原則2:使用靈活;

原則3:簡(jiǎn)單直觀地使用;

原則4:可感知的信息;

原則5:容錯(cuò)能力;

原則6:低體力勞動(dòng);

原則7:接近和使用的大小和空間。

在具體應(yīng)用中,物聯(lián)網(wǎng)、眼動(dòng)追蹤技術(shù)、語音識(shí)別技術(shù)、AR/VR的使用以及云計(jì)算等,都是非常典型的人機(jī)交互案例。

HCI發(fā)展史以及大量觀點(diǎn)及案例證明,技術(shù)可以明顯改善HCI。

伴隨著通訊與信息技術(shù)的突破與發(fā)展,它們持續(xù)為HCI帶來明顯的影響與改善。比如這些年借助AI技術(shù)蓬勃發(fā)展的RPA,就為業(yè)務(wù)流程自動(dòng)化以及辦公業(yè)務(wù)場(chǎng)景帶來了極大的人機(jī)交互帶來體驗(yàn)改善。

人機(jī)交互與RPA

前文我們提到,人機(jī)交互的目標(biāo)是使計(jì)算機(jī)能夠更好地適應(yīng)人的需求,提供更友好、更智能、更自然的交互方式,如語音識(shí)別、圖像識(shí)別、自然語言處理、手勢(shì)控制等。

RPA是一種利用軟件機(jī)器人模擬人類操作的技術(shù),它可以通過用戶界面與企業(yè)的應(yīng)用系統(tǒng)交互,并完成預(yù)期任務(wù)的技術(shù)。

當(dāng)代RPA還融合了人工智能(AI)和機(jī)器學(xué)習(xí)(ML)相結(jié)合,實(shí)現(xiàn)智能流程自動(dòng)化(IPA),處理更復(fù)雜的用例,如自然語言處理(NLP)、計(jì)算機(jī)視覺(CV)和數(shù)據(jù)分析等。

RPA可以實(shí)現(xiàn)重復(fù)性、基于規(guī)則的工作流程的自動(dòng)化,提高工作效率、準(zhǔn)確性和合規(guī)性,降低人力成本,減少錯(cuò)誤率,節(jié)省成本和時(shí)間,適用于各種重復(fù)性、標(biāo)準(zhǔn)化的業(yè)務(wù)場(chǎng)景,如財(cái)務(wù)、人力資源、供應(yīng)鏈、信息技術(shù)等。

王吉偉頻道曾在《數(shù)字化轉(zhuǎn)型時(shí)代,RPA+AI是打開人機(jī)協(xié)同的最佳方式》一文中講過,在當(dāng)代企業(yè)管理軟件系統(tǒng)以及各種自動(dòng)化工具中,從操作難度、部署周期、投資成本等角度而言,RPA可以算是廣大組織應(yīng)用人機(jī)協(xié)同最好的方式。

在這其中,RPA最大的優(yōu)勢(shì)就是降低了程序開發(fā)難度,可以讓一線的業(yè)務(wù)人員參與到簡(jiǎn)單應(yīng)用的開發(fā)之中,讓全民開發(fā)成為進(jìn)一步成為現(xiàn)實(shí)。

RPA之所以能做到這一點(diǎn),在于它改變了程序開發(fā)的人機(jī)交互模式。使得不會(huì)編程的普通員工借助RPA工具,也能像程序員一樣開發(fā)他們需要的自動(dòng)化程序或者說軟件機(jī)器人。一方面RPA讓開發(fā)程序變得更加簡(jiǎn)單,從寫代碼變成了“拖拉拽”各種功能組件;另一方面可以讓更多的業(yè)務(wù)流程實(shí)現(xiàn)自動(dòng)化,不再需要人力去重復(fù)執(zhí)行。可以說,RPA同時(shí)改變了程序開發(fā)和業(yè)務(wù)執(zhí)行的人機(jī)交互。

所以,RPA與人機(jī)交互有著密切的聯(lián)系。因?yàn)镽PA本質(zhì)上是一種人機(jī)協(xié)同的工作模式,它需要人來定義規(guī)則、監(jiān)督執(zhí)行、優(yōu)化改進(jìn),機(jī)器則負(fù)責(zé)執(zhí)行規(guī)則、提供反饋、學(xué)習(xí)改進(jìn)。

RPA不僅可以模擬人類的操作,還可以結(jié)合AI技術(shù),實(shí)現(xiàn)對(duì)人類的理解和決策。比如利用OCR(光學(xué)字符識(shí)別)技術(shù)識(shí)別圖像中的文字,利用NLP技術(shù)理解語言中的意圖,利用智能決策技術(shù)制定最優(yōu)方案等。融合AI等技術(shù)的RPA,具備以下幾個(gè)優(yōu)勢(shì):

1、有效減輕工作負(fù)擔(dān),讓人們從繁瑣的后臺(tái)任務(wù)中解放出來,專注于更有價(jià)值的創(chuàng)新和戰(zhàn)略性的工作;

2、提高人機(jī)交互的速度和質(zhì)量,軟件機(jī)器人可以全天候地工作,不受時(shí)間、地點(diǎn)和情緒的影響,也不會(huì)犯錯(cuò)或遺漏;

3、拓展人機(jī)交互的范圍和深度,軟件機(jī)器人可以訪問和整合多個(gè)不相關(guān)的軟件系統(tǒng),處理大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),并利用AI和ML的能力進(jìn)行學(xué)習(xí)和優(yōu)化。

由此,RPA是一種有效且典型的優(yōu)化人機(jī)交互的技術(shù)。它可以實(shí)現(xiàn)流程自動(dòng)化、智能化和優(yōu)化,為企業(yè)帶來效率、質(zhì)量和價(jià)值的提升。

LLM對(duì)人機(jī)交互的影響

LLM是一種利用神經(jīng)網(wǎng)絡(luò)在大量無標(biāo)注文本上進(jìn)行自監(jiān)督學(xué)習(xí)或半監(jiān)督學(xué)習(xí)的語言模型。LLM具有海量的參數(shù)(通常為數(shù)十億或更多),能夠在多種任務(wù)上表現(xiàn)出優(yōu)異的性能。

從目前各領(lǐng)域的應(yīng)用來看,基于LLM的生成式AI技術(shù)的出現(xiàn),為人機(jī)交互帶來了顛覆性的變化。

生成式AI給人們最直接的感觸就是,原來工作流中的好多各種軟件操作以及跨軟件操作,現(xiàn)在只需要跟生成式AI進(jìn)行幾輪對(duì)話就完成了。

比如用Midjourney生成圖片或者是ChatGPT Plus生成軟件應(yīng)用代碼,已經(jīng)完全不需要使用繪圖軟件及編程軟件。并且ChatGPT 的插件生態(tài)正在快速完善,以后將會(huì)有越來越多應(yīng)用場(chǎng)景的業(yè)務(wù)操作,只需要對(duì)話就能搞定。

這就是交互方式的改變,它直接將原有的與各種軟件UI的人機(jī)交互,變成了與一個(gè)聊天窗口進(jìn)行交互,是一種前所未有的交互體驗(yàn)。

總結(jié)起來,LLM或者說生成式AI對(duì)人機(jī)交互產(chǎn)生了以下幾點(diǎn)影響:

首先,提高了人機(jī)交互的效率、質(zhì)量和便利性。通過生成式AI,用戶可以快速獲取想要的信息或服務(wù),不需要花費(fèi)大量的時(shí)間和精力。同時(shí)LLM可以根據(jù)用戶輸入和上下文生成合適的回復(fù),減少用戶輸入負(fù)擔(dān),提高交互流暢性和自然性。此外,生成式AI還可以根據(jù)用戶的反饋和偏好,動(dòng)態(tài)地調(diào)整自己的輸出,以達(dá)到更好的交互效果。

比如ChatGPT可以幫助用戶完成寫作、設(shè)計(jì)、編程等復(fù)雜的任務(wù),或者為用戶提供個(gè)性化的推薦、咨詢、娛樂等內(nèi)容。

其次,增加人機(jī)交互的多樣性和創(chuàng)造性。LLM可以根據(jù)用戶需求和偏好生成不同風(fēng)格的文本、音頻、視頻等內(nèi)容,滿足用戶的個(gè)性化和多元化的需求。通過生成式AI,用戶可以接觸和選擇更多的內(nèi)容,從而拓展視野和思維。當(dāng)然,生成式AI也可以與用戶進(jìn)行更深入和靈活的對(duì)話,滿足用戶不同的情感和情緒需求。

比如通過生成式AI為用戶提供不同風(fēng)格和主題的文本、圖像、音樂等,或者為用戶生成一些新穎和有趣的內(nèi)容,如詩(shī)歌、故事、笑話等。

第三,改變?nèi)藱C(jī)交互的關(guān)系和意義。通過生成式AI,用戶可以與人工智能建立更緊密和信任的聯(lián)系,甚至產(chǎn)生一種共創(chuàng)與合作的感覺。

基于LLM的聊天機(jī)器人,可以為用戶提供更多的反饋和建議,或者與用戶共享自己的想法和感受。生成式AI還可以讓用戶更加了解自己和人工智能的優(yōu)勢(shì)和局限,以及如何更好地利用和發(fā)展它們。第四,拓展人機(jī)交互的領(lǐng)域和場(chǎng)景。ChatGPT等生成式AI應(yīng)用具有強(qiáng)大的適應(yīng)性和泛化性,可以應(yīng)用于各種不同的領(lǐng)域和場(chǎng)景,如教育、娛樂、醫(yī)療、商業(yè)等。無論用戶想要學(xué)習(xí)、游戲、咨詢、購(gòu)物等,都可以通過與ChatGPT等應(yīng)用交流來達(dá)到目的。

第五,增強(qiáng)人機(jī)交互的趣味性和親切感。基于LLM的生成式AI應(yīng)用具有豐富的知識(shí)和個(gè)性,可以根據(jù)用戶的興趣和情緒來調(diào)整自己的語言風(fēng)格和話題,甚至可以生成一些幽默、詩(shī)歌、故事等創(chuàng)意內(nèi)容來娛樂用戶。

這樣,用戶不會(huì)感到與機(jī)器人交流是一件枯燥無味的事情,而會(huì)覺得與機(jī)器人交流是一件有趣和溫馨的事情。

LLM對(duì)人機(jī)交互有著重要而復(fù)雜的影響,使得它在各個(gè)領(lǐng)域都有著巨大發(fā)展?jié)摿托袠I(yè)應(yīng)用價(jià)值。廣大組織應(yīng)該積極地探索和利用LLM以及生成式AI,提升人機(jī)交互的水平和體驗(yàn),提高人機(jī)交互效率和質(zhì)量,增強(qiáng)人機(jī)交互關(guān)系,拓展人機(jī)交互的領(lǐng)域和場(chǎng)景。

當(dāng)然,我們也應(yīng)該注意其帶來的風(fēng)險(xiǎn)和挑戰(zhàn),以及如何合理地使用和監(jiān)督它。

需要說明的是,目前基于大語言模型的生成式AI正在與RPA快速融合,生成式AI將會(huì)為RPA的人機(jī)交互帶來質(zhì)的飛躍。

LLM改變RPA人機(jī)交互

RPA可以自動(dòng)化執(zhí)行重復(fù)性、規(guī)則性和低價(jià)值的業(yè)務(wù)流程,可以提高效率、降低成本和減少錯(cuò)誤。但它也面臨著一些挑戰(zhàn)和局限性,比如難以處理復(fù)雜、多變和高價(jià)值的業(yè)務(wù)場(chǎng)景,以及難以適應(yīng)業(yè)務(wù)流程的變化,需要不斷地維護(hù)和更新,難以處理復(fù)雜的、非結(jié)構(gòu)化的、需要?jiǎng)?chuàng)造性或判斷力的任務(wù)等。

雖然超自動(dòng)化架構(gòu)已經(jīng)讓RPA的運(yùn)行足夠穩(wěn)定,但對(duì)于復(fù)雜流程而言也會(huì)存在穩(wěn)定運(yùn)行的隱患。

之前廠商們想盡各種辦法解決這些問題,但無法從根本上杜絕這些問題。直到基于LLM的生成式AI橫空出世,一下就解決了之前RPA遇到的多重難題。

對(duì)于LLM如何影響RPA,王吉偉頻道(id:jiwei1122)已經(jīng)在《GPT等AI大模型震撼來襲,基于RPA的超級(jí)自動(dòng)化仍是最佳落地載體》一文中有過詳細(xì)介紹。這里,再簡(jiǎn)單說說LLM如何改變RPA的人機(jī)交互。

LLM可以為RPA提供更強(qiáng)大的自然語言處理能力,提供更強(qiáng)大的知識(shí)獲取和推理能力,以及提供更強(qiáng)大的生成和創(chuàng)造能力。

具體而言,LLM對(duì)于RPA人機(jī)交互的影響可以體現(xiàn)于以下幾個(gè)方面:

提高RPA的智能水平。應(yīng)用LLM,能夠更好地識(shí)別和理解用戶的自然語言輸入以及生成自然語言,更好地滿足用戶的需求和意圖。還可以根據(jù)上下文和目標(biāo)生成合適的操作步驟,進(jìn)行多輪對(duì)話和推理,處理更復(fù)雜和多樣的業(yè)務(wù)場(chǎng)景,實(shí)現(xiàn)更復(fù)雜和靈活的業(yè)務(wù)流程自動(dòng)化。

用戶可以通過語音或文字與RPA進(jìn)行對(duì)話,告訴它要執(zhí)行什么任務(wù),而不需要通過復(fù)雜的編程或拖拽組件來設(shè)計(jì)流程。

此外,LLM也可以幫助RPA進(jìn)行知識(shí)抽取和推理,從而提供更有價(jià)值的信息和建議。

擴(kuò)展RPA的應(yīng)用范圍。LLM可以有效擴(kuò)大RPA的應(yīng)用范圍,讓軟件機(jī)器人能夠處理更多涉及自然語言的任務(wù),比如文本分類、文本摘要、文本生成、機(jī)器翻譯、問答系統(tǒng)等。也可以通過與其他模態(tài)的數(shù)據(jù)進(jìn)行交互,比如圖像、音頻、視頻等,從而實(shí)現(xiàn)更豐富和多維的業(yè)務(wù)流程。

LLM還可以讓軟件機(jī)器人能夠與其他AI技術(shù)如OCR、NLP、低代碼、流程挖掘、chatbot等進(jìn)行集成和協(xié)作,實(shí)現(xiàn)超級(jí)自動(dòng)化。

通過使用LLM,RPA可以跨越語言和文化的障礙,服務(wù)更廣泛和多元的客戶和市場(chǎng)。增加RPA的創(chuàng)新潛力。LLM可以增強(qiáng)RPA的創(chuàng)造力和靈活性,使其能夠根據(jù)不同的場(chǎng)景和數(shù)據(jù)生成適合的文本,如報(bào)告、摘要、建議等。例如,RPA可以根據(jù)用戶提供的關(guān)鍵詞或主題,自動(dòng)生成一篇博客文章,并在文章中插入相關(guān)的圖片、視頻、鏈接等。

通過使用LLM,RPA可以進(jìn)行更靈活和自適應(yīng)的學(xué)習(xí)和生成,產(chǎn)生更多新穎和有趣的內(nèi)容和方案。LLM也可以與人類進(jìn)行更有效和友好的協(xié)作和溝通,激發(fā)更多的創(chuàng)意和靈感。

提升RPA的開發(fā)效率。生成式AI可以讓用戶通過簡(jiǎn)單的語言描述來定義和修改業(yè)務(wù)流程,而不需要編寫復(fù)雜的代碼或者使用圖形化界面。并可以根據(jù)用戶的反饋和數(shù)據(jù)分析來優(yōu)化和調(diào)整業(yè)務(wù)流程,實(shí)現(xiàn)持續(xù)改進(jìn)。優(yōu)化RPA交互體驗(yàn)和用戶滿意度。融合LLM的RPA能夠與用戶進(jìn)行更加自然、友好、有趣的對(duì)話,增加用戶的信任和參與感。RPA可以根據(jù)用戶的情緒和興趣,調(diào)整語氣和風(fēng)格,甚至講一些幽默或者引用一些名人名言來調(diào)節(jié)氣氛。

擴(kuò)展閱讀:ChatGPT與RPA集成,生成式AI+自動(dòng)化流程讓AIGC價(jià)值倍增當(dāng)然,LLM對(duì)RPA人機(jī)交互的影響不只是智能、效率和創(chuàng)新層面的,它還直接影響了RPA的軟件架構(gòu)變化。

后記:LLM影響下的RPA架構(gòu)變遷

在LLM之前,RPA已經(jīng)極大地改善了程序開發(fā)以及流程自動(dòng)化的人機(jī)交互。并且,很多廠商都已經(jīng)打出了“RPA人人可用”的概念。在這個(gè)概念的背后,其實(shí)就是RPA的易用性越來越強(qiáng),應(yīng)用它開發(fā)程序并實(shí)施流程自動(dòng)化越發(fā)簡(jiǎn)單。在易用性方面,從CV到屏幕抓取再到AI模型,廠商們做了大量的探索與嘗試。在RPA的程序開發(fā)環(huán)節(jié)上,基于AI、0代碼等技術(shù),RPA正在逐步擺脫原有的“拖拉拽”形式,向“點(diǎn)選用”以及對(duì)話式(包括語音驅(qū)動(dòng))流程創(chuàng)建的方式過渡。

在人機(jī)交互上,對(duì)話式流程創(chuàng)建,可以說是RPA乃至超自動(dòng)化的終極狀態(tài)。未來我們要使用超自動(dòng)化,只要在系統(tǒng)內(nèi)打幾行字或者說一句話就能創(chuàng)建各種軟件機(jī)器人或者自動(dòng)化程序。

但是之前的對(duì)話式創(chuàng)建,僅適用于簡(jiǎn)單的預(yù)設(shè)置流程。稍微復(fù)雜的流程便無能為力,或者需要更多流程步驟去觸發(fā)和調(diào)動(dòng)更多流程才能實(shí)現(xiàn)。流程的健壯性難以經(jīng)受考驗(yàn),并且用戶必須熟悉相應(yīng)語法及指令才能使用。

在應(yīng)用體驗(yàn)上,仍然存在一些不足或者說進(jìn)步空間。

LLM出現(xiàn)之后,對(duì)于融合生成式AI的RPA產(chǎn)品,用戶使用自然語言都能驅(qū)動(dòng)RPA去創(chuàng)建流程。并且生成式AI以生成內(nèi)容的形式彌補(bǔ)RPA在情緒識(shí)別、非結(jié)構(gòu)化數(shù)據(jù)處理等方面的不足,可以讓任何人無需太多學(xué)習(xí)就能更加簡(jiǎn)單、快速、高效的驅(qū)動(dòng)RPA開發(fā)各種自動(dòng)化程序,真正讓RPA實(shí)現(xiàn)了人人可用。

擴(kuò)展閱讀:多家廠商引入ChatGPT,集成與融合生成式AI成為RPA技術(shù)新趨勢(shì)以前使用RPA,是人直接操作RPA通過托拉拽搭積木的方式搭建各種程序。現(xiàn)在則是人通過自然語言與GPT等生成式AI溝通,多模態(tài)AI在理解人類操作意圖后,進(jìn)一步驅(qū)動(dòng)RPA連接企業(yè)管理軟件去自動(dòng)化執(zhí)行各種業(yè)務(wù)流程。

GPT等AI大模型則進(jìn)一步連接了人與RPA等系統(tǒng),向上連接人的意圖,向下指揮RPA機(jī)器人,成為人和RPA等自動(dòng)化系統(tǒng)之間的一個(gè)紐帶,讓程序開發(fā)與自動(dòng)化流程的操作更加簡(jiǎn)單。GPT把人和基于RPA的超自動(dòng)化連接起來,這是人機(jī)交互體驗(yàn)上一個(gè)巨大的進(jìn)步。

在王吉偉頻道看來,從過去的“人+RPA”到現(xiàn)在的“人+生成式AI+RPA”,引入LLM以及集成生成式AI,表面看是極大地提升了RPA產(chǎn)品的人機(jī)交互,本質(zhì)上是LLM影響了RPA的架構(gòu)變化。

現(xiàn)在幾乎所有廠商都在重度研究LLM與RPA以及超自動(dòng)化的全面融合,RPA都已在產(chǎn)品架構(gòu)中加入了模型層。這意味著,不管是調(diào)用第三方模型還是自研模型,RPA都已成為標(biāo)準(zhǔn)的模型層上的應(yīng)用。

可以預(yù)見,接下來隨著LLM成為RPA的標(biāo)配,它也將全面變革大模型時(shí)代的RPA。

【王吉偉頻道,關(guān)注AIGC與IoT,專注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動(dòng)化與RPA,歡迎關(guān)注與交流。】

       原文標(biāo)題 : 大模型時(shí)代來臨,基于LLM的生成式AI正在快速變革RPA人機(jī)交互

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)