前一陣很多人都在玩 ChatGPT,很多人驚嘆于這類Language Model的表現(xiàn),也同時在搜尋著更多應用的場景,一個易于想到的應用就是與 RPA 軟件的結合。

當前的 RPA 軟件,一般是針對不同類型的任務制定了相應的工具包,用戶在使用的時候,一般需要根據自己的業(yè)務邏輯定制自動化腳本,從而達到自動化重復任務的目的。要實現(xiàn)這個自動化主要需要兩個部分:
-
-
第一部分任務包定義了常用的操作,作為定制化腳本的基礎。例如針對網頁上的操作和 Excel 界面的操作,會有各自的程序包。第二部分流程腳本,通常是基于具體的業(yè)務邏輯,在任務包的基礎上編寫的腳本。很多廠商也會提供低代碼工具和 GUI 的設計器來輔助自動化腳本編寫。
這些 RPA 腳本基于預先定義的規(guī)則,如果運行的環(huán)境有了變化,例如一個網頁上有少許修改,可能就不適用了。所以 RPA 的應用依賴于定制化,也有一定的維護成本。雖然很多 RPA 廠商把定制和維護的活丟給合作伙伴,自己的業(yè)務比較干凈,但是也沒有太改變本質。當前 RPA 工具里也有一些 AI 的應用,不過主要還是應用在局部,屬于上述任務包的部分,例如 OCR,文本處理等,并沒有體現(xiàn)在任務流程里。很多 RPA 工具包里針對流程這一塊,也有 Process Mining 的工具,但并不是解決這個問題。Process Mining 更多是通過分析 Event Log,推導 Workflow(參考 Alpha Algorithm,PetriNets),并根據一些 pattern 提供流程優(yōu)化建議。
02
GPT 模型如何幫助 RPA 應用
既然 GPT 模型能生成代碼,當然也可以用它生成自動化腳本。如果去問 ChatGPT,它也是回答可以生成腳本,進而可以實現(xiàn)在自動化任務。是不是這就可以實現(xiàn)通用的自動化任務了?
試一試,問一個具體的問題,使用UiPath去填充表單??梢钥吹?,ChatGPT 可以生成Python代碼:
不用UiPath,改用Selenium,相當于換了一個標準任務包,也可以生成代碼。例如讓他生成一段在 Google 搜索 Dath Vader 并打開鏈接的代碼。BTW, 不知道為啥 Dath Vader 同學違反 Content Policy。
根據生成代碼的指令生成 Python 代碼,其實還是停留在 Copilot 這個階段??梢宰鳛橐粋€開發(fā)者的輔助工具,幫助流程腳本開發(fā)者提高開發(fā)效率。我們當然并不滿足于此,是否能直接打通呢,使用 GPT 模型來處理用戶的輸入,直接轉化為 Action,直接完成任務豈不更好。不過,如果再去問 ChatGPT,它也無法給出更具體的回答了,停留在一些指出方向的建議,在使用模型簡化用戶和 RPA 軟件之間的交互等等。
03
能否實現(xiàn)通用的任務自動化?Adept AI 的嘗試
目前有一些 Personal Assistant 能接受指令,完成任務,例如 Siri,Alexa,不過也僅限于一些事先定義好的 Task Automation,并不是通用的任務自動化?,F(xiàn)在看到 ChatGPT 的表現(xiàn),似乎看到了一些希望。也有很多人在進行了這些方面的探索,一個值得關注的公司是Adept AI。Adept AI Lab 由參與建立 Transformer 框架和 GPT 模型的一組大牛創(chuàng)立,希望能解決這個難題,進而實現(xiàn) General Intelligence,打造一個能幫人類完成任何計算機任務的工具。
針對這個問題,Adept 團隊已經發(fā)布了一個新的模型,叫做 Action Transformer(ACT-1),ACT-1 對于常用的 computer tasks 進行了訓練,從而能將用戶輸入的指令直接轉化為一組 Action。Adpet 給出了一些 demo 的 video,看起來比較 cool。從 video 來看,產品以一個瀏覽器插件作為載體,提供一個自然語言的輸入接口(Best programming language is English.),能夠根據用戶的輸入,理解用戶意圖,并操作瀏覽器來完成對應的任務。
例如,幫我在Houston找個60萬以下的房子:又或者是,將新客戶的信息錄入 CRM 系統(tǒng):
不過幾個視頻看下來,似乎還比較早期,這個視頻也經過了一些處理,速度也是加了倍速的。目前可能也是針對一些指定的任務做訓練,與真正的通用型模型還有一些距離。不過即使只是讓 AI 自己能做好簡單的任務,就已經很困難了。沒有預先定義的腳本,還需要處理復雜的上下文。試想一下如果能將目前的 RPA 軟件的“自動化重復任務”擴展到“自動化任何任務”,RPA 使用的范圍可就廣多了。
而程序邏輯由 Rule Based 模式向 Data Driven 模式轉化在很多領域都在發(fā)生。前 Tesla AI Lead Andrej Karpathy 把它定義為Software 1.0 與 Software 2.0。Software 1.0 是程序員給計算機明確指令,Software 2.0 則使用更抽象,對人類不友好的語言,例如神經網絡的權重。給定模型框架,目標和數據,由 training systems 來寫這些權重。
于是我們有了 Software 1.0 程序員,Software 2.0 程序員,以及 Web 3.0 程序員。。即便是 3.0,不過Andrej說,不好意思,在座的各位都比不過算法:
扯遠了,除了Adept AI以外,目前也有很多其他的 AI Lab 在做這方面的探索。由 DeepMind co-founder Mustafa Suleyman 和 Reid Hoffman 孵化的 Infection AI 也是想用 AI 去幫助人們完成各種計算機任務,最終人類不用去學習各種編程語言,不用學習軟件使用手冊,不用關注各種瑣碎細節(jié),只用關注創(chuàng)造性思考的部分。不過對于每天搬磚的打工人來說,創(chuàng)造性思考的部分是哪部分呢?
https://chat.openai.com/chat
https://karpathy.medium.com/software-2-0-a64152b37c35
Dath Vader封面圖由Midjourney生成:
繼續(xù)閱讀:
未經允許不得轉載:RPA中國 | RPA全球生態(tài) | 數字化勞動力 | RPA新聞 | 推動中國RPA生態(tài)發(fā)展 | 流 > 基于GPT 能自動化任意 RPA 任務嗎
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報告正式發(fā)布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產業(yè)共進,第四屆ISIG中國產業(yè)智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業(yè)研究報告》正式發(fā)布 | RPA中國