ChatGPT等大語言模型展示了前所未有的創造能力,但距AGI(通用人工智能)還有很大的距離,缺少自主決策、記憶存儲、規劃等擬人化能力。
為了探索大語言模型向AGI演變,進化成超越人類的超級人工智能,米哈游與復旦NLP研究團隊聯合發布了一篇基于大語言模型的“智能體”論文。將具備感知、大腦和行動三大功能的智能體,投放在文本、沙盒游戲等實驗環境中讓其自行活動。
結果顯示,這些智能體具備自主感知、計劃、決策和交流等擬人化能力,例如,當周圍環境變得困難、艱苦時,智能體會自動調整策略和行動力;在社會模擬環境中,智能體會表現出同情等擬人化情感;當兩個陌生智能體通過簡單交流后,會記住彼此。
該技術框架與之前斯坦福大學、清華大學發布的AI代理游戲模擬實驗類似,都是在大語言模型的基礎之上構建功能更強大的AI機器人,這為行業的發展起到了推動作用。
論文地址:https://arxiv.org/abs/2309.07864
Github:https://github.com/WooooDyy/-Agent-Paper-List
根據論文介紹,智能體主要由感知、決策與控制以及執行三大模塊組成,通過感知環境、做出智能決策然后執行具體的行動。
感知模塊
感知模塊用于從環境中獲取各種信息,相當于人的感官。可以包含多種傳感器,獲取不同類型的數據,例如,攝像頭獲取圖像信息,麥克風獲取語音信息等。
感知模塊預處理這些原始數據,轉化為智能體可以理解的數字表示,以供后續模塊使用。常用的感知傳感器包括:
圖像傳感器:攝像頭、RGB-D 攝像機等,用來獲取視覺信息。
聲音傳感器:麥克風,獲取語音、環境聲音等音頻信息。
位置傳感器:GPS、INS(慣性導航系統)等,獲知智能體自身位置。
觸覺傳感器:觸覺 ARRAY、觸覺手套等,獲取物體接觸時的觸覺反饋。
溫度、濕度、氣壓等環境傳感器,獲取環境參數信息。
感知模塊需要對原始數據進行預處理,例如,圖像去噪、聲音降噪、格式轉換等,以生成可供后續模塊使用的規范化數據。同時,感知模塊還可以進行特征提取,如從圖像中提取邊緣、紋理、目標區域等視覺特征。
決策與控制模塊
該模塊是智能體的“大腦”,對感知模塊獲取的數據進行處理、分析,并做出相應決策。可細分為以下子模塊:
知識庫/記憶:儲存各類先驗知識、經驗,以及執行過程中的觀測、經歷等信息。
推理/規劃:分析當前環境,根據目標任務制定行動方案。如路徑規劃、動作序列規劃等。
決策:根據當前環境狀態、知識和推理結果,做出最優決策。
控制:將決策結果轉換為控制指令,向執行模塊下達執行命令。
決策與控制模塊的設計是智能體技術的關鍵。早期使用基于邏輯和規則的符號方法,近年來深度學習技術成為主流。模塊的輸入是感知獲取的各類數據,輸出是對執行模塊的控制指令。
執行模塊
執行模塊接收控制指令,并將之轉換為具體的環境交互行為,以實現相應任務。它相當于人的“四肢”。執行模塊連接智能體的 “效應器”,根據控制指令驅動效應器實施行動改變環境。主要效應器包括:
運動執行機構:機械臂、機器人底盤等,改變智能體自身位置或進行物體操作。
語音/文本輸出:語音合成器、顯示器等,以語音或文本形式與環境交互。
工具/設備操作接口:控制各類設備、工具,擴展智能體的環境操作能力。
執行模塊的具體設計與智能體的物理形式相關。例如,服務型智能體只需文本或語音接口,而機器人需要連接并精確控制運動機構。執行的準確性和彈性是影響任務成功的關鍵。
在測試實驗中,研究人員主要進行了任務、創新和生命周期管理三大類實驗,來觀察智能體在不同環境中的表現。
任務實驗
研究人員構建了文本游戲和生活場景兩個模擬環境,來測試智能體完成日常任務的能力。文本游戲環境使用自然語言描述虛擬世界,智能體需要通過閱讀文字描述來感知周圍環境并采取行動。
生活場景模擬則更加真實和復雜,智能體需要利用常識知識來更好地理解命令,例如,在房間黑暗時主動打開燈光。
實驗結果表明,智能體可以利用其強大的文本理解生成能力,在這些模擬環境中有效地分解復雜任務,制定計劃,并與動態變化的環境互動,最終完成預定目標。
創新實驗
研究人員探索了智能體在專業領域如科學創新的潛力。由于這些領域存在數據稀缺性和專業領域知識理解難度等挑戰,研究人員測試了為智能體配備各類通用工具或專業工具的方案,來提升其對復雜領域知識的理解能力。
實驗表明,智能體可以利用搜索引擎、知識圖譜等工具進行在線研究,并與科學儀器設備接口,完成材料合成等實際操作。這使其成為頗具潛力的科學創新助手。
生命周期實驗
研究人員使用開放世界游戲Minecraft來測試智能體的持續學習和生存能力。智能體從最基礎的活動如開采木材和制作工作臺開始,逐步探索未知環境,獲得更復雜的生存技能。
實驗中,智能體使用進行高層次計劃制定,并可以根據環境反饋不斷調整策略。結果表明,智能體可以在完全自主的情況下開發技能,持續適應新的環境,展現出強大的生命周期管理能力。
此外,在社會模擬方面,研究人員探討了智能體是否會表現出人格和社交行為,并測試了不同的環境設置。結果表明智能體可以展現出某些層次的認知能力、情感和性格特質。在模擬社會中,智能體之間會出現自發的社交活動和群體行為。
本文素材來源復旦NLP、米哈游論文,如有侵權請聯系刪除
END
未經允許不得轉載:RPA中國 | RPA全球生態 | 數字化勞動力 | RPA新聞 | 推動中國RPA生態發展 | 流 > 米哈游、復旦發布,具備感知、大腦、行動的大語言模型“智能體”
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發展洞察(2022)》報告正式發布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產業共進,第四屆ISIG中國產業智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業研究報告》正式發布 | RPA中國