<kbd id="iaq82"><pre id="iaq82"></pre></kbd>

當前位置：首頁 > RPA最新資訊 > AI視角 > 米哈游、復旦發布，具備感知、大腦、行動的大語言模型“智能體”

米哈游、復旦發布，具備感知、大腦、行動的大語言模型“智能體”

suntingting 發布于 2023-10-17 15:08:40
分類：AI視角
來源：
閱讀()
評論()

ChatGPT等大語言模型展示了前所未有的創造能力，但距AGI（通用人工智能）還有很大的距離，缺少自主決策、記憶存儲、規劃等擬人化能力。

為了探索大語言模型向AGI演變，進化成超越人類的超級人工智能，米哈游與復旦NLP研究團隊聯合發布了一篇基于大語言模型的“智能體”論文。將具備感知、大腦和行動三大功能的智能體，投放在文本、沙盒游戲等實驗環境中讓其自行活動。

結果顯示，這些智能體具備自主感知、計劃、決策和交流等擬人化能力，例如，當周圍環境變得困難、艱苦時，智能體會自動調整策略和行動力；在社會模擬環境中，智能體會表現出同情等擬人化情感；當兩個陌生智能體通過簡單交流后，會記住彼此。

該技術框架與之前斯坦福大學、清華大學發布的AI代理游戲模擬實驗類似，都是在大語言模型的基礎之上構建功能更強大的AI機器人，這為行業的發展起到了推動作用。

論文地址：https://arxiv.org/abs/2309.07864

Github：https://github.com/WooooDyy/-Agent-Paper-List

根據論文介紹，智能體主要由感知、決策與控制以及執行三大模塊組成，通過感知環境、做出智能決策然后執行具體的行動。

感知模塊

感知模塊用于從環境中獲取各種信息,相當于人的感官。可以包含多種傳感器,獲取不同類型的數據,例如，攝像頭獲取圖像信息,麥克風獲取語音信息等。

感知模塊預處理這些原始數據,轉化為智能體可以理解的數字表示,以供后續模塊使用。常用的感知傳感器包括:

圖像傳感器:攝像頭、RGB-D 攝像機等,用來獲取視覺信息。

聲音傳感器:麥克風,獲取語音、環境聲音等音頻信息。

位置傳感器:GPS、INS(慣性導航系統)等,獲知智能體自身位置。

觸覺傳感器:觸覺 ARRAY、觸覺手套等,獲取物體接觸時的觸覺反饋。

溫度、濕度、氣壓等環境傳感器,獲取環境參數信息。

感知模塊需要對原始數據進行預處理,例如，圖像去噪、聲音降噪、格式轉換等,以生成可供后續模塊使用的規范化數據。同時,感知模塊還可以進行特征提取,如從圖像中提取邊緣、紋理、目標區域等視覺特征。

決策與控制模塊

該模塊是智能體的“大腦”,對感知模塊獲取的數據進行處理、分析,并做出相應決策。可細分為以下子模塊:

知識庫/記憶:儲存各類先驗知識、經驗,以及執行過程中的觀測、經歷等信息。

推理/規劃:分析當前環境,根據目標任務制定行動方案。如路徑規劃、動作序列規劃等。

決策:根據當前環境狀態、知識和推理結果,做出最優決策。

控制:將決策結果轉換為控制指令,向執行模塊下達執行命令。

決策與控制模塊的設計是智能體技術的關鍵。早期使用基于邏輯和規則的符號方法,近年來深度學習技術成為主流。模塊的輸入是感知獲取的各類數據,輸出是對執行模塊的控制指令。

執行模塊

執行模塊接收控制指令,并將之轉換為具體的環境交互行為,以實現相應任務。它相當于人的“四肢”。執行模塊連接智能體的 “效應器”,根據控制指令驅動效應器實施行動改變環境。主要效應器包括:

運動執行機構:機械臂、機器人底盤等,改變智能體自身位置或進行物體操作。

語音/文本輸出:語音合成器、顯示器等,以語音或文本形式與環境交互。

工具/設備操作接口:控制各類設備、工具,擴展智能體的環境操作能力。

執行模塊的具體設計與智能體的物理形式相關。例如，服務型智能體只需文本或語音接口,而機器人需要連接并精確控制運動機構。執行的準確性和彈性是影響任務成功的關鍵。

在測試實驗中，研究人員主要進行了任務、創新和生命周期管理三大類實驗，來觀察智能體在不同環境中的表現。

任務實驗

研究人員構建了文本游戲和生活場景兩個模擬環境,來測試智能體完成日常任務的能力。文本游戲環境使用自然語言描述虛擬世界,智能體需要通過閱讀文字描述來感知周圍環境并采取行動。

生活場景模擬則更加真實和復雜,智能體需要利用常識知識來更好地理解命令,例如，在房間黑暗時主動打開燈光。

實驗結果表明,智能體可以利用其強大的文本理解生成能力,在這些模擬環境中有效地分解復雜任務,制定計劃,并與動態變化的環境互動,最終完成預定目標。

創新實驗

研究人員探索了智能體在專業領域如科學創新的潛力。由于這些領域存在數據稀缺性和專業領域知識理解難度等挑戰,研究人員測試了為智能體配備各類通用工具或專業工具的方案,來提升其對復雜領域知識的理解能力。

實驗表明,智能體可以利用搜索引擎、知識圖譜等工具進行在線研究,并與科學儀器設備接口,完成材料合成等實際操作。這使其成為頗具潛力的科學創新助手。

生命周期實驗

研究人員使用開放世界游戲Minecraft來測試智能體的持續學習和生存能力。智能體從最基礎的活動如開采木材和制作工作臺開始,逐步探索未知環境,獲得更復雜的生存技能。

實驗中,智能體使用進行高層次計劃制定,并可以根據環境反饋不斷調整策略。結果表明,智能體可以在完全自主的情況下開發技能,持續適應新的環境,展現出強大的生命周期管理能力。

此外，在社會模擬方面,研究人員探討了智能體是否會表現出人格和社交行為,并測試了不同的環境設置。結果表明智能體可以展現出某些層次的認知能力、情感和性格特質。在模擬社會中,智能體之間會出現自發的社交活動和群體行為。

本文素材來源復旦NLP、米哈游論文，如有侵權請聯系刪除

END

繼續閱讀：

未經允許不得轉載：RPA中國 | RPA全球生態 | 數字化勞動力 | RPA新聞 | 推動中國RPA生態發展 | 流 > 米哈游、復旦發布，具備感知、大腦、行動的大語言模型“智能體”

相關推薦

熱門信息

閱讀 (14728)
1 2023第三屆中國RPA+AI開發者大賽圓滿收官&獲獎名單公示
閱讀 (13753)
2 《Market Insight：中國RPA市場發展洞察（2022）》報告正式發布 | RPA中國
閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰賽」成功舉辦及獲獎名單公示
閱讀 (12964)
4 與科技共贏，與產業共進，第四屆ISIG中國產業智能大會成功召開
閱讀 (11567)
5 《2022年中國流程挖掘行業研究報告》正式發布 | RPA中國

快速導航

主站蜘蛛池模板：林州市| 宝兴县| 从江县| 翁源县| 巫溪县| 怀安县| 洛川县| 江孜县| 蛟河市| 昌图县| 婺源县| 原阳县| 汉源县| 日喀则市| 察隅县| 顺平县| 南通市| 娄底市| 武隆县| 汶川县| 平顶山市| 临夏市| 乌兰县| 牟定县| 诸暨市| 衡水市| 田阳县| 大足县| 宁安市| 托里县| 出国| 上饶市| 堆龙德庆县| 临泉县| 岗巴县| 长阳| 磐安县| 淅川县| 措美县| 张掖市| 高邮市|

<ul id="oq2a0"><pre id="oq2a0"></pre></ul>

<ul id="oq2a0"><pre id="oq2a0"></pre></ul>

<strike id="oq2a0"><s id="oq2a0"></s></strike>

<samp id="oq2a0"></samp>