隨著ChatGPT等大模型的出現,AGI概念正在從哲學層面快速轉向實際應用落地,并且ChatGPT已經展示出了初級AGI的功能(如AutoGPT),有不少專家認為,AGI時代可能在10年內到來。
因此,需要一個明確的技術框架來討論和衡量不同系統的AGI能力。谷歌的DeepMind研究人員提出了6項關于“AGI框架”的定義原則。
基于這些原則,又提出了表現力和通用性兩個維度的AGI技術框架,包含5個表現力等級(初級、熟練、專家、大師和超人)和通用詳細等級劃分。
論文地址:https://arxiv.org/abs/2311.02462
谷歌研究人員表示,這一框架有助于指導AGI定義和風險評估,為技術研究指明了發展方向。期待學術界可以在此基礎上開展后續研究,逐步完善AGI的量化框架和基準測試,以更準確地衡量AI的進步,并謹慎應對風險。
AGI簡單介紹
AGI英文全稱是Artificial General Intelligence,中文譯為通用人工智能。AGI是指在任何任務上,AI都可以像人類一樣表現出高度適應性和靈活性,高效率地完成指定任務。
當前的AI通常被設計為在特定的任務或問題范圍內表現出色,而AGI能夠跨領域學習、理解、推理并應用所學知識。
ChatGPT已經具備初級AGI功能,例如,它既能當情感伴侶與你聊天,也能查看郵件、生成創意文本/圖片等,幫你處理日常工作。
AGI的主要技術特征包括學習、推理、理解、感知、創造、通用學習、自我意識等重要能力。
學習能力:AGI應能夠自主學習新任務,而無需針對每項任務的特殊編程。
推理能力:能夠用擬人化的邏輯推理來解決復雜問題。
理解力:可以理解語言、概念、情感等,以及如何處理它們之間的關系。
感知能力:能夠通過感官(例如,計算機視覺、語音識別)來感知這個世界。
創造力:能夠創造性地解決問題,例如,生成圖片、語音、視頻等。
通用學習:能夠將在一領域學到的知識,遷移到其他領域。
自我意識:理論上,AGI需具備記憶存儲、歷史查詢的能力,讓其擁有自我意識以提升工作效率。
谷歌對于AGI則提出了6項更具體,有指導意義的原則,這有助于該技術以健康、安全的方式發展。
通用性和表現力
衡量一個AGI需要同時考量其通用性和表現力兩個維度。通用性指能夠處理任務的廣度和多樣性,表現力指在這些任務上達到的水平。
高通用性和表現力都對AGI意義重大且不可或缺。一個系統即使在很多任務上有出色表現,如果這些任務過于相似或局限,也難稱為AGI。
反過來,一個極為通用的系統,如果所有任務的完成質量都很差,也與人類智能難以媲美。通用性和表現力必須同時達標,才可能成為AGI。谷歌對于這兩個維度給出了詳細的定義框架。
1)表現力
初級(Emerging)
要求與不熟練的人類差不多或略勝。對應狹窄AI中的早期專家系統,通用AI中的大型語言模型。
熟練(Competent)
要求超過50%熟練成人的表現。對應狹窄AI中的語音助手、VQA系統等。尚無通用AI達到。
專家(Expert)
要求超過90%熟練成人的表現。對應狹窄AI中的語法檢查、圖像生成模型等。尚無通用AI達到。
大師(Virtuoso)
要求超過99%熟練成人的表現。對應狹窄AI中的圍棋軟件AlphaGo等。尚無通用AI達到。
超人(Superhuman)
要求超過100%人類的表現,做到人類根本無法企及的任務。對應狹窄AI中的AlphaFold蛋白結構預測等。
2)通用性
狹窄AI(Narrow AI)
只能處理一小類特定的任務。不同表現力層次要求同上。
通用AI(General AI)
需要能處理廣泛的認知任務,包括語言、邏輯、創造等大部分人類有能力的任務。
不同表現力層次對應的最低要求如下:
初級:各任務表現尚可,但大多數任務不佳。
熟練:大多數任務達到一般人中等水平。
專家:大多數任務超過90%人類表現。
大師:所有任務超過99%人類表現。
超人:所有任務超出人類極限。
關注能力而非機制
AGI的定義應該關注AI系統的能力,而不是實現這些能力的具體機制。例如,我們不應該要求AGI必須通過類似人腦的學習機制來實現其能力,也不應將AGI的定義建立在“強AI”這樣主觀意識方面的假設上。AGI的重點應是評估其可以完成的任務類型和效果。
這條原則的合理性在于,神經網絡等當前主流技術的成功正是建立在不完全擬人的基礎上。與人腦相比,它們有著完全不同的計算機構成和信息處理方式。
面向能力而非特定機制,既可以避免因為假設了不必要的實現條件而過早地限制AGI的定義,也可以忽略那些目前難以科學檢驗的主觀意識屬性,把討論集中在較為客觀和可操作的能力層面。
元認知能力
AGI的定義應該關注處理非物理世界的認知任務,而不是要求必須具備機器人那樣的物理能力。元認知能力,如學習新技能的能力,也被認為是AGI達到高通用性的關鍵。
之所以這樣,是因為目前在非物理領域如語言、視覺、推理等方面,AI系統取得的進展明顯領先于具備實際移動操作能力的機器人。
將物理能力作為AGI的先決條件,顯然過于苛刻。當然,長遠來看,在物理世界獲得經驗可能會提升一些認知能力,但短期內應該關注AI已比較拔尖的認知能力。
關注潛力而非部署
谷歌認為,我們不應該要求一個系統必須被實際大規模部署,才能被認定為AGI。只要一個系統能夠在受控環境下,通過標準測試展示完成某類別任務的能力,就可以認定它具備對應的AGI水平。
因為實際部署會帶來很多技術之外的障礙,如法律監管、社會接受度等。把部署作為AGI的必要條件,讓AGI的判定標準包含了太多非技術因素。我們應該關注AI系統的本質能力,而不是它的實際應用程度。
關于生態
用于衡量AGI的任務應具有生態效度,即與人類在現實生活中重視的任務盡可能接近。不應只關注那些易于量化但是與實際生活脫節的任務。
現有的許多AI基準測試過于簡化,脫離實際場景,很難真正評估一個系統在復雜環境下協助人類的能力。
相反,我們需要設計更貼近真實世界,模擬人類活動的測試,以得到對AGI實際能力的準確評估。這需要我們跳出傳統的思維定勢,不僅追求易測量,也要追求對用戶有意義。
關注通往AGI的路徑,而非單一目標
谷歌認為,我們應該將AGI視為一個連續發展的過程,而不是一個固定的目標。需要設定AGI發展路徑上的多個進展階段,而不是只關注最終的AGI概念。
這種層次化和漸進的方法有助于我們理解和把控AGI的進展軌跡。不同層次也對應著不同的風險和對策。
如果只一味追求最終的AGI,很容易忽視進展過程中的重要問題。而一個循序漸進的多階段框架,則支持我們在每一步都審慎地評估機遇和風險,以確保AI的健康發展。
本文素材來源谷歌論文,如有侵權請聯系刪除
未經允許不得轉載:RPA中國 | RPA全球生態 | 數字化勞動力 | RPA新聞 | 推動中國RPA生態發展 | 流 > 谷歌提出AGI的6大原則,和5大能力等級
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發展洞察(2022)》報告正式發布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產業共進,第四屆ISIG中國產業智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業研究報告》正式發布 | RPA中國