中科院提出“思維傳播”,極大增強ChatGPT等模型復雜推理能力

      后臺-系統設置-擴展變量-手機廣告位-內容正文頂部

      中國科學院自動化研究所與耶魯大學計算機系研究人員聯合發布了,一份名為《思維傳播:用大型語言模型進行基于類比的復雜推理》的論文。

      ChatGPT等大型語言模型展示出了超強的創造能力,只需簡單的文本提示就能生成小說、營銷創意、簡歷等各種文本內容。但在處理復雜的推理任務時卻差強人意,主要面臨從0推理以及在任務推理過程中錯誤累加兩大難題。

      為了解決這些難題,研究人員提出了思維傳播(Thought Propagation,簡稱“TP”)的技術框架,通過提出類比問題、解決類比問題、聚合類比問題,從而提升大語言模型的復雜推理能力。

      根據在最短路徑尋優、創造性寫作和語言模型智能體計劃測試結果顯示,相比傳統方法,思維傳播將性能分別提升了12%、13%和15%。

      簡單來說,就是為大語言模型添加一種擬人化的“類比思想”,讓其學會總結、利用過往的成功經驗,不必總是從0開始。

      論文地址:https://arxiv.org/abs/2310.03965

      思維傳播框架簡單介紹

      從論文內容來看,思維傳播框架模擬的就是人類的“類比思想”。當我們遇見新問題時,經常會使用過往的經驗、行動來解決這些難題,這也被稱為“類比推理”。

      思維傳播框架主要由LLM Propose、LLM Solve、LLM Aggregate、多層實現和即插即用等多個模塊組成。

      LLM Propose :通過使用 prompt 的方式讓語言模型提出與輸入問題相關的類比問題。提出的類比問題可以從兩個角度幫助解決輸入問題:(1)類比問題的解可以直接轉移應用到輸入問題上;(2)解決類比問題可以推導出針對輸入問題的計劃。

      LLM Solve:使用現有的提示方法(如 Chain-of-Thought)來解決輸入問題和 LLM Propose 模塊提出的類比問題。得到輸入問題和類比問題的初始解。

      LLM Aggregate:該模塊聚合類比問題的解來增強輸入問題。具體來說,有兩種方式: (1)提示語言模型基于類比問題的結果直接產生輸入問題的新解。

      (2)比較輸入問題和類比問題,并基于類比問題的結果推導針對輸入問題的計劃。然后執行該計劃來糾正輸入問題的中間推理。

      多層實現:可以堆疊多個思維傳播層,以利用 K 跳的類比問題來逐層改進輸入問題的解。

      即插即用:思維傳播兼容現有方法,可以應用到不同的推理任務中,只需要替換 LLM Solve 模塊的具體實現。

      思維傳播框架性能測試

      為驗證思維傳播框架的性能,研究團隊在最短路徑尋優、創造性寫作和語言模型智能體計劃三大任務上進行了比較實驗。

      結果顯示,思維傳播相比于僅使用提示方法的基線系統,在找到最優解的性能提升12%,在生成連貫段落的性能提升13%,在完成任務的性能提升15%。

      研究人員指出,這三個任務分別需要搜索圖結構數據、開放式寫作和長時間計劃,當前的提示方法仍面臨挑戰。

      而思維傳播框架展現了在這些復雜推理任務上取得顯著提升的潛力。同時,該框架提供了一種可即插即用的通用類比推理方法,可避免針對特定任務設計定制提示,降低使用門檻。

      思維傳播框架對大語言模型的重要性

      從思維傳播框架在GPT-4、GPT-3.5等大語言模型的測試結果來看,可顯著提升復雜推理能力,并減少推理的錯誤。

      提高復雜推理能力: 思維傳播可以重用解決類比問題的經驗,來增強大語言模型處理復雜任務的能力,例如,最短路徑尋優、創造性寫作等需要多步推理的任務。

      減少推理錯誤:通過比較類比問題的解來指導輸入問題的推理,可以幫助大語言模型避免從0開始推理時容易堆積的錯誤。

      減少任務特定提示設計:提供了一個通用的類比推理框架,可以即插即用地應用到不同任務,減少了針對特定任務設計定制提示的工作量。

      提供新的研究視角:思維傳播為研究社區提供了,從類比推理視角來增強大模型復雜推理能力的新思路和有效途徑。

      表現優于同等規模模型:在多個任務上的試驗表明,基于思維傳播的GPT-4明顯優于不使用該框架的GPT-4,以及其他同等計算量的模型。

      可擴展性:思維傳播是是一個通用框架,未來可繼續優化和擴展到更多的復雜推理任務中,以發揮GPT-4等大語言模型的潛力。

      總體來說,思維傳播框架的優勢在于可以重用類比問題的解來直接得到輸入問題的新解,避免從0開始推理。

      同時,它還可以學習到解決類比問題的總體策略,推導出計劃來指導輸入問題的推理,以此規避中間步驟的錯誤。

      本文素材來源中國科學院自動化研究所論文,如有侵權請聯系刪除

      未經允許不得轉載:RPA中國 | RPA全球生態 | 數字化勞動力 | RPA新聞 | 推動中國RPA生態發展 | 流 > 中科院提出“思維傳播”,極大增強ChatGPT等模型復雜推理能力

      后臺-系統設置-擴展變量-手機廣告位-內容正文底部
      主站蜘蛛池模板: 双鸭山市| 武宁县| 安龙县| 广灵县| 道孚县| 余姚市| 同仁县| 太仆寺旗| 三穗县| 治多县| 梨树县| 仁怀市| 本溪| 清苑县| 包头市| 淄博市| 资兴市| 庆云县| 玉山县| 永嘉县| 崇信县| 怀仁县| 革吉县| 会东县| 平阳县| 永仁县| 阿鲁科尔沁旗| 温州市| 竹北市| 湖口县| 玛多县| 滕州市| 彭山县| 朝阳区| 吉安县| 邵阳县| 海南省| 吴旗县| 通道| 城市| 云林县|