谷歌旗下的AI研究機構DeepMind和紐約大學的研究人員聯合開發了一個AI模型——AlphaGeometry。
AlphaGeometr是一種神經符號模型,內置了大語言模型和符號推理引擎等功能,主要用于解決各種超難幾何數學題,同時可以自動生成易于查看的解題原理。
為了驗證AlphaGeometr的性能,研究人員使用了正規國際奧數比賽的規則對其進行測試。
結果顯示,AlphaGeometry 在官方奧林匹克競賽時間限制下正確解決了,30道題中的25 道,接近人類金牌得主的25.9道。
而之前最先進的模型只能解決30道中的10道題。AlphaGeometry成為目前功能最強的解決幾何難題模型。
論文地址:https://www.nature.com/articles/s41586-023-06747-5?ref=maginative.com
AlphaGeometry的核心技術創新在于,破除了定理證明,對人類證明示例數據的嚴重依賴。
數學定理證明一直是檢驗邏輯思維和問題求解能力的關鍵任務,一直是AI研究的重要方向。盡管當前機器學習方法在許多領域取得長足進步,但是面對大部分數學任務仍然束手無策。
主要原因是,翻譯人類證明樣本到機器可驗證的格式是極其耗時、耗力的,這在幾何證明中尤其突出,翻譯難度加大導致了嚴重的數據稀缺。
AlphaGeometry通過大規模隨機生成幾何定理和相應的證明,來解決數據稀疏的問題,產生了上億組訓練數據。
具體來說,AlphaGeometry 首先使用圖形構建語言隨機生成大量候選定理陳述,然后利用符號演繹引擎(如演繹數據庫 DD)推導出所有可能的新結論,遞歸地回溯每個新結論所依賴的前提,提取出最小依賴集作為該定理的證明。
為了擴大證明的范圍,除了純符號演繹,該方法還通過代數推理引擎新增了許多依賴代數操作的證明步驟。最終,得到了大約1億組合成的定理證明訓練數據。
在獲得大規模訓練數據后,AlphaGeometry使用 Transformer 大語言模型進行預訓練,學習預測證明的序列。
此外,它還進行了針對性微調,集中優化輔助構造的生成。以解決幾何證明中一個關鍵難題,定理證明中的外生項生成問題。
在實際應用時,AlphaGeometry采用了交互式的神經符號框架。簡單來說,大語言模型會首先生成一組輔助構造候選,然后符號引擎基于新構造判斷定理是否得證。
如果仍未成功,則迭代上述流程,語言模型會在更豐富的上下文中生成新的輔助構造候選。
這個框架設計的非常巧妙,大語言模型負責開拓解空間,提出新的假設,而符號引擎則保證精確正確的推理。完美地結合神經網絡的創造力和符號系統的解釋性、精確性。
AlphaGeometry基本解決了幾何定理證明領域數據稀疏的關鍵難題,開創了不依賴人類證明示例、利用合成數據訓練AI模型的創新方法。
本文素材來源AlphaGeometry論文,如有侵權請聯系刪除
未經允許不得轉載:RPA中國 | RPA全球生態 | 數字化勞動力 | RPA新聞 | 推動中國RPA生態發展 | 流 > 大模型獨立解答30道國際奧數難題,能力接近金牌選手!
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發展洞察(2022)》報告正式發布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產業共進,第四屆ISIG中國產業智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業研究報告》正式發布 | RPA中國