文本總結是機器學習算法的最佳應用途徑之一,微軟研究院最近發表的一篇論文證明了這一點。同時,文本自動總結功能有望減少企業員工閱讀郵件的時間。一項調查表明,企業員工平均每天需要2.6個小時用來閱讀郵件信息。近日,“谷歌大腦”(Google Brain)聯合英國倫敦帝國理工學院構建了一個智能系統,利用Google的Transformers架構與針對抽象文本量身定制的文本總結系統,可總結包括:新聞、科學、故事、說明、電子郵件、專利以及立法法案等文本內容。
在上述所有文本形式中,Google Brain的AI完美的總結了1000個文本實例,其真實度與編輯、作家所撰寫的內容幾乎一樣。正如研究人員所指出的那樣,與執行技術相比,文本摘要旨在從輸入文檔中生成準確而簡潔的摘要。抽象總結不僅可以復制輸入中的片段,還可以產生新穎的單詞或覆蓋主要信息,從而使輸出在語言上保持流利和人性化。
“情感探測器”是Google人工智能研究部門,Google Brain的研究人員在論文中介紹的一種神經結構。與所有深層神經網絡一樣,它們包含布置在相互連接層中的神經元,這些功能從輸入數據傳輸信號并緩慢調整每個連接的權重,這就是所有AI模型如何提取特征并學會進行總結的方式。Google Brain的團隊設計了一個數據訓練模型,其中包含了整個文檔中很重要的句子。人工智能必須通過利用網絡和新聞文章來填補空白,包括研究人員編寫的新語料庫和網絡文章等。
在實驗中,研究小組選擇了性能最佳的Pegasus模型:一種具有5.68億個參數或從歷史數據中學習的變量模型,通過從3.5億個網頁中提取的750GB文本(通用抓取)和從新聞網站收集的文章總計3.8TB。研究人員稱,在流利性和連貫性方面達到了很高的語言質量,并且不需要人工進行修改、校準等處理。
未經允許不得轉載:RPA中國 | RPA全球生態 | 數字化勞動力 | RPA新聞 | 推動中國RPA生態發展 | 流 > Google Brain的AI,實現了最先進的文本總結功能
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發展洞察(2022)》報告正式發布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產業共進,第四屆ISIG中國產業智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業研究報告》正式發布 | RPA中國