世界人工智能大會回顧:智能文本處理技術與未來辦公機器人

      后臺-系統設置-擴展變量-手機廣告位-內容正文頂部

      在2020年世界人工智能大會云端峰會中,達觀數據與浦東青聯聯合舉辦了“智能時代,‘語’你同行”行業論壇,圍繞語言智能,與多位行業專家與學者展開了一場精彩線上交流盛宴。

       

      達觀數據陳運文博士在論壇上進行了《智能文本處理技術與未來辦公機器人》的主題分享,在其分享中,和線上觀眾介紹了多款智能辦公機器人的應用場景與未來展望。以下為演講內容精華整理,觀看大會回放可直接下拉最下方二維碼進行精彩回顧。

       

       

      大家好,我是達觀數據創始人兼CEO陳運文,今天非常榮幸在世界人工智能大會的舞臺,使用云端的方式和大家分享《智能文本處理技術與未來辦公機器人》。

       

      首先和大家科普一下文字語言處理的概念。在人工智能版圖中,從技術站分為三方面:圖像處理、語音識別和文本處理。文本語義理解是人工智能領域中技術難度最高,處理技術最復雜的領域,因為語言文字高度抽象概括,被微軟創始人比爾蓋茨稱為“人工智能皇冠上的明珠”,它涉及人們日常工作范圍最密集的領域,所以讓計算機處理文字有巨大的實用價值。

       

       

      我們今天對文字的應用,傳承自5000年以來人類使用文字的經驗。人類歷史上最早的四種文字,從楔形文字到埃及圣書文、瑪雅文到中國甲骨文已經有5000年時間。文字是人類文明誕生和發展的核心標志,我們今天所有日常工作和信息交流都離不開對文字使用。

       

      在文字誕生之前,信息只能靠基因發展延續下去,文字發明后,理性和抽象思維能力得到傳承,大幅度提升了人類文明的進化速度。在計算機科學發展之下,能否讓計算機這項非常強大的工具幫助我們更好地進行文字閱讀寫作、審核、分析的工作,減少工作中對文字處理的繁重負擔,我們認為是非常有意義的事。

       

      達觀數據的核心技術自然語言處理(Natural Language Processing,簡稱NLP)它分為:自動閱讀和自動寫作。計算機有閱讀能力后可以幫助我們進行核對、審批、查驗、分析、派發等日常工作;計算機具備寫作能力后可以幫助我們起草日常報告、進行潤色糾錯、輔助填表、擴充內容等。

       

      今天企業日常辦公中需要大量的文檔資料處理工作。從早期的算盤、帳本到現在的自動化處理技術,以及大量自動化處理的相關智能技術,這些技術逐步發展,對我們辦公的自動化發揮了巨大價值。

       

       

      我們認為RPA是我們今天辦公機器人的非常關鍵的應用基礎之一,RPA,Robotic Process Automation,英文翻譯過來叫機器人流程自動化,它的特點是計算機軟件可以模擬人進行鍵盤和鼠標的操作,從而把在電腦上進行的大量規則性、重復性、事務性的工作大幅進行自動化,流程性的重復性工作將提升幾十倍效率。

       

      我們認為利用好RPA,再結合語言文字認知的相關能力,就可以在辦公場景中做很多工作。RPA可以登陸應用、移動文件、讀寫數據庫、從文檔和表單中提取信息、郵件處理等等。將這些工作能力進行合并,就是一款款智能辦公機器人。我們來看一下幾款辦公機器人的例子。

       

      1、智能報銷機器人

      財務部門需驗證大量發票真偽,將報銷費用、分攤費用、信息手動錄入ERP財務系統,完成報銷流程。      

           
      通過達觀智能辦公機器人,將自動識別各類發票,包括增值稅專用發票、增值稅普通發票、機票行程單、火車票、餐飲票等,并將識別結果結構化,每筆報銷縮短為5min。      


      2、郵件自動化處理機器人

      會計部門業務人員每月需多次向相關單位發送賬齡信息收集通知郵件,并在指定時間內收取單位回執郵件,對附件數據進行匯總。      

           
      通過達觀智能辦公機器人,可根據郵件主題關鍵字收取指定郵件,統計已回復郵件單位及超時未回復單位,并根據業務需求匯總各單位回執EXCEL文件數據,每封郵件處理時間由3分鐘縮短至0.5分鐘。      


      3、財務報表機器人

      銀行客戶經理需將大量財務報表上的數百項信息手動錄入至銀行系統,還需將財務信息填寫至盡職調查報告,這些財務報表數量多、會計科目數值大、人工采集非常耗時、易出差錯。      

           
      智能辦公機器人可自動識別企業財務報表并錄入系統,自動生成信審報表,全流程從4小時降低至10分鐘內,效率提高23倍。      

       
      結合人工智能技術開發出來的智能辦公機器人,它背后有巨大的價值,我們認為可以總結成三點:更快速、更準確、更便宜。輔助人類完成很多量大繁瑣重復的工作,縮短70%的耗時;降低95%的錯誤率;釋放50%的人力。  

       
      下面是達觀數據已經在各行各業實現的機器人自動化辦公的例子。  


      1、同業對賬機器人

      同業業務部對賬人員需下載多個不同銀行賬戶和金融機構自身財務核心系統眾多流水,并逐條比對繁多條目,將不符的賬目錄入余額調節表,查明差額原因。這個過程中銀行賬號及流水信息數量大,人工耗時且易出差錯,資金風險高,審計和監管風險大。      

           
      下圖是辦公機器人來進行對賬,減少了管賬人員工作量、100%保障賬單數據準確性、提高資金安全保障,滿足監管和審計要求。      

           
             

           

      2、貸款信息錄入機器人

      業務經理在“個人快速貸款”相關的業務場景中,需要人工進行貸款業務的任務分發、材料審核、合同制作、信息錄入編輯、積分記錄等操作。      

           
      這個工作是每天每月都需要完成的,我們開發的辦公機器人可以很快完成貸款方面所有資料的錄入相關工作,將靠原來完成的手工操作全部自動化,大幅提高了效率。      

           
             

           

      3、納稅審核機器人

      辦公機器人也可以像人一樣做好監督管理工作。在納稅申報環節,企業需提交大量當年度及以前年度資料,由于大部分資料均為紙質版或掃描件,稅務人員在整理信息時非常耗時耗力,且存在納稅企業重復提交篡改后的文檔的風險。      

           
      智能辦公機器人可以將文檔進行比對,以方便從業人員一目了然地了解申報資料的篡改風險。       

           

      4、披露報告撰寫機器人

      辦公機器人可自動進行指定商業報告的撰寫工作,給大家展示一下機器人進行銀行貸款報告撰寫流程。      

           
      機器人自動按照人的工作邏輯完成報告的撰寫,可以大幅度提高效率,讓人少加班,非常受到銀行基層員工歡迎。      

       
             

       
      將人類延續5000年的文化更好的進行自動化,這背后離不開智能化技術的應用價值。我們來看一下這背后有哪些機制以及未來將有哪些演化?  

       
      首先是自然語言處理技術,讓機器人理解文檔內容,需要有語義分析的能力作為基礎。達觀數據在字、句、篇章三個層面完成語義分析相關工作。并且加入各行各業知識圖譜更好地進行行業里文字資料處理分析的相關工作。  

       
         

       
      其次是圖像識別OCR技術,辦公機器人像人一樣完成工作,需要處理很多紙制、掃描件存在形態的文檔資料,比如身份證、行駛證等證件照掃描件等。  

       
      OCR技術如同人眼睛,達觀OCR 基于機器學習和深度學習的技術,綜合運用圖像處理、計算機視覺、自然語言處理等技術,充分利用圖像特征和自然語言的先驗知識,關注整個圖像序列對應的文字內容,利用文字序列上下文語義進行消歧,獲得更好的效果。同時,獨有研發的將抽取和檢測識別結合一體,將從圖像直接抽取出要素的端到端模型的迭代優化,實現效率和效果雙佳。  

       
      所有智能化技術背后離不開大量模型和算法。達觀數據挖掘了超過2000億字的資料庫,進行歸納總結。中國有句古話叫“讀書破萬卷,下筆如有神”,辦公機器人的智能化程度背后離不開大量對文檔資料的閱讀和學習。  

       
      目前在金融、法律、財稅、制造、軍工企業等行業都有達觀數據的智能辦公機器人進行自動化工作,未來達觀也將開發更多的辦公機器人賦能各行業。  

       
      我們相信未來將有越來越多的企事業單位設立相關部門部署智能辦公機器人,讓人和計算機共同進行協作。我們預計十年之內,將有超過50%日常辦公工作可由辦公機器人來完成。在這個過程中,我們將讓計算機不斷學習人類知識,讓辦公機器人處理更多不同應用場景中的工作內容。  

       

      掃碼下方二維碼,觀看大會精彩回放

          
       

      特別聲明:

      文章來源:達觀數據(Datagrand_)

      原文鏈接:https://mp.weixin.qq.com/s/WedgONZzjSqeX6kmkQ_PLw

      RPA中國推薦閱讀,轉載此文是出于傳遞更多信息之目的。如有來源標注錯誤或侵權,請聯系更正或刪除,謝謝。

      未經允許不得轉載:RPA中國 | RPA全球生態 | 數字化勞動力 | RPA新聞 | 推動中國RPA生態發展 | 流 > 世界人工智能大會回顧:智能文本處理技術與未來辦公機器人

      后臺-系統設置-擴展變量-手機廣告位-內容正文底部
      主站蜘蛛池模板: 元江| 上杭县| 北票市| 平顶山市| 临朐县| 曲沃县| 龙海市| 延边| 大宁县| 曲阜市| 龙里县| 托里县| 五河县| 诸城市| 广饶县| 陈巴尔虎旗| 仲巴县| 基隆市| 南川市| 金山区| 邯郸县| 射洪县| 海盐县| 策勒县| 淮南市| 和静县| 汝州市| 武安市| 长沙市| 光泽县| 文山县| 沽源县| 浠水县| 武功县| 东光县| 乐清市| 砚山县| 左贡县| 那曲县| 五家渠市| 峨边|