文章來源 | 36氪Pro
作者 | 詠儀
圖片來源 | 達觀數(shù)據(jù)
如有侵權(quán),請聯(lián)系刪除
36氪獲悉,「達觀數(shù)據(jù)」于昨日推出新產(chǎn)品“智能文本 RPA”。
達觀數(shù)據(jù)成立于 2015 年,技術(shù)方向是自然語言處理(NLP),即在文本數(shù)據(jù)基礎(chǔ)之上做各種應(yīng)用,比如文本挖掘、搜索推薦等,主要產(chǎn)品是文本智能化處理軟件系統(tǒng),能夠幫助客戶完成文檔智能審閱、推薦、搜索、客戶意見洞察等工作。此前,達觀已成功服務(wù)招商銀行、中國平安、華為、中國移動等數(shù)百家金融、制造、軍工、科技等領(lǐng)域企業(yè)和政府機構(gòu)。
RPA(機器人流程自動化)是近兩年較為火熱的話題。簡單來說,這是一項橫向的、貼近業(yè)務(wù)流的技術(shù),用于自動化處理重復(fù)、規(guī)則明確、并且需要人類切換不同系統(tǒng)來完成的工作。具體到產(chǎn)品形態(tài),則是自動化軟件,模擬人類的交互完成重復(fù)性事務(wù)。
舉個例子,如果一個分析師每天需要關(guān)注一家上市公司的數(shù)據(jù),每天要在同一個網(wǎng)站扒數(shù)據(jù),并填到表內(nèi),那么 RPA 機器人就可以自動完成獲取數(shù)據(jù)、填表、導(dǎo)出等工作。
具體到達觀的 RPA 產(chǎn)品,主打 NLP + RPA + OCR,即在機器人里集成了 NLP(自然語言處理) 和 OCR (光學(xué)字符識別) 模塊,優(yōu)勢在于能做更多復(fù)雜應(yīng)用場景的業(yè)務(wù)流程自動化。陳運文表示,在企業(yè)流程中,大約 10 - 20%是簡單業(yè)務(wù)流程,其他則是需要人工參與的復(fù)雜流程,本次達觀推出的 RPA 產(chǎn)品,相當(dāng)于是傳統(tǒng) RPA 的升級版,能夠大大提高服務(wù)能力。
傳統(tǒng) RPA 產(chǎn)品由開發(fā)平臺、控制中心、終端機器人組成。在 RPA 三大核心部分的產(chǎn)品功能設(shè)計上, 達觀智能 RPA 產(chǎn)品負責(zé)人金克指出,面向企業(yè)級用戶,達觀數(shù)據(jù)會從擅長的 NLP 與 OCR所覆蓋的場景切入,在產(chǎn)業(yè)設(shè)計層面結(jié)合兩者的易用性與準(zhǔn)確率。在前端,達觀RPA提供兩個版本,一個是面向業(yè)務(wù)人員的版本,可直接拖拽模塊或錄屏,無代碼設(shè)置程序;另外也提供IT人員版本,可編程,用于更復(fù)雜的業(yè)務(wù)流程。
在目標(biāo)市場上,達觀的 RPA 產(chǎn)品面向的還是中大型客戶,產(chǎn)品目前已經(jīng)完成測試階段,并有實際落地案例。從落地效果上看,達觀 RPA 單個機器人能夠完成 4 個普通員工的工作,成本在人類員工的25%。
達觀數(shù)據(jù)副總裁賈學(xué)鋒在發(fā)布會上也介紹,截至目前,達觀智能 RPA 已推出銀行、財稅、政務(wù)、保險、證券基金等數(shù)十種不同崗位的機器人員工。在售后工單處理、商業(yè)案例報告生成、供應(yīng)商準(zhǔn)入核實、智慧政務(wù)行政審批、金融文檔的抽取驗查和填寫等場景中已開展工作。
對于此次新產(chǎn)品發(fā)布,36氪也對達觀數(shù)據(jù)創(chuàng)始人兼 CEO 陳運文進行了采訪。
NLP+OCR,解決RPA“最后一公里問題”
陳運文表示,達觀數(shù)據(jù)自 2017 年即接觸到 RPA,并且與國內(nèi)外 RPA 公司和咨詢公司均有合作,發(fā)現(xiàn) RPA 與 NLP 天然的互補性, NLP 技術(shù)是提高 RPA 能力的重要模塊。因此,達觀自 2018 年年初開始研發(fā),并且于今年 1 月完成 RPA 產(chǎn)品 1.0 研發(fā),推向試點客戶。
他對 36 氪介紹:“在文本處理里,也分為簡單和復(fù)雜流程,簡單的文檔處理可以通過 RPA 來完成,而復(fù)雜的的工作單靠 RPA 無法處理,達觀即是補全了這塊的能力。”
通過自然語言邏輯分類、自然語言數(shù)據(jù)提取、識別和深度學(xué)習(xí)模式預(yù)測,達觀的新產(chǎn)品可以將 RPA 的應(yīng)用場景覆蓋面提升 80% 以上,比如能更好地解決傳統(tǒng) RPA無法處理的非結(jié)構(gòu)化數(shù)據(jù)源問題,像圖片驗證碼識別、證件識別、紙質(zhì)文檔識別、合同抽取、財務(wù)報表抽取、報告生成等業(yè)務(wù)需求。
比如說,金融行業(yè)和政府機構(gòu)都有大量的資料報送和審查場景,存在大量非結(jié)構(gòu)化的數(shù)據(jù)。陳運文以一個數(shù)據(jù)采集場景舉例,一張單據(jù)上,無論填寫者用“供應(yīng)商”還是“甲方”,表達的意思是一樣的,但對于 RPA 機器人來說,如果不知道兩個字段的意思相通,抓數(shù)據(jù)的時候就會出現(xiàn)錯誤,這就需要 NLP 模塊來幫忙。
RPA最早起源于國外,但陳運文認為,RPA 在中國規(guī)模化發(fā)展更需要做有中國特色的 RPA產(chǎn)品。和英文相比,中文更靈活,語法結(jié)構(gòu)更復(fù)雜,這使得融合的 NLP 技術(shù)在實現(xiàn)路徑和方法上存在一定的差異化,在語義理解上也面臨更大的難度與挑戰(zhàn);另一方面,中國大型企業(yè)復(fù)雜的組織架構(gòu)與權(quán)限劃分需要從產(chǎn)品設(shè)計上做好不同部門、職級、角色的機器人隔離設(shè)計。
以NLP起家,為何做RPA?
目前國內(nèi)做 RPA 的公司大致分為幾類:只做 RPA 的創(chuàng)業(yè)公司、傳統(tǒng)的IT/運維/運營自動化廠商、巨頭,以及人工智能公司,達觀數(shù)據(jù)屬于人工智能公司一類。
從業(yè)務(wù)邏輯來看,達觀數(shù)據(jù)做 RPA 產(chǎn)品可以說順其自然。
此前達觀數(shù)據(jù)的主營產(chǎn)品“文本智能化處理軟件系統(tǒng)”是以NLP+OCR為核心,完成實際業(yè)務(wù)中的文本數(shù)據(jù)抽取、識別、關(guān)聯(lián)比對、核對、寫作等環(huán)節(jié)。對于業(yè)務(wù)中的各種非結(jié)構(gòu)化文檔,前期獲取數(shù)據(jù)即會涉及到跨系統(tǒng)抓取,獲取后的處理環(huán)節(jié),也需要結(jié)合業(yè)務(wù)操作流程。
與 RPA 的業(yè)務(wù)模式有共通互補之處,并且通過此前產(chǎn)品,已經(jīng)了解了不少客戶的實際業(yè)務(wù)流程——這也是達觀數(shù)據(jù)將 RPA 與 NLP 結(jié)合的原因。
不過,現(xiàn)在 RPA 公司也會采取調(diào)用外部 NLP 模塊來做文本處理,NLP 公司還有無自己做 RPA 的必要?陳運文表示:
-
第一,如果 RPA 公司調(diào)用國外的 NLP 模塊,若對中文支持不好,機器人效率會不理想。
-
第二,RPA 貼近業(yè)務(wù)的特性,能讓客戶直觀地看到業(yè)務(wù)效率的提升,ROI表現(xiàn)突出,這能很好地降低AI的落地門檻——若作比喻,那么RPA則是蛋殼,AI能力是內(nèi)里,客戶想要的是一整個雞蛋,兩者不能缺失。無論是在拓新客戶,還是服務(wù)老客戶層面,做 RPA 都是很好的選擇。
未經(jīng)允許不得轉(zhuǎn)載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動力 | RPA新聞 | 推動中國RPA生態(tài)發(fā)展 | 流 > 專注 NLP+RPA+OCR,「達觀數(shù)據(jù)」發(fā)布新產(chǎn)品“智能文本 RPA ”
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報告正式發(fā)布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進,第四屆ISIG中國產(chǎn)業(yè)智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業(yè)研究報告》正式發(fā)布 | RPA中國