隨著企業(yè)規(guī)模的不斷擴(kuò)大,越來(lái)越多的文檔材料等需要人工進(jìn)行審核,尤其銀行、金融機(jī)構(gòu)、審計(jì)機(jī)構(gòu)等文本相關(guān)崗位審核工作尤為繁重。隨著人工智能技術(shù)不斷積累及成熟,越來(lái)越多的人工智能技術(shù)被落地賦能于各行業(yè)的智能化系統(tǒng)設(shè)計(jì),智能輔助人類辦公,其中OCR(光學(xué)字符識(shí)別)、NLP(自然語(yǔ)言處理)等技術(shù)應(yīng)用的尤為廣泛。
本文以合同審核項(xiàng)目為例,講述如何利用人工智能技術(shù)實(shí)現(xiàn)文檔智能審閱,同時(shí)利用RPA技術(shù)實(shí)現(xiàn)文檔審閱智能化、批量化,從而打造智能文檔審閱系統(tǒng)。
合同審核中存在的問(wèn)題
合同作為一類審核項(xiàng)繁多、審核困難且容易帶來(lái)較大風(fēng)險(xiǎn)的文檔,對(duì)于一家企業(yè)來(lái)說(shuō)需要花費(fèi)極大的時(shí)間、精力進(jìn)行審核和校對(duì),尤其是對(duì)于集團(tuán)性企業(yè)來(lái)說(shuō),需要耗費(fèi)大量的財(cái)務(wù)、法務(wù)人員的時(shí)間精力。合同審核主要存下如下問(wèn)題:
1)合同數(shù)量龐大,人工審核工作量巨大。
2)審核細(xì)節(jié)多,審核速度較慢,工作內(nèi)容較為重復(fù)且枯燥。
3)失誤無(wú)法避免,會(huì)帶來(lái)巨大風(fēng)險(xiǎn)點(diǎn)。
4)可能涉及到各類掃描件、證照等,難以至于獲取信息。
構(gòu)建智能合同審閱系統(tǒng)改變傳統(tǒng)工作方式
智能合同審核系統(tǒng)是主要基于NLP、OCR、機(jī)器學(xué)習(xí)等技術(shù)完成對(duì)各類合同文檔的關(guān)鍵要素抽取,例如合同甲方、乙方、金額,幣種、標(biāo)的物、地點(diǎn)、時(shí)間等結(jié)構(gòu)化的信息,并基于一定的規(guī)則設(shè)置幫助合同審計(jì)人員完成自動(dòng)審核工作的一體化解決方案。下面來(lái)講講智能合同審閱系統(tǒng)的幾大核心步驟或功能模塊:
隨著合同審核的階段或業(yè)務(wù)流程的不同,不同階段可能有不同格式的文件,如Word、PDF、JPG等。對(duì)于電子版的Word、PDF等格式我們可以采用一些第三方的庫(kù)或者轉(zhuǎn)Htm等方式直接提取其中的文本及結(jié)構(gòu)信息。
對(duì)于掃描件或者照片等格式的附件我們需要利用OCR技術(shù)將其轉(zhuǎn)化成電子文本,在這里我們可以直接使用一些第三方的OCR能力(例如阿里云、百度、騰訊優(yōu)圖等),我們可以根據(jù)具體的樣本或者文本需要選擇不同的OCR服務(wù)。當(dāng)然并非所有的OCR需求均可以使用通用能力完成,部門特殊樣本或證照的識(shí)別可能需要根據(jù)具體需求及樣本進(jìn)行模型。
2. 合同信息智能抽取
將合同各類附件從紙質(zhì)文件轉(zhuǎn)化成可以進(jìn)行處理的電子化文本之后,我們需要根據(jù)不同的審核需求進(jìn)行識(shí)項(xiàng)的抽取。比如對(duì)于合同整本我們可能需要抽取其中的甲方、乙方、標(biāo)的物、金額、時(shí)間、地點(diǎn)、重要條款等。
我們可以基于規(guī)則+模型結(jié)合的方式實(shí)現(xiàn)問(wèn)文本信息智能抽取。對(duì)于合同模板十分固定或者上下文明確的合同模板,我們可以直接通過(guò)規(guī)則提取:對(duì)于并非十分固定的合同模板我們則需要利用NLP的一些算法訓(xùn)練抽取模型。
利用NLP技術(shù)中的分詞、命名實(shí)體識(shí)別等技術(shù)直接抽取合同中涉及到甲方、乙方、地名、金額、標(biāo)的物、實(shí)體信息。但是對(duì)于一些比較特殊的實(shí)體,比如具體的標(biāo)的物、付款方式、違約條款等我們需要根據(jù)實(shí)際需求進(jìn)行數(shù)據(jù)標(biāo)注及模型訓(xùn)練。開(kāi)始中文檔上傳輸出熟機(jī)質(zhì)核規(guī)則制定模型訓(xùn)驗(yàn)化模型.
可以通過(guò)正則表達(dá)式或者通過(guò)系統(tǒng)前段實(shí)現(xiàn)一些文本錨點(diǎn)配置工具,便于使用者快速的進(jìn)行提取。
對(duì)于合同審核中所涉及到的格式規(guī)范的文件,例如表格或者營(yíng)業(yè)執(zhí)照、資質(zhì)附件等結(jié)構(gòu)化的文件,我們可以直接采用在附件中的相對(duì)位置或者基于某一參照點(diǎn)的相對(duì)位置來(lái)獲取具體信息。
3. 合同智能審核
我們可以在通過(guò)系統(tǒng)中通過(guò)模型或者配置各類審核規(guī)則去進(jìn)行智能審核,審核包括以下維度:
主要對(duì)合同中的甲方、乙方、風(fēng)險(xiǎn)條款、違約條款等要素是否存在進(jìn)行審核。
主要審核合同中的關(guān)鍵信息是否正確,例如甲方、乙方等信息與營(yíng)業(yè)執(zhí)照、各類資質(zhì)證書(shū)上的名稱是否一致。
比如金額、利息、合同標(biāo)的物、付款方式等是否滿足企業(yè)的法務(wù)、財(cái)務(wù)等規(guī)定。
自動(dòng)糾正合同中的文字錯(cuò)誤及與語(yǔ)法錯(cuò)誤,目前我們常見(jiàn)的各類輸入法以及文本辦公軟件都具有文本糾錯(cuò)功能或服務(wù),但是其大多是針對(duì)通用場(chǎng)景,如果我們需要其針對(duì)某一特殊領(lǐng)域的合同進(jìn)行智能糾錯(cuò),還需要根據(jù)特定的合同預(yù)料進(jìn)行訓(xùn)練。
在合同審核的過(guò)程中,往往涉及到版本的不斷修改,那么如果避免某次修改內(nèi)容未被發(fā)現(xiàn)而帶來(lái)的風(fēng)險(xiǎn)呢,通過(guò)版本智能對(duì)比功能,我們可以輕松發(fā)現(xiàn)合同前后變化。
通過(guò)RPA實(shí)現(xiàn)文檔審核自動(dòng)化
RPA主要指機(jī)器人流程自動(dòng)化,通過(guò)模擬人工鍵盤、鼠標(biāo)操作實(shí)現(xiàn)點(diǎn)擊、輸入、復(fù)制、粘貼等操作。通過(guò)預(yù)設(shè)固定規(guī)則及流程,可以協(xié)助人工完成大量固定及重復(fù)性較高的工作。
在合同等文檔進(jìn)行審閱的過(guò)程中,可能存在巨大數(shù)量的合同進(jìn)行審閱,及時(shí)利用A技術(shù)也需要耗費(fèi)極大的人力成本。
那么利用RPA技術(shù)我們可以很好與文檔智能審閱系統(tǒng)或現(xiàn)有的合同、ERP系統(tǒng)很好的結(jié)合起來(lái)比如我們利用PA技術(shù)實(shí)現(xiàn)文檔的批量下載、上傳、識(shí)別以及對(duì)識(shí)別結(jié)果進(jìn)行導(dǎo)出,也可以利用RPA技術(shù)定期去將所有審核異常的結(jié)果進(jìn)行匯總,發(fā)送給相關(guān)人員進(jìn)行校驗(yàn)。
隨著人工智能技術(shù)的不斷成熟,以及日益增長(zhǎng)的文檔信息抽取、審核、流轉(zhuǎn)的相關(guān)需求,相信會(huì)有更多的AI技術(shù)會(huì)進(jìn)行落地,尤其是隨著PRA技術(shù)的廣泛落地,RPA+AI將會(huì)具有更廣闊的應(yīng)用場(chǎng)景。
本文由 @淡寫(xiě) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理繼續(xù)閱讀:
未經(jīng)允許不得轉(zhuǎn)載:RPA中國(guó) | RPA全球生態(tài) | 數(shù)字化勞動(dòng)力 | RPA新聞 | 推動(dòng)中國(guó)RPA生態(tài)發(fā)展 | 流 > 如何利用AI+RPA設(shè)計(jì)智能合同審閱系統(tǒng)
熱門信息
閱讀 (14728)
1 2023第三屆中國(guó)RPA+AI開(kāi)發(fā)者大賽圓滿收官&獲獎(jiǎng)名單公示閱讀 (13753)
2 《Market Insight:中國(guó)RPA市場(chǎng)發(fā)展洞察(2022)》報(bào)告正式發(fā)布 | RPA中國(guó)閱讀 (13055)
3 「RPA中國(guó)杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎(jiǎng)名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進(jìn),第四屆ISIG中國(guó)產(chǎn)業(yè)智能大會(huì)成功召開(kāi)閱讀 (11567)
5 《2022年中國(guó)流程挖掘行業(yè)研究報(bào)告》正式發(fā)布 | RPA中國(guó)