ChatGPT的出現再次將AI推向了風口,今天我們不聊ChatGPT,聊聊在小微票稅貸領域比較火的RPA。
RPA的全稱是機器人流程自動化(Robotic Process Automation)。回顧RPA的發展歷程,經歷了4個重要的發展時期。
RPA 1.0階段:實現單獨個體業務的自動化
在這一階段,RPA幾乎涵蓋了桌面自動化軟件的全部操作。但未能做到將若干個部門合作的某一業務形成“閉環”,實現端到端的自動化。
RPA 2.0階段:實現跨部門業務合作的自動化
在這一階段,RPA可以實現端到端的自動化,讓多部門的業務合作自動化成為現實。同時,RPA機器人可以7*24全天候工作,并用業務流程代替了人機交互,釋放出更多的應用可能。它主要被部署在VMS虛擬機上,能夠編排工作內容,集中化管理機器人、分析機器人的表現等。缺點是RPA的工作仍然需要人工的控制和管理。
RPA 3.0階段:RPA“上云”
在RPA的第三階段,RPA通常部署在云服務器和SaaS上,特點是實現自動分級、動態負載平衡、情景感知、高級分析和工作流。缺點是處理非結構化數據仍較為困難,需要更強大的技術融合。
RPA弱耦合的特性能夠實現跨軟件低成本地快速部署,隨著企業服務業務云端化的趨勢,RPA上云也成為必然的結果。
RPA 4.0階段:AI+RPA
RPA是企業切入AI最好的“切口”。運用人工智能、機器學習以及自然語言處理等技術,可以實現非結構化數據的處理、預測規范分析、自動任務接受處理等功能。
在小微票稅貸場景用到的RPA嚴格意義上講僅處于2.0-3.0之間,整個RPA采集財稅票數據的過程包括:授權提供賬號密碼(強授權)--RPA登錄--RPA采集--文字解析--結構化數據儲存,部署在云服務器和SaaS,可以實現端到端的自動化。缺點是,因全國有36個省市稅局,稅局網站上的數據存儲格式會不定期更新,更新后數據的解析和儲存就會容易錯誤,導致數據準確性下降,所以目前這套技術還需要大量后臺人工維護的成本,在稅局格式更新后需要通過人工修復儲存結構。
因票稅貸場景里獲取到的財稅票數據的使用者多數為風控從業人員,故接下來本文會從三個風控從業人員感興趣的方向聊一聊。
01
票稅貸RPA獲取并儲存了哪些數據?
數據的大類可分為稅務、發票、財務三大類數據。
稅務數據包括納稅基本信息、申報繳款信息、納稅風險信息三大類。納稅基本信息包括公司登記信息、納稅信用等級、變更稅務登記信息、投資信息/股東信息;申報繳款信息包括增值稅申報表明細(一般納稅人)、增值稅申報表明細(小規模納稅人)、企業所得稅納稅申報表月(季)度、企業所得稅申報表年度、社會保險費申報表、完稅證明信息、稅務修改記錄;納稅風險信息包括欠稅信息、稽查檢查文書信息、稅收違法違章信息。
稅務數據以使用頻率最高的增值稅申報表明細(一般納稅人)截圖舉例。
截圖里每一個字段及其字段的數值都可以結構化的儲存下來。紅色框的8個格子里的數值是我們在計算銷售額時比較關注的內容,風控內部俗稱8大項,8大項相加的總和即是當月企業應納稅銷售額。我們可以通過獲取到的月度時序變量衍生出大量用于評估企業經營規模、穩定性、成長性的指標。
發票數據包括銷項發票數據、進項發票數據和機動車銷售發票數據。銷項發票數據和進項發票數據各自都包括了開票明細表和貨物明細表。開票明細數據在稅局網站上是如下形式呈現,可以清晰的看到每一筆交易的時間、金額、交易對象,可以用來分析企業上下游供應鏈的情況。
財務數據就是大家比較熟悉的財務三大表了,資產負債表、利潤表、現金流量表,雖然都說小微企業財務數據不可信,但是通過已上報的財務數據分析勾稽關系,再對照稅務和發票數據,是可以發現一些潛在的風險的。
02
財稅票數據RPA獲取是否合規?
很多對RPA技術有需求的機構最想問的問題就是,RPA合規嗎,這不就是幾年前被監管嚴查的爬蟲技術嗎?基于這個問題,希望以下的幾個觀點能消除使用者的顧慮(歡迎有不同的觀點來討論):
首先,RPA數據的采集是需要經過企業法人本人強授權后才能進行,即需要簽署同意授權協議、提供企業基本信息、法人身份核驗、提供稅局賬號和密碼后才能對數據進行采集。
其次,幾年前嚴查的并不是爬蟲技術本身,技術本無錯,若是禁了技術的發展,豈不是禁了AI的未來。之前的錯在于爬取了隱私數據(通訊錄和通話記錄等數據),且將隱私數據用在了非本筆貸款審批以外的用途(催收等用途)。本來無一物,何處惹塵埃!而票稅貸里的RPA采集的是企業經營數據,本身就是半公開數據,同時若RPA的技術提供方能做到在采集后立即刪除原始數據,且不將數據用于本筆貸款審批以外的其他用途,這樣整個數據的采集和使用閉環里就不存在任何非合規的內容。
最后,近幾年監管對于數據使用的要求是必須要經過持牌機構傳送,財稅票數據作為企業數據,可以通過企業征信牌照的通道,央行發放的企業征信牌照遠超過了個人征信牌照,這也助力了RPA技術這幾年在企業信貸領域的推廣。
03
票稅貸RPA未來的發展方向?
票稅貸場景里的RPA并不是AI,那未來會發展成AI嗎?答案是“會”!
大膽設想票稅貸場景里的RPA未來還會經歷兩個具有跨越式突進的階段。如果把當下稱為1.0,則2.0時代RPA可以自動的處理非結構化數據,例如當稅局數據格式發生變化時,可以實時的進行數據抓取和儲存結構的修復,實現零人工干預。3.0時代RPA會跟機器學習、NLP等技術結合起來,可以實現報稅欺詐行為、開票欺詐交易的自動識別,并利用過往業務數據積累的逾期數據,自動實現企業信用評估模型的開發和迭代。3.0時代功能的實現也會最終讓RPA當下的一個SAAS服務逐步演變為MAAS(Model as a Service)服務。
未經允許不得轉載:RPA中國 | RPA全球生態 | 數字化勞動力 | RPA新聞 | 推動中國RPA生態發展 | 流 > 小微票稅貸場景:RPA向AI轉型的必經之路
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發展洞察(2022)》報告正式發布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產業共進,第四屆ISIG中國產業智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業研究報告》正式發布 | RPA中國