流程挖掘(Process mining),也譯為過程挖掘,從學科發(fā)展角度來看它并不是一個新鮮事物,但是在我國產業(yè)界被廣泛關注還是在2020年以后,作為超自動化的關鍵技術被國際知名咨詢機構Gartner連續(xù)3次收錄到其年度技術趨勢報告中。根據(jù)2022年中國信通院發(fā)布的《超級自動化技術與應用研究報告》,超自動化是一個技術合集,換言之就是一組實現(xiàn)企業(yè)業(yè)務流程自動化的技術。具體包括:機器人流程自動化(RPA)、低代碼應用平臺、智能業(yè)務流程管理系統(tǒng)(iBPMS)和流程挖掘等。當然,以上這些功能型的技術也是建立在大數(shù)據(jù)、人工智能、云計算和深度學習的基礎理論之上。
01
流程挖掘與企業(yè)數(shù)字化轉型
圖1 超自動化技術助力企業(yè)數(shù)字化轉型閉環(huán)
圖1給出了基于超自動化技術實現(xiàn)企業(yè)數(shù)字化轉型的路線圖。具體而言,企業(yè)數(shù)字化轉型的起點是業(yè)務信息系統(tǒng),如企業(yè)資源管理系統(tǒng)(ERP)、客戶資源管理系統(tǒng)(CRM)和辦公系統(tǒng)(OA)等,更確切地來說是業(yè)務信息系統(tǒng)中記錄的業(yè)務數(shù)據(jù)。首先,通過數(shù)據(jù)收集和預處理技術,把業(yè)務數(shù)據(jù)轉化為流程挖掘工具可以直接分析的標準事件日志,并以此為輸入進行流程模型挖掘和關鍵流程性指標分析,進而理解業(yè)務流程實際運行的全貌。其次,進行業(yè)務流程的深度分析和洞察,包括性能分析、合規(guī)性檢查和偏差根因分析等。基于以上分析結果,針對運行流程中的性能瓶頸和行為偏差有針對性地進行流程的數(shù)字化再造。比如對違規(guī)和缺少信息系統(tǒng)支撐的業(yè)務,通過低代碼技術和業(yè)務流程管理系統(tǒng)對業(yè)務進行快速搭建和重構,對執(zhí)行效率比較低、返工率高的流程節(jié)點,通過部署RPA機器人來提高流程節(jié)點的局部效率進而優(yōu)化全局的效率。除了以上基于離線事件日志的分析技術,還可以基于流程預測性監(jiān)控和預警技術來對業(yè)務流程運行進行實時管控。綜上所述,流程挖掘作為超自動化的底座技術,起到了關聯(lián)業(yè)務系統(tǒng)、業(yè)務數(shù)據(jù)以及其他超自動化技術的作用,是當前實現(xiàn)企業(yè)數(shù)字化轉型的核心關鍵技術。
02
流程挖掘的學科定位
與RPA和低代碼技術不同的是,流程挖掘不僅僅是一門技術,它更是一門學科!作為一門學科,它既有相對完備的理論技術,又有核心算法,此外,流程挖掘還有典型的應用場景(詳情請參考中國流程挖掘行業(yè)研究報告)。根據(jù)“流程挖掘之父”、德國亞琛工業(yè)大學Wil van der Aalst教授的論述,流程挖掘是建立在流程科學與數(shù)據(jù)科學之間的一個跨領域交叉學科,其學科定位如圖2所示。
圖2 流程挖掘學科定位
具體而言,流程科學涉及到形式化方法、Petri網理論、并發(fā)論、工作流管理與流程自動化等領域。數(shù)據(jù)科學則涉及到數(shù)據(jù)挖掘、機器學習、統(tǒng)計學、分布式計算和可視化理論等領域。
03
流程挖掘發(fā)展歷程與產業(yè)概述
圖3 流程挖掘發(fā)展歷程圖
接下來我們回顧一下流程挖掘的發(fā)展歷程,如圖3所示。具體而言,流程挖掘理論研究起源于1999年,Wil教授在荷蘭埃因霍芬理工大學(Eindhoven University of Technology, TU/e)成立流程挖掘研究小組;產業(yè)起源于2007年,F(xiàn)utura PI公司成立于荷蘭埃因霍芬。國際上第一波發(fā)展高潮是2009-2011年這個時間段,標志性的事件包括:IEEE成立了流程挖掘工作組、Wil教授出版了全球首部流程挖掘專著、Process Gold、Fluxicon和Celonis等流程挖掘公司相繼成立,第一波的流程挖掘行業(yè)發(fā)展本質上是學術研究帶動產業(yè)發(fā)展。國際上第二波發(fā)展高潮是2018-2021年這個時間段,標志性的事件包括:Gartner開始針對流程挖掘這一細分領域發(fā)布行業(yè)指南、Celonis經過10年的發(fā)展成為德國獨角獸企業(yè)(估計達到110億美金)、成功舉辦首屆流程挖掘行業(yè)學術年會,第二波流程挖掘行業(yè)的發(fā)展已經是產業(yè)為主帶動學術研究了。直到2021年,Wil教授宣布加入Celonis擔任首席科學家,學術和產業(yè)實現(xiàn)了一個很好的融合。相比而言,國內第一波發(fā)展高潮是2021年前后,中間相差了大約10年的時間。
流程挖掘作為一門相對年輕的應用型學科,經過20年的快速發(fā)展,目前已經發(fā)展為有基礎理論和核心算法、有學術開源工具、有專著、有行業(yè)年會、有行業(yè)學術組織、有典型的商業(yè)產品和成功案例。
圖4 國際知名流程挖掘提供商
圖4匯總了國際上典型的流程挖掘產品提供商,其中包括流程挖掘明星企業(yè)Celonis、RPA巨頭UiPath (2021年收購ProcessGold)、IT巨頭微軟(minit)和IBM(myInvenio)、SAP(Signavio)等等。圖5是出自Gartner 2023年3月發(fā)布的流程挖掘工具魔力象限(Magic Quadrant for Process Mining Tools),給出了國際上不同流程挖掘廠商產品力的比較結果。
圖5 2023年Gartner流程挖掘工具魔力象限
04
國內流程挖掘產品能力與面臨的挑戰(zhàn)
相比于國外十余年的產業(yè)積累,2021年可以定位為我國流程挖掘產業(yè)化的元年,也是在這一年出現(xiàn)了10多家提供流程挖掘產品的公司。
圖6 我國主要流程挖掘提供商
圖6匯總了我們國內流程挖掘產品的提供商(筆者如有遺漏,還請聯(lián)系補充),大致可分三類:(1) 單純以流程挖掘為核心產品的流程挖掘創(chuàng)業(yè)企業(yè),如北京凡得科技的流程挖掘產品Process X;(2) RPA廠商,為了擴展產品矩陣增加了流程挖掘產品,如弘璣cyclone公司的流程挖掘產品;(3) 跨國公司中國區(qū),如SAP中國提供的流程挖掘產品Signavio、IBM中國的流程挖掘產品myInvenio和UiPath的產品。
圖7 流程挖掘產品核心能力
圖7匯總了國內流程挖掘產品的核心能力,具體包括如下核心功能:(1) 流程挖掘的起點是企業(yè)的各類業(yè)務信息系統(tǒng),首先是事件日志的提取、數(shù)據(jù)建模和預處理;(2) 以事件日志為輸入進行模型挖掘,得到一個能夠描述業(yè)務流程的圖形化表達;(3) 以流程模型和事件日志為輸入,進行合規(guī)性檢查和性能分析,找到性能和行為偏差;(4) 針對得到的性能和行為偏差,進行根因分析,發(fā)現(xiàn)產生偏差的根本原因;(5) 前面都是傳統(tǒng)的流程挖掘,近年來隨著人工智能、深度學習的發(fā)展,實時/準實時的流程預測性監(jiān)控得到越來越多的關注,主要包括剩余時間、下一個活動、結果的實時預測等等。
雖然近年來國內流程挖掘學術研究和產業(yè)均有較好的發(fā)現(xiàn),但是核心技術和算法方面仍然存在如下瓶頸:(1) 數(shù)據(jù)提取耗時,缺乏高效的ETL提取工具和方法論,一般數(shù)據(jù)提取的時間能占到流程挖掘項目實施的80%;(2) 數(shù)據(jù)質量難以保證,如噪聲、不完整軌跡、屬性缺失和缺少事件關聯(lián)等問題突出;(3) 模型挖掘結果的可靠性難以保證,已有大部分商業(yè)工具用有向圖來作為流程模型的描述,但有向圖在描述業(yè)務流程時存在天然的局限,雖然部分工具支持BPMN模型挖掘,但是模型挖掘的質量還難以保證;(4) 合規(guī)性檢查準確率有待提高,作為典型的流程挖掘應用場景,流程的合規(guī)性檢查目前得到的關注較低,已有的商業(yè)化工具大都無法提供精準的診斷結果;(5) 根因分析結果較為初級,缺乏系統(tǒng)化的根因分析工具;(6) 流程預測效率和準確性有待提高,缺乏系統(tǒng)化的流程案例剩余時間預測、下一事件預測和結果預測的分析工具。
圖8 國內流程挖掘行業(yè)發(fā)展挑戰(zhàn)
如圖8 所示,我國流程挖掘行業(yè)面臨如下挑戰(zhàn):(1) 產業(yè)起步晚、產品成熟地低:相比于國外10余年的產業(yè)積累,我國產業(yè)起步較晚,2021年才算是正式開啟這個賽道。產品的完整度和成熟度方面還有一定的差距;(2) 行業(yè)人才少、項目經驗不足:相比于國外10多年人才和項目的積累,我國流程挖掘行業(yè)從業(yè)者數(shù)量有限,同時由于產業(yè)剛起步,有項目經驗的人才就更少了,這可能是未來制約我國流程挖掘產業(yè)快速發(fā)展的一個潛在瓶頸;(3) 原始學術積累有限:相比于國外20年的原始創(chuàng)新積累,我國流程挖掘領域的學術積累明顯不足,同時學術研究的規(guī)模和質量也還沒有在國際形成較大的影響力,專注于流程挖掘的高校也相對有限。因此,建議在我國流程挖掘行業(yè)的啟蒙階段,從一開始就確立產學研相結合的模式,充分發(fā)揮高校和科研院所在人才培養(yǎng)和學術創(chuàng)新方面的優(yōu)勢。
作者簡介:劉聰,山東理工大學二級教授、博士生導師,山東省泰山學者青年專家,山東省自然科學基金優(yōu)秀青年基金獲得者(省優(yōu)青),山東省青年科技獎獲得者,IEEE流程挖掘工作組成員。博士畢業(yè)于荷蘭埃因霍芬理工大學(Eindhoven University of Technology),師從歐洲科學院院士、“流程挖掘之父”Wil van der Aalst教授。目前兼任凡得科技首席技術顧問和RPA中國研究院流程挖掘首席技術顧問。Email: liucongchina@163.com
未經允許不得轉載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動力 | RPA新聞 | 推動中國RPA生態(tài)發(fā)展 | 流 > 流程挖掘技術概述與發(fā)展趨勢
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報告正式發(fā)布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產業(yè)共進,第四屆ISIG中國產業(yè)智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業(yè)研究報告》正式發(fā)布 | RPA中國