作者:曹善文
中國聯合網絡通信有限公司研究院工程師,研究方向為數字經濟、運營商數字化轉型和企業流程治理等。
論文引用格式:
曹善文. 基于流程挖掘視角下的數據要素利用研究[J]. 信息通信技術與政策, 2023,49(4):59-64.
摘要:流程挖掘作為跨數據挖掘與過程建模的關鍵技術,有助于發揮數據要素價值,但當前業內對流程挖掘技術、數據要素利用程度不足?;谝靥卣骷癉IKW模型等分析,發現數據要素應用于流程挖掘具有直接性、動態性和外部性等特征,可通過業務牽引、要素整合、技術融合機制發揮要素價值。因而企業需要進一步強化流程挖掘技術應用積累、注重數字化治理體系建設、探索建立數據安全與共享的共存機制等措施促進數據要素價值最大化。
關鍵詞:流程挖掘;數據挖掘;數據要素;運營管理
01
引言
數字經濟時代下,隨著數據存量不斷加大、數據分析處理技術不斷成熟,數據作為與勞動、資本、土地、技術、知識、管理并列的生產要素將對企業生產方式、社會運行方式、政府治理模式產生重大影響。數據要素已成為企業數字化轉型升級的重要資源,可以有效促進企業創新能力升級,獲得新的競爭優勢[1]。企業生產運營的核心目標是為顧客提供更有競爭力的產品,包括提供新產品形態或提高現有產品的競爭力[2]。數據要素分為業務貫通、數智決策、流通賦能三次價值釋放過程[3]。一次價值可使數據貫通推動企業整個業務流程有序運轉;二次價值可進一步通過數據挖掘與分析,為業務提供客觀的觀察視角,清晰洞察業務過程;三次價值使企業業務從有序運轉向智能運轉轉變。
一方面,數智決策可以賦能企業生產力提升及商業模式的演進,利用數據挖掘等技術為生產決策提供戰略洞察,發現新價值。但直接基于歷史數據的分析,如對促銷、訂貨等相關性挖掘,發現很多時候并不能保證這些相關性挖掘能得到良好的決策或預測表現[2]。除了數據質量、過度擬合、算法規則等導致系統性誤偏外,預期新價值的實現也存在一定試錯成本、資源投入及不確定性。另一方面,從運營管理視角來看,企業價值構成中的無形服務要素的權重越來越大,顧客感知價值的多樣性和動態性不斷增加,對傳統運營模式提出新的挑戰[2]。顧客的決策行為變得更為復雜,既追求產品的個性化也追求服務過程的個性化,如是否能夠及時、主動、有效響應客戶在產品使用過程中的需求,這就需要企業加大對現有生產過程的關注力度。同時,數據洞察發現的潛在機會需要與生產流程重構及組織適配相結合,才能真正產生價值。例如,中國聯通將流程、數據、場景、平臺、工具作為數字化轉型五要素,通過數據、流程的有效統一,推進管理、業務的智慧運營。而當前大部分企業對于數據的利用僅以統計分析、報表展示為主,應用層次淺、范圍窄、力度小,缺少與業務的深度耦合,未能充分釋放數據要素價值[4]。
根據IEEE(Institute of Electrical and Electronics Engineers)的定義,流程挖掘(Process Mining)是一門跨數據挖掘與業務過程建模分析領域的交叉學科,通過整合數據分析、圖形可視化等技術,直接從客戶及業務視角為企業運營管理效率賦能。流程挖掘已逐漸成為產業界數字化變革的重要工具選擇,為數據要素在企業微觀層面的應用提供了直接方向。數據要素及技術用于監控和分析生產流程資源消耗,及時發現異常進而實現生產過程的實時優化[2]。數據要素能夠通過優化生產決策流程、創新組織體系,驅動企業從傳統工業經濟的科層制組織向網絡制組織轉變,提升企業創新能力,其實現路徑在于基于流程挖掘的企業管理訴求的深度洞察[1,5]。但當前專門從流程挖掘視角出發對數據要素利用微觀機制的研究較少,本文擬從流程挖掘技術發展、數據需求和特征,以及數據要素的利用機制等方面展開分析,以進一步完善數據要素在微觀層面應用的底層邏輯,為企業充分發揮數據要素價值提供參考。
1 數據要素推動流程治理能力升級
隨著20世紀90年代計算機技術的普及,企業開始大量應用信息系統來管理內部活動,進行大規模的信息化建設。在此背景下,美國學者Michael Hammer、James A. Champy[6]提出了流程再造(Business Process Reengineering,BPR)理論,強調企業在先進技術的沖擊下,需要對業務活動進行基本(Fundamental)、徹底(Radical)、顯著(Dramatic)的反思,對企業流程進行根本性的設計。在流程再造理論的影響下,無論是BPR或是流程改進(Business Process Improvement,BPI)均注重以流程建模、流程規劃為起點開展流程設計優化。但流程優化變革從開始到落地周期較長,且隨著市場環境的快速變化,難以實現對流程的精細化管理,極易導致業務與流程兩張皮現象。傳統業務模式需要以客戶為中心進行重構,而僅僅通過點狀的優化、依賴人工調研及判斷的方式難以實現預期效果,因此亟需全局、多維視角的深度業務流程洞察。
企業經過大規模信息化建設、長期的生產經營積累了豐富的運營數據(用戶交互數據、生產數據等),對這部分數據的挖掘利用可有效提升企業生產力、改善生產關系、提高治理能力、建立新的競爭優勢。尤其對于數字化較為成熟的企業,數據資源豐富、質量高,能夠提供更準確、更全面且更有預測力的決策建議,從而提升企業效益[3]。因此,對真實運行的業務流程進行數字孿生成為重要方向。得益于信息化的大規模普及,以及數據挖掘、機器學習技術的發展,對業務運行日志數據進行挖掘和分析成為現實。流程挖掘是基于IT系統日志數據對企業某項業務活動真實運行過程的可視化分析與診斷,進而對業務流程進行改進,被稱為企業的“X光機”。流程挖掘可以在業務流程管理的關鍵環節甚至全部環節中發揮不可替代的價值[7]。
關于流程挖掘的發展,荷蘭埃因霍芬理工大學(Eindhoven University of Technology)Wil van der Aalst教授[8]率先于1999年開始嘗試相關方面的研究;于2002年推出首個流程挖掘算法Alpha Mine;并于2005年發布了業內第一個流程挖掘學術平臺ProM。國際首個流程挖掘學術社區IEEE過程挖掘工作組(IEEE Task Force on Process Mining)于2009年成立,并于2011年發布《過程挖掘宣言》[8],推動流程挖掘技術演進及業務應用發展。商業化方面,2009年前后國外開始出現一些流程挖掘企業[8],如Futura PI(2007年)、Process Gold(2009年)、Celonis(2011年);由于國內企業信息化水平、流程體系建設水平、流程重視程度等相對滯后,流程挖掘市場需求仍處于市場培育期,普遍對流程挖掘技術應用不足。
2 流程挖掘數據要素需求、特征及技術路徑
流程挖掘可通過對真實運行流程的可視化還原、診斷來精準定位問題,發揮數據及算法價值,結合組織管理需要對流程、系統、組織進行改進,實現企業的降本增效,優化生產關系,提高企業生產力。
2.1 流程挖掘數據要素需求
企業的核心數據要素是客戶交互和運營數據,并基于數據洞察優化自身產品和服務,提升客戶感知和黏性[9]。流程挖掘數據主要來源為生產系統中活動事件日志數據,包括時間戳、執行者、活動節點及關聯數據。由于企業生產活動需要各職能部門協同,組織范圍廣、時間跨度大且實際生產場景復雜多變,因此需要從各個業務系統抽取數據,對不同類型及格式的數據進行采集、存儲及清洗。
2.2 流程挖掘數據要素特征
(1)直接性。一般認為數據要素具有非排他性、非競爭性等經濟特征,導致數據確權、定價及交易困難。相較于數據要素在宏觀領域的應用,即企業除了賦能自身生產以外,通過交換、交易、分配等方式流入數據要素市場,直接獲取收益或獲得更豐富的數據要素為經濟體系提供數據賦能。但數據要素作為企業競爭優勢的重要構成,在相關制度尚待健全的情況下,一般化的共享、交易意愿不強。因此,企業內部應用流程挖掘技術對數據進行采集及共享,在微觀層面不存在確權、交易、定價等障礙,可以直接最大化發揮數據要素一次及二次價值。
(2)動態性。外部環境的變化導致企業實際生產過程復雜多變,基于歷史數據的預測模型存在概念漂移(Concept Drift),弱化了數據模型的指導意義。在線流程挖掘技術對事件運行數據進行即時分析,并構建預測模型來監測流程示例,直接對生產過程進行干預,如對預警流程提前終止,避免錯誤流程繼續執行下去從而產生更大損失,提升執行過程的精準性,實現了動態數據—動態模型—即時決策的良性循環。
(3)外部性。流程挖掘可直接賦能企業各類生產活動,快速且顯著提升業務運行效率,成功的流程挖掘實例可推動知識經驗在企業部門間擴散。一方面,調動企業各業務線對數據要素的重視和利用,利用流程挖掘技術開展流程治理;另一方面,推動部門之間數據的開放、共享,進一步發揮數據要素及技術的溢出效應,推動公司整體業務生產及運營管理效率提升。
2.3 流程挖掘技術路徑
流程挖掘技術路徑具體如下。
(1)流程仿真?;跇I務活動在各運營系統中的日志數據,基于流程挖掘算法及流程圖算法,對業務過程進行流程建模,可視化還原真實流程運行軌跡。
(2)開展一致性分析。結合預先設計的流程模型、經驗知識等,判斷流程路徑是否按照預期規則執行,以及結合實例數、運行時間等維度,分析主流程路徑中堵點、斷點,并對異常流程路徑進行合規性、必要性分析。
(3)實施業務改進?;谝恢滦苑治霭l現的問題,改進現有流程運行規則,如對于重復機械的活動應用機器人流程自動化(Robotic Process Automation,RPA)技術實現自動化,并通過持續的流程挖掘對流程運行情況進行實時預警。以流程為牽引推動企業各類生產要素關系優化,如推動組織架構完善、優化人員投入,實現企業運營管理的降本提效。
03
流程挖掘對數據要素利用的微觀機制
企業的本質是一種資源配置機制,即將各類要素以一定組合有序投入生產,從而獲得最大化價值產出的過程。隨著市場環境變化、企業業務范圍快速擴張,企業內部形成了紛繁復雜的流程。企業在生產流程中沉淀了大量數據,但往往分散于各個系統中,形成數據孤島。因此,原始數據呈現低價值性、碎片化特征,只有經過收集、存儲、分析等勞動投入之后才能成為具有使用價值的數據產品[10,12]。一般數據挖掘算法需要對數據進行預處理,如要求數據標準化、去掉極端值,其預測結果會由于過擬合或欠擬合而產生偏差,且無法回溯原因。流程挖掘可以基于系統沉淀的全量日志數據及數據挖掘技術,進一步直觀展示業務的所有路徑,尤其是對變體的觀察可以從各個視角為業務的改進提供指引。
根據業內經典的數據—信息—知識—智慧模型(Data-to-Information-to-Knowledge-to-Wisdom Model,DIKW模型),數據要素由低到高可劃分為數據、信息、知識和智慧四個層級(見圖1)。流程挖掘實現了數據與業務生產的緊密銜接和融合,更為有效地實現數據要素從數據到信息、知識及智慧的演進。原始數據通過加工處理并結合業務理解形成信息,解決數據表征問題,即“是什么的問題”;信息通過數據挖掘算法,如歸納演繹形成知識,可以解釋各變量之間的相關關系;知識進一步通過流程挖掘算法與業務過程分析進行結合,發現問題產生的原因,即因果關系,進而明確業務改進方向及組織優化關系,實現企業的智慧運營。
圖1 基于DIKW模型流程挖掘應用
3.1 業務牽引機制
流程挖掘為數據要素利用提供了系統性方案,以業務視角切入整合各類跨系統數據并直接作用于業務改進,避免了數據濫用、減少盲目性和低效投入。
(1)關注企業整體價值實現過程。企業的高階流程反映了企業從發現客戶需求到滿足需求的全部業務活動的組合,流程挖掘可以從端到端視角來橫向整合各類相關數據,還原企業價值鏈,發現價值生產運營問題。并基于實時數據的分析與監控,為客戶提供產品全生命周期的服務[2]。
(2)注重對異常情況的研判分析。流程挖掘基于某項業務活動的全量數據進行分析,除了能夠對主干流程關鍵環節的運行時效、方式進行分析外,還可以發現特殊流程變體,及時發現不合規、不合理現象,降低企業運營風險。
(3)發現顛覆性創新機會?;诳陀^數據的分析能夠減少人的主觀偏見、消除認識誤區,成為知識技能的創新媒介[3]。進一步將數據洞察與商業機理結合,發現新機會、新模式,重塑競爭優勢并通過業務流程重構實現商業落地。
3.2 要素整合機制
數據要素洞察能夠優化企業運行方式,重新配置各類生產要素,形成新的要素結構,提高資源配置效率、全要素生產率,驅動企業創新和治理能力提升[11-12]。而業內知名的集成信息系統體系結構(Architecture of Integrated Information System,ARIS)模型將企業中的流程、組織、數據、系統等要素進行結構化的梳理。在ARIS模型中,流程視圖被作為核心控制模塊用來記錄數據視圖、組織視圖和功能視圖之間的關系。由此,數據要素可通過流程挖掘實現對企業各類要素的整合和重構,其微觀機制如圖2所示。
圖2 數據要素通過流程挖掘實現對各類要素整合的微觀機制
在戰略層面,準確識別時代發展機遇或數據經濟機遇下的新市場、新機會,制定公司戰略。進而通過戰略解碼,明確企業要開展哪些活動以及如何有序開展這些活動,即梳理公司的活動流、業務流與價值流,同步將強化創新、兼顧風險等管控要求納入其中?;诹鞒掏诰虬l現的問題,進行企業價值流改進,并對企業中的組織、勞動、系統等生產要素進行有效串聯、有機整合,實現最大化價值產出。如借助于RPA可以實現對規則明確、重復的業務環節進行自動化執行,優化勞動要素投入。
3.3 技術融合機制
把數據轉化為生產力需要先進的數據分析及可視化技術,數據要素也有助于驅動生產技術的改進,提高創新效率[2,13]。流程挖掘橫跨數據挖掘及過程建模領域,相較于傳統標準化的流程模型,業務實際運行過程往往非常復雜,流程挖掘需要處理的數據量大、實時性高且各類流程活動關系復雜,需要盡可能以便于理解的方式對流程進行可視化還原。因此,流程挖掘技術不僅需要傳統的大數據采集、存儲及分析技術,還需要可視化圖形技術對各類流程活動執行邏輯及相關關系的直觀展現。流程挖掘需要反映各類流程活動節點、時間戳、執行者、決策點及活動之間的相關性和重要性程度,還要考慮日志噪聲及模型準確性問題。由此產生了各類流程挖掘算法,如利用概率統計技術過濾或迭代模型適應度的方式解決流程挖掘中的日志噪聲問題的啟發式算法、遺傳算法等;為解決流程結構過于錯綜復雜、結構化程度低等問題,利用模糊聚類方法對日志實例進行聚類的聚類算法、模糊挖掘算法等;利用決策樹分析、機器學習技術進一步對決策點進行因果解釋的決策挖掘算法等。不同流程挖掘算法為數據要素的深度應用提供了重要方向,可以最大化發揮數據要素的價值,賦能企業運營管理效率的提升。
04
以流程挖掘助力數據要素利用的建議
4.1 強化流程挖掘技術的應用及積累,快速發揮數據要素價值
流程挖掘作為連接數據挖掘與流程管理的交叉學科,有助于企業快速利用、放大數據要素價值,實現數字化智慧運營。當前,流程挖掘技術應用主要集中于信息系統完善、組織規模大、業務流程復雜的大型企業,如電信、金融、互聯網等行業, 流程意識不足、技術成熟度偏低導致整體普及度不高。數據供給端,迭代、優化數據挖掘及流程挖掘算法,提升數據要素價值的可視化水平;增強流程分析、診斷、改進能力,提升流程預測監控結果的有效性、可執行性,更好滿足企業業務需求。數據需求端,將流程挖掘融入數字化轉型戰略設計,通過外引內育提高流程挖掘能力儲備,充分發揮系統日志數據對生產管理運營的直接賦能作用。
4.2 注重流程治理與數據治理相結合,提升企業數字化治理能力
企業數字化變革是技術創新與要素創新驅動下的經營發展理念、業務生產模式及組織管理模式的深刻重構。為了更好發揮數據價值,需要提升數字素養,積極將數據洞察與業務流程相結合,進一步加強系統治理、數據治理及流程治理聯動的數字化治理體系,推動數字化戰略落地[14]。建立規范的、跨系統的數據存儲、采集、分析等標準規范,健全數據治理體系,尤其要提升日志數據質量及可用性。企業流程治理需注重從客戶端到端視角出發,對企業業務活動進行梳理、重構,充分運用流程挖掘技術基于客觀數據開展問題分析與診斷,提升流程治理的針對性和有效性。
4.3 探索建立數據安全與共享的共存機制,助力數據要素市場化建設
企業生產活動需要多部門的有機配合。企業業務數據分散于各類生產系統中,如客戶關系管理(Customer Relationship Management,CRM)、企業資源計劃(Enterprise Resource Planning,ERP)等,形成數據孤島。流程挖掘是從端到端視角對企業生產過程進行分析,必然涉及各部門、各系統之間數據的拉通和共享,如進一步涉及產業鏈上的上下游企業,則各組織可能會由于競爭、隱私安全或缺乏信任而共享意愿不強。因此,在微觀層面,流程挖掘對數據要素的利用需要兼顧數據安全與數據流通兩全的制度設計。一方面,利用隱私計算、人工智能等技術,開發兼具隱私保護的流程挖掘算法,為數據要素“可用不可見”的實現模式提供有益探索;另一方面,企業可通過建設數據中臺、成立數據歸口管理部門、出臺數據共享管理辦法等方式,為數據要素的共享利用提供保障。但當前仍以管理控制為主,需要逐步探索建立數據要素收益分配的市場化機制,提升各部門主體對數據要素利用的積極性。
05
結束語
在數字化轉型下,數據要素推動企業流程治理能力升級,而流程挖掘技術的發展提升了數據要素現實價值,依托直接性、動態性、外部性等特征,通過發揮業務牽引、要素整合、技術融合等機制,促進數據要素在企業內部微觀層面的高效利用,助力企業實現智慧運營。目前,流程挖掘技術成熟度不高,需要企業進一步強化流程挖掘技術應用積累,提升數字化治理能力,探索建立數據安全共享的共存機制等,從而促進數據要素價值最大化。
Research on data factor utilization from the perspective of process mining
CAO Shanwen
(Research Institute of China United Network Communication Co., Ltd., Beijing 100176, China)
Abstract: As a key technology across the fields of data mining and process modeling, process mining helps to bring the value of data factor into play, but at present, enterprises have insufficient use of process mining technology and data factor. Based on the analysis of factor characteristics and DIKW model, it is found that the application of data factor in process mining has the characteristics of directness, dynamism and externality, which can exert the factor value through the business oriented mechanism, the factor integration mechanism and the technology integration mechanism. Therefore, the enterprises need to further strengthen the application and accumulation of process mining technology, attach importance to the building of digital governance system, and explore to establish the coexistence mechanism for data security and sharing so as to maximize the value of data factor.
Keywords: process mining; data mining; data factor; operation management
本文刊于《信息通信技術與政策》2023年 第4期
未經允許不得轉載:RPA中國 | RPA全球生態 | 數字化勞動力 | RPA新聞 | 推動中國RPA生態發展 | 流 > 基于流程挖掘視角下的數據要素利用研究
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發展洞察(2022)》報告正式發布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產業共進,第四屆ISIG中國產業智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業研究報告》正式發布 | RPA中國