機器寫作RPA市場:為何AI獨角獸與互聯網巨頭紛紛加注?

      后臺-系統設置-擴展變量-手機廣告位-內容正文頂部

      語言是人與人交流的工具,也是網絡用戶與互聯網連接的方式。在互聯網時代信息爆炸的時代,互聯網語言文本的處理需求迅速增長;同時,提升資訊生產速度、延展其覆蓋面的需求也不斷增加,機器協作人類進行文本理解和生成成為人工智能研究的核心方向。近十年來,機器寫作以商業應用為目的,從規則、模板寫作發展到了以神經網絡模型為核心的智能寫作,從輔助記者創作逐步走向自動化寫作,應用場景也從模板化的資訊類數據報告,深入到分析報告、詩歌創作、長故事文本創作、廣告營銷文本寫作等,并且商業化程度越來越高,市場影響力越來越大。

       

      作者 | 李雯、樊曉芳

       

      一、智能寫作背景概述

      1. 智能寫作定義

      寫作主要有四要素:寫作主體、寫作客體、寫作受體、寫作載體,即作者、世界、讀者、作品。

      這四要素構成了寫作系統。與人類寫作不同的是,現階段智能寫作的寫作內容是對人類描寫的世界的復述,而不是直接的對世界的描寫。

      智能寫作的創作主體是機器、算法,創作模式分為輔助創作和自動創作,現階段的主要目的是解放人力到更富有創造性的工作上,在具體的任務上主要是自動摘要、文本聚合、結構化數據生成、看圖說話、詩詞對聯寫作等,也開始逐步涉及長文本故事創作。

      2. 智能寫作方法及流程

      自然語言生成的文本生成類型從數據來源進行劃分,又分為數據到文本、文本到文本、圖像到文本的寫作這三大類。不同的數據來源、不同的文本結構,又影響了機器寫作文本生成的流程。

      所以基于自然語言處理技術的發展,從文本生成的流程和結果來看,現階段對機器寫作的探索主要是三個類型:結構化數據創作、摘要式寫作及半原創式寫作。

      3. 智能寫作產品類型及功能

      受限于技術發展,目前智能寫作主要落地產品分為兩種,一種為輔助寫作,這種方式更易研發和商業化,能迅速滿足用戶需求;另一種是自動寫作,相對而言技術難度更高,商業化程度較低。

      二、智能寫作產品技術方案及核心技術

      三、智能寫作產業及市場

      1. 智能寫作產業生態及產業鏈

      自然語言處理和生成技術的突破,促使各大公司和團隊在近十年來開始關注相關技術的商業應用,但智能寫作的相關產品依賴于落地行所處業的生態狀況。智能寫作已經形成了一定的產業鏈條。

      上游為數據和設備方,中游為輔助和自動創作產品及技術服務商,下游對接C端讀者、創作者,和媒體、金融機構、政府機關、資訊平臺等B端。目前智能寫作市場玩家主要有四大類:

      上市科技巨頭:內部應用、技術研發為主,暫未實現商業化,重視辦公、資訊、營銷場景布局。

      中小型技術公司:主要提供To B端的SaaS服務,初期多布局細分領域,而后逐步延伸應用行業。

      傳統媒體:以聯合研發、內部應用模式為主,數據質量及讀者粘性較好,暫未實現商業化。

      新興智能媒體平臺:技術先進,數據量及讀者群龐大,應用覆蓋自動寫作、輔助創作、平臺運營等。

      2. 智能寫作潛在市場

      Statista數據顯示,2018 年,全球自然語言處理的市場規模達 5.8319 億美元,到 2024 年將達到約 21 億美元,智能寫作相關技術具有廣闊的市場空間。其中,對智能寫作的需求最強、黏性最高的四個市場分別是內容資訊、金融財經分析、數字營銷和行政辦公。

      四、智能寫作主要應用場景與相關代表公司

       

      五、代表機構案例

      智搜Giiso:針對B端資訊機構提供技術服務,語義識別最高精度92.67%,單篇稿件最長2000字。具體提供三大解決方案:針對媒體的智媒(新一代智能融媒體平臺)、針對內容營銷行業的智書(智能內容生產車間)和面向B端技術團隊的智訊(智能資訊機器人商店)。

      字節跳動(Xiaomingbot):小明寫稿機器人應用了文本生成算法、序列預測排序、文本摘要及視頻理解等技術,可以自動生成多語言新聞資訊,還可以面向企業客戶提供改寫和生成廣告文案服務。此外,小明還被用于公益事業,在短時間快速生成尋人文章、尋人短視頻。

      香儂科技:獲億級A輪投資,針對金融行業的B端機構和C端從業人員提供PDF解析、非結構化關鍵信息抽取服務、圖像OCR、多語言翻譯、輿情監控、智能文檔審核、專業金融問答、智能報告生成等服務。其Glyce模型在 13 個中文 NLP 任務上達到了當前最佳性能。

      阿里巴巴: 阿里發布的“AI智能文案”產品順利通過了圖靈測試,該產品結合淘寶、天貓的海量優質內容與自然語言算法,聚焦于商品文案,實現了三項核心能力:高度模擬多種風格的人類文案、自由定義字數、實時在線樣本學習,其中短標題文案生產達到1秒20000條。

      金山軟件:目前全國政務系統中,金山 WPS 的覆蓋率超過了50%,針對公文寫作素材難找、寫作耗時、人工校對易漏等難題,金山軟件在智能模板匹配、智能圖文排版、智能校對和智能素材推薦、長文件智能要點匯總與目錄檢索方面實現技術落地。

      達觀數據:為企業級客戶提供文本智能審閱系統、文檔審核、垂直搜索API和客戶意見洞察等功能,曾為某全球知名會計事務所節省審核人力成本25%,輔助某銀行提升工作效率,審計隊伍從800人減少至600人。目前累計融資額超2億元,刷新中國NLP領域的融資記錄。

      六、AI技術應用智能寫作的局限性及趨勢

      技術研發局限

      1. 機器難識別寫作素材真假,易生產假新聞。

      2. 缺乏對輸出文本質量的客觀、準確的評估標準與優化目標。

      3. 機器難理解復雜的語義,導致生成內容的語義易偏移。

      4. 生成主觀性強的文本時,易出現偏見語言和極端化觀點。 

      5. 難以為自動寫作產品建立價值參照體系。 

      6. 機器的情感分析、理解能力較弱。

      7. 單個領域、單一體裁的機器寫作模型難用于其他種類內容。

      8. 難以實現針對不同用戶的內容個性化 。

      9. 智能寫作文本主導市場將導致信息繭房和自動學習負循環。

      10. 智能寫作版權歸屬模糊。

      11. 原創度低的改編式機器寫作易侵權其他作者作品。

      研發趨勢

      1. 大體量數據、非結構化數據、小樣本數據處理能力不斷提高。

      2. 神經網絡模型逐步替代規則寫作及統計模型。

      3. 計算機視覺相關技術逐步被應用到中文自然語言處理。

      4. 機器翻譯模式被逐步要用到智能寫作的文本生成技術中。

      5. 融媒體發展需求推動不同媒介生成技術的融合式研發。

      6. 全自動寫作在主題選取、內容生成時應用更多用戶畫像技術。

      7. RPA或將成為降低素材搜集難度及文本管理成本的重要技術。

      應用趨勢

      1. 從文本糾錯到文本預測。

      2. 從輔助創作到自動化寫作。

      3. 從短文本到故事性長文本生成。

      4. 從數據、資訊類紀實文本到鑒賞性、營銷性文本。

      5. 從單向內容輸出轉變為交互式內容互動。

      6. 從數字文字到圖像、視頻可視化發展。

      未經允許不得轉載:RPA中國 | RPA全球生態 | 數字化勞動力 | RPA新聞 | 推動中國RPA生態發展 | 流 > 機器寫作RPA市場:為何AI獨角獸與互聯網巨頭紛紛加注?

      后臺-系統設置-擴展變量-手機廣告位-內容正文底部
      主站蜘蛛池模板: 迁西县| 广安市| 桓台县| 芦溪县| 慈溪市| 米泉市| 鄯善县| 临武县| 绍兴县| 称多县| 博爱县| 旬阳县| 蛟河市| 丁青县| 岫岩| 原阳县| 新龙县| 东台市| 武宁县| 虹口区| 莫力| 称多县| 营山县| 东阳市| 准格尔旗| 顺平县| 云林县| 咸阳市| 广水市| 宣恩县| 宁夏| 杭锦旗| 佛坪县| 蒙阴县| 诸城市| 乳源| 白城市| 犍为县| 水富县| 涿州市| 卓资县|