?

淺析基于商業智能的新聞采編業務流程數據分析挖掘

2017-05-12 03:30陳辛夷
中國傳媒科技 2017年3期
關鍵詞:商業智能業務流程數據挖掘

■文/陳辛夷 康 潔

淺析基于商業智能的新聞采編業務流程數據分析挖掘

■文/陳辛夷 康 潔

隨著大數據時代的到來,越來越多的企業采用商業智能的相關技術,從生產、銷售等環節的數據中“淘金”,為企業決策層提供輔助決策。本文將商業智能關鍵技術應用于新聞采編業務,針對新聞生產業務的全流程,通過對全流程狀態分析、新聞生產力、傳播影響力等主題的數據分析挖掘,展示新聞采編發的流轉過程,展示采編部門和人員的生產效率,展示稿件的傳播影響力。文中介紹了商業智能的工作原理,對新聞采編業務流程數據分析挖掘方法進行了深入研究。

商業智能;數據分析;數據挖掘

引言

在大數據時代,數據的價值越來越受到各行業的重視。企業內積累的大量業務流程數據迫切需要人們從中“淘金”。商業智能是能滿足企業這一迫切需求的有力工具,能將海量數據轉化為知識,有助于從以往數據中發現業務趨勢,為企業決策層提供輔助決策。Gartner調查顯示,2012年和2013年,BI已上升到全球CIO優先考慮的十大技術的首位。

當今傳統媒體轉型面臨嚴峻形勢,而大數據將是媒體轉型的有力武器。在新媒體時代,用戶需要及時、準確、個性化的新聞服務。數據挖掘可以幫助傳統媒體充分發揮人才資源優勢,提升品牌競爭力和用戶黏性。在新聞采編業務中,存在大量流程數據,在以往的采編系統中這些數據并未受到重視,而借助商業智能的相關技術對這些業務流程數據進行分析挖掘,有助于提高采編全流程業務管理信息化水平,掌握報道進展情況、人員工作效率、稿件落地情況和傳播效果等。

1.商業智能的定義

商業智能又名商務智能(Business Intelligence,BI)。商業智能對數據進行收集、管理,提供一系列技術和方法對企業的各類數據進行分析。商業智能可以幫助企業的領導層從宏觀上掌握企業的運轉情況,洞察潛在行業的機會,輔助他們進行決策。

2.研究商業智能的意義

商業智能幫助企業迅速發現問題,提示企業管理者加以解決。具體到新聞采編行業來說,商業智能貼近媒體管理者的迫切訴求。通過對新聞傳播影響力的分析挖掘,使管理者可以清楚掌握新聞的傳播效果和影響力。

商業智能為新聞創造價值,幫助傳統媒體實現以“終端用戶為中心”的轉型升級,通過對用戶行為的分析挖掘,可以對用戶群體按照性別、年齡、職業、地域等因素進行分類或聚類,把用戶進行群體細分,針對不同用戶推薦感興趣的新聞內容,使媒體更懂用戶。

幫助在新聞生產的每個環節控制成本,通過新聞生產力的分析挖掘,展示各采編部門和人員的生產效率,為采編人員和部門考核提供依據。運用商業智能的方法,可以提高決策的水平,對業務流程進行改進,最終提高管理的效率。

及時性是新聞的基礎,通過對互聯網海量數據的挖掘可以發現潛在的新聞熱點。比如:網絡媒體和新媒體中大量用戶的閱讀和評論數據可以輔助采編人員發現新聞熱點。

3.商業智能關鍵技術

3.1 OLAP

即聯機分析,提供多維數據管理環境,使企業的數據分析人員能從多個維度對商業問題進行建模和分析。

3.2 數據分析

使用適當的統計分析方法對數據進行分析,提取出有價值的信息。

3.3 數據挖掘

數據挖掘就是從大量數據中挖掘出隱含的、未知的、有價值的關聯和模式,建立可用于決策的模型,提供分析風險、進行預測的功能。

4.商業智能體系結構

首先將分散在企業各系統中的數據,包括關系型數據也包括非關系型數據進行匯總,通過數據抽?。‥xtract)、轉換(Transform)、清洗(Cleaning)、裝載(Load),最終按照預先定義好的數據模型,將數據加載到數據倉庫中,這一過程簡稱ETL。

通過對企業數據需求的分析,建立企業數據倉庫的邏輯模型和物理模型,將企業各類數據按照分析主題進行組織和歸類。

在數據倉庫的基礎上提供多種軟件工具供終端用戶查詢和生成報告,包括OLAP工具、數據挖掘軟件、報表工具等。

5.在新聞業務中的應用

5.1 數據源

數據倉庫中數據的采集需要從各種業務應用系統和管理信息系統中獲取,如稿件建采系統、編輯系統、供稿系統、OA系統等,按照統一的數據標準存放在數據倉庫中。

本文將采編業務系統數據劃分為靜態信息數據、動態信息數據兩大類。

靜態信息數據是指相對穩定的信息,主要指采編部門、采編人員、發稿線路等靜態屬性信息數據。

動態信息數據收集在采編業務系統中不斷變化的流程數據,包括采、編、簽、改、發、供、饋等環節。如何對新聞業務數據,特別是用戶行為數據構建數據模型,分析稿件流轉過程,將是本文著重介紹的內容。

5.2 分析目標

通過采集稿件、流程、人員和質量數據,進行采編業務全流程的管理,掌握報道進展情況、人員工作效率、稿件落地情況、傳播影響效果等。從全流程狀態、傳播影響力、新聞生產力等主題進行數據分析挖掘,呈現新聞生產業務運行狀況。

新聞生產力分析:分析呈現采編部門、采編人員等在一段時間內的工作效率。傳播影響力:分析呈現稿件的落地情況和傳播影響效果。全流程狀態分析:分析稿件在各采編環節的流轉情況。

5.3 數據建模

數據建模主要用到的是維度模型。一個度量往往和多個維度相關,維度模型表達了數據之間的關聯關系。比如:想要了解2016年1月份在新媒體線路的中文稿件發稿情況,這個發稿量數據與線路、時間、語種三個維度相關。維度建模是從多個角度和層次反映數據之間的聯系,從多個維度對數據進行重組,為決策提供數據的多維視圖。

維度模型有兩種不同性質的表:事實表和維度表。

通常采用星型或雪花模型把事實表和維度表融合在一起,中間是事實表,周圍是維度表。

圖1 新聞發稿情況雪花模型示意

事實表存放的是業務性能的度量值。 一個事實代表一個業務度量值,如:發稿量。

維度表提供觀察度量值即事實的角度,如:線路、時間。

維度表的屬性列(如:語種包含中、英、法、意、日、阿、俄)是用戶使用數據的約束條件,同時也是數據分析時的切割工具,因此維度表的質量與深度直接影響整個數據倉庫的性能。

對于稿件的業務處理流程,本文采用處理維度進行描述,屬性列對應采編業務流程中的采稿、入庫、建稿、建新稿、編輯、簽發等環節。

在數據倉庫中可以根據需要,建立多個應用主題,本文建立了新聞生產力分析主題、傳播影響力分析主題和全流程狀態分析主題。

5.4 關鍵指標體系

5.4.1 新聞生產力

在新聞生產力評估中可以采用生產率、人均生產稿件數量、投入人員占比等作為考核部門新聞生產力的指標,指標值可根據時間匯總到年、季、月、雙周、周、日,可通過以下維度查看稿件數量的詳細情況:媒體類型、新聞分類、供稿類別、稿件處理流程。

表1 新聞生產力指標

5.4.2 傳播影響力

在傳播影響力評估中,在本文中采用傳統媒體影響力指數、網絡媒體影響力指數、國內媒體影響力指數、海外媒體影響力指數、海外社交媒體影響力指數、全網影響力指數為主要的指標。其中全網影響力指數為其余五個指數的加權計算結果。

網絡媒體傳播影響力指數如下表,指標值可根據時間匯總到年、季、月、雙周、周,可查看指標在不同媒體上的詳細情況。

表2 網絡媒體傳播影響力指標

5.4.3 全流程狀態分析

全流程狀態分析可實時監測各指標的變化情況,可通過以下維度查看指標的詳細情況:稿件處理(采稿、入庫、建稿、建新稿、編輯、簽發等)、稿件媒體類型、稿件供稿類別。

表3 稿件組全流程狀態分析指標

5.5 業務流程數據挖掘算法

在“以用戶為中心”的思想指導下,充分利用關聯規則、分類、聚類等數據挖掘技術,對日常新聞業務數據進行挖掘。本文采用以下方法對新聞業務用戶行為數據、全流程狀態數據等進行分析。

5.5.1 關聯規則和序列模式

關聯規則用于分析用戶數據,發現用戶行為模式。關聯規則描述數據項之間存在的關聯關系,即根據一個事務中某些項的出現推導出另一些項在同一事務中也出現。Apriori算法是關聯規則的經典算法。關聯規則最初針對購物籃分析問題提出,即分析消費者經常同時購買哪幾種商品。在新聞業務中,關聯規則挖掘可以找出新聞采編業務人員個人特征與稿件之間的關聯性;根據業務人員的關注點推薦相關稿件,將相同性質的報道任務分配給適當的記者或編輯。

5.5.2 時間序列分析

時間序列分析根據固定時間間隔來記錄事件結果。新聞業務系統每天固定時段處理稿件數變化,每月處理稿件數,每季度總的發稿量等就是時間序列的案例。

分析時間序列數據,可以借助一些可視化的手段,如:柱狀圖、折線圖,從而觀察出某些現象特征及行為,通常時間序列有四種主要的變化:

長期或趨勢變化。用于反映長期變化的總體方向,體現為趨勢線。

循環運動。體現為沿著趨勢線或者趨勢曲線長時間的擺動,包括周期性和非周期性的擺動。

季節性移動或季節性變化。反映每年都重復出現的事件,體現為在連續幾年的同期重復出現相同或相似的模式。

非規律或隨機變化。由于偶然或隨機事件引起的變化。

數據挖掘技術應用于新聞業務流程管理對數據的歸納、分析和處理精細化有重要幫助。通過獲取與分析用戶行為模式,分析以往采編流程數據,全面掌握采編業務的運作狀態,了解采編人員的特點,實現服務個性化、智能化。

6.結束語

在傳統媒體戰略轉型的迫切形勢下,需要依靠技術創新提升核心競爭力和傳播影響力。大數據是內容、渠道、服務的核心支點,是傳統媒體轉型的有力推手。本文探討了在商業智能的通用框架下,數據分析挖掘技術在新聞采編業務流程數據上的應用。通過對新聞生產力、傳播影響力、全流程狀態的分析挖掘,使用先進的方法和工具,梳理采編業務流程,識別行為數據產生點和管理控制點并進行指標體系設計,幫助決策者把握業務發展方向。隨著大數據時代的發展,商業智能相關技術的應用將助力媒體融合,為傳統媒體戰略轉型提供有力支持。

[1]張良均,陳俊德等.數據挖掘實用案例分析[M].北京:機械工業出版社,2013(7): 18-30.

[2]陳哲.數據分析企業的賢內助[M].北京:機械工業出版社,2015(5):1-27.

[3] Ralph Kimball,Margy Ross.數據倉庫工具箱(第三版)[M].北京:清華大學出版社, 2015(1):5-11.

(作者單位:新華社技術局)

G210.7

A

1671-0134(2017)12-118-03

10.19483/j.cnki.11-4653/n.2017.03.030

猜你喜歡
商業智能業務流程數據挖掘
改進支持向量機在特征數據挖掘中的智能應用
航天企業基于信息化的業務流程體系構建方法研究
ERP系統在企業財務管理和業務流程管理中的應用
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
互聯網+背景下物流公司的業務流程再造
什么是商業智能?它的定義和解決方案
軟件工程領域中的異常數據挖掘算法
建設項目全過程造價管理咨詢服務的業務流程分析
關于實時商業智能的文獻綜述
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合