?

電子商務平臺數據質量控制系統及仿真模型分析

2016-12-21 23:41徐剛陳紅荀啟明
現代情報 2016年11期
關鍵詞:電子商務平臺數據質量

徐剛 陳紅 荀啟明

〔摘要〕本文在系統動力學的基本原理基礎上,構建了電子商務平臺數據質量控制系統的因果關系圖,利用VENSIM PLE仿真軟件進行系統仿真,從有效性和靈敏性兩方面驗證了技術進步率及管理因素對電子商務平臺數據質量的影響。結果表明,該模型能夠較好的擬合現實中技術進步率及管理因素與電子商務平臺數據質量的相互關系,并且為電商平臺數據質量建設管理提供了相應的參考依據。

〔關鍵詞〕技術進步率;管理因素;電子商務平臺;數據質量

DOI:10.3969/j.issn.1008-0821.2016.11.016

〔中圖分類號〕F71336〔文獻標識碼〕A〔文章編號〕1008-0821(2016)11-0087-07

〔Abstract〕Based on the basic theory of system dynamics,this paper built cause and effect diagrams of e-commerce platform data quality control system.This paper conducted es system simulation with VENSIM PLE simulation software and verified the rate of technological progress and management factors impact on the quality of e-commerce platform data quality effectively and sensitively.The results showed that the model could better fit the relationship between the rate of technological progress and management factors and e-commerce platform data quality in reality.Hopefully,this paper could provide some advice on how to manage e-commerce platform data quality.

〔Key words〕the rate of technological progress;management factors;e-commerce platform;data quality

電子商務與實體經濟深度融合逐步加深,在優化資源配置的同時,不僅對生產方式,也給我們的生活方式帶來了顛覆性的改變。電商平臺最大的特點就是“數據化”,數據成為了構成電商平臺的重要元素。數據產生在企業的各種業務活動中,相關的數據被平臺數據庫收集(不通),經由電商平臺采集存儲和處理分析,提供給數據需求者使用。在此過程中,電商平臺會出現諸如,數據不完整、不準確、不可信等關于數據質量的問題,導致數據失效、決策失誤。因此,對數據質量的管理與控制、提升電子商務平臺數據質量已經成為業界最為關心的話題。

目前對電子商務平臺數據質量的研究主要集中在數據挖掘、數據倉庫等技術層面,注重對數據采集、存儲、處理環節的數據質量[1],忽略了數據質量控制是一個系統、整體的問題。本文在深入分析電子商務數據質量控制系統的構成要素及各要素相互關系的基礎上,針對數據質量全過程控制、用戶使用滿意度、綜合影響因素,將數據質量控制系統看成一個整體系統,建立能夠刻畫電商平臺數據質量控制變化的系統動力學模型,并通過仿真對模型的有效性進行驗證。本文基于系統動力學原理,構建電子商務平臺數據控制系統,通過仿真模型來確立對數據質量控制產生影響的因素,并深入的剖析各因素對電商平臺數據質量的影響程度。

1電子商務平臺數據質量控制系統影響因素分析

11數據質量全面控制影響因素分析

MIT數據質量項目的負責人Wang教授等人(1997)認為應當將數據看作實體產品,將數據作為具有生命周期的產品進行管理,數據質量的衡量需要貫穿數據的生產全過程與結果[2]。國內學者商廣娟(2005)從現代數據質量的概念角度出發,提出要提供和改進數據質量必須對數據運行的全過程進行管理控制。高品質的數據質量是由訪客數據生成、采集存儲、分析處理與發布共享各個階段的高品質的綜合作用決定的[3]。

電子商務平臺數據質量的控制應當貫穿數據生命周期的始終,因此,本文將數據生命周期劃分為訪客生成數據、數據采集存儲、數據處理分析、數據發布共享4個階段,對數據產品的全過程質量進行系統分析。

12用戶使用滿意度影響因素分析

電子商務平臺數據用戶使用滿意度已成為衡量其數據質量的重要指標,如Strong等(1997)國外學者認為“數據就是適合用戶使用的”,數據質量就是數據滿足特定用戶期望的程度[1,4];向上(2007)從用戶使用角度對數據質量進行判定,認為高質量的數據就是指那些適合用戶使用的數據,強調用戶的滿意度[5]。

結合眾多學者的研究,數據質量可以說是滿足使用要求的相對狀態[6]。本文認為數據的用戶滿意度需要通過用戶期望與電子商務數據質量實際情況共同來確定。

13管理因素、技術應用及信息因素綜合影響因素分析在數據運行全過程質量控制中,對數據質量產生影響的因素較多,谷斌(2007)認為管理因素與技術水平是影響數據質量的兩個重要因素,無論哪個因素出現消極面,都會對數據運行全過程的產生負面影響[7]。本文也將通過管理因素、技術應用、信息因素這三大因素對數據的收集存儲、分析處理、發布共享環節的質量進行分析。

MIT數據質量研究中心將數據質量描述分為4個類別,每個類別下繼續分為若干個屬性,通過識別出4類對用戶有用的信息質量維度來認識數據質量,包括本征質量,應用質量、描述表達、可訪問性4個類別。其中,本征質量涵蓋了數據的可信度、準確性、客觀性;描述表達質量涉及可解釋性、一致性、簡潔性;可訪問性方面的質量涉及平臺的可訪問性及訪問的安全性;應用方面的質量多與用戶使用相關聯。在對國內外一部分研究數據質量基本要素分類的學者的觀點梳理的過程中,認為數據的本征質量、數據表達、獲取特性最終大部分會在數據的發布共享階段體現出來,即以上3種數據特征會對數據發布共享質量產生積極影響,進而作用于電商平臺數據質量[2]。

綜上所述,本文通過構建全面數據質量控制系統及用戶滿意度反饋系統,結合管理因素、技術應用、信息因素的綜合作用,以技術進步率為核心,分析電商平臺數據質量控制系統的變動趨勢。

2電子商務平臺數據質量控制系統動力學模型

21電商平臺數據質量控制系統的因果關系分析

通過對國內外有關數據質量的研究文獻進行梳理發現要使電商平臺數據質量控制系統發揮效用,關鍵在于數據質量全過程控制的協調及綜合作用,電商平臺數據質量最終會通過用戶滿意度獲得體現。用戶使用滿意度越高,其在使用的過程中產出的數據會成為數據質量全過程控制系統數據的來源,訪客生成的數據質量也會隨之提升[8]。

此外,數據多樣性、數據量、數據增長、變化速度會導致數據來源的復雜性,伴隨而來的就是數據來源質量提升,高質量的數據環境是保證數據質量的前提。因此,數據來源質量越高,數據采集存儲狀態越好[6]。數據采集存儲狀態良好,會降低數據處理難度,提高數據處理分析能力。宗威、韓京宇等學者(2013)提出強大、高端的數據處理分析技術是數據發揮效能的重要手段,數據處理分析能力會正向作用于數據發布共享質量,為數據的獲取和共享提供了條件,增進電子商務數據質量的產出水平[1,10]。技術進步、管理因素會對數據采集存儲、數據處理、信息發布階段管理提供保障和支持。數據發布共享質量受到數據本征質量、獲取特性、數據表達的共同影響[11],同時,數據發布共享提供給數據需求者使用,其質量越高,滿足用戶期望的比重越高,用戶滿意度越高。用戶滿意度成為了衡量電子商務數據質量的另一個重要維度,數據質量與用戶滿意度之間呈正相關關系。

在深入分析電子商務平臺數據質量的全過程控制及構成要素的基礎上,本文將技術應用、管理因素、信息因素確立為主要的影響因素,并將各個因素之間的相互作用機理通過訪客生成數據質量、數據采集存儲狀態、數據處理分析能力、數據發布共享質量、用戶滿意度這5個子系統表現出來。其一,訪客生成數據質量子系統體現在數據來源的復雜性及用戶滿意度的作用下,其對電子商務數據質量的影響程度;其二,數據采集存儲狀態子系統、數據處理分析能力子系統、數據發布共享質量子系統依賴于技術應用、管理因素及信息因素;其三,用戶滿意度子系統受用戶期望與電子商務數據質量的共同影響,是基于數據使用端對電子商務數據質量的外部評價的輸出,采用。

通過上述分析,本文通過技術進步率、管理因素、信息因素對數據采集存儲狀態、分析處理能力、發布共享質量的影響方式,綜合評價電子商務平臺數據質量,可以得到如下的電商平臺數據質量控制影響因素的因果關系圖(見圖1)。

由圖1可知,電子商務數據質量由訪客生成數據質量、圖1電子商務平臺數據質量控制系統的因果關系模型

數據采集存儲狀態、數據處理分析能力、數據發布共享質量決定,通過用戶滿意度體現出來。圖中決定電子商務數據質量的四大環節由信息、管理、技術三大因素共同影響。本文將技術作為影響電子商務數據質量的核心因素,采用技術進步率這一變量來分析當技術產生進步時,電商數據質量發生變動的趨勢及變動效率。技術進步率越大,技術應用越廣泛,訪客生成數據質量、數據采集存儲狀態、數據處理分析能力、數據發布共享質量就越好。

22模型假設及系統流圖

根據上述因果關系圖構建系統動力學流圖,本文引入2個狀態變量、3個速率變量、15個輔助變量、7個常量建立了電子商務平臺數據質量控制的系統動力學流圖(見圖2),在合理科學分析各變量、常量現實情況的基礎上,利用系統動力學相關函數對個變量的數學公式進行設置,為進行系統模擬仿真提供更準確的依據。圖2電子商務數據質量控制系統動力學流圖

221模型基本假設

(1)電子商務從1995年起,以Web技術為代表的信息發布系統,爆炸式地成長起來,成為目前Internet的主要應用。1990-1993年,電子數據交換時代,成為中國電子商務的起步期。1998年3月,我國第一筆互聯網網上交易成功。因此,本文假定系統的初始時間為21世紀初,本模型設定的系統仿真時間為100個季度。(2)由于電子商務發展的初期之前,有電子郵件、Web技術等電子信息技術的基礎,因此,初期電子商務數據質量=10。

222模型參數及方程設定

L1用戶滿意度=INTEG(DELAY1((用戶體驗-用戶期望)/用戶期望,8),0)

以用戶體驗減去用戶期望的差值與用戶期望的比值,來表示用戶期望得到的滿足程度,該值越大則表示用戶滿意度越高。本文對用戶滿意度這一狀態變量采用一階延遲函數,是因為在用戶期望與實際體驗的過程中存在延遲,電子商務平臺數據質量的用戶滿意度是一個大眾的概念,需要時間緩沖,假設延遲時間為8個季度。

3電子商務平臺數據質量控制系統模型的仿真分析

31模型有效性分析

模型有效性仿真對于檢驗判斷模型模擬運行結果的準確性和有效性具有十分重要的意義。因此,本研究借助系統動力學理論與方法,通過Vensim PLE平臺對上述模型進行仿真研究,仿真結果如圖3所示。

從圖3的系統仿真運行結果中可以看出:在技術進步率的作用下,訪客生成數據質量在電商平臺初期出現了一定的延遲效果,繼而呈現遞增的趨勢,說明在技術進步率的作用下,技術進步、管理因素等會使訪客生成數據質量獲得改善和提高。當訪客數據質量提高到第60個季度時,此時將會保持在一個相對比較穩定的水平上增長,趨勢較為平緩,此階段可以視作訪客數據質量進入了成熟期。

數據的發布共享階段,在前30個季度中,呈現一種低速增長的量變積累過程,當量變達到一定程度后,數據發布共享質量將會以井噴式、爆炸式的形式增長,待推動力乏力后,將會以一種平穩低速的模式改善系統的結構。

用戶滿意度是電子商務數據質量的一種評價方式,從第1個季度到第25個季度都在以較高的速度在增長著,而在第26個季度之后,用戶滿意度趨于一種穩定的態勢,是因為電子商務發展的前期,用戶的需求以及期望不高,用戶體驗的新鮮感,使得用戶很容易就能被電子商務平臺帶來的利益所滿足。當電子商務平臺發展趨于成熟,技術的進步,人們對其質量提出了更高的要求,同時用戶體驗也圖3系統有效性檢驗

越不容易被滿足,此時用戶需求的多樣性等很難被全部實現,用戶滿意度出現平緩下滑的趨勢。

電子商務數據質量在前40個季度(前10年)主要依賴于互聯網WEB技術的支持,一直在穩步發展當中,卻并未獲得根本上的質變,直到21世界初期,智能手機、移動互聯網技術的廣泛傳播才促使電子商務數據質量獲得質變,而且數據質量的增長也在以躍進式、倒U型的特點獲得發展。

32模型敏感度分析

靈敏度分析的主要用于尋找模型中較為敏感的參數,以此作為調試對象分析和尋找滿足系統運行實際的最佳杠桿作用點。根究本文研究目的,主要改變技術應用進行靈敏度測試,一方面改變技術進步率;另一方面是改變管理因素與技術進步率的作用結構。

321改變技術進步率

靈敏度分析的關鍵在于尋找模型中較為敏感的參數和杠桿作用點。本文研究的核心是技術進步率對電子商務數據質量的推動力,以及該控制系統的作用方式。因此,采用敏感度分析方法對技術進步率進行調整,觀察用戶滿意度、訪客生成數據質量、數據發布共享質量及電子商務數據質量的變化趨勢。在保持其他參數不變的情況下,將技術進步率的初始值由1調整到5、9等兩種情況,通過VENSIM仿真得到圖4的結果。

通過不斷的提高技術進步率的數值,從數據發布共享質量、電子商務數據質量圖形中的斜率獲得了提高,表明可以在很大程度上改善數據發布共享質量,從而改進電子商務數據質量。這表明電子商務數據質量依賴技術進步率的作用路徑,隨著技術的革新,電子商務數據質量控制系統將會越加完善。而訪客生成數據受用戶滿意度的影響,當技術環境中技術取得不斷進步時,用戶的需求就越多樣、對質量的要求也會越高,換言之,用戶如果在技術進步并沒有得到滿足,其用戶滿意度就會降低,從而會影響訪客生成數據質量。

322改變技術應用結構

為了進一步分析技術進步率對電子商務數據質量控制系統的作用方式,保持其他變量不變的情況,考察技術應用內部結構對電商數據質量控制系統的影響,將技術應用=技術進步率09+管理因素01中的系數由(09,01)調整到(08,02)、(07,01),不斷降低技術進步率對技術應用的影響比重,提高管理因素的作用力度,結果如圖5所示。

通過調整技術應用的內部結構,即管理因素、技術進步率的比重,可以較為明顯的從數據采集存儲狀態、數據處理分析能力、數據發布共享質量及電子商務數據質量這4張圖中發現,提高管理因素在技術應用所占的比重,降低技術進步率的比重,以上包含電子商務數據質量的全過程,都存在一種現象,調整后的電子商務數據各過程的質量都得到了提升,并且提升的空間較為可觀。

而管理因素與技術進步率的結構的調整對用戶滿意度圖4技術進步率敏感度分析

及訪客生成數據質量的影響不大,究其原因為管理因素是電商平臺內部因素,對外部數據質量及用戶滿意度的控制和影響比較微弱。

4模型結論與啟示

本文利用系統動力學研究方法建立了電子商務數據質量控制系統的系統動力學模型,在對技術進步率、管理因素、信息因素的分析基礎上構建了各變量間的流變量模型,通過VENSIM PLE仿真發現在技術進步率及管理因素的作用下,技術進步、管理因素、信息因素對電子商務數據質量的關系并非簡單的線性關系。電子商務數據質量受技術進步率、管理因素、信息因素的影響,呈現指數增長趨勢,即是表明受三者的綜合作用,電子商務數據質量不僅表現出正向促進作用,而且當量變積累達到一定階段,會產生質變,以指數增長的情形增長。

41技術進步率對電子商務數據質量存在正向影響

在電子商務的平臺建設中,應當注意對技術的開發及引進,做到引進吸收再創新,促進技術的革新與進步,在初期以技術引進為主,加速技術進步的積累過程,完成電子商務數據平臺量變的積累。為此,對技術進步的關注及重視,持續保持對技術所涵蓋的各種形式知識的積累與改進。然后,技術引進與技術開發并重,技術進步應當為應用創新創造了新的技術。

42電子商務數據質量控制過程質量受管理因素的影響通過改變技術應用結構,調整技術應用的構成,提高管理因素的作用比重,在保持其他不變的情況下,管理因素的作用力極大的改善了電子商務數據質量控制系統的整體質量,尤其是對電商數據質量內部全過程控制的環節的質量和狀態有了極大的提升。為此,電商平臺應當高度重視管理因素的作用效果,合理發揮技術進步率、管理因素、信息因素的綜合作用。從數據收集、數據存儲到數據分析處理、發布共享,電子商務平臺的管理者應對數據質量管理的建設保持高度關注和重視,提供足夠的支持力度。人員的專業素養是保證電商數據質量不可或缺的一部分,加大相關技術人員的儲備,為電商平臺建設注入活力。另外,企業必須制定科學合理的管理制度和方案來削弱管理機制障礙的負面影響,考慮大數據在各個方面可能發生的種種意外情形,利用專門的數據提取和分析工具,任命專業的數據管理人才加強對大數據的管理,提高員工的數據質量意識,以保證電商平臺的數據質量,從而挖掘出更多準確、有效、有價值、高質量的信息。圖5技術應用結構敏感度分析

參考文獻

[1]韓京宇,徐立臻,董逸生.數據質量研究綜述[J].計算機科學,2008,35(2):1-5.

[2]Strong D M,Lee Y W,Wang R Y.Data quality in Context[J].Communications of the ACM,1997,40(5):103-110.

[3]商廣娟.有效的數據質量管理體系——21世紀管理的基石[J].航空標準化與質量,2005,(2):18-22.

[4]Cappiello C,Fran calan ci C,Pernici B.Data quality assessment from users pespective[C].IQIS,2004.

[5]向上.信息系統中的數據質量評價方法研究[J].現代情報,2007,27(3):67-68,71.

[6]姜作勤.數據質量研究與實踐的現狀及空間數據質量標準[J].國土資源信息化,2004,(3):23-28.

[7]谷斌.信息系統建設中的數據質量管理體系研究[J].情報雜志,2007,26(5):65-67.

[8]鐘珞,馬志軍,水俊峰,等.支持電子商務的高性能數據倉庫平臺的設計[J].武漢理工大學學報,2003,25(2):65-68.

[9]楊迪,馬怡安,王錚,等.運營商在大數據背景下對數據質量管理體系的探索及思考[J].互聯網天地,2016,(1):73-79.

[10]宗威,吳鋒.大數據時代下數據質量的挑戰[J].西安交通大學學報:社會科學版,2013,33(5):38-43.

[11]馮纓.網絡調查數據質量控制的方法與對策研究[M].上海:上海三聯書店,2013.

(本文責任編輯:孫國雷)

猜你喜歡
電子商務平臺數據質量
強化統計執法提高數據質量
淺談統計數據質量控制
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合