?

大數據實踐客體的非傳統分析

2019-10-30 18:53張少初
科學與財富 2019年30期
關鍵詞:非傳統大數據實踐

張少初

摘 要:本文分析了大數據實踐客體的非傳統,包括大數據的非確定性,大數據的非實在性,大數據的非統一性。

關鍵詞:大數據;實踐;非傳統

如今大數據發展大體分為兩種類型,一是企業型大數據,企業產品的研發和服務領域產生了大量的海量數據,對這些數據進行整合與分析,完善企業業務吸引更多客戶群體從而正向循環式的產生了更多的超大規模的數據。二是網絡型大數據,在互聯網上發生的、蘊含極其豐富的可被發掘價值的大數據。如具有社會價值、科研價值等等的數據。大數據具有的4 V特性(Volume規模巨大,Velocity速度極快,Variety模態多樣,Veracity真偽難辨)導致其規模與復雜度顯而易見。帶來的技術挑戰集中表現在數據的異構性和不完備性、數據處理的實效性、數據的隱私保護、大數據價值服務的有效性發掘、大數據的再分析處理等方面。企業在針對網絡型大數據方面的問題更為嚴峻,也一直努力去探討研發下一個階段的可行商業開發和應用形態。

人們在運用大數據分析從而得到相關有用價值的知識,因此大數據的價值更為顯著,在不斷的學習與管理大數據平臺期間也要對獲取的相關知識進行整合,這樣才能更好的發展大數據的相關結構。大數據技術的卓越發展促使了大數據引擎檢索與分析在航空、車載服務、科技資源、醫療等領域開展了示范應用,同時也獲得了大眾好評。

1.大數據的非確定性

虛擬網絡數據的不確定性包括數據的不確定性、模型的不確定性和學習的不確定性。以上不同類型的不確定性讓網絡數據難以有效地利用其價值服務于人們的實踐活動。

1.1數據的不確定性

網絡原始數據的不準確性和數據采集處理粒度、應用需求與數據集成和展示等因素迫使數據在不同尺度、不同維度上都有不同程度的不確定性。傳統數據側重于數據準確性的處理方法,很難應對海量數據、多類型數據、高維數據的不確定性數據??偠灾?,在數據的信息采集、信息查詢、信息建模、信息存儲、信息檢索和信息挖掘等方面都使用優良的新方法來應對數據不確定性的挑戰。大數據時代以來,概率統計論的方法廣泛應用于不確定性數據的處理當中。網絡時代使用不確定的方法早已難以應付數據的不確定性對大數據的影響,高速計算機硬件的研發也為解決數據不確定性提供了有效的幫助。

1.2模型的不確定性

只有不斷創新研發出對數據處理的新的方式,合理的抱我模型表達與復雜度之間的平衡才能夠應對在數據不確定性的環境下提出新的模型方法?!翱赡苁澜缒P汀笔轻槍Σ淮_定數據的建模系統設計上最為樸實的觀點。只有數據的各種狀態都加以刻畫才能解決各類結構范疇下數據的不確定性。模型刻畫模式由于具有較強的表達能力而且可對數據相關性進行建模,因此被廣泛的應用于不確定數據的建模領域。此外,不確定性模型的建構對數據管理和挖掘信息的查詢、信息的檢索、信息的傳輸、信息的展示等各個方面都有深有影響。

1.3學習的不確定性

數據模型需要對數據模型參數有著深入的了解與學習。在眾多偶遇情況中一個局部有界的查詢都尤為吃力,通過不確定的學習方法來解決最優解NP問題是現今廣泛運用的一種方式?,F今大數據時代背景下,傳統近視的不確定學習法應對大數據模型的龐大規模承載著巨大的責任與挑戰。隨著計算機多核CPU/GPU的普及與研究在解決近似的不確定性學習數據模型方面成為了重要手段。

2.大數據的非實在性

非實在性是網絡數據有別于其它數據的關鍵特性。網絡數據的非實在性在數據模式的非實在性、數據產生的行為的非實在性和數據智慧的非實在性在度量和預判上顯得難以駕馭。

2.1模式的非實在性

網絡大數據對數據結構、數據功能等方面展現出了局部結構特點所不具備的特定模式特征。在多領域的網絡數據里由于數據的屬性不同、功能不同等層面不僅存在著參差不齊的差異而且油相互彼此關聯著。數據模式在結構方面由于不同的關聯程度讓網絡數據構成顯現出模塊結構,網絡數據自動地相互分離涌現成眾多小塊的演變過程促成了網絡功能結構。這些模式的非實在性特征對于社會網絡模型的發展有著重大的科研意義。

2.2行為的非實在性

大數據網絡有著許多相似的個體并建立著相關的社會關系。大數據采集技術日新月異的發展讓人們所獲得的數據都具有時序性,而且虛擬網絡個人行為數據的暴漲就是其分布統計的結果。資深專家Schelling在虛擬社會網絡模型演變過程中數據自主的相互分離成連通塊這一現象對于研究虛擬網絡模型規律影響盛大。虛擬網絡個體發送郵件的數量日益劇增,個體與個體使用社交網絡媒介頻率涌現的特征也證明了自然界和社會中個體與個體之間的互相競爭模式能顯現出一種不同的同步狀態的非實在性。

2.3智慧的非實在性

網絡數據無法預測與掌控,個體與個體大量的相互轉換、融合和連接所持續變化演進形成各式各樣的語義簡稱為智慧的非實在性。這種別具匠心的智慧顯現方式在互聯網和虛擬網絡平臺的火速發展中建立了全新的數據生產模式、大數據處理協作模式和全新的商業群體模式。

綜上所述,網絡社交媒介對大數據的研究領域包含了信息數據庫、信息數據挖掘和信息機器化學習等模式,由于海量大數據規模龐大關系復雜且深入研究領域眾多,使得部分研究成果無法直接借鑒于虛擬網絡大數據引擎,至今為止就連大數據科學與技術的內涵與延伸都缺乏權威的界定與論證,因此大數據技術在理論和方法研究領域發展空問廣闊,擬定全新的“數據”到“數據”的研究方案需要更加完備的理論體系的支撐。

3.大數據的非統一性

大數據的非統一性包含信息數據類型的非統一性、信息數據內在模式的非統一性和信息數據結構的非統一性。它使得網絡大數據信息存儲、信息挖掘、信息分析等眾多發面遭受了前所未有的挑戰。

3.1數據類型非統一性

網絡數據日新月異的增長包括其信息技術數據途徑多樣化的演變與發展、信息數據類型豐富多彩的涌現與擴張,網絡大數據技術針對信息數據采集、信息存儲和信息處理的要求也隨之不斷創新。大數據網絡的興起在個人運用網絡信息技術的同時(如微博、微信等網絡信息平臺APP),對信息數據傳播媒介、信息數據傳播個人和信息數據引擎等方面都帶來了全新的挑戰。簡短的文本信息數據漸漸取代了傳統通信的長文本信息數據,簡短的文本信息由于長度短,信息上下文統計信方便快捷,針對傳統文本信息挖掘(如信息檢索、信息主題發現、信息語義和信息情感分析等)帶來恐懼的研究挑戰。相關聯的研究數據源包括利用外部數據源(如Wikipediaft)、搜索結果等)擴充文檔或依賴內部類似文檔信息源去擴展短文本信息源。外部、內部數據源的引用都帶來了噪音方面

的不良影響,處理并有機融合這些各式各異的的數據也帶來了前所未有的全新的挑戰。比如社交媒體中探尋地域信息與內容的融合、時空信息技術與內容信息技術的結合等。

3.2數據結構的非統一性

傳統數據對象的處理不僅能將相關信息存儲在關聯數據庫中,而且處理數據對象都具有結構性。虛擬網絡、移動筆記本、傳感器等尖端技術的出現使得信息數據生成方式豐富多彩,非結構化信息數據的生成主導了大數據信息存儲的主流。非結構化數據蘊含著五彩繽紛絢麗的數據知識且格式類別眾多,基本包括文本數據、文檔數據、圖形數據、視頻數據等形式,其異構、可變的表現形態給數據信息分析和數據信息挖掘帶來了不小的挑戰。針對非結構化數據信息組織凌亂富含相關無用信息的特點,其帶給數據信息存儲、數據信息分析帶來了很大的挑戰。

參考文獻:

[1]吳吉義,傅建慶,張明西,等.云數據管理研究綜述電信科學,2010(5):34.41

[2]呂新奎: 《中國信息化》,北京:電子工業出版社,2002年

猜你喜歡
非傳統大數據實踐
基于文本挖掘的非傳統文本批評話語研究
慢、輕、微、精”,做傳統行業的非傳統企業……何丹妮
初中政治教學中強化新八德教育探討
體驗式學習在數學教學中的應用研究
生物專業師范生教學實習的問題與對策研究
校企協同實施高職專業課程改革的實踐研究
基于大數據背景下的智慧城市建設研究
論當代插圖藝術的非傳統媒介化
依托國際組織 保障我國非傳統安全
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合