?

聲像資料中數據挖掘技術研究

2022-05-13 22:12葛向然
科學家 2022年5期
關鍵詞:數據挖掘

葛向然

摘要:隨著聲像的發展以及聲像資料的普及,人們可以將聲音、圖像進行儲存,收集和儲存聲像的能力已經超過了在聲像中獲取信息的能力,這一結果促使我們大力發展聲像資料下的數據挖掘技術,發現聲像資料下隱藏起來的數據信息。本文通過對聲像資料和數據挖掘技術的定義研究,拓展出聲像資料下數據挖掘技術的應用,希望可以為我國聲像資料下的數據挖掘技術提供幫助。

關鍵詞:聲像資料;數據挖掘;圖像數據挖掘

前言:數據挖掘技術的大量應用,有利于在網絡中快速地提取所需要的信息,通過對圖像數據挖掘、Web數據挖掘技術進行分析,不僅對聲像資料的數據分析具有幫助,也能為發展數據挖掘技術提供方向,對聲像資料下的數據挖掘技術研究具有現實意義。

一、聲像資料

(一)聲像資料的定義

聲像又被叫做是感覺聲源。當人們聽見聲音,并根據聲音發生的位置產生的聲音畫面就叫做聲像,所謂聲像資料就是指在錄音機、錄像帶、磁盤、光盤、手機等載體上記錄的聲音和圖像,不同于音像或者是影像,是聲音和影像的結合。一切可以聽見或者是看見的都可以被稱作是聲像。

(二)聲像資料的發展現狀

現今階段,聲像資料一般用于司法鑒定,為了保證案件的公平與真實性,每一件案件都需要進行證物收集。因為聲像資料一般起到記錄和儲存信息的作用,所以聲像資料一般作為證物出現,但是為了保證證物的真實性會對聲像資料進行司法鑒定。一般會對聲像資料進行完整性、真實性進行鑒定,鑒定聲音圖像是否屬于同一人,鑒定聲像資料是否屬于案件有關范圍。例如,如果是錄音類聲像資料,那么根據錄音中的聲音以及所說情況,首先應該根據個人說話的音線和語言特征判斷錄音的真實性與準確性,然后分析情況。在各個領域中聲像資料都展示出了它的重要性,聲像技術也越來越受到重視

二、數據挖掘技術

(一)數據挖掘概述

數據挖掘,就是在大量的數據中識別、分析出可以使用的相關知識,從大量不完全的數據中提取有需要的數據信息的過程,這些數據都具有隨機性、不確定性,他可能是數學結構也可能不是數學結構,可能需要在基礎上再次進行演繹,也可能在基礎上進行歸納就可以。數據挖掘是一個完整的過程,他從大量的信息中提取分散的信息,然后通過數據選擇、數據預處理等步驟合成有用的信息,并通過這些信息獲取豐富的知識或者是做出相對應的決定[1]。

(二)數據挖掘技術的發展現狀

目前,我國數據挖掘技術已經不再是初級階段,它已經從初級階段走向中級階段。在初級階段的過程中已經完成了理論知識依據、模型框架構建等工作;中級階段將在初級階段的基礎上為數據挖掘提供技術支持,完善算法優化等工作。國內的數據挖掘技術研究稍晚,目前還沒有形成完整的研究體系,大多數的數據挖掘技術還在實驗和基礎理論準備中,所以國內目前有許多高等院校以及事業單位都在進行相關實驗,如清華大學和中國科學院等。所以數據挖掘前景良好,未來會出現更加先進的數據挖掘技術。

三、聲像資料下的數據挖掘技術

(一)圖像數據挖掘

圖像數據挖掘技術就是通過對圖像分析、模式識別、人工智能等技術對圖像中的信息就行挖掘。找出數據庫中隱藏在圖像、影像中的關聯與存在信息。圖像數據挖掘與傳統的數據挖掘的區別在于,第一,圖像上的所有信息都是隱藏的;第二,可以對圖像生成多重解釋;第三,圖像中的信息也包括圖像對象的空間信息。

1.目標識別

目標識別一直都是研究圖像挖掘技術中非?;钴S的領域,通過識別系統發現圖像中正式存在的影像,然后再通過技術對影像進行挖掘,然后建立模型。一個目標識別系統一般情況下是由四個部分組成:分別是模型數據庫;屬性探索器;假設編輯器還有假設驗證器。

2.影像檢索

影像檢索一般考慮圖像標引還有系統檢索。一種是通過具體描述對圖像進行搜索,也就是常見的關鍵字、關鍵詞等進行搜索。第二種,也是通過他在圖像上的內容進行檢測,如我們所觀察到的信息、顏色、紋理還有形狀這些方面進行檢測。

3.圖像分類

根據基本內容對所鑒別出來的信息進行大致分類與聚類,是大量信息挖掘中尋找有價值的信息中非常重要的一種方法。分類模型在圖像挖掘技術中也叫做信息分類器,一般是通過最原始的信息在語義上進行劃分。目前主要由兩種分類器構成,分別是參數分類和非參數分類。

(二)web數據挖掘技術

web數據挖掘是指應用數據挖掘技術在文檔和數據服務器中自行尋找有效信息,在網絡中尋找到的音像和影像也算聲像資料的一種。

1.Web聲像挖掘技術

web是指在網絡環境中通過不同的圖像分析工具,在大量的、不完整的、不確定的、隨機性的圖像數據資源中,尋找資源規矩、特征和有用信息的一個過程。

2.web上的信息檢索

現今時代,信息化時代的快速發展,網絡已經成為了一個巨大的心意容量空間,里面存儲了大量的各方面的信息,同時為了方便信息搜索也出現了許多網絡信息檢索系統,也就是我們經常提到的搜索引擎[2]。盡管這方面的系統已經被大眾熟練運用,但是還是會出現許多問題,比如搜索范圍較小、信息精準度不高。大多數的引擎搜索系統都處于關鍵詞匹配這一低層次的應用中,在面對較高層次的搜索就會顯得束手無策。

3.基于內容的聲像檢索

基于內容的聲像檢索是一種新的聲像檢索技術,它除了應用最基本的關鍵詞或者是相似度進行信息匹配外,還可以用圖像顏色的特征進行搜索。比如,國外開發的一些用于圖像內容搜索的系統,如IBM等,國內不斷研究也開發了許多檢測系統,但是這些系統還存在一定的局限性。

4.MPEG4對基于內容的視頻檢索的影響

新一代多媒體MPEG4為多媒體壓縮數據提供了非常廣闊的舞臺,它與之前基于標準的搜索不同在于,它不只是像素的組合,可以把視頻中的每一個要素看成同一系列的對象。它不僅僅只是單聲道或者是多聲道,它可以是單聲道、多聲道、文字、動畫等所有組合。所以許多內容都可以通過它進行檢測,對于基礎內容的檢測可以起到促進作用。

總結:當今社會處于一個信息化的時代,無線網絡、數字城市都是我們處于信息化時代的體現,可以將每個人連接在一起,信息共享。從聲像資料的數據挖掘來看,聲像資料不僅僅只是我們儲存聲音、影像的一種工具,更是獲取知識的一種途徑。數據挖掘技術也是將聲像資料充分利用的一種有力工具,但是目前技術還不算完善,許多方面還在進步。

參考文獻:

[1]黃君,陳超雪.云計算背景下物聯網數據挖掘技術研究[J].電子世界,2021(22):4-5.

[2]王麗麗.大數據背景下數據挖掘技術的應用[J].計算機與網絡,2021,47(20):45-47.

猜你喜歡
數據挖掘
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘的分析與探索
數據挖掘技術綜述與應用
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
高級數據挖掘與應用國際學術會議
高級數據挖掘與應用國際學術會議
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合