?

大數據分析管理系統在新能源汽車事故分析中的應用

2024-03-24 05:00王娜李強
時代汽車 2024年2期
關鍵詞:數據分析新能源汽車數據挖掘

王娜 李強

摘 要:隨著新能源汽車的廣泛使用,新能源汽車事故數據的分析處理越來越受到人們關注。傳統的事故數據分析方式通常需要大量的人力和時間,而且往往只能分析少數的數據變量。數據挖掘技術以其強大的數據分析和挖掘能力,已經在新能源汽車事故數據分析處理中得到廣泛應用,以幫助研究人員從事故數據中挖掘出潛在的規律和特征,為事故原因和解決方案的提出提供科學依據。本文設計了一套新能源汽車事故大數據分析管理系統,更加高效、有規律地分析新能源汽車事故數據。

關鍵詞:數據挖掘 數據分析 新能源汽車

1 引言

近年來,隨著新能源汽車的發展,其在全球范圍內的銷售量不斷增長。與此同時,新能源汽車事故數據分析處理也成為了重要的研究領域之一。事故數據的分析處理可以為制定相應的交通規則和提高交通安全性提供有益的參考依據[1]。但是,傳統的事故數據分析方式需要大量的人力和時間,且只能分析少數的數據變量,限制了數據的分析深度和廣度。為了提高新能源汽車事故數據分析處理的效率和準確性,數據挖掘技術被應用于新能源汽車事故數據分析處理領域中。數據挖掘技術可以挖掘大量的數據,找到隱藏在海量數據背后的真實信息,幫助研究人員從事故數據中更準確有深入地發現規律和特征,為事故原因和解決方案的提出提供科學依據[2]。因此,本文旨在探討數據挖掘技術在新能源汽車事故數據分析處理中的研究現狀、存在的問題及解決方案。

2 數據挖掘技術在新能源汽車事故分析中的應用

隨著新能源汽車的不斷發展,特別是電動汽車的普及,其在道路安全方面帶來了新的挑戰。為了達到更高的安全性能,減少交通事故的發生,數據挖掘技術在新能源汽車事故分析中得到了廣泛應用[3]。數據挖掘技術在新能源汽車事故分析中的應用主要包括以下三個方面:

2.1 事故模式挖掘

使用數據挖掘算法可以對大量的新能源汽車事故數據進行處理和分析,從而找出發生事故的常見模式和規律。通過挖掘事故模式可以有效地提高新能源汽車產業安全性能,并開發相應的預防機制。

2.2 風險評估和預測

數據挖掘技術的另一個重要應用領域是新能源汽車風險評估和預測。通過對相關數據的統計分析和建立合適的數據模型,可以對車輛的潛在風險進行評估和預測,以實現更加準確的安全性工程決策。

2.3 智能駕駛和自主導航

數據挖掘技術有助于新能源汽車開發智能駕駛和自主導航技術。通過對車輛控制系統和傳感器數據的分析,可以在極短的時間內判斷出車輛周圍的道路、障礙物和其他車輛位置,并且實現自主化的駕駛與導航操作。

3 存在的問題

新能源汽車在未來交通中將起到越來越大的作用。但是,隨著新能源汽車的發展和日益普及,由于新能源汽車本身的特殊性質、復雜性和安全難題,新能源汽車事故造成的人員傷亡和財產損失仍然存在不容忽視的風險。因此,新能源汽車事故分析具有重要的意義,在此過程中,數據挖掘技術被廣泛應用。但是,在實際應用中,數據挖掘技術也存在一些問題。

3.1 數據獲取困難

由于大多數新能源汽車沒有安裝行車記錄儀,導致數據的獲取非常困難。一些新能源汽車廠商為了減輕對用戶的干擾或節約成本,未能安裝準確的傳感器,這使得獲取數據變得更加困難。

3.2 數據質量差

由于數據獲取困難,不少新能源汽車企業沒有完全重視數據質量的重要性。因此,在事故數據處理過程中,許多數據質量存在較大的問題。使用這些數據進行分析會導致結果的不準確。

3.3 特征提取與分析難度大

新能源汽車的數據較為復雜,涵蓋了很多不同領域的數據。由于新能源汽車的復雜性和特殊性,如何有效地進行特征提取和分析是一個挑戰。而且,新能源汽車的數據還與用戶的行為習慣、環境變化等因素密切相關,這使得數據的清洗和預處理困難[4]。

3.4 數據安全問題

在新能源汽車事故分析過程中,由于數據涉及用戶個人隱私,數據泄露風險會給數據分析和應用帶來很大風險。

4 新能源汽車大數據分析管理系統

為了更加高效、有規律地分析新能源汽車事故數據,特研發了一套新能源汽車事故大數據分析管理系統。該系統的實現可分為三大部分,其中第一部分為多源數據預處理系統。該系統通過對不同來源、不同結構的新能源汽車數據進行匯聚和預處理,將處理后的采集數據形成結構化的原始數據、數據片段及特征數據,并保存至Mysql數據庫,以方便后續分析模型使用。第二部分為事故數據分析系統,該系統使用各種工具手段,例如新能源汽車事故模式識別模型和事故特征模式匹配追蹤模型等,以便提取大量數據背后的事故發生規律及其關聯因素。第三部分為測試驗證系統,主要關注單要素和多要素安全量化分析算法模型的測試及驗證。該系統使用大量事故車和正常車數據來驗證模型的輸出結果,以確保安全要素的各種特征得到完整的確認。系統的總體結構圖如圖1所示:

4.1 多源數據采集預處理系統

該系統主要包括以下幾個功能:

數據采集:通過多種方式和渠道采集數據,包括爬蟲、API接口、日志文件、數據庫等。該功能能夠實現高效、靈活、準確地獲取所需的數據,并對數據源進行適當的篩選和過濾以保證數據的準確性和完整性。

數據預處理:對采集獲得的數據進行初步整潔、轉換和標準化處理,確保數據的一致性和規范化,包括數據清洗、數據轉換、數據集成、數據規范化等。有效的數據預處理能夠為后續的數據分析和挖掘工作提供可靠的基礎。

數據存儲:將預處理后的數據存儲在適當的數據倉庫或數據管理系統中,包括關系型數據庫、非關系型數據庫、數據湖等。具體的存儲方式取決于數據的類型和規模,同時需要考慮數據的安全性和可擴展性。

數據訪問:為用戶和需求方提供方便快捷的數據訪問接口,包括圖形化界面、API接口、數據導出和數據共享等多種方式,滿足不同用戶的各類數據查詢和數據挖掘需求。同時需要考慮數據的隱私保護和安全訪問等問題。

為了實現多源數據采集預處理系統的快速采集和預處理不同來源和類型數據的能力,系統需要按照數據采集和預處理的需求設計軟件架構。圖2所示:

主要包含以下四個模塊:高速隊列消息模塊、數據實時計算模塊、實時緩存模塊和數據總線接口模塊。這些模塊將協同工作,確保數據的高效采集、實時計算、快速緩存以及數據總線接口的平穩連接。這樣的軟件架構能夠為多源數據采集預處理系統提供高效、可靠的數據處理能力。

1)高速隊列消息模塊,其作用是接收來自新能源汽車國家監管平臺和其他數據平臺的實時數據,并將其傳輸給數據實時計算模塊和實時緩存模塊,以進行高吞吐量的分布式計算和緩存。

2)數據實時計算模塊,其作用是對接收到的數據進行合法性檢查、結構化處理和安全相關數據項提取。

3)實時緩存模塊,其作用是暫存平臺接收的數據,并按需分發給多個實時計算模塊,以實現海量數據的實時處理。

4)數據總線接口模塊,其作用是實現各模塊間數據的調用及消息傳遞,并將預處理后的數據存儲于安全信息數據庫中,以便按類別進行管理。

4.2 事故數據分析系統

事故數據分析系統主要的功能模塊有事故數據管理模塊、事故數據切片管理模塊和事故分析及可視化模塊。

4.2.1 事故數據管理模塊

事故發生后,需要進行現場調查并記錄基本信息,包括事故、車輛和動力電池信息。這些記錄可供事故分析人員在線查閱,以便了解事故情況、車輛狀況和電池狀況。以上數據將被提交到系統中,脫敏并保存,以支持后續的數據管理和使用。為簡化理解,建議將長句分解并減少重復使用。具體的管理功能如下:

數據列表:該功能可展示所有已經錄入的事故車數據列表,并可通過各種篩選方式進行查詢和排序,以快速找到所需記錄。

數據查詢:該功能可根據唯一識別碼或其他關鍵字對數據進行搜索,并將匹配的結果呈現在列表中,方便用戶查看和處理。

數據刪除:該功能可根據用戶選擇的條件,對指定的事故數據進行刪除操作,從而清理系統中已失效或無效的數據記錄。

數據修改:該功能可允許用戶對已錄入的事故數據進行編輯和修改,例如更新車輛信息或者更正事故描述等。

數據導入:該功能可以將批量的事故數據一次性導入到系統中,從而避免手動錄入時發生重復或輸入錯誤的情況。同時,系統也可進行數據校驗,確保導入的數據格式正確,并進行后續的數據脫敏和保存。

以上幾個功能有助于用戶對事故數據進行管理和維護,提高了工作效率和數據質量。

4.2.2 事故數據切片管理模塊

為了從事故車數據文件中獲取對事故分析有價值的信息,需要進行數據切片。數據切片過程包括兩個步驟,第一步是通過對靜態數據字段(例如:車輛信息、事故信息、動力電池信息)進行篩選,確定模型所需的目標車輛;第二步則是根據選定的切片數據項和范圍,對目標車輛的動態數據文件進行動態裁剪,生成最終的數據切片文件。

4.2.3 事故分析及可視化模塊

針對已經發生的事故,如何分析事故因素并找到關鍵原因,對于預防類似事故的再次發生具有重要的意義。事故分析及可視化模塊有三個具體的功能:

事故縱向分析:縱向比較分析即不同時間段內同一地區或某一宏觀環境中事故的比較。該方面分析可以了解事故總量的變化趨勢、事故形勢的變化情況以及對現有交通管理措施的改進等。其中,模塊會考慮多個因素,例如人為因素、天氣條件等,并提供可視化圖表,幫助用戶更好地理解數據。同時,通過數據挖掘技術,用戶也能從縱向變化趨勢中發現事故的規律和模式,從而更精準地制定交通安全管理措施。

事故橫向分析:橫向比較分析即對不同地區或相似區域的事故進行比較。該方面分析可以找出某些區域或路段和其他地區相比容易發生交通事故的原因,以便更好地制定防范措施。例如,可以通過大數據技術,在全國甚至全球范圍內對相同條件下的事故數據進行比對,在此基礎上了解全國交通安全形勢,查找問題癥結,促進乃至引領行業轉型升級與創新發展。

事故模式分析:事故模式分析即根據歷史事故數據和相關信息建立數學模型,從而對事故發生可能性進行預測并采取有效的措施加以遏制或減輕事故的發生。該模塊將綜合考慮駕駛員、車輛、道路環境等多個因素,利用大數據挖掘出事故發生的規律,并通過可視化圖表呈現給用戶。其中,針對高頻的某一類別事故,可根據有效性評價指標,通過建立常見事故發生模式來進行后續二次事故預測,以便指導公安部門和參與行業進行整改發力。

5 結論

目前傳統新能源汽車事故研究分析方法有限,無法深入分析事故根本原因,更無法提供有效的安全預警。本文將數據挖掘技術引入新能源汽車事故分析中,提出了基于大數據思維的研究方法。這種方法能系統地分析新能源汽車的全生命周期數據,在此基礎上構建了新能源汽車事故大數據分析管理系統。該系統可以充分收集和分析新能源汽車在使用過程中的事故信息,對于整合相關部門資源、加強道路管理、提升安全方案等方面具有支持作用[5]。針對不同類別的事故資料進行深入分析,可以發現其問題所在并采取相應措施,從而有效地提升行業的安全性,推進新能源汽車高質量發展和促進行業轉型。

基金項目:2022年江西省教育廳科技項目”新能源汽車用戶數據及車輛健康數據挖掘及分析方法研究”(項目編號:GJJ2202505)。

參考文獻:

[1]吳志強,廖承林,李勇.新能源電動汽車消防安全現狀與思考[J].消防科學與技術,2019,38(1): 148-151.

[2]佟麗珠.新能源汽車安全問題現狀分析[J].時代汽車,2018,300(09): 62-63.

[3]張文,王東,鄭靜楠,等.電動汽車領域的大數據研究與應用[J].大眾用電,2016(S2):64.

[4]賀玲,吳玲達.數據挖掘中的聚類算法綜述[J].計算機應用研究, 2007,24(1):10-13.

[5]方凱正,陳佚,劉沙,等.新能源汽車安全分析及發展建議[J].汽車實用技術,2020,307(04): 24-26.

猜你喜歡
數據分析新能源汽車數據挖掘
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
淺談新能源汽車的概況和發展
關于新能源汽車發展的若干思考
基于新能源汽車產業發展對汽車專業人才培養的思考
新常態下集團公司內部審計工作研究
淺析大數據時代對企業營銷模式的影響
一種基于Hadoop的大數據挖掘云服務及應用
基于GPGPU的離散數據挖掘研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合