?

基于過閘數據的江蘇省內河貨運情況分析

2023-06-24 08:47陳奕超陳冬劉春啟
水運管理 2023年3期
關鍵詞:內河航運數據分析江蘇省

陳奕超 陳冬 劉春啟

【摘 要】 為提高江蘇省內河水運行業的科學管理水平,基于對江蘇省交通運輸船閘聯網收費數據的分析,對全省航閘運行、貨物運輸情況進行研究。提出針對數據預處理、總體情況分析、船閘運行分析、貨物運輸分析等4部分的算法設計,并采用2021年全年過閘數據對全省內河航運發展進行實證分析,這對于全面提升江蘇省港航行業規劃建設、運行管理及綜合服務水平具有重要意義。

【關鍵詞】 江蘇??;內河航運;過閘數據;數據分析

0 引 言

江蘇省是內河航運大省,全省內河航道網絡密布,航道總長約2.4萬km。內河航運是江蘇省經濟發展的重要支柱,內河貨運量約占全省綜合貨運量的1/3。隨著我國經濟由高速增長階段進入高質量發展階段,尤其是在推動江蘇高質量發展走在全國前列的目標指引下,江蘇省內河航運發展面臨的形勢和任務都發生了重大變化?!督煌◤妵ㄔO綱要》《智能航運發展指導意見》等國家、省部委頒布的文件對內河航運發展指明了方向。本文通過對江蘇省交通運輸船閘聯網收費數據開展航運大數據分析,對全省航道運行、貨物運輸情況進行了實證研究。

1 江蘇省航閘基礎設施現狀

江蘇省內河航道網絡密布,截至2021年底,江蘇省內河航道里程達24 648 km,航道網密度23.0 km/100 km2,兩者均居全國第一位。Ⅳ級以上內河高等級航道里程3 197 km,通達80%的縣級城市;省干線達標航道里程達2 363 km,可通行1 000噸級船舶的航道覆蓋全省78%的縣級及以上航道節點和50%的省級及以上開發區。

江蘇省內河航道共有通航船閘111座,其中交通部門管理的船閘有52座,施橋、邵伯等10座位于京杭運河沿線的船閘由蘇北航務管理處管理,其余船閘由相應的市航道處或港航中心管理。

2 過閘數據簡介

船舶過閘數據來源于江蘇省交通運輸船閘聯網收費數據庫,以2020年的船舶過閘數據為例,信息數據共計305萬條,主要包括船舶名稱、上下行標志、船閘名稱、報到時間、船籍港名稱、船舶類型、船舶參數(總長、總寬、總噸、載重噸、型深)、空載標志、貨物名稱、航次起點、航次終點、實際載貨等數據信息。

船舶過閘的數據覆蓋面廣、統計周期長,除部分蘇南航道外,基本涵蓋所有在江蘇省內航行的內河船舶。

3 算法研究

為更好地從過閘數據中提取有效信息,實現內河水運信息化,提高內河水運行業的科學管理和組織服務水平,本文從數據預處理、總體情況分析、船閘運行分析、貨物運輸分析4部分對江蘇省過閘數據開展研究,更全面地分析內河水運狀況,以期獲得更準確的結論。

3.1 數據預處理

本研究采用的船舶過閘信息數據量大,字段信息多,存在著包括數據重復、數據缺失、數據異常、數據雜亂等一系列問題;因此,在數據分析之前需要對所采集數據進行數據清洗,確保消除所有的“臟數據”。

(1)重復數據清洗。船舶過閘信息重復填報和系統故障都可能導致數據庫中出現重復的記錄。針對數據重復的情況,在數據預處理階段對每條過閘記錄進行重復性分析,若發現相同船舶識別號在相同時刻重復填報數據,則只保留第一條記錄,并將重復記錄直接刪除。

(2)缺失數據清洗。缺失數據是數據清洗工作解決的另一個重要問題。在數據錄入過程中,由于人為操作失誤、部分信息需要保密或者數據來源不可靠等各種原因,造成數據殘缺,如某條記錄的屬性值被標記為“NULL(無)”或空缺等。一旦不完整、不準確的數據用于數據分析,則會影響分析結果的準確性。如果過閘數據中重點研究字段的缺失比例較小,可以通過直接刪除重點字段缺失數據來進行清洗。

(3)數據格式統一。船舶過閘信息數據中存在同類數據或者不同數據的同類字段的格式不統一問題。在數據錄入過程中,由于各系統之間的差異、操作人員的失誤或者數據傳輸過程中產生的問題等原因,使得數據集中的數據格式不一致,這樣也會導致分析過程中的報錯,甚至嚴重影響數據分析結果的精確度。如時間字段在兩種數據中分別被存儲為“29-10月-18 03.51.53.000上午”和“2018- 10-29 03:51:53”,這些格式不一致的數據在后續的數據分析過程中可能會報告錯誤信息,因此,在預處理階段應將其轉換為統一格式的數據。

3.2 總體情況分析

(1)航道貨運數據轉換。船舶在江蘇省內河航道航行過程中,可能存在一次或者多次的過閘記錄,如果簡單地將全省過閘貨運量進行累計,其結果將會遠大于實際航道貨運量;因此,為獲得較為準確的航道貨運數據,應剔除重復統計的船舶過閘記錄。分析算法將過閘記錄按“船名”和“過閘時間”排序后,根據“起訖點”“實載貨量”“上下行”3個識別字段,剔除重復航次數據后,得到江蘇省內河航道貨運數據,基于此可以統計全省內河航道貨運量。

(2)貨物運輸總體情況。剔除重復過閘記錄后,根據數據中起訖點代碼判斷各條記錄起訖點所屬的行政區,在其基礎上根據起訖點與船閘所屬地的關系,統計全省內河貨物運輸的區間量、交換量以及過境量(區間量:江蘇省―江蘇??;交換量:江蘇省―省外;過境量:省外―省外),并且分析與周邊省市的交換關系。

(3)船舶、貨種總體情況。根據船舶類型、噸級字段,統計全省在航船舶的噸級和類型結構組成,并且根據船閘所在通道、實載貨種判別分通道的貨運情況以及分貨種的貨運情況。內河貨運總體情況分析算法流程如圖1所示。

3.3 船閘運行分析

(1)船閘運行情況。根據各船閘運行記錄的每一條過閘數據,計算每次過閘記錄中的過閘開始時間與結束時間的時間差,累計分組即得到各船閘統計時間內的運行時長。通過船閘字段以及過閘時間字段,聚合相同船閘開閘次數的記錄,即可統計全省船閘開放閘次的數據。

(2)船舶過閘分析。除了對船閘運行時間與閘次數據進行分析外,過閘船舶數量、過閘貨物量以及待閘時間分析是管理部門關注的重點;因此,在過閘數據分析中,需要通過船閘字段以及過閘時間字段統計分時段的各船閘過閘船舶數量,通過船閘字段、時間字段以及實載貨物量字段統計分時段的各船閘的過閘貨物量,并且結合收費時間字段以及過閘時間字段,可以計算出江蘇省各船閘在不同時間段內的平均待閘時間。

(3)全省船閘統計排名。通過船閘運行時長、開放閘次、過閘船舶數量、過閘貨物量以及待閘時間5個分析要素,對全省52座交通部門管理的船閘統計排名,從不同的角度為管理部門以及船舶所 有人提供參考。全省船閘運行情況分析算法流程見圖2。

3.4 貨運流向分析

(1)起訖點識別。過閘數據記錄有船舶過閘時填報的起訖點,但這兩個字段是以數字編號的形式記錄,需要將其與文字匹配,來識別每一條記錄起訖點,還需要結合江蘇省行政區劃數據,將起訖點字段聚合到地級市名(外省市采用省名)。

(2)流向聚類分析。對于相同起點(省市)、訖點(省市)字段的過閘記錄進行聚類分析,統計相同起訖點的船舶貨運流向數據,并且結合數據中貨種字段,計算不同貨種的貨物運輸流向。剔除起訖點相同的區間貨物交換記錄以及不符合常理的錯誤數據。貨物流向分析算法流程如圖3所示。

4 實證分析

采用江蘇省2021年全年過閘數據,結合上文闡述的分析算法對全省內河航運發展狀況進行實證分析。

4.1 總體情況分析

2021年,江蘇省內河貨運量9.4億t,同比減少1.3%。全省內河貨運量中,省內各港口間貨物交流量為5.9億t,占比63.1%; 與其他省交流量為2.8億t,占比29.8%; 其他省貨物過境量為6 678萬t,占比7.1%。2021年江蘇省與其他省份間的內河貨運量為2.8億t,其中其他省到江蘇的貨運量占71.2%,達到2.0億t,環比增長34.8%,全省內河水運與周邊省市聯動性進一步提升。安徽、山東發往江蘇省的貨運量位居前兩位,分別達1.0億t和7 478萬t,分別占其他省到江蘇的貨運量的50.4%、37.6%,通過南京楊家灣船閘和徐州藺家壩船閘等從安徽、山東到江蘇的貨運量大幅增長。2021年江蘇省與周邊省市內河貨物運輸情況見圖4。

4.2 船閘運行分析

2021年江蘇省聯網收費船閘共開啟60.2萬閘次,環比增長2.9%;累計運行50.9萬h,環比增長6.8%;過閘船舶305萬艘次,環比下降1.4%;過閘貨物22.3億t,環比增長0.5%;過閘船舶平均運力為692.1 t,環比上升0.5%。2021年內河過閘船舶數量及環比變化如圖5所示。

統計各個船閘過閘船舶數量,諫壁船閘、江陰船閘、淮安船閘、施橋船閘、宿遷船閘、皂河船閘、邵伯船閘、劉老澗船閘、淮陰船閘、泗陽船閘10個船閘2021年過閘船舶均超過14萬艘次,主要分布在京杭運河沿線,其中諫壁船閘、江陰船閘過閘船舶數量20萬艘次左右。2021年部分船閘過閘船舶數量及環比變化情況如圖6所示。

從過閘貨物量看,施橋船閘、淮安船閘、邵伯船閘、淮陰船閘、劉老澗船閘、泗陽船閘、宿遷船閘、皂河船閘8個船閘過閘貨物量均超過億噸,但2021年施橋船閘、淮安船閘、淮陰船閘過閘貨物量環比分別下降1.4%、6.6%、5.2%,諫壁船閘、江陰船閘因所在航道等級相對低等因素,過閘貨物量相對較少。

4.3 貨運流向分析

2021年,江蘇省聯網收費船閘共過閘貨物量21.1億t,環比下降0.9%;完成內河貨運量9.4億t,環比減少1.3%,其中礦建材料、煤炭、鋼鐵是江蘇內河貨運最主要貨種,分別占比44.8%、21.4%、7.3%。2021年全省內河貨運雷達圖如圖7所示。

從貨物流量流向看,內河運輸貨物出發地主要為徐州、無錫、南通、鎮江,發出貨運量分別為1.0億t、9 149萬t、8 267萬t和7 139萬t,分別占總發出量的15.1%、13.6%、12.3%和10.6%;到達地主要為淮安、蘇州、南通、無錫,到達貨運量分別為1.3億t、1.0億t、9 471萬t、8 637萬t,分別占總到達量的16.4%、13.2%、12.0%、10.9%。在內河運輸中,江蘇省主要與安徽省和山東省開展內河貨物運輸,分別完成貨運量7 980萬t和2 485萬t,占總貨運量的8.5%和2.7%。

從煤炭流量流向看,內河運輸煤炭以運抵江蘇省內港口為主,占發出到達量的61.2%。其中:煤炭出發地主要為徐州、鎮江、無錫,發出量分別為4 111萬t、1 291萬t和1 143萬t,分別占總發出量的43.8%、13.7%和12.2%;煤炭到達地主要為蘇州、淮安、揚州、無錫和常州,到達量為2 339萬t、1 816萬t、1 716萬t、1 625萬t和1 412萬t,分別占總到達量的15.8%、12.2%、11.6%、10.9%和9.5%。

從金屬礦石流量流向看,出發地主要為淮安、泰州、鹽城,發出量分別為1 066萬t、779萬t、271萬t,分別占總發出量的35.6%、26.0%、9.1%;金屬礦石到達地主要為無錫、南京、淮安、徐州,到達量分別為638萬t、551萬t、484萬t和434萬t,分別占總到達量的21.1%、18.3%、16.0%和14.4%。

猜你喜歡
內河航運數據分析江蘇省
江蘇省交通圖
江蘇省政區圖
對開發內河航運的建議
新常態下集團公司內部審計工作研究
淺析大數據時代對企業營銷模式的影響
內河航運與區域經濟的相關性分析
內河航運信息服務系統功能架構
江蘇省紀委
江蘇省人大
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合