◆林鵬 孟硯怡/房縣審計局
SPSS(Statistical Product Service Solutions),“ 統 計產品與服務解決方案”軟件,是世界著名的統計分析軟件之一,集大量成熟的統計分析方法、完善的數據定義操作管理、開放的數據接口以及靈活的統計表格和統計圖形于一體。與我們審計人員常用的SQL SEVER等數據庫軟件相比,SPSS優勢更加明顯。在“一卡通”惠民惠農財政補貼資金管理使用情況審計過程中,筆者大膽使用SPSS技術,極大地提高了審計工作效率。
“一卡通”惠民惠農財政補貼資金的數據面廣、數據量大,利用計算機軟件篩選比對出疑點數據,已成為此類審計項目通常的審計方法。本次審計采集到最多的就是EXCEL數據,從十多個基礎部門收集、匯總而來。由于各部門需求不同,數據輸入者習慣不同,數據的格式存在很多差異。本文以某縣醫保局提供的某年度醫療救助數據為例,演示運用SPSS技術開展審計數據分析工作。
SPSS提供了兩種合并數據文件的方式,分別是縱向合并和橫向合并??v向合并是將數據首尾對接,即將一個文件中的數據追加到另一個文件后面,依據兩份數據文件中的變量名進行數據對接。橫向合并是按照記錄的次序或者某個關鍵變量的數值,將不同數據集中的不同變量合并作為一個數據集,新的數據中的變量數是所有原數據集中不重名的變量總和。
有兩份關于醫療救助發放的EXCEL表(見圖1),兩個數據文件中數據項不盡相同,且同一數據項的變量名也不完全一致?,F需要將這兩份數據合并在一起。
圖1 醫療救助發放明細表
操作步驟如下:
1.打開將要合并的數據文件;
2.選擇菜單【數據】→【合并文件】【添加個案】(見圖2);
圖2 縱向合并數據文件窗口
3.選擇打開的數據集,隨后進入縱向合并數據文件窗口,【新的活動數據集中的變量】框中顯示的是兩個數據文件中的同名字段,SPSS默認它們有相同的數據含義,并將它們作為合并后新文件中的字段;【非成對變量】框中顯示的字段名是兩個文件中不同字段名,或者字段名相同但字段大小類別不同。其中,字段名后的(*)表示該字段是當前數據編輯器窗口中的字段,(+)表示該字段是待添加數據表的字段;在【非成對變量】框中可以將兩個字段同時選中,再單擊【對】按鈕指定配對,表示它們的名稱不同但數據含義是相同的,可納入合并后的數據中。選擇好配對的字段,單擊確定即可將兩表合并,得到合并后的新表(見圖3)。
圖3
橫向合并數據就是將當前數據表與另一個數據表進行左右對接,相當于SQL中的LEFT JOIN。但實際操作比SQL語句簡單直觀得多。
例如在采集民政局提供的低保數據表時,需要采集低保救助表(見圖4)和春節慰問表(見圖5)。
圖4 低保救助表
圖5 低保春節慰問表
兩份數據中低保受助人的基本信息相同,只是在春節慰問表中受助人的信息少了。我們可以從低保數據中獲取春節慰問人員的家庭住址。
操作步驟如下:
1.數據編輯器窗口中打開一個需要合并的表,如這里的春節慰問表;
2.選擇菜單【數據】→【合并文件】【添加變量】(見圖6);
圖6 橫向合并文件窗口
3.兩個待合并的數據中所有字段名都顯示在【新的活動數據集】框中,SPSS默認這些變量均以原有字段名進入合并后的新數據中;
4.指定提供合并數據的方式。SPSS有三種數據提供方式:【兩個文件都提供個案】是SPSS默認的方式,指由原來兩個表格共同組成合并后的數據文件;【非活動數據集為基于關鍵字的表】只在當前活動數據集的基礎上,將其數據的字段合并進來,即合并后表格中的數據僅包含當前表中的數據;【活動數據集為基于關鍵字的表】指在第二個表格的基礎之上,將數據編輯器窗口中的其他字段合并進來,即合并后表格中的數據包含第二個表中的數據。至此,春節慰問表中就新增加了字段“家庭地址”,統一了所有民政低保資金數據的格式,方便下一步數據分析。
SPSS界面操作簡單、方便,擁有良好的幫助系統和自學系統,對于熟悉SQL等數據庫系統的審計人來說,SPSS不僅同樣擁有數據導入、合并、關聯對比等功能,還有成熟的統計過程、完美的圖形處理功能,可以更好地完成審計分析,極大地提高審計效率。