?

科技論文中常見的統計學問題及解決意見

2009-10-26 09:35韓維棟黨少農
中國編輯 2009年5期
關鍵詞:假設檢驗論文統計學

韓維棟 黨少農

[摘要]科技論文是總結和傳播科學研究成果的文獻形式,其統計學原理和具體的統計方法使用得正確與否直接影響到科技論文的科學性與嚴謹性。本文結合編輯工作實踐,以醫學論文為例,探討科技論文中常見的涉及統計學的問題(如科研設計問題、統計描述問題、統計推斷問題、論文中統計方法的說明問題等),并提出解決科技論文統計學問題的幾點意見。

[關鍵詞]科技論文統計學問題對策

[中圖分類號]G23[文獻標識碼]A

科技論文是科研工作的總結和成果傳播的重要形式,其撰寫的邏輯過程應當與科研的工作過程一致,即提出研究問題、設計研究方案、收集數據、統計分析數據和得出結論。統計學原理和方法貫穿于整個研究工作,是科研工作不可或缺的重要工具。因此,在科技論文中應當規范合理地體現研究工作所使用的統計學原理和具體的統計方法。美國統計協會在《統計實踐的倫理指導》中特別指出,在發表論文時作者有責任清楚地報告足夠的相關統計分析信息。隨著科學技術的快速發展。越來越多的科技論文被發表,然而由于各種原因,科技論文中涉及統計學的問題層出不窮,嚴重地影響了論文的科學性和嚴謹性。筆者擬結合編輯工作實踐,就科技論文中經常出現的統計學問題進行分析。并提出解決這些問題的幾點意見。

一、科技論文中常見的統計學問題

1科研設計問題

為了保證研究的科學性、客觀性和嚴謹性。需要制訂科學周密的研究計劃。并在此計劃的指導下安排研究進程,收集、整理和分析數據。制訂一個良好的科研設計方案,需要根據專業的要求。運用科學的統計思想和手段來完成。然而。目前一些研究者在認識上仍存在誤區。只重視數據分析時的統計工作,忽視了設計時的統計要求。從邏輯上說,如果設計上存在嚴重缺陷,后續的統計分析可能就會失去意義。目前,由于論文篇幅所限。一些科技論文在材料和方法部分要么不說明研究設計方案,要么說明過于簡略。使讀者無法清晰地了解該研究的設計方案。甚至無法重復、驗證該項實驗。

(1)研究設計方案交代不清楚

以筆者從事的醫學期刊所接觸的稿件為例。目前。醫學研究大體可以分為基礎醫學研究、臨床醫學研究和社區人群研究三大類?;A醫學研究的對象主要是動物、組織、細胞和基因等。在這類研究文章中研究者對實驗動物的選擇、分組和隨訪,細胞培養和分組等方面常常交代不明確。臨床醫學研究的主要對象是病人,在這類研究文章中對于病人的選擇和篩選,研究組的設立或隨機化方式交代不清。此外,這類研究文章的一個突出問題是對照的選擇說明不清晰。在對照研究中,合理規范地設立對照是研究因素被單獨清晰顯現的重要手段,但常見的問題是對照人數偏少,選擇方式沒有說明等。在社區人群研究方面,由于影響研究的因素更加復雜。所以對于這類研究文章在研究設計中更需要對可能影響研究的混雜因素進行詳細的說明。

(2)隨機化問題

隨機化是統計分析的理論基礎,相關的統計分析方法都建立在隨機抽樣和隨機分組的基礎上。遵循隨機化可以使樣本更具有代表性。組間更加均衡??萍颊撐闹嘘P于隨機化的主要問題是從論文中無法看出該研究是否做了隨機化抽樣或隨機化分組,作者常在此問題上表述不清。

(3)樣本量問題

統計分析是個概率研究問題,必要的重復(樣本量)是其又一個重要的理論基礎。樣本量過小使得樣本無法代表總體,可能會把偶然事件當作規律性事件,也可能使得研究結果無法重復。例如,醫學研究論文中常見的問題是沒有給出樣本量估算的方式或依據。關于樣本是否足夠完成研究也沒有說明。其次。臨床研究中,樣本量過小是個突出的問題。再次,有些臨床研究只重視病例樣本量,而忽視對照的樣本量。造成組間樣本量過于懸殊。在分子生物學的研究中,樣本量過小直接影響到實驗重復次數的問題,在這類研究中,研究者常常忽視這一點,只做一次實驗就得出結論,而無法進行統計學分析。

(4)非研究因素的控制

科學研究主要是為了觀察研究因素所產生的效應。但需要注意的是。必須控制或安排好非研究因素,因為它們可能會干擾對研究因素的觀察。所以,在研究設計時應當充分考慮到這些因素的作用。在論文中應對此進行必要的說明。目前,醫學論文中對于這個問題常常闡述不清,主要表現在:對這些因素的發現、識別和選擇的依據不明確,或在材料方法部分回避該問題。

2統計描述問題

統計學的一項重要工作就是對數據進行合理的描述。來揭示數據呈現的規律或特征。這也是統計結果表達的重要步驟。在科技論文中。應當對數據進行合理的統計描述。目前,科技論文中常見的統計描述問題首先表現為數據資料類型不清楚,進而無法選擇合適的描述指標。統計資料主要分為計量資料和計數資料兩種。計量資料是用某種測量工具測量所獲得的具有單位的數據,這樣的數據主要是描述數據的集中趨勢(平均數)和離散程度(變異度);計數資料則是根據某種分類標準將數據分類,然后清點每個分類的觀察單位的數量,這類數據通常需要通過相對數(率/比)進行描述。所以,分清資料的類型是進行正確統計描述的前提。其次,計量資料的統計描述。多數研究者選擇用算術均數進行平均水平的描述。其實有時并不一定合適。描述平均水平的指標與數據的分布狀態有關,而不是一概用算術均數。算術均數是在數據符合正態分布或對稱分布時最合適,如果數據是偏態分布,則應當選擇中位數。與之相應的變異度指標也需要根據數據的分布情形來選擇。第三,計數資料的統計描述,常見的問題是計算相對數時分母過小,這樣計算的率等指標常不穩定。無法說明問題。如泉觀察例數太少,建議以絕對數進行表達。此外。率和構成比常容易混淆。常以構成比來說明率的問題。這種問題常發生在以數據為基礎統計的分析中。

3統計推斷問題

對于抽樣性研究來說,還需要進行必要的統計推斷。根據研究問題的不同,統計推斷主要有可信區間和假設檢驗。

(1)可信區間

可信區間(confidence interval,CI)是用來對總體特征進行估計的方法。它是從概率的角度把抽樣誤差考慮在內估計總體均數(率)所在的范圍。研究論文中常出現計算了相應的樣本均數(率)后沒有進行可信區間估計的問題,這樣的點估計無法說明抽樣誤差對估計的影響。

(2)假設檢驗

假設檢驗是進行總體間比較的統計方法。在應用假設檢驗時需要對各種方法的使用條件有所了解,否則容易造成方法誤用。論文中假設檢驗方法使用不當,其重要原因就是對各種方法的使用條件缺乏了解。合理應用假設檢驗要注意兩個基本前提:資料類型和研究問題(設計)。資料類型決定了假設檢驗方法的大類區分,如計量資料對應t檢驗和方差分析等,而計數資料對應卡方檢驗等。在大類確定后需要根據研究的問題和設計類型選擇具體的檢驗方法。

隨著計算機的普及,統計分析軟件的推廣,許多復雜的高級統計方法得以推廣,多元線性回歸模型和多元Logistic回歸模型是使用最為廣泛的高級統計方法,同時也出現了很多研究者濫用這些統計方法的情形。這些方法的使用有明確的條件和要求,回歸模型從邏輯上講是分析原因和結果的問題。因此,對于符合前因后果時序的數據是合適的。如前瞻性研究、干預性研究。此外,這些方法對數據也有一定的要求。Logistic回歸模型就要求數據為分類數據,然而,論文中常出現使用連續性數據的情況。

4論文中統計方法的說明

在科技論文中常常缺乏對所使用的統計學原理和具體統計方法的必要說明。在材料方法部分應當對研究設計的相關問題進行說明,在統計部分應當說明所使用的具體統計方法。對于復雜的統計模型,應當給出必要的變量定義和過程說明。此外,應當給出該研究假設檢驗使用的檢驗水準。

統計圖表是統計分析結果表達的有力工具。目前,科技論文中的統計圖表不規范,欠自明性和邏輯相關性,圖表過于復雜或過于簡單。

二、解決科技論文中統計學問題的幾點意見

避免或減少科技論文中運用統計學出現的問題。需要作者、審稿專家和編輯人員的共同努力。

1提高作者對統計學重要性的認識及基本統計技能

許多研究者認為統計學只是幫助他們計算平均數的簡單工具,沒有充分認識到統計學原理和方法在科學研究中的不可或缺性。統計學不是幾個公式和方法,而是涉及一整套科學的邏輯思維方式方法及其運用。所以。應加強研究者在這方面的訓練,提高研究者對科研設計中統計應用的重視程度。

2建立論文發表前的統計學審稿制度

由于統計學具有較強的專業性,對于其他專業的學者來說靈活應用有一定難度,因此有必要請統計專業人士對論文的統計學應用進行評價,及時發現其中的統計學問題并給予合理的建議,這樣有助于減少統計問題的發生。提高論文的質量。

3科技期刊應增加論文撰寫的統計學要求

科技期刊可以考慮與統計專業人士合作制定論文撰寫時的統計學要求。如規范的統計學表達方法、文章中必須出現的統計學內容等。目前。多數科技論文的研究設計部分不清晰。有必要進行規范。否則審稿專家也無法判斷研究是否合適。對于有嚴重統計學問題的論文可以考慮要求作者提供原始數據進行核查。

4編輯人員應該在論文的統計把關方面有所作為

編輯人員對科技論文的科學性、創新性和規范性負有不可推卸的甄別責任。但是,許多編輯人員只重視專業知識及編輯業務知識的學習,而忽視了對統計學知識的學習,以致對文稿中存在的統計學問題缺乏甄別能力,在審閱修改時未能及時發現存在的問題。因此,在這方面應該引起編輯同人的重視。第一,要提高認識。在科技論文中出現統計學問題或瑕疵,會大大降低論文的科學性和學術質量,進而影響到刊物的質量。第二,要加強學習。加強對統計學知識的學習。不斷提高應用統計學知識的能力。特別是對實際工作中遇到的統計學問題,能夠及時請教,相互交流,弄清問題所在,真正達到“去粗取精、去偽存真、優者刊出、劣者淘汰”的目的。

猜你喜歡
假設檢驗論文統計學
假設檢驗結果的對立性分析
大數據的統計學基礎分析
統計學教學與實驗實踐的一體化整合初探
本期論文英文摘要
統計推斷的研究
本期論文英文摘要
省屬地方高校應用統計學專業人才培養模式研究
鳳爪重量質量管理報告
本期論文英文摘要
基于改進隱馬爾科夫模型的畜禽全基因組關聯分析中的多重檢驗方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合