?

問卷是否可信
——基于體育核心期刊論文(2010—2018年)的系統分析

2020-04-09 01:19柯友枝孫建剛張業安
體育科學 2020年2期
關鍵詞:信度一致性研究者

柯友枝,孫建剛,張業安,李 博,劉 陽,3*

(1.上海體育學院 體育教育訓練學院,上海 200438;2.上海體育學院 期刊中心,上海 200438;3.上海市學生體質健康研究中心,上海 200438)

0 前言

問卷是指研究者為了收集調查對象的行為、態度及觀念等社會資料或信息,將所要調查的內容和問題編排成統一形式,從而用以解釋所研究的問題和驗證所提出的研究假設的一種測量工具(徐建華等,2015)。問卷調查法,即以問卷為測量工具來收集資料的一種調查方法,在體育人文社會調查、運動心理測量等體育學研究中得到了廣泛的應用(黃漢升等,2009)。在體育科學研究中,問卷調查研究最為重要的前提是確保問卷的可靠性和準確性,即信度和效度(曾五一等,2005)。作為評價調查問卷的兩個重要指標,信度和效度的高低既是一個問卷的基本特征,也是衡量問卷的關鍵指標。一個信度和效度較好的問卷是調查研究結果可信可靠、準確真實的重要前提,對研究的整體質量有著至關重要的作用,因此,提高信度和效度是研究者追求的目標。在這兩個基本特征中,信度是效度的基礎,好的問卷首先應具備較高的信度,如果信度低,效度必然低(張力為,2002a)。因此,調查問卷的信度往往是研究者重視的首要問題。

信度(reliability)是指測驗的可靠程度,它表現為測驗結果的穩定性和一致性(Carmines et al.,2009),是表明問卷調查科學性的一個重要因素(李燦等,2008)。對于使用問卷法的研究者來說,對所使用的問卷進行信度檢驗是保障研究結果科學性的重要前提(方千華,2008;齊紅梅等,2013)。另外,進行正確的信度分析可以幫助研究者識別與整個問卷關聯性不大的題項,為進一步修改問卷提供理論依據(張虎等,2007)。因此,體育科學研究人員掌握體育研究調查問卷信度檢驗的一般流程,了解不同信度檢驗方法并進行合理選擇與應用是極有必要的。本研究檢索了2010—2018年體育科學研究領域《中文社會科學引文索引》(CSSCI)刊發的使用問卷調查法的學術論文,對其中信度測評情況進行總結與分析。

1 研究對象與方法

1.1 研究對象

以問卷信度測評方法在我國體育研究領域中的應用情況為研究對象,以2010—2018年CSSCI收錄的9本體育類期刊①本研究納入的9本期刊2010—2018年均被評為體育類核心期刊。采用問卷調查法的學術論文為調查對象,納入研究的9本期刊分別是《體育科學》《中國體育科技》《北京體育大學報》《上海體育學院學報》《體育學刊》《體育與科學》《天津體育學院學報》《武漢體育學院學報》《西安體育學院學報》。

1.2 研究方法

通過文獻資料調研收集相關文獻,運用數理統計法對研究信息進行統計與分析。以中國知網(CNKI)高級檢索程序為檢索工具,以中國社會科學索引(CSSCI)收錄的9本體育類期刊為論文來源,論文的刊發時間段為2010年1月1日—2018年12月31日。在精確論文來源期刊和刊發時間的基礎上,將符合研究條件的各期刊所有論文導入文獻閱讀與管理軟件,通過對文獻題目、摘要和全文閱讀的方式進行人工篩選,檢索流程如圖1所示,最終納入1 221篇研究論文。以數理統計法對納入文獻進行信息提取與整理分析。

圖1 納入分析論文的檢索流程Figure 1. Process of Document Retrieval

1.3 納入與排除標準

納入標準:納入2010年1月1日—2018年12月31日,在9本指定刊物上刊發的論文,其中運用問卷調查法(包括使用各類量表)的全部納入。

剔除標準:未采用問卷調查法的論文;僅采用由詢問事實性問題組成問卷的論文;所有作者均為國外研究者的論文;非定量研究范式的論文;會議論文、刊訊、題錄、通知等。

2 結果與分析

2.1 運用問卷法的期刊概況

問卷調查法是當前體育研究領域常用的研究方法之一,在體育科學研究中占有重要地位(黃漢升等,2009)。由表1可知,2010—2018年采用問卷法的論文總數有所下降,一方面說明我國體育科學研究條件逐漸提升、研究方法逐漸充盈;另一方面,從運用問卷法作為研究方法的論文占比可以看出,問卷調查法仍然是體育研究領域中不可忽視的一種重要的研究方法。使用問卷調查法的論文數目最多的刊物是《北京體育大學學報》(349篇),其次是《武漢體育學院學報》(208篇),兩者數量相差較大且明顯多于其他刊物,比排在第3位的《上海體育學院學報》多出75篇。問卷法論文刊登數量最少的是《體育與科學》(75篇),其次是《體育科學》與《體育學刊》(78篇),兩者差別較小。從各刊物發表問卷調查論文數量占本刊物所有論文總數的百分比來看,《上海體育學院學報》《北京體育大學學報》《武漢體育學院學報》所刊發的論文中問卷調查研究論文所占權重相對較高,《體育學刊》《體育科學》《體育與科學》所刊發的論文中問卷調查研究論文所占權重相對較低??傮w而言,問卷調查法在體育研究領域體現出了運用的廣泛性和實用性,體現了體育學科研究的定量化趨勢,符合體育科學研究發展的要求。

2.2 應用問卷法的規范性

2.2.1 問卷名稱的報告

近年來,問卷的編制逐漸引起了體育科學工作者的關注,其編制方法的科學性、規范性和合理性不僅影響到各種測量的準確性,更彰顯了體育學科的發展水平(戴儉慧等,2014)。問卷具備清晰明確的名稱是問卷規范性的標志之一,其對于研究目的的表達以及研究方法的展現具有重要作用。而在本研究中卻發現,納入的1 221篇使用問卷調查法的論文中,具有(或提到)所使用問卷名稱的比例僅為56.8%(693篇),有43.2%(528篇)的論文沒有或沒有說明問卷的名稱,不但給閱讀者帶來了諸多不便,同時也對于研究者之間的學習交流造成了阻礙。

從數據上看,問卷法應用的規范性問題仍然存在改進空間。使用問卷調查法對研究對象進行調查之前,對所使用的問卷進行基本情況的介紹是研究規范性的一種體現。本研究發現,部分研究者對問卷信息交代不全或者不夠重視的情況,反映出研究者在研究方法運用過程中對一些細節問題的輕視或者認識不到位。張力為(2006)對91篇采用問卷調查為主要方法的碩士論文進行分析,發現問卷調查法在運用過程中缺乏科學的系統性和繼承性。事實上,問卷法與其他方法一樣,是一種嚴謹的研究方法,各環節都應體現出研究的科學性與規范性(劉朝杰,1997)。反之,研究者對學術的怠慢會影響到公眾對科學研究的學術尊重。人既作為研究的主體和客體,制約和影響著問卷調查的可靠性和適用性,作為一種具體的社會調查方法,問卷調查法有著特定的方法學范式(徐建華等,2015)。事實證明,只要研究者們規范科學地運用問卷調查法,保證問卷調查的質量,更易于獲得有價值的研究成果(徐建華等,2019)。

表1 各期刊每年發表采用問卷法論文總數及占總論文數比率Table 1 The Number of Articles Published by Each Journal in Each Year Using Questionnaires and the Ratio of Total Articles

2.2.2 問卷類型的選擇

納入本研究的文獻中,多數(60.2%)論文采用“自編問卷”,但需注意的是,使用自己編制的問卷,其難度遠大于借用前人研制且已認可的問卷(張力為,2006)。部分研究使用的是“引用問卷”(21.8%)和“改編問卷”(10.1%),還有部分研究對采用問卷的來源性質交代不清(7.9%)。調查結果顯示,自編問卷占據大多數,但其潛在的問題需要引起注意,最為突出的是問卷的信效度檢驗問題。使用未經(或未正確)進行信度測評的問卷,將會使研究結果的可靠性和客觀性受到質疑(李曼,2013)。

部分研究者借用或移植國外問卷,將先前研究的信度估計方法作為自己當前研究的信度估計方法,這在一定程度上可減輕研究者的負擔(張立敏等,2008)。但由于地區文化的差異以及樣本的特點,借用或移植問卷存在著一定的弊端,表現在語言、測量和功能等值性上。這就涉及到測驗的本土化問題,即測量的方法、標準與程序等必須要與特定語言或文化背景條件下對象的特殊性相一致(葉國雄等,1994)。另外,在研究中應用前人研制的問卷時,不僅要考慮和報告研制者最初研制該問卷時的信度,還應檢驗和報告該問卷在本項研究中的信度(張力為,2002a)。還有部分論文僅僅提到運用問卷法進行研究,對問卷的來源描述不清,體現出研究者們的科學研究素養有待提高??傊?,標準化的問卷是一個不斷發展和演變的過程,尤其當借用和移植國外的問卷時,還會衍生出本土化的問題,因此須正確謹慎的運用問卷調查法。

2.3 問卷信度的測評情況

問卷是用于測量人們某些特征的工具(風笑天,1994),而信度是評價問卷測驗質量的最基本指標(張力為,2002b)。本研究發現,在所檢索到的1 221篇文獻中,報告信度結果的有740篇(占總數的60.6%),有481篇(占總數的39.4%)文獻未對信度進行報告(表2)。對于只問詢事實類的問卷,例如,僅采用由社會人口學信息或基本情況所組成的問卷,一般而言,是不需要進行信度檢驗的(張力為,2002a)。因此,本研究在文章篩選中剔除了僅使用問詢客觀事實問卷的研究,以保證本研究結果的準確性。雖然對信度進行報告的比例較高,但對于體育科研的嚴謹性來說,60.6%的比例不足以令人滿意。對問卷信度進行清楚合理的評價,是國內科學研究者們進行問卷調查時常常容易忽略的問題(張虎等,2007)。問卷設計者往往注重的是數據收集的難易程度以及問卷設計的邏輯性問題,很少會關注問卷的可信度問題。然而,測評問卷信度是問卷調查法研究中非常重要的一步(葉寶娟等,2012),只有信度被接受時,問卷的數據分析才是可靠的(徐萬里,2008),以問卷法為主的體育科學調查研究均應提高對這一環節的重視程度。

呈現具體的信度結果是對問卷進行信度檢驗科學性的表征,相同功能問卷之間信度的對比,需要以問卷的信度結果以及信度計算方法為依據。本研究發現,納入研究的論文中對問卷信度結果的描述有3種情況,“有具體值”說明的論文數為524篇(占論文總數的42.9%)(表2),此類論文有信度檢驗的具體數值,因此,某些檢驗方法相同的論文之間可以進行信度對比,讀者也能夠通過具體的數值了解問卷的信度程度。然而遺憾的是,部分論文僅交代了信度值,而具體的信度檢驗程序卻不得而知。對信度結果進行“主觀描述”的論文數為149篇(占論文總數的12.2%),此類論文沒有報告信度結果的具體值,僅對信度進行了主觀描述,例如,使用“信度較高”等詞匯。此類論文雖然對問卷的信度進行了說明,但讀者很難把握問卷的具體信度程度,且不同問卷信度之間不能進行對照與對比,研究者們若想參考、改良或使用此問卷比較困難。對所使用的問卷信度結果“無任何說明”的論文為548篇(占論文總數的44.9%),這些論文雖然使用了問卷調查法,但對問卷信度結果完全沒有提及,對同領域的研究者來說,通過此類論文獲取的研究結果和經驗的可靠性得不到保證。有研究表明,以問卷調查為主要研究方法的碩士論文對信度的運用也存在較多誤區(毛志雄,2014;張力為,2006)。由此可見,研究者們對自身使用的問卷信度信息掌握并不充分,對問卷信度的重視程度不足,對問卷調查法的使用方法還需進一步的了解。綜上說明,研究者缺乏專業的研究技能,問卷法被濫用的情形并不少見。

表2 問卷信度的測評情況Table 2 Test Results of Questionnaire Reliability

2.4 問卷信度的測評方法

對于問卷信度的測評而言,明確地報告信度的檢驗方法是不可或缺的。詳細介紹問卷信度檢驗方法可以讓讀者根據對研究方法的陳述評判研究的質量,同時還能給讀者提供同類研究遵循的研究流程,以檢驗研究結果的準確性(張力為,2002b)。但對信度檢驗方法無任何說明的論文高達573篇(占論文總數的46.9%)(表3),此現象說明,研究者在問卷調查法中對信度的檢驗不夠重視或者并不清楚信度檢驗的方法,一定程度上影響到論文的質量且可能直接影響研究結果的準確性和客觀性。有640篇論文(占論文總數的52.4%)對問卷信度的檢驗方法進行了明確的說明,但對于科學研究的嚴謹性來說,這一比例仍遠遠不夠。

表3 問卷信度測評的方法使用情況Table 3 Usage of the Method of Questionnaire Reliability Test

從納入論文對問卷進行信度測評的指標來看,內部一致性信度是目前最常用的指標。另外,重測信度的應用也為數不少,但大多數研究對內部一致性的重視程度高于重測信度。不同的信度檢驗方法適應于不同的條件,不同檢驗方法得出的結果也會存在一定差異,能夠從不同角度反映問卷的信度程度。在實際研究中,很難對某一問卷進行所有可信度的評估,選用合理的信度檢驗方法要結合問卷種類和研究目的(蔣小花等,2010)。更重要的是,選用的方法要與調查問卷的整體設計要求相符合(黃漢升,2009)。另外,利用紙筆測驗進行調查研究時,應先確定需要進行信度檢驗的內容,并非所有的內容都需要進行信度測評(張力為,2002a)。有8篇論文(占論文總數的0.7%)在評估信度時以“專家評估”“相關系數”“交叉證實”“r值”的方式對信度結果進行描述,并不能反映出研究中信度測評采用的具體方法,也就不能對其信度測評的合理性進行準確的認識。更進一步,因為不能確定其信度檢驗方法是否合理,就不能確定其信度高低。綜上說明,部分研究者對問卷信度檢驗重視不足,對信度的相關專業知識了解不足。

2.5 問卷信度測評的趨勢

從信度是否報告的角度看,總體呈現出趨向規范化的良好態勢,越來越多的論文在使用問卷調查法時報告了信度。最低為2012年度的47.6%(圖2),但也有近一半的論文報告了信度,最高為2018年度80.9%的論文報告了信度。在一定程度上說明,研究者對于問卷調查法信度報告的意識逐漸增強。盡管問卷調查法的信度檢驗方面取得了很大的進步,但是,也應意識到問卷應用的問題仍然存在,研究規范性仍需繼續優化加強。

圖2 問卷信度測評的趨勢Figure 2. Trends of Questionnaires Reliability Assessment

從信度結果呈現方式的趨勢來看,信度結果報告的方式越來越具體化,有“具體值描述”的越來越多,“無任何說明”“主觀描述”的情況也越來越少(圖2)。從目前情況看,在運用問卷法收集資料的調查研究中,對于問卷信度檢驗的過程有了很大進步,但還存在著一定的問題。在調查中也發現,部分研究者只是對信度的具體值一筆帶過,但具體程序卻不得而知。這不僅影響到科學研究結果的準確性,還會使人們對問卷調查法的總體信任感受到影響。目前,體育科學研究應用問卷調查法時信度檢驗方面存在諸多不足,但也能看到我國研究者在此方面取得的進步,還需體育工作者共同努力繼續改善這一狀況。

3 問卷信度應用規范

3.1 測評方法

問卷的信度是指問卷調查結果的穩定性和一致性。研究者根據不同問卷或量表會選擇不同的信度檢驗方法,這一選擇以問卷內容、研究目的以及應用現狀為基礎,其最終目的是保障問卷的質量,確保研究結果的權威性。以下為體育科學實踐中常見的問卷信度檢測方法,其適用范圍、計算方法、分析方法和評價標準歸納為表4。

3.1.1 重測信度

問卷的重測信度(test-retest reliability)是指用同樣的問卷,在相似的情境下對同一組調查對象在不同的時間進行兩次測量,測評其結果的一致程度(張力為,2002a)。結果相關程度越高,或是差異越不顯著,則信度也就越高,測量結果越一致。重測信度常用于事實性或習慣性行為等在短時間內無明顯變化的調查問卷(亓萊濱等,2003),以及了解調查對象的態度和意見的問卷(蔣小花等,2003)。通常來說,問卷測評的內容和難易程度都會影響到問卷的重測信度(Otter et al.,2010)。內容多、回答難的問卷由于增加了被調查者回答的不確定性而使得問卷重測信度降低,而問卷內容越少,對調查者來說越簡單,其重測信度也越高。此外,如果兩次問卷調查的間隔時間過長,也會降低重測信度。因此,常見的兩次測量間隔需在2~4周(蔣小花等,2003)。對問卷重測信度進行評價分析時,當評估的變量是二分類變量時,可用Kappa系數評估重測信度;當評估連續變量或等級變量時,則應采用基于方差分析的內部相關系數ICC(intraclass correla‐tion coefficient)來測評問卷的重測信度(Bailey et al.,1994)。一般ICC>0.80表示重測信度極好,0.61~0.80表示重測信度較好,0.41~0.60表示重測信度中等,0.21~0.40表示重測信度較差,ICC≤0.20則表示重測信度很差(Landis et al.,1977)。

3.1.2 內部一致性信度

問卷的內部一致性信度(internal consistent reliabili‐ty),是指問卷內測評相同內容的所有題目之間的一致性。內部一致性信度適用于了解調查者態度以及意見式的問卷(亓萊濱 等,2003),克隆巴赫系數(Cronbach's α)是最常用的內部一致性信度檢測指標(Bonett et al.,2015)。其應用的條件是被檢測的所有題目都必須是測量同一種現象,并對該現象進行相等程度地解釋(Cronbach et al.,1951)??寺“秃咋料禂翟酱?,各條目間相關程度越高。一般,克隆巴赫α系數>0.80表示內部一致性極好,0.71~0.80表示內部一致性較好,0.66~0.70表示內部一致性中等,0.60~0.65表示內部一致性較差,<0.60則表示內部一致性很差(DeVellis,2006)。需要注意的是,判斷問卷或量表內部一致性高低時,需要同時考慮題目的數量(巫秀美 等,1998;Eisinga et al.,2013)。因為克隆巴赫α系數會隨著題目數量的增加而增加,而并非真實題目之間內部一致性的增加(溫忠麟 等,2011;Yang et al.,2011)。

3.1.3 折半信度

問卷的折半信度(split-half reliability)是指將一份問卷分成對等的兩半后,調查被試者在這兩個部分所得分數的一致程度。折半信度在評判某個測驗特定兩半之間的一致性程度時較有使用價值(陳希鎮等,1991)。這種方法一般不適用于事實式問卷,常用于調查被試者態度以及意見式問卷(亓萊濱等,2003)。在應用折半信度進行分析時,如果問卷中包含反意條目,需要先將反意條目的得分作逆向處理,以保證條目有相同的得分方向,進而將全部條目按奇偶或前后順序分成對等的兩半(蔣小花,2010),最后計算其Spearman-Brown系數和Guttman Split-Half系數以評估其相關程度(Thompson et al.,2010)。折半信度系數通常在0.60~0.80,一般應>0.70(Luking et al.,2017)。

表4 信度運用方法Table 4 Reliability Application Methods

3.1.4 復本信度

問卷的復本信度(equivalent-form reliability)是讓同一批被調查者一次性完成兩份等效問卷,計算兩份等效問卷結果的一致程度。有兩份難度、內容、形式和提問方向完全一致的問卷是測量復本信度的前提(李燦等,2008)。復本信度在一定程度上可以彌補重測信度的缺陷,但因為很難得到兩份等效的問卷,所以在實踐中較少采用此種方法(蔣小花,2010)。一般常用Pearson相關系數、Ken‐dall等級相關系數和Spearman等級相關系數計算復本信度。復本信度的標準往往很高,一般在0.85~0.90,>0.85表示信度可被接受(McDowell,2006)。

3.1.5 評分者信度

問卷的評分者信度(scorer reliability)指的是多個問卷評分者給相同被試人員評分時的一致程度。在實踐中,有些問卷需要調查者根據被調查者的回答進行等級評判或打分,如考試試卷等。因此,該問卷的信度在很大程度上取決于調查者評分的穩定性以及一致性,對這類客觀性較低的問卷,則需要計算評分者信度以判斷問卷的質量(李燦等,2008)。評分者信度又分為評分者間信度,即不同評分者測評同一份問卷的結果一致性程度;以及評分者內信度,即同一評分者在不同時間或地點對同一份問卷評定結果的一致性。評分者信度常用Pearson相關系數或Kendall、Spearman等級相關系數進行計算(Bartko et al.,1976)。評分者信度相關系數通常在0.65~0.95之間,一般要求宜>0.85(McDowell,2006)。

3.2 應用流程

問卷調查法是體育科學研究實踐中最常用的研究方法之一。對問卷進行信度測量與評價是保證問卷質量的關鍵,也是保證研究結果科學性的前提。盡管問卷的類型多種多樣,其信度的測量與評價也有著不同的方法和標準,但研究者在對問卷進行信度檢驗時都應遵循嚴格的流程和規范。從上文對2010—2018年我國9本體育類核心期刊應用問卷調查法的論文進行系統分析后發現,仍有部分已發表的論文在信度應用流程的規范性上存在欠缺。因此,本研究總結歸納了問卷信度應用的一般流程(圖3)。

圖3 問卷調查法信度檢驗流程圖Figure 3. Reliability Test Flow Chart of Questionnaire Survey Method

在對問卷信度進行測評時,首先判斷該問卷是否為已存在問卷,如果是,則查詢該問卷是否已經進行過信度檢驗,并確定該問卷信度測評對象是否與本研究相同或類似(包括年齡、性別、地區、文化等社會人口學情況),信度報告是否規范,檢驗方法是否正確,評估標準是否適宜。如果該問卷符合以上條件,則可被引用。如果該問卷不符合以上條件或者是全新設計的問卷,則應進行規范的信度檢驗。進行標準信度檢驗首先應確定測驗的內容,并非所有的內容都需要進行信度檢驗;合理的信度指標需根據問卷的種類和研究目的以及問卷的整體性研究設計進行選擇;信度結果需根據所選擇的信度檢驗方法采用相應的測評方法進行計算;判斷信度結果是否符合評價標準是對所得信度結果進行分析,以此來判斷該問卷的信度程度。如果符合信度評價標準則表明該問卷信度具有可信度,否則,應修改問卷再次進行規范的信度檢驗直至符合評價標準。問卷信度檢驗描述示例如下:

對學生校外身體活動問卷進行重測信度檢驗,120名11歲在校5年級學生(男生50.0%)完成該問卷,并在2周后再次完成該問卷。采用組內相關系數對問卷兩次測試結果進行分析,結果顯示,該問卷的組內相關系數在0.61~0.85,根據Landis等(1977)的評價標準,證明該問卷具有較好的重測信度。

4 小結

隨著體育科學定量研究范式的普及,問卷調查法仍然是目前常用的體育社會科學研究方法之一,在本研究納入的9本刊物中均占有較高比例,但同時也揭示了我國科學研究者在使用問卷調查法過程中所潛在的一些問題。在提倡學術規范的今天,科學研究者在運用問卷調查法時,須重視并加強問卷的編制修訂工作,遵循信度檢驗的一般流程,正確應用信度檢驗方法,從而有效地利用問卷調查法得出科學客觀的研究結論,保證學術論文的質量。

猜你喜歡
信度一致性研究者
注重整體設計 凸顯數與運算的一致性
商用車CCC認證一致性控制計劃應用
Why do we celebrate the New Year?
基于Paxos的分布式一致性算法的實現與優化
用水痘病毒開發新型HIV疫苗
餓死的毛毛蟲
研究者調查數據統計
大學生積極自我量表初步編制
年輕瘦人糖尿病增多
論高職英語多元化綜合評價模式的效度與信度
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合