?

臨床研究數據采集策略和要點

2022-07-15 01:11王瑞平李斌
上海醫藥 2022年9期
關鍵詞:調查問卷臨床研究

王瑞平 李斌

摘 要 數據質量是臨床研究的核心,也是評估臨床研究中干預措施實施效果的數據基礎,關系著整個臨床研究的成敗。本文從臨床研究數據采集策略與核心要點入手,先后詳細介紹了臨床研究數據的潛在來源、常用的數據采集工具、數據存儲方案、研究數據清理和質量控制等4個方面的內容,以期為臨床研究者今后實施臨床研究數據采集提供參考。

關鍵詞 臨床研究 數據采集策略 電子數據采集工具 臨床試驗病例報告表 調查問卷

中圖分類號:R-3 文獻標志碼:C 文章編號:1006-1533(2022)09-0037-06

引用本文 王瑞平, 李斌. 臨床研究數據采集策略和要點[J]. 上海醫藥, 2022, 43(9): 37-42.

Strategies and critical points of clinical research data collection

WANG Ruiping, LI Bin

(Clinical Research & Innovation Center, Shanghai Skin Disease Hospital, Shanghai 200443, China)

ABSTRACT Data quality is the core of clinical research and is also the data basis for assessing the effectiveness of intervention implementation, which is related to the success or failure of the entire clinical research. This article successively introduces four aspects in detail such as potential sources of clinical research data, common data collection tools, data storage scheme, study data cleaning and quality control starting from the strategies and critical points of clinical research data collection, so as to provide a reference for clinical researchers to implement clinical research data collection in the future.

KEY WORDS clinical research; data collection strategies; digital data collection tools; case report form; questionnaire

數據質量關系著整個臨床研究的成敗,是一個值得所有臨床研究者關注的核心問題。如果將研究方案設計比喻為臨床研究的“骨骼”,那么數據質量就是臨床研究的“經脈和血肉”,是描述和呈現臨床研究結果的基礎和支撐。本文從臨床研究數據來源、數據采集工具、數據存儲方案、數據清理和質量控制等4個方面入手,介紹臨床研究數據采集的策略和要點,以期為臨床研究者今后開展規范的臨床研究數據采集提供思路與參考。

1 臨床研究數據來源

研究者在開展臨床研究之前,首先應全面了解和思考本次開展的臨床研究可及的數據源,這不僅可以幫助研究者梳理和優化數據采集思路,還可以提高后續數據獲取的便捷性,通??梢云鸬健笆掳牍Ρ丁钡男Ч?。整體上看,目前開展臨床研究的數據來源主要包括:①根據臨床研究目標而設計的病例報告表(case report form, CRF)記錄的數據;②來源于醫療機構的醫院信息系統(hospital information system, HIS)、實驗室信息管理系統(laboratory information management system, LIS)和電子病例信息系統(electronic medical record information system, MRIS)的電子診療數據;③來源于疾病預防控制中心、婦幼保健院、統計局、環保局、氣象局等單位通過主動監測或被動監測所采集的數據;④政府機構、專業研究機構和國內外研究者等建立的注冊登記研究數據庫和大型隊列數據庫;⑤國內外開源的人口學和基因組學數據;⑥來源于互聯網檢索、藥店藥品購買記錄登記等途徑所獲取的數據。

病例報告表CRF和調查問卷(questionnaire)是一種印刷的、可視的或是電子版的文件,用于記錄和報告根據所有研究方案要求所采集的每位受試者(調查對象)的信息。如圖1a所示,印刷紙質版調查問卷和CRF是記錄患者或受試者信息最常用的形式,也是臨床研究數據來源的重要載體。隨著電子信息和網絡技術的飛速發展,電子數據庫、互聯網數據平臺逐漸得到了人們的認可,在臨床研究中的應用越來越多,如圖1b的問卷星、圖1c的EpiData數據庫就是目前在臨床研究中被廣泛應用的電子數據庫和網絡平臺數據庫。

如圖2所示,HIS、LIS、MRIS等來源于醫院記錄患者診療、用藥、花費等信息的電子數據庫是研究者開展臨床研究的重要數據來源,通過上述信息系統可以便捷地獲取患者的診療信息,做到無縫銜接,降低數據輸入和數據清理的時間成本,縮短研究周期。

有些政府機構和事業單位如疾病預防控制中心、婦幼保健院、統計局、環保局、氣象局等平常會采用主動監測或被動監測的方式采集居民健康狀況、氣象和環境等數據,這些數據也是研究者開展臨床研究的有效數據來源。如本研究團隊之前開展的“國家傳染病自動預警信息系統的優化研究”[1-3]就是基于中國疾病預防控制中心開發的“中國疾病預防控制信息系統”和“國家傳染病自動預警信息系統”所采集的傳染病數據而開展的研究。

近年來,隨著網絡信息技術的快速發展,臨床研究的規模和范疇突破了空間和地域的限制,越來越多的跨院區、跨地域、跨國界等多中心臨床研究在全球范圍內開展,積極推動了臨床研究的發展。特別是國內外專業研究機構所建立的臨床注冊登記研究數據庫、大型隊列數據庫、腫瘤基因圖譜數據庫等,多數為“開源”數據庫,研究者可以向這些開源數據庫負責人提出申請,審批通過后來獲取現成的數據庫資料,開展聯合分析,往往可以取得較好的研究成果(圖3)。此外,有些研究者利用互聯網數據庫檢索、藥店藥品購買登記記錄等途徑所獲取的數據,開展基于綜合數據源的傳染病早期預警、慢性病干預措施的綜合評價、薈萃分析等研究,也逐步得到了廣大研究者的認可。

2 臨床研究數據采集工具

當研究者全面了解臨床研究數據的可能來源后,研究者須根據研究目標及自身所能獲取的數據資源,選擇合適的采集工具來收集預開展的臨床研究項目數據。目前,臨床研究常用的數據采集工具包括:紙質版數據采集工具和電子數據采集工具。

如圖1a所示,CRF和調查問卷是經典的紙質版數據采集工具,在臨床研究中應用廣泛。這類數據采集工具填寫方便,如出現填寫錯誤也易于修正并留痕,并且在后續隨訪患者時也可便捷地查看前期診療記錄,使研究者及時掌握受試者的情況。但此類紙質數據采集工具存在存儲條件要求高、易潮濕霉變不利于長期保存、占用空間大、數據須錄入數據庫才能利用等缺點,因此研究者在選擇數據采集工具時應進行綜合考量。CRF和調查問卷無本質上區別,二者都是記錄研究對象信息的載體。通常情況下,CRF多用于臨床試驗研究,其主要內容包括:受試者基本信息、受試者篩選信息(診斷、納入和排除標準)、受試者一般人口學特征和既往疾病疫苗接種史、基線數據、試驗期不同觀察時間節點數據、隨訪期數據、安全性評價指標等。調查問卷則一般用于橫斷面研究、病例對照研究和隊列研究等臨床研究類型,其主要內容包括:一般人口學特征、基礎疾病和疫苗接種史、個人習慣和生活方式(如吸煙、飲酒、飲茶、體育鍛煉、睡眠等)、暴露因素和潛在混雜因素信息采集、研究結局變量信息采集、調查員和研究對象聯系方式等內容。須特別說明的是,研究者應用CRF或調查問卷采集數據時,不能把既往別人設計使用過的CRF或調查問卷拿來直接使用,而是應該根據自己的研究目標和研究內容,創建新的CRF或調查問卷,在這個過程中可以參考既往使用過的紙質問卷。每個臨床研究項目的CRF或調查問卷都應該先通過項目組專家會議的討論、制定與修改,預調查合格后才能正式使用。對于大規模的臨床研究,特別是流行病學調查或隊列研究,在正式調查開始前應對CRF或調查問卷進行信度和效度的評估,以保證后續數據采集的高質量。

相比于紙質數據采集工具,電子數據采集工具同時具備易存儲、不受儲存空間限制、無需二次數據錄入即可使用、可長期保存等優勢,近年來越來越受到研究者的青睞。但電子數據采集工具不僅需要電腦、手機或平板電腦等電子設備的輔助,通常還需要網絡支持和支付電子數據平臺維護費用,這導致臨床研究成本高,很大程度上地限制了其在小型臨床研究中的應用。目前,眾多生物醫藥公司開發了臨床研究數據電子采集工具,并投入市場使用。盡管有一些電子數據采集工具應用方便,而且免費使用,但從數據安全的角度考慮,研究者應選擇那些有資質、數據安全且有保障的正規電子數據采集工具,并在使用前簽訂正規合同,保證臨床研究數據安全性。綜合來看,臨床研究者目前使用比較廣泛的電子數據采集工具包括問卷星、臨床研究整合平臺(clinical research information platform, CRIP)和醫路云等,其中問卷星分為免費試用版和正式收費版(圖1b),而CRIP和醫路云(圖4)均為收費平臺,研究者可以根據自身實際情況選擇使用。

3 臨床研究數據存儲方案

臨床研究團隊選擇合適的數據采集工具完成臨床研究數據采集后,應考慮數據的存儲方案。臨床研究數據須長期存儲,數據存儲的物理空間應滿足安全、穩定、提取便捷等要求,以便數據的后期提取利用和溯源。

通過CRF和調查問卷等紙質數據采集工具所收集的數據,首先應將紙質版采集的數據信息錄入電子數據庫才可以使用,常用的數據庫錄入軟件包括EpiData、EpiInfo、Excel辦公軟件等(圖1c),其中EpiData為專業的免費數據錄入軟件,具有存儲量大、使用便捷、錄入可質控等優點,是一款值得推薦的臨床研究數據錄入和存儲軟件。須強調的是,研究者完成紙質版問卷內容錄入電子數據庫后,除了完成電子版數據的安全備份保存外,紙質版問卷也須長期保存,保存年限要求≥10年,以便后期數據核查和溯源。

電子數據采集工具本身具備數據存儲功能,通??梢詽M足臨床研究團隊對數據存儲的要求。須強調說明的是,研究者如果對數據的保密級別及數據儲存空間有特殊要求,應事先與電子數據采集工具平臺責任方進行協商,簽訂保密協議和相關合同,確保臨床研究數據的安全性。當臨床研究內容如果涉及大容量儲存空間需求時,如對視頻、影像學資料存儲,須要對物理儲存空間進行本地化擴容部署,或選擇云端空間儲存,但均要保證儲存數據的安全性。此外,應用電子數據采集工具的臨床研究項目,如果研究內容涉及到患者的就診信息、實驗室檢查信息和臨床用藥信息,研究者可以利用醫院現有的HIS、LIS、MRIS等數據(圖2),通過數據治理和系統對接后,直接導出并軌到電子數據采集平臺進行統一儲備和使用。應特別注意的是,盡管電子數據采集工具平臺有很多優勢,但同時也存在數據丟失無法恢復的風險,因此研究者應于平常做好數據備份,即便意外情況發生也可以及時恢復數據。

4 臨床研究數據清理和質量控制

無論是通過紙質數據采集工具還是電子數據采集工具所收集和記錄的數據,均須要對數據進行清理、核查和質量控制,其中在數據采集過程中開展的工作主要為數據核查和質量控制,而數據采集結束后通常要對數據進行一次徹底清理和質量控制,保證研究數據的完整性、準確性和可靠性。臨床研究數據的清理、核查和質量控制為一項專題工作,將會花費較多的時間和精力,應由富有經驗的專業統計人員開展,研究者須給予充分重視。

臨床研究項目開展過程中,項目團隊應提前建立“數據質控小組”對數據采集的質量進行核查和質量控制。數據質控小組可以由項目組成員構成,而多中心臨床研究可采取各分中心互查的方式開展,同時也可以邀請學科領域的專家成立“數據監察管理委員會(data surveillance and monitoring board, DSMB)”負責,或邀請獨立的第三方公司開展數據核查。數據核查和質量控制的核心內容包括:①CRF或調查問卷填寫的完整性;②數據修正是否留痕并簽名;③數據填寫是否有邏輯錯誤或異常值;④隊列研究隨訪或臨床試驗開展進度是否與調查問卷填寫的進度一致;⑤隨機抽取5%~10%的CRF或調查問卷進行重新調查,核查數據填寫的準確性;⑥核查紙質版問卷記載的內容是否與數據庫內容一致,以及核對數據庫內容是否與HIS、LIS、MRIS來源的數據一致。在臨床研究數據核查和質量控制的形式上,通常采取現場調研的方式開展,研究團隊應根據數據核查方案,提前準備好電腦和相關材料供數據質控小組的工作人員使用。數據質控小組應根據核查方案逐項開展數據核查工作,并做好記錄,核查完畢后進行統一現場反饋,發現問題及時解決。

臨床研究項目結束后,在開展數據統計分析之前應對采集的數據資料進行質量控制和清理,完成后鎖定數據庫再交付項目團隊或第三方數據公司開展統計分析工作。項目結束后的數據質量控制和清理與項目開展過程中的數據核查和質量控制類似,但不完全相同。該階段的數據質控和清理的主要內容包括:①數據庫中各數據變量的完整性,重點核查“數據缺失”的情況,查找缺失原因,翻閱原始記錄如發現因數據遺漏所導致,須進行及時補充,而如果數據缺失是因研究對象失訪導致,可以采取數據填補技術對缺失的數據進行補充,具體數據填補方法可參考前一期的專題介紹[4]或參考專業的文獻開展;②檢查數據庫中各數據變量的邏輯性和合理性,重點核查“異常值”和“邏輯錯誤”,對數據庫出現的極大值或極小值給予關注,同時關注數據庫中各變量之間的邏輯關系,翻查原始記錄如發現錯誤則及時修正。如圖5所示,在一項“上海居民吸煙、飲酒生活習慣流行病學調查”研究中[5],應用調查問卷采集居民的吸煙和飲酒行為,如果調查對象對問題B1的回答是“否”,那么數據庫中B1a、B1b、B1c、B1e、B1f等5個變量應為缺失值,若這5個變量中出現數據就判定為邏輯錯誤,須清除這些數據。此外,邏輯核查應注意重點變量“性別”“年齡”和“日期”與數據庫中其他變量之間的邏輯關系,如“男性”不可能患“卵巢癌”、“疾病病程”不會長于“患者年齡”等。③數據錄入的準確性核查,對于紙質調查問卷采集的數據,后續須要錄入電子數據庫,為降低錄入的錯誤,在建立電子數據庫時可以應用“check”文件進行質量控制,同時采用雙錄入后的一致性檢驗開展數據錄入質量的評價和控制,推薦研究者使用EpiData數據庫軟件建立數據庫,方便后續的數據錄入質量控制。同樣,該階段的數據清理和質量控制也須由經驗豐富的專業人員對整個數據清理和質量控制過程進行記錄,完成后開展交流會,確認無誤后鎖定數據庫,最后交付項目研究團隊。

參考文獻

[1] 王瑞平, 姜永根, 郭曉芹, 等. 基于傳染病自動預警信息系統的“流行標準”最優化選擇分析[J]. 中國衛生統計, 2017, 34(2): 214-217; 221.

[2] 王瑞平, 陶芳芳, 毛琦, 等. 國家傳染病自動預警信息系統條線人員對系統預警原理、日常操作和預警效果認知調查[J]. 中國公共衛生, 2019, 35(12): 1690-1692.

[3] 王瑞平, 毛琦, 吳毅凌, 等. 傳染病長期趨勢對國家傳染病自動預警信息系統預警閾值設置的影響分析[J]. 現代預防醫學, 2019, 46(11): 1921-1923; 1932.

[4] 王瑞平, 肇暉, 李斌. 隨機對照臨床試驗設計要點和規范[J]. 上海醫藥, 2022, 43(7): 72-77.

[5] 王瑞平, 陳思婷, 位磊, 等. 上海地區銀屑病患者吸煙、飲酒情況及其與銀屑病發病的關聯性分析[J]. 世界臨床藥物, 2021, 42(11): 994-999.

猜你喜歡
調查問卷臨床研究
大學生手機成癮與人格特質分析
微信訂閱服務中信息過載的調查與防控機制研究
碳酸氫鈉溶液關節腔持續沖洗治療痛風性膝關節炎的臨床研究
高職高專學生逃課現狀、原因及對策分析
腹腔鏡手術聯合促性腺激素釋放激素激動劑治療卵巢內異囊腫的臨床研究
黃芝通腦絡膠囊治療糖尿病周圍神經病變的臨床觀察
穴位注射輔助局麻下經皮椎間孔鏡椎間盤髓核摘除術術中鎮痛的臨床探究
《道路勘測設計》課程設計教學改革研究
試論解放學生還學生自由
動態X光片在頸椎病早期診斷中的臨床研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合