?

比較醫學大數據平臺的建立

2022-03-16 01:40張連峰鮑琳琳劉江寧向志光孟愛民楊志偉
中國比較醫學雜志 2022年12期
關鍵詞:動物模型醫學數據庫

吳 玥,魏 強,張連峰,薛 婧,鮑琳琳,劉江寧,向志光,孟愛民,楊志偉,高 苒,孔 琪

(中國醫學科學院醫學實驗動物研究所,國家人類疾病動物模型資源庫,國家衛生健康委員會人類疾病比較醫學重點實驗室,新發再發傳染病動物模型研究北京市重點實驗室,北京市人類重大疾病實驗動物模型工程技術研究中心,北京 100021)

比較醫學是對不同種動物(包括人)之間健康和疾病現象進行類比研究的科學。通過實驗動物來研究人類各種疾病,揭示實驗動物與人類正常和疾病狀態之間的聯系,從而了解疾病發生發展機制和規律[1-2]。比較醫學的概念在19 世紀末最早由生物學、獸醫學和醫學的一些先驅者提出,并在醫學領域得到發展[3-4]。發展至今,比較醫學已經成為實驗動物學與獸醫學、醫學的交叉學科,是聯系基礎醫學和臨床醫學的橋梁。隨著實驗動物行業快速發展,基于實驗動物和動物模型產生的比較醫學數據爆發式增長,積累了豐富的大數據資源。海量科學數據對包括實驗動物學和比較醫學在內的生命科學、醫學、藥學等多個科學領域帶來了沖擊性影響[5-6]。

我國實驗動物資源及動物模型研究缺乏成規模的資源數據庫或大數據平臺。建立比較醫學大數據平臺,對這些資源和數據進行保存,并實現有效共享,對于國內科研人員充分利用現有實驗動物和比較醫學大數據資源進行人類疾病研究與防治及科學創新性研究具有積極意義。實驗動物及比較醫學大數據資源的保存、利用和共享也是全球性的發展趨勢。

1 材料和方法

1.1 數據來源

本平臺的原始數據主要來源于中國醫學科學院醫學實驗動物研究所自有數據,實驗動物研究機構,以及已經公開發表的期刊文獻、圖書專著、公共數據庫和研究報告等。經過專家組論證,制定元數據和數據采集相關表格,確定數據結構和數據標準。

1.2 數據收集方法

全國范圍內聯絡實驗動物行業科研機構、高等院校、行業企業等相關單位按照比較醫學大數據平臺數據格式要求及采集規范采集對應數據,對收集的信息進行匯總,形成從資源研制、表型分析、研究應用等可公開的實驗動物/動物模型、動物實驗、比較醫學等科研大數據。數據管理員對提交的數據從內容、格式、完整性和質量等方面進行審核,數據管理負責人進行復審。最后交由比較醫學領域專家以會議或函審等方式審核確認后收錄到數據庫中進行共享,可保障數據質量。

1.3 數據庫建立

比較醫學大數據平臺基于B/S(browser/server)架構進行設計開發,系統部署在linux 操作系統,整個平臺的設計基于HTML5 內核,采用TP5.0 框架,底層采用關系型數據庫MySQL 進行基礎數據存儲,使用lvs(linux virtual server)、keepalive 實現集群高可用,保障系統的穩定性。系統采用以角色為基礎的權限管理設計模型RBAC(role-based access control),實現通過多角色對系統功能的訪問控制?;诋斍跋到y架構孵化了含有多個子庫的網絡平臺。

1.4 訪問方式

比較醫學大數據平臺網址:https://com-med.org.cn/??晒_獲取,免費使用。

2 結果

2.1 比較醫學大數據平臺架構與內容

比較醫學大數據平臺系統分為四個層次:數據源層、數據抽取層、數據存儲層、應用層,包括用戶管理、系統監控等支撐功能(見圖1)。(1)數據源層主要包含了比較醫學研究產生的各種源數據,包括實驗數據,以及數據分析和共享為目的進行的數據采集、錄入、整合、處理、存儲、發布的過程。(2)數據抽取層主要包括內部、外部數據源到比較醫學大數據平臺的數據采集、傳輸、校驗、轉換、加載等幾個過程。(3)數據存儲層包括緩存數據庫、數據倉庫。(4)應用層由數據分析與數據展示兩部分構成。(5)網頁門戶方便用戶通過瀏覽器錄入、查詢、分析數據。(6)按照用戶的角色,對其進行分類,進行多級權限分配與權限控制。(7)系統安全監控包括:網絡監控、服務器監控、數據庫監控與日志監控等。(8)提供數據備份機制,以保證全系統的穩定性和可靠性。

圖1 比較醫學大數據平臺架構Figure 1 Framework of comparative medicine big-data platform

比較醫學大數據平臺包含網站首頁、數據庫、分析工具、比較分析、外部資源、資料中心6 個一級欄目,對應不同的功能模塊(見圖2)。首頁包含全局檢索功能,可輸入關鍵詞,對所有子庫數據進行查詢。比較醫學數據庫、比較醫學分析工具、外部資源的分類導航功能可引導用戶瀏覽并跳轉至對應內頁。網站介紹、新聞動態、相關文獻、數據庫引用等信息可幫助用戶快速了解網站整體情況及行業相關動態。此外,還包含注冊登錄、數據提交,人類疾病動物模型、實驗動物品系、基因工程動物3 個數據集的數據下載以及全站數據統計功能。

圖2 比較醫學大數據平臺首頁Figure 2 Home page of comparative medicine big-data platform

2.2 主題數據庫

比較醫學大數據平臺的主題數據庫分為八類,包括32 個子庫(見圖3),其中平臺主題數據庫21 個(見表1),通過整合比較醫學相關數據資源,制定元數據和數據采集規范及相關表格,根據各子庫的特點,設置了不同的字段。提供查詢、顯示、數據錄入、數據審核等功能,為獲得有效的實驗動物和動物模型科學數據提供服務。外鏈子庫11 個,為比較醫學框架體系子庫。平臺主題數據庫通過關聯的動物模型、品系、物種、微生物數據庫,實現數據詞條相互關聯,用戶可點擊查看被關聯的數據。子庫與字段均可以通過網站后臺進行修改及擴展。

圖3 比較醫學大數據平臺數據子庫Figure 3 Sub-database of comparative medicine big-data platform

表1 比較醫學大數據平臺主題數據庫Table 1 Subject database of comparative medicine big-data platform

續表1

2.3 生物信息學在線工具

比較醫學大數據平臺“分析工具”欄目按照在線工具、比對工具、互作工具、預測工具、富集工具、作圖工具集成生物信息學工具,包含分類目錄、簡介、工具列表,可以外鏈到對應工具頁面。通過網站后臺可以不斷錄入新的生物信息學分析工具,目前已收錄46 個常用的生物信息學分析工具,例如BLAST、clustal omega、MUSCLE、JBrowse、circos 等(見圖4)。

圖4 比較醫學大數據平臺生物信息學工具Figure 4 Bioinformatics tools of comparative medicine big-data platform

2.4 基于動物模型數據的比較分析

比較醫學大數據平臺以動物模型數據庫為核心,提供指定“動物模型”的同類數據比較功能,可通過輸入動物模型全稱、動物模型的物種或品系、動物模型類別、動物模型涉及的微生物名稱進行檢索并選擇動物模型(最多可選擇10 條),調取比較生理、比較生化、比較病理、比較影像、比較行為、比較解剖6 個子庫的數據,提供對動物模型生理學、生物化學、病理學、影像學、解剖學、行為學層面的比較分析。將同類型數據在一個頁面以多列的形式進行比較,每種屬性一行,比較結果相同數據顯示紅色,不同則顯示黑色。例如可以檢索并選擇“PDGF-hα-SynucleinA53T 轉基因小鼠帕金森模型”與“單側紋狀體注射6-OHDA 誘導帕金森小鼠模型”,選擇“比較行為學數據庫”,將兩個模型的行為學數據進行比較分析,生成分析結果(見圖5)。

圖5 比較醫學大數據平臺比較分析功能Figure 5 Comparative analysis function of comparative medicine big-data platform

2.5 外部資源

比較醫學大數據平臺“外部資源”欄目按照基因組學數據庫(genome database)、基因表達數據庫(gene expression database)、轉錄組學數據庫(transcriptomics database)、蛋白組學數據庫(proteomics database)、蛋白互作數據庫(protein interaction database)、代謝組學數據庫(metabonomics database)、實驗動物資源數據庫(laboratory animal resource database)、人類疾病數據庫(human disease database)的分類匯總已建立的公共數據庫。數據庫目錄列表內容包括:數據庫名稱、標簽、介紹、關鍵詞、網址,可以外鏈到對應數據庫。左側為數據庫分類導航欄,右側為數據庫瀏覽列表,點擊列表可打開相應詳情頁,查看對應數據庫詳細信息及相關的其他數據庫;可通過標題、關鍵詞、介紹進行檢索,通過網站后臺可以添加新的分類并且不斷錄入新的數據庫,目前已收錄122 個公共數據庫信息(見圖6)。

圖6 比較醫學大數據平臺外部資源欄目Figure 6 External resources of comparative medicine big-data platform

3 討論

科學數據是當代傳播速度最快、影響面最寬、開發利用潛力最大的戰略性、基礎性科技資源??萍紕撔略絹碓揭蕾囉诖罅?、系統、高可信度的科學數據。國務院在2015 年發布了《促進大數據發展行動綱要》(國發〔2015〕50 號)[7]。2018 年3 月國務院辦公廳發布了《科學數據管理辦法》(國辦發〔2018〕17 號)[8]。國家科技部據此設立了科學數據共享平臺,啟動了“云計算和大數據”、“高性能計算”等重點專項。國家衛健委科教司在2019 年5 月發布了《醫療衛生機構衛生健康科學數據管理辦法(征求意見稿)》,并指定中國醫學科學院建立科學數據中心[9]。在此背景下,我們于2015 年建立了比較醫學大數據平臺,并于2020 年改版升級。

歐美等發達國家高度重視實驗動物及人類疾病動物模型相關科學研究,建立了多個實驗動物數據庫以及資源平臺[10],例如美國Jackson 實驗室的小鼠遺傳資源庫(MGI)、小鼠表型數據庫(MPD)、基因表達數據庫(GXD)、小鼠腫瘤生物學數據庫(MTB)、動物模型與人類疾病關聯數據庫(LAMHDI)等。美國密蘇里大學的大鼠基因組數據庫(RGD)。英國有“嚙齒類基因組數據庫”、“小鼠細胞遺傳圖譜”、“畸形人鼠同源性數據庫”,以及歐洲小鼠突變資源庫等,對實驗動物品系資源及相關研究數據進行共享[11]。

國內建立了嚙齒類等6 個實驗動物資源庫和國家人類疾病動物模型資源庫[12],也建立了實驗動物資源數據庫等少量的數據庫[13]。作者所在單位已建立了實驗動物品系數據庫、基因工程大鼠資源庫。但是缺乏大規模動物模型、動物實驗及比較醫學相關數據,無法滿足實驗動物研究人員多層次全方位的實際需求[14-16]。

我們建立了一個統一的比較醫學大數據平臺,實現了數據庫、常規統計分析以及科學研究三者間的有機結合。進行人類疾病動物模型與相關比較醫學數據的收集、處理和分析研究。有效整合來自研究所及相關單位的各種實驗動物資源、疾病動物模型與比較醫學相關數據,實現了比較醫學相關科學數據資源的集成共享以及不同數據庫的分級管理。彌補了我國在人類疾病動物模型資源供應和相關技術服務方面的劣勢,為疾病的科學研究提供便利,對國內科研人員充分利用現有實驗動物和比較醫學大數據資源進行科學創新性研究具有積極意義。

通過調動各機構分散的動物模型資源,化零為整,實現了國內分散的疾病動物模型研究資源的整合和信息化。匯聚國內外的比較醫學相關數據資源,圍繞我國疾病動物模型發病機制、疾病診斷、治療藥物靶點、重大新藥創制、疾病防治等領域的研究,進行實驗動物資源、動物模型表型數據的集成,提供高水平的疾病動物模型資源支撐。解決臨床醫院、藥物研究、基礎研究等方面對實驗動物與動物模型數據的共享、查詢及分析問題。

世界上尚無比較醫學相關的大數據平臺。本研究建立的比較醫學大數據平臺,通過數據集中,滿足不同層次、不同研究目的的需求。解決醫學動物實驗和臨床醫學研究結果數據存儲和比較分析的科學問題,進而促進人類疾病基礎醫學、轉化醫學和臨床醫學研究,增強生物醫藥創新能力,最終提高我國生物醫藥領域的整體研究水平。研究者可以根據數據庫中已有的實驗方案和實驗指標對實驗進行優化,如選用合適的實驗動物種類及品系、年齡、性別、規格、質量標準,采用適當的分組方法,選擇科學、可靠的檢測技術指標等,從而對實驗方案進行優化[17]。

比較醫學大數據平臺可服務于人類疾病動物模型資源制作、模型分析、藥效學評價等相關的生物醫藥產業,為我國乃至全世界的生物醫藥研發服務,搶占較大的國內市場份額和一定的國際市場份額,產生巨大的經濟效益。平臺支撐的生物醫藥產業,將促進創新藥物的產生,使我國具有自主知識產權的創新藥物通過國際標準的平臺評價,獲得國際話語權,帶動生物醫藥產業的進步,具有不可估量的經濟貢獻。

今后會將比較醫學大數據平臺的支撐能力不斷放大,形成基于人類疾病動物模型大數據的支撐性科學數據平臺?;诒容^醫學大數據,智能預測動物模型可能產生的表型,揭示動物模型與人類正常和疾病狀態之間的聯系,根據醫學問題研究需要進行動物模型選擇或研制,為醫藥領域科技規劃的實現、人口健康領域研究目標的順利完成提供疾病動物模型資源保障。感謝中國醫學科學院醫學實驗動物研究所秦川教授提出建立數據庫并指導數據庫完善。

猜你喜歡
動物模型醫學數據庫
肥胖中醫證候動物模型研究進展
胃癌前病變動物模型復制實驗進展
醫學的進步
潰瘍性結腸炎動物模型研究進展
預防新型冠狀病毒, 你必須知道的事
數據庫
數據庫
數據庫
醫學
數據庫
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合