亚洲精品一区二区三,乡村寡妇大乱淫,97一区二区国产好的精华液,教师~淫辱の教室2樱花

 
 

生物醫學大數據發展的新挑戰與趨勢

發布時間:2018-09-07 11:49:40  |  來源:中國網·中國發展門戶網  |  作者:張國慶 李亦學 王澤峰 趙國屏  |  責任編輯:趙斌宇
關鍵詞:生物醫學,大數據,整合,交互,數據挖掘

數據標準與質量控制

生物醫學大數據的數據標準包括術語集、數據標準、綜合標準等。典型的術語集包括基因本體?GO、人類表型本體?HPO等,序列最簡描述信息標準集包括?MIxS?與?MIGS以及?ICD10、SNOMED-CT等醫學數據標準。生命科學領域的數據標準大多由有國際影響力的機構或協會率先提出,伴隨配套的數據解析或分析軟件,逐步得到學術界的認可。例如:由國際核酸序列數據庫協會(INSDC)定義的“The DDBJ/ENA/GenBank Feature Table Definition”是?NCBI、EBI?等數據中心最早的核酸序列數據標準,以及基因組拼接數據標準;EBI?和?NCBI?等定義的基因芯片實驗數據標準?MIAME、GEO,FGED?定義的二代測序數據標準?MINSEQE,以及拼接文件格式?BAM、變異文件格式?VCF、遺傳特征描述格式?GFF3等,醫學領域得到最為廣泛認可的數據標準是醫學影像標準?DICOM。醫學領域的標準比生命科學領域的數據標準要復雜得多,規范化程度也更高。醫學領域的標準大多需要經過立項、草案、發布等階段,得到了更為廣泛的認可,如國際標準化組織健康信息學標準化技術委員會的?ISO/TC 215?系列標準、HL7(衛生信息用戶層,ISO?定義的信息交換7層協議規范中的第七層)、臨床數據交換標準協會?CDISC等;標準的范圍也遠比生命科學領域的數據標準復雜,包括詞匯術語、數據描述、技術操作、應用服務和醫療管理等。

生命科學的標準主要集中在術語集和數據標準,不同的標準之間相對獨立,對數據產出過程、分析過程的規范性表述較少。醫學的數據標準更強調互操作、互聯互通等,不同的標準自成體系,但是對支撐科研的數據標準的描述反而較少。因此,生物醫學大數據亟待加強臨床科研的數據標準體系的建設,以及數據分析過程的操作相關的標準的建設。

數據質量控制受到數據產出、數據分析的影響,不同的數據質控有所差別。芯片、基因組數以美國食品藥品監督管理局(FDA)主導的?MAQC、MAQC-II、MAQC-III?等,由于獨立于技術系統之前,得到了較為廣泛的認可。蛋白質組的數據質控,缺少與?MAQC?相匹配的大項目,而是主要通過?PRIDE、iPROX?等數據匯交平臺的質控工具來體現。數據質量控制需要提供參考數據集作為基準,包括實驗方法產出的原始數據與參考數據集的吻合情況,以及數據分析形成的分析結果與參考數據集的吻合情況。因此,針對有廣泛用途或者重要用途的數據類型,建設參考數據集、參考數據分析流程,是數據質量控制的關鍵環節,也是生物醫學大數據平臺的重要建設內容。

我們正在建設以組學數據百科全書——NODE為代表的開放式基礎性平臺,并達到了一定的數據規模。其中,在整合存儲方面,數據平臺與數據庫包括以微生物組大數據平臺為代表的領域示范平臺,以駱駝基因組變異數據庫、可翻譯轉錄組?RNA?數據庫等為代表的專題數據庫。在交互共享方面,正在向?NODE?系統集成全基因組、外顯子組、轉錄組等常規組學數據分析流程,微生物?16S?RNA、宏基因組、微生物功能注釋等領域組學數據分析流程。在前沿信息技術方面,利用?GPU?技術對轉錄組、宏基因組等組學數據拼接、映射等高資源消耗的環節進行優化。在標準質控方面,開展了包括描述信息和原始數據在內的質量控制,并建立了自動化的質控流程,將實現數據匯交時就自動完成質控評估的功能。

面對生物醫學大數據的挑戰,建立全面支撐生命科學研究數據與健康醫學大數據的匯交、管理、共享與挖掘的技術與資源體系,形成以遞交為基礎、以整合為導向的數據存儲中心,以主題為基礎、以交互為導向的數據共享中心,以及以傳統信息技術為基礎、以前沿信息技術為導向的下一代生命科學數據轉化中心,將有效地支撐生物醫學、健康醫療等領域的基礎研究、應用研究和產業示范。(作者:張國慶 李亦學 王澤峰 趙國屏 中國科學院計算生物學重點實驗室生物醫學大數據中心 中國科學院-馬普學會計算生物學伙伴研究所 中國科學院上海生命科學研究院(上海營養與健康研究院)中國科學院大學 上海 上海生物信息技術研究中心 上海?!吨袊茖W院院刊》供稿)

 

<  1  2  3  


返回頂部
<ins id="vdzd1"></ins>
<ins id="vdzd1"></ins>
<del id="vdzd1"><span id="vdzd1"></span></del>
<ins id="vdzd1"></ins>
<cite id="vdzd1"></cite>
<progress id="vdzd1"><ruby id="vdzd1"></ruby></progress>
<cite id="vdzd1"></cite><cite id="vdzd1"></cite>
<cite id="vdzd1"></cite><menuitem id="vdzd1"><video id="vdzd1"><menuitem id="vdzd1"></menuitem></video></menuitem>
<cite id="vdzd1"></cite>
<cite id="vdzd1"><span id="vdzd1"><cite id="vdzd1"></cite></span></cite><ins id="vdzd1"></ins>
<cite id="vdzd1"><span id="vdzd1"><cite id="vdzd1"></cite></span></cite>
<listing id="vdzd1"><ruby id="vdzd1"><progress id="vdzd1"></progress></ruby></listing><ins id="vdzd1"><span id="vdzd1"></span></ins>
<noframes id="vdzd1"><progress id="vdzd1"><ruby id="vdzd1"></ruby></progress>
<ins id="vdzd1"></ins>
<cite id="vdzd1"><span id="vdzd1"><menuitem id="vdzd1"></menuitem></span></cite>
<var id="vdzd1"></var><var id="vdzd1"></var>
亚洲精品一区二区三 桐庐县| 洛浦县| 绥滨县| 普兰店市| 鹿邑县| 津市市| 油尖旺区| 长寿区| 谢通门县| 贵阳市| 新龙县| 湘乡市| 得荣县| 西充县| 湘西| 青神县| 贵溪市| 万源市| 东宁县| 太仆寺旗| 漯河市| 侯马市| 襄垣县| 民和| 竹山县| 满洲里市| 库尔勒市| 黑山县| 韶山市| 镇平县| 柳州市| 延庆县| 彰化市| 海原县| 余姚市| 柘城县| 沁水县| 聂拉木县| 兖州市| 甘肃省| 民乐县| http://444 http://444 http://444