克日,永利集团生命与康健大数据中心团队题为“The BIG Data Center: from deposition to integration to translation”的研究论文被国际学术期刊《核酸研究》(Nucleic Acids Research)在线揭晓。该研究效果的揭晓是海内首次以数据中心为模式,整体宣布我国生命组学数据资源建设情形,标记着生命与康健大数据中心建设取得实质性主要希望,也标记着我国建设综合性基因组数据资源获得国际偕行认可。
生命与康健大数据中心建成面向国家大数据生长战略的多条理生物组学数据资源系统,包括基于高通量测序的原始组学数据归档库(Genome Sequence Archive,GSA),围绕国家主要战略生物资源的基因组组数据库(Genome Warehouse,GWH),基于测序数据的基因表达数据库(Gene Expression Nebulas,GEN),基于中国人群以及国家主要物种群体的基因组变异数据库(Genome Variation Map,GVM),基于全基因组DNA甲基化图谱的表观基因组数据库(Methylation Bank,MethBank)以及基于公共审编(Community Curation)的生命科学维基知识库(Science Wikis),起源形成我国生命与康健数据汇交与共享平台,具备可效劳于全球的基因组数据共享网络。
国际三大数据中心(NCBI、EBI、DDBJ)对全球生物数据恒久占有着主导职位,北京基因组研究所生命与康健大数据中心(BIG Data Center),作为基因组所的主要研究单位,肩负相关公共数据库资源系统的研究与建设,面向我国生齿康健和社会可一连生长的重大战略需求,围绕国家精准医学和主要战略生物资源的组学数据,建设海量生物组学大数据贮存、整合与挖掘剖析研究系统,生长组学大数据系统构建、挖掘与剖析的新手艺、新要领,建设组学大数据汇交、应用与共享平台。
生命与康健大数据中心章张研究员、赵文明高级工程师以及肖景发研究员为本文配合通讯作者。该研究获得永利集团战略性先导科技专项、永利集团国际大科学妄想、国家863项目、国家973项目、国家自然基金项目等项目基金的资助。

大数据中心建设
论文链接