2020年1月22日,国家基因组科学数据中心正式发布2019新型冠状病毒资源库。该库整合了世界卫生组织(WHO)、中国疾病预防控制中心(CDC)、美国国家生物技术信息中心(NCBI)、全球流感序列数据库(GISAID)等机构公开发布的冠状病毒基因组序列数据、元信息、学术文献、新闻动态、科普文章。同时,对不同冠状病毒株的基因组序列做了变异分析与展示。
2019新型冠状病毒基因组序列发布动态
2019新型冠状病毒资源库收录了来源于NCBI的GenBank数据库和GISAID数据库发布的2019新型冠状病毒(2019-nCoV)病毒株的株名、采样日期、采样地点、样本提供单位、数据递交单位等元信息。通过该资源库还可访问到国家基因组科学数据中心基因组数据库GWH从公共数据库收录的冠状病毒科基因组和蛋白序列,用户可基于Accession号、种名、属名、采样日期、采样地点、宿主、分离源、发布日期等元信息筛选感兴趣的冠状病毒株,个性化选取序列进行下载以开展相关的科学研究。
GWH数据库收录的冠状病毒科基因组序列信息
2019新型冠状病毒资源库将持续更新元信息与基因组序列数据,实时监控NCBI的PubMed数据库中发表的2019新型冠状病毒和其他冠状病毒的学术文献、中新网与新华网发布的新闻,同步更新世界卫生组织与中国疾病预防控制中心发布的科普介绍,为用户开展学术研究、掌握科研进展、了解新闻动态与科学知识提供资源与窗口。
2019新型冠状病毒资源库基于不同参考基因组序列开展2019-nCoV病毒株基因组变异分析,并对结果进行了统计与可视化展示。通过对全基因组序列相似性比较和变异位点分析,获取2019-nCoV病毒株之间、2019-nCoV病毒株与SARS冠状病毒以及与类SARS冠状病毒蝙蝠株之间的变异程度、变异区域、变异碱基的详细信息。经数据分析,2019-nCoV与2003年爆发的SARS病毒基因组序列相似度为80%,与2017年2月从国内的蝙蝠中采集到的Bat SARS-like coronavirus isolate bat-SL-CoVZC45基因组序列相似性最高,相似度为88%。对2019-nCoV病毒株的基因组变异分析可为追溯病毒来源、追踪病毒株变异路径、防控新型冠状病毒引发的疫情、治疗病毒性肺炎提供重要的数据基础与决策支持。
2019新型冠状病毒基因组变异分析:基因组变异分析的参考基因组为GenBank发布的2019新型冠状病毒株基因组序列MN908947.3,SARS-Cov为SARS 冠状病毒,bat-SL-CoVZC45为类SARS冠状病毒蝙蝠株,其余基因组序列来源于GISAID发布的2019新型冠状病毒株。红色竖线表示变异位点。