2月7日,我校生命科学学院朱政霖博士与中国农业大学的孟赓博士合作完成的冠状病毒动态分析数据库(CoVdb)构建,其论文“全球冠状病毒动态分析数据库”在预印本网站bioRxiv上发表[1]。(注:bioRxiv的论文均未经同行评审)
CoVdb(covdb.popgenetics.net)是专门针对冠状病毒的基因组数据库,囊括了所有已报道的冠状病毒株基因组。通过对其历史和全球范围内的群体遗传学、功能和结构分析,提供冠状病毒的全面信息,将为全球冠状病毒研究,特别是为2019-nCoV研究做出贡献。CoVdb结合、比较和注释了已有的冠状病毒基因组,提供了亚细胞位置、功能、蛋白质拓扑结构以及群体水平的全面分析结果,为冠状病毒科的基因组鉴定和功能研究提供了方便。
CoVdb广泛收集了已发表的冠状病毒基因组数据。统计表明,平均每个病毒菌株有5-14个可能的蛋白质编码基因。尽管冠状病毒的结构并不复杂,该研究仍然对冠状病毒基因进行了亚细胞定位分析,并预测了它们在病毒感染过程中的作用。预测表明:病毒27%的蛋白质位于宿主细胞核或宿主细胞质中,32%的冠状病毒基因被预测为膜蛋白。群体遗传学分析发现了2242个可能处于正选择的核酸区域,这些区域分布于400个基因中,且大部分位于病毒基因组的ORF1。这些正选择区可能与病毒复制和感染相关的适应性突变有关。研究结果为冠状病毒的研究和流行病学调查提供了重要依据。
CoVdb依据基因组构建了冠状病毒的系统发生树,同之前的研究结论一致[2]。CoVdb的系统发生树表明2019-nCoV可能源自蝙蝠,且与SARS-CoV关系密切。
相关文献:
[1] Zhenglin Zhu, Kaiwen Meng, Geng Meng. A database resource for Genome-wide dynamics analysis of Coronaviruses on a historical and global scale. bioRxiv (2020) doi: https://doi.org/10.1101/2020.02.05.920009
[2] Roujian Lu*, Xiang Zhao*, Juan Li* et al. Genomic characterisation and epidemiology of 2019 novel coronavirus: implications for virus origins and receptor binding. Lancet (2020) pii: S0140-6736(20)30251-8. doi: 10.1016/S0140-6736(20)30251-8.