北京基因组所(国家生物信息中心)合作开发叶绿体基因组综合数据库CGIR
叶绿体是植物把光能转化为化学能的主要细胞器,具有自力的基因组。自植物叶绿体基因组被发明以来,其已被普遍应用于展现植物系统进化关系、光合作用调控机制研究、叶绿体基因工程等方面。随着基因测序手艺的生长,只管已宣布了海量的植物叶绿体基因组序列,但怎样整合应用这些数据现在仍面临数据命名标准不统一、数据信息不全及较高经济价值的物种尚未举行测序等诸多问题。
克日,4001老百汇网站(国家生物信息中心)国家基因组科学数据中心章张、宋述慧团队团结中国中医科学院中药资源中心袁媛、黄璐琦团队开发了迄今为止物种数目最多的叶绿体基因组综合数据库Chloroplast Genome Information Resource (CGIR)。CGIR收录了来自11,946个物种的19,388条叶绿体基因组序列,其中包括使用天下第四次中药资源普查标本自测的718种未揭晓的叶绿体基因组序列,凭证基因组(Genomes)、基因(Genes)、微卫星序列(SSRs)、DNA条形码(Barcodes)、DNA特征序列(DSSs)五个功效�?槎允菥傩凶橹牍芾�。研究效果以“Towards comprehensive integration and curation of chloroplast genomes”为题在国际期刊Plant Biotechnology Journal上揭晓。
凭证生物物种名录(The Catalogue of Life),经由大规模人工审编,CGIR首先对所收录叶绿体基因组的物种分类信息举行了审编,凭证纲、目、科、属、种差别分类层级举行了整理,并依据权威植物研究机构邱园宣布的天下功效植物名录(World Checklist of Useful Plant Species)对药用植物、食用植物、情形植物、能源植物、有毒植物、能源植物等举行了标注。同时,CGIR对基因名的不规范命名、异名、过失注释等情形也举行了审编修正。在此基础上,对各基因组的基因注释信息举行系统整理,为用户检索、浏览和信息获取提供便当。
针对分子标记开发这一叶绿体基因组最为常见的应用情景,CGIR使用生物信息学要领盘算了所收录叶绿体基因组的微卫星序列、DNA条形码和DNA特征序列三种差别类型分子标记信息,且同时开发了响应的树型视图利便用户凭证分类层级信息快速寻找目的标记,简化了研究职员开发分子标记的流程。
综上,CGIR通过自主测序、整合果真基因组资源和人工数据审编向用户提供了现在为止最周全、物种数目最多的叶绿体基因组数据。经审编的物种分类、物种功效、基因名称与序列、分子标记等包管了数据的高度可靠,对植物系统发育、物种判断、叶绿体基因工程的生长均具有主要意义。
该研究由中国中医科学院中药资源中心、中科院北京基因组研究所(国家生物信息中心)配合完成�;幸徊┦垦芯可⑻锒饭こ淌Α⒔毖芯吭�,宋述慧研究员为本文配合第一作者,袁媛研究员,章张研究员和黄璐琦院士为配合通讯作者。该研究获得了科技基础资源视察专项、中国中医科学院科技立异工程项目、中央本级重大增减支项目“名贵中药资源可一连使用能力建设项目”的资助。
论文链接
CGIR数据处置惩罚示意图及主要功效�?榈氖萃臣�