近期,NCBI(美国国家生物信息中心,下同)根据一封来自苏州的电子邮件,将BLAST数据库的EU.1的样本序列更正为“未识别物种”。
让NCBI工作人员没有想到的是
他们在邮件中回复的
“Dr.Xia(夏博士,编者注)”
竟然是苏州的一名高三学生
夏天做DNA条形码研究课题时上传的样本数据
给NCBI的BLAST数据库纠错的学生名叫夏天,是苏州工业园区领科海外教育学校的高三学生。
去年底,正在读高二的夏天参与了冷泉港亚洲DNA学习中心(以下简称“学习中心”)秋季DNA条形码项目,进行了“虾的进化关系”的课题研究。在研究中,夏天将一段竹节虾的基因测序结果上传至NCBI的BLAST数据库进行比对分析时,却没有比对出虾,序列最相近的却是鲇鱼,这引起了夏天的好奇。
夏天发现,这段鲇鱼序列来自一条韩国学者上传的数据,但与此同时,也有其他数据显示这是一种细菌。
究竟是虾和鲇鱼的序列相近
还是提取样本时,细菌侵染了样本?
如果这确实是细菌
NCBI的数据岂不是有错?
夏天充满了疑问
基于前期学习DNA条形码项目时学习中心老师的指导,夏天怀着质疑的精神,在接下来几个月的时间里,将基因数据库网站研究了一遍,又将韩国学者上传的EU这一段“鲇鱼”序列放到了第三方基因数据平台里比对,发现仍是细菌。几经验证研究后,夏天证实了自己的想法,BLAST数据库的这条共享数据确实出错了:这条混在细菌群里的“鲇鱼”实际是假交替单胞菌属。
夏天随即将这一发现告诉了
学习中心的课题指导老师约翰博士和王心悦
在老师们的鼓励及指导下
今年9月夏天给NCBI写了一封邮件
指出数据库中的EU这一样本
与假交替单胞菌属有着98%的相似性
没想到,邮件发出后仅5个工作日,夏天就收到了NCBI工作人员的回复,他们基于夏天的印证,决定将该样本标记为“未识别物种”,以提醒其他的研究者这条信息的不确定性,同时在BLAST数据库里也将不再显示这一段序列的搜索结果。如今,数据库已将EU.1的样本序列标记为未识别样本。
“很神奇,而且也没想到他们称呼我为Dr.Xia,大概对方也没想到写邮件的仅是一位高三学生吧。”夏天说。
来源:苏报融媒记者陶赟婷图片由冷泉港亚洲DNA学习中心提供编辑:小吉更多资讯请猛戳阅读原文下载引力播App
点分享点点赞点在看预览时标签不可点收录于话题#个上一篇下一篇