当前位置:首页 > 资讯 > 研究

肠道微生物研究入门必看:神奇菌群有哪些?

时间:2017-03-04 11:27:58 网络 weiyisheng

人体寄生的微生物数量达数万亿,在人的免疫、消化及代谢方面起重要作用,甚至参与“脑-肠道”之间的信息交流,因此对正常肠道生理及人的健康很重要。所以,肠道菌群的变化或不稳定以及生物多样性的改变是一系列肠道功能紊乱及代谢疾病的特征。从健康和社会角度出发,了解宿主-微生物群的复杂关系以及调节方法具有重要意义。

过去对微生物的研究主要依赖分离培养,而环境中99%的微生物都是不可培养的,因此限制了我们对微生物的认识。高通量测序技术和生物信息学的进步大大促进了我们对微生物的研究。

在被高通量测序的多年熏陶下,大伙对16S微生物多样性、宏基因组、宏转录组等名词应该不是很陌生。这些技术是我们了解微生物的组成及功能的重要手段。

今天我们先来聊聊其中最简单的微生物多样性。它回答的问题是:样本里含有哪些物种,各个物种的比例有多少。

以细菌多样性研究为例,细菌中都含有一种16S rRNA基因,它含有9个可变区(V1-V9),这些可变区在不同物种间差异较大,因此可以通过检测可变区来区分不同的物种。由于二代测序读长的限制,无法测出全长1.5kp,因此常检测1-3个可变区,常见的有V1-V3、V3-V5、V4等。

这里有一个核心的概念,OTU(operational taxonomic unit):即操作分类单元,是人为将序列按照一定的相似度(细菌通常为97%)划归为一组,简单理解,一个OTU表示一个物种。

OTU的聚类方法有三种:

1、de novo OTU 聚类,是将所有序列直接按照两两之间的相似度,划分成一个个OTU,选取该OTU中丰度最高的序列作为该OTU的代表序列,然后用代表序列比对参考数据库,获得该OTU的物种注释,常用数据库有RDP、Silva及Greengene,有时也会比对NCBI-nt库。

优点:不依赖参考数据库,尤其是所研究的样品中含有的已知物种较少,如极端环境中。

缺点:受测序错误及嵌合体影响较大,说白了就是有些序列并非真实存在,是实验过程产生的“假序列”,用这种方法聚类时就会被误认为是一个独立的OTU,不过可以通过去嵌合体等分析手段缓解。

2、closed-reference聚类,这种方法是将序列与参考数据库直接比对,比对到同一参考序列的作为一个OTU,在OTU聚类的同时,也获得了该OTU的物种注释信息。

优点:所获得的OTU可信度高;另外,由于不同文章中检测的16S区域不同,如果要合并分析,不能用de novo OTU picking的方法聚类,因此只能用close-reference方法聚类。

缺点:只能得到已知物种的序列,丢失未知物种的信息。

3 、open-reference OTU聚类,具有上述两种聚类方法的特点,即将序列与参考序列比对,未比对上的序列再进行de novo聚类。兼具上述两种方法的优点,但无法用于不同16S区域的合并分析。

由于目前的参考数据库信息有限,所以OTU的注释结果中常见到一些uncultured*之类的没有分类信息。

无论采用哪种聚类方式,最终我们都会得到这样一种OTU聚类表:

这里包含每个样本所含的OTU种类及序列数,同时还有各个OTU的物种注释信息。需要说明的是,如果某个样品的测序量比较大,那每个OTU中分到的序列数也会相应增加,因此OTU的序列数不能直接进行样品间的横向比较,而是要将序列数转化为比例,即序列数除以该样品的总序列数,得到该OTU在该样品中的比例,用这一比例进行横向比较,我们就可以说该OTU的丰度在不同样品间是升高了还是降低了。至此,我们已经知道样品中的物种及其比例。后续的PCA、heatmap图以及统计分析等都是基于以上的聚类表。