沙门菌是全球范围内最重要的几种食源性致病菌之一,给人类卫生保健系统造成了严重的经济负担。在美国,沙门菌每年引起约140万例感染事件,造成15 000人住院,超过400人死亡。在中国,大约70%-80%的食源性疾病的暴发流行是由沙门菌引起的。沙门菌可分离于多种食物食源性疾病暴发在线数据库,同时,这些污染沙门菌食物的广泛分布,使得在沙门菌食源性疾病暴发流行期间,人们很难对它们进行调查和溯源。
目前,已建立起多种鉴定沙门菌的方法,如传统的生化鉴定、血清型鉴定及PCR鉴定等。近年来,应用于沙门菌鉴定的方法,大多以核酸为基础,包括环介导等温扩增、实时荧光定量PCR、脉冲场凝胶电泳、规律成簇间隔的短回文重复序列等。PFUE目前被认为是食源性致病菌亚分型的金标准,并得到了广泛应用。CRISPR是细菌基因组中进化最快的一种遗传元件,它普遍存在于约90%古细菌和40%细菌的基因组中,包括沙门菌。近年来,CRISPR的研究已成为生物界的一大热点,沙门菌便是其中的一个代表。
1沙门菌的CRISPR系统
1. 1沙门菌CRISPR位点的发现
1987年,Ishim在对大肠埃希菌的碱性磷酸酶同工酶所对应的核酸序列进行分析时,发现在该产物编码区的下游存在着一个由29个碱基组成、重复出现的、并且高度保守的核酸序列;同时,在两个重复的核酸序列之间,存在着长度大致相等、独特的非重复核酸序列,将它们间隔开来。2000年,Monica等通过比对数种古生菌和细菌的核酸序列,发现大肠埃希菌和伤寒沙门菌的核酸序列中,存在着高度同源的大小为29的重复序列,当时称之为SRSRs序列,直到2002年,Jansen R等才将其正式命名为CRISPR,即规律成簇间隔的短回文重复序列,并一直沿用至今。
1. 2沙门菌CRISPR位点的结构
在已发现的含有CRISPR位点的细菌中,该位点的数量从1个3个不等。比较而言,沙门菌中普遍存在2个CRISPR位点,由前导区,序列高度保守的重复区,以及间隔区(spacer)3个部分组成。其中,序列高度保守的重复区与间隔区交替出现,最终形成一个完整的CRISPR位点。前导区一般位于CRISPR位点的上游,由AT富集的、大小为300 -500的碱基组成。该区在种内相对保守,但是在种间却存在着显著水平的差异yak。研究表明,前导区的存在,很可能起着CAS ( CRISPR-associated)相关蛋白的识别位点的作用。重复区一般由平均长度为29 by的碱基组成,序列高度保守,但也存在如其他细菌一样的被称为退化重复的变异山等研究发现,重复区的序列具有二重对称性,意味着它们能够形成发夹般的、稳定的二级结构;同时,重复区的数量与lAS系统的完整程度呈现正相关,即lAS系统越完整,CRISPR位点中的重复区数量越多;而在其他细菌中,尚未发现如此的规律。间隔区一般由平均长度为32 by的核普酸序列组成,它们的插入和丢失,导致了沙门菌CRISPR位点的多样性,被形象地称为CRISPR微进化。值得注意的是,沙门菌的CRISPR间隔区特有地与血清型密切相关,在一定程度上,可以用CRISPR来代替沙门菌血清学分型。在同一个CRISPR中,基本上不存在相同或是较相似的间隔区。长期的研究表明,部分间隔区序列与已知的质粒、噬菌体的序列相匹配.0。目前,CRISPR Data-base数据库中的间隔区序列,仅存在约2%能在Eubank中找到其相应的匹配,其原因可能是目前全基因测序的噬菌体和质粒还比较少。随着全基因组测序技术的进一步发展,测序的噬菌体和质粒越来越多,而相应匹配的间隔区比例也在不断上升。
1. 3沙门菌CRISPR/CAS系统的结构
尽管CRISPR大量发现于多种古细菌和细菌中,但是鉴于CRISPR的非编码区特性,如要发挥其功能,还必须依赖于其相关的蛋白。2002年,Jansen R等。对CRISPR侧翼序列进行比对,发现在不同的细菌基因组间,都含有4个基因;同时,这些基因表现出显著的同源性,说明这些基因与CRISPR位点存在很大的关联。迄今为比,已鉴定出40多种与CRISPR位点相关的、多样化的、基因,已们主要编码与CRISPR相关的蛋白,这些蛋白存在RNA结合蛋白、聚合酶等结构域,与核酸的重组修复等功能有关。每个CRISPR位点都伴有一类特异的CRISPR相关的ca、基因。Paraffinic等根据45种ca、基因对应的CAS蛋白的序列同源性、组成情况和功能,将CRISPR系统分成9种亚型。
在已测定的亚型的沙门菌中,CRISPR/CAS系统倾向存在于CRISPRI位点的一侧,且8个连续的基因按照序排列,与其他在染色体或质粒上按照顺序排列的细菌略有不同,同时还存在诸如及其后所有、基因缺失等现象叫。这些ca、基因分为两大类,各自编码不同功能的蛋白质。一类称为核心基因,包括基因编码的蛋白,主要在新重复序列的获得中发挥作用,编码的蛋白被预测具有核酸酶和解旋酶的功能,在靶标基因的剪切中扮演重要角色。另一类称为亚型特异性基因,包括其中只有少部分已经确定。基因以外,还存在另一类非基因。发现,伤寒沙门菌中的LRP基因,对于CRISPR的活性具有直接的调控作用,参与的加工、DNA的剪切及调节外源DNA的进入等。
2沙门菌CRISPR系统的作用机制与功能
2.1 CRISPR系统的作用机制
CRISPR的作用机制类似于免疫防疫,可分为适应阶段、表达阶段和干扰阶段。①适应阶段,CRISPR系统将一段与入侵的质粒亦或噬菌体上的同源短片段(原间隔序列proto-spacers),插入到前导序列与第一段重复序列之间,同时伴随一次重复区的复制,进而形成了一个新的重复区一间隔区单元,使得CRISPR基因座留下入侵的噬菌体或是质粒的序列信息,为随后的两个阶段提供结构基础。②表达阶段,CRISPR基因座被转录成一段长的CRISPR RNA前体,该前体在相应蛋白的作用下,被切割并加工成小的、成熟的crRNA。随后,成熟的crRNA、蛋白结合形成crRNA蛋白复合体。③干扰阶段,由crRNA充当向导,习crRNA蛋白复合体找到与crRNA同源的外源核酸靶序列,通过碱基互补配对原则进行配对,随后crRNA蛋白复合体将靶标序列降解。在CRISPR免疫的3个阶段中,适应阶段的机制,在不同的CRISPR系统中高度保守,主要通过蛋白发挥功能。后两个阶段,不同于第一个阶段,它们属于执行阶段,在不同的CRISPR系统中差异性较大,发挥作用的蛋白也有所差别。
CRISPR干扰与已发现的RNA干扰有诸多相似性,但是它们在蛋白结构、作用靶标、防御机制等方面存在诸多差异。目前,已发现的CRISPR的功能还仅仅局限于防御外源基因的入侵,而真核生物则能通过RNA相关通路,调节胞内的基因表达等。
2. 2沙门菌CRISPR系统的功能
除去与其他细菌CRISPR类似的抵御外源质粒和噬菌体DNA的入侵的功能以外,沙门菌CRISPR还能介导自身短期表型的变化,也能介导长期的亚类进化,同时,由于沙门菌的CRISPR特有地与血清型密切相关,使得我们能在沙门菌食源性疾病暴发期间能快速地对其进行溯源。最近有研究表明,沙门菌的CRISPR结构与它的耐药密切相关。当然,更多的功能目前还尚不清楚,还有待进一步的研究。
3 CRISPR在沙门菌分型中的应用
CRISPR间隔区的插入及丢失,形成了间隔区特有的高度多态性,进而间接造成了CRISPR的多元性。因此,可通过设计相应的引物,扩增细菌中的CRISPR位点并测序,获得CRISPR序列信息,通过CRISPR软件分析,了解CRISPR间隔区的数量,大小及排列情况。通过比对和分析这些序列信息,可对细菌进行分型研究。同时,鉴于间隔区在细菌核酸序列中是按照外源核酸序列入侵先后的顺序排列,所以可利用CRISPR对细菌进行遗传进化研究。
2012年,通过对783株130种情型的沙门菌进行CRISPR分析,发现CRISPR存在高分辨率,高实用性等优点,与PFUE相比,它能够有效区分暴发流行中相同血清型的菌株,耗时更短,自动化程度更高,还能用于研究沙门菌的多态性;同时发现CRISPR的多元性与血清型及ST型(sequence type)密切相关。建议鉴于CRISPR与血清型的高度相关性,只需根据两个CRISPR位点的大小,就能初步对沙门菌进行分型。其次,可以用软件对CRISPR位点的间隔序列进一步分析,得到更细致的分型结果。
CRISPR除了单独应用于沙门菌的分型之外,还能与其他分型方法联用。近年来,基于沙门菌的两个毒力基因的MLST及CRISPR两种分型方法的结合,建立了一种新的沙门菌分型方法,命名为CRISPR-MVLST,并成功应用于沙门菌的研究中。2011年,Liu等将该方法应用于171株9种血清型的临床沙门菌分离株的分型研究,发现该方法较PFUE而言,具有更高的分辨率,能将暴发菌株及高度克隆的菌株区分开来,可作为沙门菌暴发流行时一种重要的分型方法。2013年,Shari at等将该方法应用于175株海德堡沙门菌和鼠伤寒沙门菌的分型研究中,表明该方法具有实用性强、分辨力高、流行病学一致性高等优点,同时认为可以将该方法作为PFUE分型方法的一种补充,用于沙门菌的分型研究。
CRISPR技术以核酸序列为基础,具有良好的可操控性,可用于下游的进化分析。Fricke W F等比对了28株沙门菌的基因组发现,CRISPR介导的免疫能够控制细菌短期的表型变化,也能介导长期的沙门菌亚类的进化,认为CRISPR分析对评估沙门菌亚类的潜在进化性至关重要,能够帮助和预防未来沙门菌的暴发流行。Time R E等通过对156株78种血清型的肠道沙门菌进行序列测定,发现CRISPR反映了与系统进化不同的进化模式,同时,有可能因为水平基因的转移或共享环境的获得,影响着目前沙门菌的分布情况。
4小结与展望
在CRISPR结构中,间隔区的插入和丢失、间隔序列与外源DNA的高度同源性、ca、基因家族及其所编码蛋白的多种功能,使它被广泛地应用于沙门菌及其他细菌的分型和进化分析研究。无论是单独使用,还是与其他方法联用,都表现出诸多优越性。但是,现阶段应用CRISPR进行细菌分型研究,数据尚不充分,数据库也不健全,还没有形成特定的标准。另外,目前对于CRISPR的研究还仅仅局限于它的防御机制,是否还有其他功能,以及已发现的关于CRISPR的各种现象的原因,如新间隔序列的获得及选择性缺失,都未得到明确的解答。此外,迄今发现,CRISPR只存在于90%的古细菌和40%的细菌,在数量上差异如此之大,是因为目前测序的细菌数量过少,还是由于与细菌共进化的噬菌体中,也存在CRISPR,亦或是存在类似于CRISPR的其他元件,都值得探究。CRISPR作为一个新的研究领域,鉴于它特殊的结构及强大的功能,应用前景广阔。CRISPR也许会像RNA一样,将揭开生物学领域的又一层面纱。