SNP位点对基因的影响

snp 是 single-nucleotide polymorphism 的简称,中文为单核苷酸多态性。snp 是如今遗传研究中最热门的一个研究对象,第一是因为他在生物中大量存在,分布广泛。第二他是引起人类(也包含其他生物)疾病的重要原因。

简单来说,snp 就是一个碱基发生了改变。snp 导致基因的转录、翻译受到影响,蛋白质序列、结构的变化使其无法实行原来特定的功能,人因此患上了某一种疾病。那么 snp 有哪些种类?是否所有的 snp 都能够造成基因的变异呢?

snp 的种类

  • 非同义编码 SNP(non-synonymous coding SNPs,nscSNPs)
  • 同义编码 SNP(synonymous coding SNPs,scSNPs)
  • 内含子区 SNP
  • 基因调控区域 SNP

不同snp对基因的影响

非同义编码 SNP,顾名思义就是碱基的改变导致翻译出的蛋白质和原来不同,他会直接改变基因编码蛋白的氨基酸组成,其功能影响取决于变异氨基酸位点是否对蛋白结构或功能起到至关重要的作用。

同义编码 SNP,本身并不改变蛋白质序列,但由于蛋白质翻译存在密码子偏好性,从常用的密码子转到发生多态性之后的不常用密码子,这个过程会导致核糖体通过 SNP 周围 mRNA 片段时速度发生改变,而细胞内的蛋白质折叠过程一般被认为是与翻译过程同步进行的,因此这些 scSNP 会影响 P-gp 折叠和其转移到细胞膜的时间,因此会改变底物和抑制物的作用位点的结构 。

内含子区 SNP,内含子在真核生物基因组中占有很大比重,因此分布在内含子区域的 SNP 也很多, 但分析表明内含子区域的 SNP 的致病风险明显低于编码区和基因调控区,但位于第一个内含子的 SNP 比其他内含子中 SNP 有更大的致病风险 。与内含子相关的大多数引起疾病的突变集中在内含子—外显子连接处(GU或AG)。每个外显子和内含子连接区具有高度保守和一致的序列,即大多数内含子5’末端以GT开始,大多数内含子3’末端与AG开始,称为GT-AG规则。

基因调控区域 SNP ,基因的调控区域主要包括启动子、5’UTR 和 3’UTR,这些区域有很多基因表达调控序列元件,如转录因子结合位点(Transcription factor binding site, TFBS)、 miRNA 结合位点等。这些序列元件与调控因子(转录因子、miRNA 等)的结合都需要特定的序列组成,这些位点发生的 SNP 可能会导致调控因子的结合能力发生改变,从 而影响正常的基因表达调控事件。

深入基因调控区域的snp

在 GWAS 研究中会发现绝大多数的 snp 位点都定位到了非编码区。编码区的snp位点很好理解:哪个基因编码发生改变,那对应的蛋白也不会行使正常的功能。而基因调控区的snp位点要明白到底如何影响基因功能需要花上不少精力。

上面已经说过,基因调控区域 SNP会影响转录因子结合位点、miRNA 结合位点等。基因表达模式主要是靠各种启动子和增强子来决定的,这些调控元件将各种信号因子和转录因子信息整合起来对基因表达进行调控。 转录因子通过结合在DNA的增强子或启动子区域上调节相应基因,提高或降低基因的转录水平。,如果基因上游调控区发生变异就可能影响基因的转录激活。

为了得到确切的结果,我们可以将 snp 集进行注释,注释工具主流的有 snpEFF,Annovar。最终会得到每一个 snp 的变异类型和影响区域。

如果一个 snp 对基因的表达产生了影响,那么这个 snp 可称为 eQTL位点(expression Quantitative Trait Loci,eQTL )。可以提取样本的 RNA 进行 qRT-PCR 得到某几个候选基因的表达量作为表型,snp 集作为基因型进行 GWAS 分析。最终得到显著 snp 位点,如果显著 snp 位点恰好在候选基因周围的调控区域,那么这个 snp 位点就是一个 cis-eQTL (顺式eQTL),不在候选基因周围的调控区域,就要进一步研究是否对候选基因有作用,如果成立,那这个 snp 位点就是一个 trans-eQTL (反式eQTL)。研究发现顺式 eQTL 的数量要远多于反式 eQTL。

现在对于非编码区的碱基效应研究还没有编码区那么明了,但是以后一定会将整个基因组研究透彻。总之,一个碱基或者多个碱基的改变会从不同层面,不同量级去影响基因的表达。就像是蝴蝶效应:一个小小的改变终将会影响这个世界,条件只是时间在时间轴的运行的时间。

参考文献

[1] 许超. SNP对基因表达影响的生物信息学模型[D]. 苏州大学, 2012.

[2] 卢坤, 曲存民, 李莎,等. 甘蓝型油菜BnTT3基因的表达与eQTL定位分析[J]. 作物学报, 2015, 41(11):1758-1766.

[3] Chen R, Davydov E V, Sirota M, et al. Non-Synonymous and Synonymous Coding SNPs Show Similar Likelihood and Effect Size of Human Disease Association[J]. Plos One, 2010, 5(10):e13574.

[4] Westra H J, Franke L. From genome to function by studying eQTLs.[J]. BBA - Molecular Basis of Disease, 2014, 1842(10):1896-1902.