责编
兮
自全基因组关联分析(Genome-wideassociationstudy;GWAS)开展以来,科学家们已经在余种人类遗传疾病或者表型中鉴定了超过15万与不同表型或疾病相关(association)的遗传学位点,为人类深入理解遗传病发病机制乃至最终攻克遗传性疾病奠定了重要的基础。然而,超过93%的GWAS位点位于非蛋白编码区域,因此无法直接推测其下游靶定基因,给理解这些位点调控疾病的分子生物学基础带来了巨大的挑战。
另一方面,自年何川教授实验室发表的一系列关于N6-methylation(m6A)修饰的工作以来,已有大量研究表明m6A在不同的人类疾病中扮演着重要的调控角色。因此,GWAS位点是否能够调控m6A的修饰水平,并以之作为“媒介”(mediator)来实现对疾病的调控,是RNA修饰遗传学领域的重要问题。探索这一问题将极大地帮助我们在不同的调控层次上理解复杂遗传疾病的发病机制及调控网络。何川课题组于年曾发表了基于非洲遗传背景的淋巴母细胞(Lymphoblastoidcellline,LCL)的m6A遗传学研究,并解析了m6A的遗传学调控及在基因调控(翻译效率等)和复杂疾病中的作用。在此基础上,基于不同遗传背景的人类组织(humanprimarytissue)的m6A遗传分析将能够进一步帮助我们在不同的遗传背景和组织类型的条件下理解m6A对疾病的调控。
年7月1日,来自麻省理工学院计算机与人工智能实验室ManolisKellis课题组的熊旭深博士和侯磊博士等在NatureGenetics上发表了题为“Geneticdriversofm6Amethylationinhumanbrain,lung,heartandmuscle”的文章。该研究在4种不同的人类组织(大脑皮质,肺,骨骼肌,心肌)中总共鉴定到了8,个组织特异(Tissue-specific)及个组织共有(Tissue-sharing)的m6A数量遗传位点(m6Aquantitativetraitloci,m6A-QTL)。这些m6A-QTL富集在27种组织相关的复杂疾病/表型中,并且解释了个疾病相关的GWAS遗传位点。
研究人员首先利用meRIP–seq方法对53个大脑皮质样品,32个肺样品,32个骨骼肌样品及12个心肌样品进行了m6A的全转录组测序,总共鉴定了超过,个m6A修饰位点。其中有58%到77%的来自不同组织的m6A修饰未在之前的研究中被报道,极大地扩充了m6A修饰的图谱。研究人员通过系统性地分析组织间特异性,发现了两种不同类型的组织特异m6A(图1),包括~28%的转录组水平的特异性(即组织特异发生在基因表达水平)及~72%的表观转录组水平的特异性(即基因在多组织中表达,而同一m6A位点仅在某特定组织中的RNA上存在)。
图1.转录组水平特异m6A(左)及表观转录组水平特异m6A(右)。随后研究人员分别在大脑皮质,肺,骨骼肌/心肌中鉴定到~,~和~个m6A-QTL位点,分别与,和个转录本上的m6A位点的甲基化修饰水平相关。
研究人员发现m6A-QTL表现了高度的组织特异性,~95%的m6A-QTL是组织特异的。与之对比鲜明的是,~50%的m6A修饰位点是组织特异的。然而,除了生物学上的差异外,这种组织特异性也有可能一定程度上是由于样品数目较少致使检测灵敏度较低导致的。因此,研究人员进一步采取了基于m6A-QTL作用方向一致性(Directionalityconsistency)的分析来系统性评估真实的m6A-QTL组织特异性。其原理在于,如果一个m6A-QTL在不同组织中保守,那么其对于m6A修饰水平作用的方向性(即线性回归中系数的符号)应保持一致(图3),而不完全依赖于m6A-QTL检测过程中的灵敏度(也可理解为statisticalpower)。通过该分析,研究人员计算得到至少71%的m6A-QTL在组织间特异。研究人员还通过仿真模拟(simulation),以及eQTL在不同组织间的保守性等分析进一步证实了对m6A-QTL组织特异性的估计。
研究人员随后与何川实验室的基于非洲遗传背景LCL细胞系得到的m6A-QTL进行了对比。发现约有1%的保守m6A-QTL,且其作用方向在两个研究中%一致,相互验证了研究的可靠性。另一方面,绝大部分的m6A-QTL在两个不同的体系中特异存在,显示了非洲遗传背景LCL细胞系与基于欧洲来源的组织样品在m6A遗传学调控上的差异,同时反映了两个研究的重要性和互补性。
通过与基因表达QTL(ExpressionQTL,eQTL)的对比,研究人员发现小部分m6A-QTL与eQTL位点重合,其中有77%的位点对m6A和基因表达量的影响相反,对应于YTHDF2识别蛋白介导的RNA降解过程,23%的位点对m6A和基因表达量的影响一致,对应于IGF2BP识别蛋白介导的增加RNA稳定性的作用,从遗传学的角度对m6A通过识别蛋白调控基因表达的机制提供了支持。另一方面,研究人员发现在绝大部分情况下,m6A-QTL与eQTL相互独立,说明遗传位点可通过不同的分子生物学基础(m6Avs基因表达)来实现最终对复杂疾病及表型的调控,同时也反映了研究m6A的遗传学调控的重要性。
随后研究人员系统性地分析了m6A-QTL与人类复杂疾病及表型的关系。首先通过GWAS与m6A-QTL的共定位分析(co-localization),研究人员在大脑皮质m6A-QTL中发现了71个与GWAS共定位的位点,其中涉及神经质(neuroticism)、抑郁症(Depression)、精神分裂症(Schizophrenia)、焦虑症(Anxiety)等与大脑及神经相关的疾病;在肺m6A-QTL中发现了与呼吸相关性状,呼气流量峰值(PEF)和哮喘(asthma)共定位的GWAS位点;在骨骼肌/心肌m6A-QTL中发现了与冠状动脉疾病(CAD),心脏跳动速率,高血压等性状共定位的GWAS位点。
此外,研究人员还利用StratifiedLDscoreregression(S-LDSC)发现了来自不同组织的m6A-QTL能够一定程度上地解释27种人类复杂疾病和表型的遗传力(heritability)。其中包括大脑皮质m6A-QTL在渐冻症,阿尔兹海默症,抑郁症,躁郁症,精神分裂症等疾病的遗传信号中的富集;肺m6A-QTL在哮喘,呼吸性状及免疫疾病中的富集;以及骨骼肌/心肌m6A-QTL在高血压,心脏病,痛风等疾病中的富集。
最后,研究人员通过RNA结合蛋白(RNABindingProtein,RBP)与m6A-QTL的整合分析,鉴定了26个潜在的m6A相关蛋白,并发现这些蛋白与已知的m6A甲基转移酶,去甲基化酶,识别蛋白等形成了紧密的蛋白互作网络,进一步拓宽了m6A相关通路的蛋白(图2)。研究人员随后通过蛋白表达量与靶定m6A的修饰水平相关性分析,进一步验证了一部分蛋白。
图2.新鉴定的潜在m6A相关通路蛋白(左)及与已知m6A调控蛋白形成的蛋白互作网络(右)。综上,该研究分析了人类多组织的m6A遗传学调控,并且提供了m6A-QTL在不同组织间,不同遗传学背景间,以及与其它不同调控层次间(如expressionQTL)的系统性对比。此外,通过m6A-QTL与疾病GWAS的整合分析,为架起遗传学位点,表观转录组及人类复杂疾病及表型之间的桥梁提供了重要的分子生物学基础。
据悉,来自麻省理工学院及哈佛医学院的熊旭深博士和来自麻省理工学院的侯磊博士为论文的共同第一作者。麻省理工学院ManolisKellis教授为论文的通讯作者。
原文链接: