《Science》文献精选┃自身免疫性疾病中常见的遗传因素本文发表于2023年《Science》,影响因子:41分 太长简略版 这是一篇关于自身免疫性疾病遗传学的详细综述,通过三个方面,包括目前对自体免疫性疾病遗传学的理解,以及共享效应、机制和进化起源。总结了相关的研究和发现。以下是该综述的提炼要点: 对自身免疫性疾病的遗传学见解 1. 同卵双胞胎有更高的一致性率: 相较异卵双胞胎,同卵双胞胎在自身免疫性疾病方面显示更高的一致性率,暗示遗传因素在这些疾病中起着关键作用。 2. 家族史的重要性:许多自身免疫性疾病的最强危险因素是阳性家族史,尽管并非所有患者都有受影响的亲属。 3. 遗传变异的影响:早期的研究着重于寻找具有较大效应大小的变异,但现代研究表明自身免疫性疾病是多基因性的。 4. 基因型阵列技术和全基因组关联研究(GWAS): 基因型阵列技术的发展和全基因组关联研究(GWAS)的兴起揭示了自身免疫性疾病的多基因性质。 5. 非编码变异的挑战:大多数与自身免疫性疾病相关的变异位于基因组的非编码区域,解释这些非编码变异的生物学后果对于临床治疗是必要的。 共同的遗传力和共同的机制 1. 自身免疫性疾病的重叠:不同的自身免疫性疾病在个体中共同发生的频率高于预期,且在家族中可能会有多种影响不同器官系统的疾病聚集。 2. 共享基因座:多个自身免疫性疾病之间存在重叠的基因座,但基因座内的变异可能与不同疾病相关。 3. 共同风险变异:研究揭示了多个自身免疫性疾病之间存在共享的遗传因素,为开发理性治疗提供了信息。 自身免疫性疾病的进化起源 1. 演化压力:遗传多样性和变异受到演化力量的塑造,有人认为自身免疫性疾病风险等位基因由于提高对感染抵抗力而在人群中高频率保持。 2. 古代DNA的应用:古代DNA研究揭示了数千年来病原体施加的选择性压力如何影响人类免疫遗传基因组,导致一些常见遗传因子的更高频率。 3. 不匹配的环境:从高水平的感染到较低的病原体暴露的过渡导致了基因选择和当前环境之间的不匹配,为慢性自身免疫性疾病的高发病率做出了贡献。 正文 对自身免疫性疾病的遗传学见解 与异卵双胞胎相比,同卵双胞胎的自身免疫性疾病始终显示出更高的一致性率(多发性硬化症分别为35%和6%)。此外,许多自身免疫性疾病的最强危险因素是阳性家族史,但大多数患有该疾病的患者并没有受影响的亲属。这些观察结果为这些疾病的病因学中存在重要的遗传成分提供了证据,同时也提出了关于预期的致病变异数量及其效应大小的问题。早期的研究进行了家庭关联分析,假定一小部分基因中的变异将具有较大的效应大小,并推动遗传风险,类似于单基因孟德尔遗传疾病。这些方法使我们能够发现一些最早和最强的自体免疫性疾病易感位点,如1型糖尿病的MHC位点和Crohn病中的核苷酸结合寡聚化结构域含蛋白2(NOD2)位点。然而,这些实验设计在阐明复杂疾病的遗传学结构方面在很大程度上并不成功。 基因分型阵列技术的发展和从家庭研究方向涉及大量病例和对照的全基因组关联研究(GWAS)的转变揭示了自体免疫性疾病的多基因性质。通过比较患病和未患病个体之间等位基因频率,已经发现了数千个强有力且可复制的自体免疫性疾病的遗传关联(图1)。检测到的位点数量随样本量线性增加,而效应大小变小,估计需要数百万个个体(对于炎症性肠病需要1000万个个体)才能完全绘制相关的基因组区域。这些主要是常见变异(在5%或更多人口中存在)的累积效应通常解释了大部分遗传性,即由基因变异引起的表型变异的部分。大规模测序研究还正在确定与自体免疫性疾病相关的罕见(通常是编码)变异。这些罕见变异通常具有较大的效应大小,并且通常汇集到与常见变异相同的基因上。 图1. 探索自身免疫性疾病之间的共同遗传效应 来自一些复杂性状的整个基因组测序研究的证据表明,罕见变异(等位基因频率<1%)是遗传力的一个重要来源。其他可能对遗传性的贡献者包括基因与环境的相互作用(例如与微生物组的相互作用)以及基因与基因之间的相互作用。绝大多数与自身免疫性疾病相关的假定病因变异(>90%)位于基因组的非编码区,这与观察到的<2%的人类基因组编码蛋白质的结果一致。阐明这些非编码变异的生物学后果对于将基因发现转化为临床表型是必要的,但这就带来了一些挑战。GWASs涉及的位点上存在许多相关变异(连锁不平衡),使因果变异的识别变得复杂,这些变异可能在一个位点上有多个变异,此外,即使明确了因果变异,如通过精细定位,其功能机制、靶基因和细胞类型往往仍然是难以捉摸的。在过去的十年里,变异疾病与基因调控性状(如基因表达、剪接和染色质表型)的整合已经开始阐明这些变异的活动及其细胞环境。例如,一项对21种自身免疫性疾病的研究显示,在CD4+ T细胞群和B淋巴母细胞中,60%的候选因子变异与H3赖氨酸27乙酰化(H3K27ac)标记的增强子簇(所谓超级增强子)有关。候选的因果变异在刺激依赖的增强子中进一步富集,包括那些产生调节性非编码增强子RNA的增强子。这些观察表明,大多数自体免疫疾病相关的变异是通过转录调控机制发挥作用的,例如通过改变核转录因子κB(NF-kB)结合来调节免疫细胞的命运和功能。 GWAS已经鉴定了与各种自体免疫性疾病的易感性相关的数千个遗传变异,其中大多数是非编码的,位于刺激依赖性的增强子元素中。这些变异可能会直接破坏增强子的功能,尽管它们的潜在后果是多种多样的。将疾病位点与日益增长的调控注释图谱整合,正在迅速提高对这些非编码变异的解释性,并使得能够为功能后续。 共同的遗传力和共同的机制 不同的自身免疫性疾病在个体中共同发生的频率高于预期,而且在家族中可能会有多种影响不同器官系统的疾病聚集。例如,在瑞典全国性登记簿中,与那些父母未患疾病的个体相比,有患有乳糜泻父母的个体患全身性红斑狼疮的相对风险为2.7倍。这些最初的临床观察最终得到了流行病学证据的支持,表明存在一些共享的风险因素。随着我们发现与自身免疫性疾病相关的数百个基因座并更深入地了解它们的遗传结构,的确发现了这些疾病之间存在着遗传重叠。 识别共享基因效应并解决其功能影响有助于揭示共同的免疫病理机制,并且为开发或重新利用理性治疗提供信息。因此,值得注意的是,21种自身免疫性疾病中每种疾病相关的变异中有三分之二存在重叠的基因座。然而,基因座内的接近并不一定表示存在共享的潜在机制(见图1)。相反,该基因座可能包含与不同疾病相关的独特致病变异。对于其相关疾病,单一基因座上经常出现多个条件独立的致病变异,增加了其复杂性。为了解决这些挑战,采用了各种共定位方法来识别真正共享的分子效应实例,其中单一变异体影响了两种或更多疾病的风险。这些研究通常利用Immunochip上基因型化的队列,这是一种自定义芯片,包含196,000个变异体,密集覆盖了与至少一种自身免疫性疾病相关的186个区域。它们的主要发现一致:在两种或更多自身免疫性疾病之间重叠的遗传位点中,约有一半(41%到60%)可归因于相同的潜在遗传效应(见图2)。这包括具有多个条件独立关联的基因座,如信号转导和转录激活因子4(STAT4),该基因座具有两个独立的遗传效应,分别与类风湿关节炎和系统性红斑狼疮相关。一个显著的例子是TYK2基因中的一个单一低频错义编码变异体(rs34536443),该基因编码是一种在免疫细胞亚群中表达的非受体酪氨酸激酶。这个变异体在检查的10种自身免疫性疾病中提供了强烈的均一保护效应。小等位基因的同源性导致疾病患病率介于0.1和0.3之间,并且几乎完全失去蛋白质功能。这反过来导致了对I型干扰素、IL-12和IL-23的信号传导的受损,进而干扰CD4+T辅助(TH)类型1和TH17细胞因子的产生。该研究表明,一种能够类似地抑制TYK2功能的药物可能对多种自身免疫性疾病有益。实际上,第一种选择性酪氨酸激酶2(TYK2)抑制剂(deucravacitinib),已于2022年9月获得美国食品和药物管理局(FDA)批准,用于治疗斑块状银屑病,并在牛皮癣性关节炎、系统性红斑狼疮、克罗恩病和溃疡性结肠炎的进行中试验。基于这一遗传证据,TYK2抑制剂可能会扩展到其他自身免疫性疾病。同一错义变异体(rs34536443)的同源性还使个体更容易罹患结核病,包括原发性结核病,这是由IL-23紊乱引起的。因此,在开始使用deucravacitinib之前,建议评估结核病的活动和潜伏感染。 图2. 自身免疫性疾病中的共同风险变异 这些数据揭示了自身免疫性疾病之间存在着可观的基因重叠,表现为在多种疾病之间共享的多功能变异,有时还具有相反的效应。通过利用这种基因重叠,对现有自身免疫性疾病队列的跨病种分析已成功地发现了新的遗传关联并改善了因果变异的识别 。强有力的证据表明,它们之间有一些共享的遗传因素,因此也有共享的免疫病理学,通过对病原体的适应而塑造的进化根源。 三、自身免疫性疾病的进化起源 遗传多样性和变异受到演化力量的塑造,包括负选择,这是一种通过消除对适应度产生有害影响的等位基因的过程。因此,存在明显增加自身免疫性疾病风险的常见遗传变异,暗示了这些变异可能提供了有益的演化权衡。考虑到免疫系统在对抗感染中的作用,以及宿主基因对感染病的敏感性有很大影响,有人提出,自身免疫性疾病风险等位基因由于在提高对感染抵抗力方面的作用而在人群中高频率保持。对于这种拮抗多效性的经典例子,即对不同性状具有相反效应的基因型,是血红蛋白亚单位-b(HBB)基因座的变异,该变异对抗疟疾起到保护作用,但在隐性遗传时会导致镰刀细胞性贫血。同样,MHC区域的遗传变异,该区域负责大部分自身免疫性疾病的遗传风险,由于编码的蛋白在抗原呈递和T细胞受体组成中的作用,预计也与各种感染的敏感性有关。最近,对感染性和自身免疫性疾病的遗传效应进行的系统分析证实,与这两类特征相关的变异比预期显著更为普遍 [超过100倍](图3)。 图3. 自身免疫风险和感染风险之间的拮抗多效性 尽管以往关于特定病原体对人类种群施加选择压力的证据主要是间接的,但近期在古代DNA制备和测序方面的进展为直接评估人类适应提供了手段。例如,一项最近的研究调查了对黑死病的遗传适应,这是一次由鼠疫杆菌引起的毁灭性瘟疫,中世纪欧洲、中东和北非地区的人口死亡率达到30%至50%。为了识别在大流行病中受到选择的遗传位点,研究人员分析了在伦敦墓地埋葬的个体的古代DNA样本,包括瘟疫之前(公元850年至1250年)、瘟疫期间(1348年和1349年)以及瘟疫之后(公元1350年至1539年)。在丹麦,瘟疫前后的个体提供了复制研究的资料。总体而言,对356个免疫相关基因和496个免疫紊乱GWAS位点的206名个体进行了分析。结果显示,免疫位点的等位基因频率发生了较大变化,但在中性演化的区域没有变化。最强烈的证据来自内质网氨肽酶2(ERAP2)的一个变异体(rs2549794),该变异体使同源性保护等位基因的个体在黑死病中的死亡率估计减少了40%。相同的等位基因与克罗恩病的风险增加有关,相应的单体型也增加了其他自身免疫性疾病的风险,包括强直性脊柱炎、银屑病和儿童特发性关节炎。ERAP2编码一种氨肽酶,用于适应抗原与MHC-I分子的结合并呈递给CD8+T淋巴细胞。同样,靠近细胞毒性T淋巴细胞相关蛋白4(CTLA4)的另一个对抗黑死病的等位基因增加了患有乳糜病、类风湿关节炎和系统性红斑狼疮的风险。因此,似乎在瘟疫幸存者中选择有益等位基因,并保持其在后代中的频率,导致了现代人群中多种自身免疫性疾病的风险增加。 正如过去的选择偏向于有利于宿主抗性的等位基因一样,它也排斥了削弱免疫应答并增加感染风险的变异,即使它们提供了对自身免疫性疾病的保护。最近的研究揭示了TYK2失义变异(rs34536443)的负选择,该变异减少了各种自身免疫疾病的风险,但在过去的2000年中由于对结核病易感性增加而发生了负选择,导致其在人群中的频率降低。这一变异还增加了患重症COVID-19的风险,与TYK2在与该疾病形式相关的type 1干扰素途径中的作用一致。 在整个历史中,人类免疫系统在环境压力的作用下不断适应,也许其中最大的压力来自传染病。其有利于更强大免疫反应的遗传印记是以更高的共享基因风险来应对各种自身免疫疾病的代价。在近现代,从高水平的感染到较低的病原体暴露的过渡,导致了基因选择和我们当前环境之间的不匹配,为慢性自身免疫疾病的高发病率做出了贡献。此外,古代DNA还被用于追踪与自身免疫疾病相关的变异的历史起源,并揭示了灭绝的旧人类,如尼安德特人和丹尼索瓦人,其基因位点富集了先天免疫和适应性免疫基因。 讨论&总结 在过去的15年里,全基因组关联研究(GWAS)已经大大推动了我们对自身免疫性疾病遗传学的理解。发现了数百个与这些疾病相关的变异,其中许多在不同的自身免疫性疾病之间重叠,证实了它们共享的遗传和免疫病理学起源。一些共享变异对不同的自身免疫性疾病产生相反的影响,呼应并为观察到的TNF-α抑制剂的不同结果提供了见解。古代DNA测序分析正在揭示数千年来病原体施加的选择性压力如何塑造了人类免疫遗传基因组,导致一些常见遗传因子的更高频率,从而导致自身免疫性疾病更高的患病率。解释这些主要是非编码风险变异的意义一直是具有挑战性的,尽管通过使用单细胞测序和来自自身免疫性疾病患者的数据,在细胞类型和特定背景上,通过与基因调控特征的多维度整合来解决这个问题。功能研究已经开始揭示了几种自身免疫性变异的分子后果,而高通量功能表征方法的发展将进一步加速这一进程。正如2021年FDA批准的两成药物中有三分之二得到了遗传证据的支持一样,揭示这些变异背后的生物学机制有望改善对这些疾病的预防和治疗选项。此外,使用来自GWAS结果的多基因预测因子可以帮助识别患有疾病风险升高的健康个体,潜在地提高筛查效果并允许在无症状阶段进行预防性干预。 许多自身免疫性疾病对不同人群有产生不同影响。然而,到目前为止,大多数基因组学研究都集中在欧洲血统的参与者中。未来,需要进行更多的努力将基因和表观遗传数据收集扩展到世界各地的多样血统。此外,需要大规模收集纵向追踪和深度表型的队列研究,以确定不仅对疾病风险有贡献,而且对疾病进展的异质性也有贡献的遗传变异,因为这些可能存在差异。最后,尽管这篇综述主要关注经典的自身免疫性疾病,但基因研究揭示了自身免疫在其他情况中的作用。例如,在帕金森病的全基因组关联研究中已经发现了HLA相关性,随后的研究报告了对a-突触核蛋白的频繁T细胞反应,这在该疾病中形成致病性蛋白聚集。这些以及在阿尔茨海默病、动脉硬化和癌症中的其他发现正在拓宽对炎症和自身免疫在人类疾病中作用的视野。 参考文献: 1. Adil Harroud,David A. Hafler,Common genetic factors among autoimmune diseases. Science 380,485-490 (2023). DOI:10.1126/ science.adg 2992 |