近日,各类媒体都被新冠病毒在英国发生了 “可怕新突变” 的新闻刷屏!为了防止这种 “新突变体” 进一步扩散,英国政府宣布对伦敦实行 4 级封锁!这意味着,伦敦人在圣诞节期间都必须待在家里!
这不禁让人联想到恐怖电影 “新突变体” (The New Mutants)里的场景:
艰难的 2020 即将过去,疫苗接种已经开始,在年底人们终于看到了一线希望的时候,可怕的 “新突变体” 给即将到来的圣诞和新年节日蒙上了阴影!
“新突变体” 究竟是一种什么突变,是怎样产生的?
要搞清楚这个问题,我们先一起来了解一下新冠病毒的结构和感染过程,并学习一些突变的基本知识!
1)新冠病毒的结构
狡猾的新冠病毒看不见、摸不着。在放大了10万倍的电子显微镜下,新冠病毒是这样的:
如果画成示意图的话,它是这样的:
在这里我们需要关心的其实只有两个部分,一个是外部的 “刺突蛋白”(S),另一个是包在里面的 “RNA基因组”,我们就叫它 “RNA” 吧。
如果将 “RNA” 取出来放大,画成直线,它是这样的:
学生物没有什么窍门,就是靠记忆!在这个图中我们要记住,新冠病毒的 “RNA” 长度是 30000 个 “核苷酸”。
“核苷酸” 也就是 A、C、G、U,后面会有说明。这 30000 个“核苷酸” 组成从 ORF1 到 ORF10 一共十个基因,负责编码十种蛋白质。
ORF 的英文全称是 Open Reading Frame, 翻译成中文是 “开放阅读框”,它是指编码一个蛋白质的基因编码区。
另外我们还要记住的是,新冠病毒 “RNA” 的 2/3 编码的是 ORF1a 和 ORF1b, 这是一个被称为 "RNA聚合酶" 的两个部分;另外还有一个很重要的部分就是图中的 S, 也就是上面所说的 “刺突蛋白” 。
我们先不管 "RNA聚合酶" 是什么玩意儿,还是先说说什么是"核苷酸"吧。
"核苷酸" 是组成遗传物质的最基本单元,如下图:
你可以看到左边的 RNA 是由 C、G、A、U 4 种 "核苷酸" 组成,而右边的 DNA 是由C、G、A、T 4 种 "核苷酸" 组成。U 和 T 的不同就是 RNA 与 DNA 的差别。
2)新冠病毒的感染过程
当新冠病毒进入人体之后,停留在呼吸道表面,会被细胞膜上的一种叫 “ACE-2” 的蛋白质分子识别,从而进入细胞内,如下图:
接着, 新冠病毒的 RNA 也进入细胞内:
进入人体细胞的病毒 “RNA” 在细胞内要做的第一件事情是,利用其 ORF1a 和 ORF1b 编码的遗传信息,和人体细胞提供的原料,合成出病毒自己的 "RNA聚合酶"。
而这个"RNA聚合酶"又能利用病毒的 “RNA” 作为模板,根据 A 和 U 相互配对, C 和 G 相互配对的原则,复制出一个新的 RNA 分子。
需要注意的是,在这个新的 RNA 分子中,原先所有的A 都变成了 U,所有的 U 都变成了 A, 所有的 C 都变成了 G, 所有的 G 都变成了 C。 也就是说,新 RNA 分子的核苷酸序列与作为模板的 RNA 序列正好相反,所以我们叫这个新的 RNA 分子为 “负链 RNA”。
“负链 RNA” 只是一个中间体,它本身没有什么功能,但它可以被病毒的 "RNA聚合酶"再次作为模板,按照同样的原则,将 A 变 U,U 变成 A,C 变成 G,G 变成 C ,复制出 “正链RNA”。
如下图,注意正链 RNA 是棕色,负链 RNA 深蓝色。
一条 “负链RNA” 可以复制出成千上万的 “正链RNA”。不仅如此,它还能复制出一些 “正链RNA”片段,如下图:
这些 “正链RNA” 片段被用于合成包括 “刺突蛋白” 在内的病毒结构蛋白质:
病毒的 “正链RNA” 和结构蛋白质一起,被精确组装成新的病毒颗粒:
然后被运送到细胞外,再去感染更多的细胞:
将这个过程放在一个图里,就是这样的:
总结一下,新冠病毒的复制一共有这 8 步:
以下的视频是新冠病毒复制的全过程:
3)突变的发生
那么,在这个过程中,突变是怎样发生的呢?
问题出在病毒的 "RNA聚合酶" 上。
"RNA聚合酶"应该按照 A 配对 U,U 配对 A,C 配对 G,G 配对 C 的规则复制出 “负链RNA”,再由同样的规则将 “负链RNA” 复制成 “正链RNA”。
在复制过程中,偶尔会有 A 不与 U 配对,U 不与 A 配对,C 不与 G 配对,G 不与 C 配对的情况发生,任何一次不遵守规则的行为就是一个 “突变”。这种单个 "核苷酸" 的突变也称为 “点突变”,是一种很常见的突变。
当然,在病毒复制过程中也会发生丢掉或增加一、两个或更多核苷酸的疯狂变异,但那种病毒很难存活下来,所以很少见。
4)突变的元凶
人体的基因组是双链的DNA, 双链的DNA在复制的时候,出错的机会很小。不仅如此,如果发生了错误,细胞还有一套修复机制,将错误率降到最低。
人体基因一旦发生了错误,有的发展成癌症,能传给后代的成为遗传病,后果是非常严重的!
而新冠病毒却大不一样!
新冠病毒的 "RNA聚合酶" 是一种出错率很高的聚合酶,而且病毒本身没有任何修复机制,这样就会很容易发生突变。
不同生物间由于基因复制和修复机制的不同,发生突变的几率差距很大,如下图:
新冠病毒属于 RNA 病毒,突变率仅次于 “类病毒”(Viriod,一种只有 RNA 没有任何蛋白质成分的植物病毒) ,比人体基因发生突变的频率要高10万倍!
5)病毒间的竞争
突变是一个随机的过程,新冠病毒 RNA 30000个核苷酸中的每个核苷酸,都有突变成其他 3 种核苷酸的可能。
根据遗传信息由三个核苷酸编码一个氨基酸的规则,有许多突变并不影响病毒所编码的蛋白,这样的突变叫 “同义突变”。“同义突变” 对病毒的活性没有任何影响。
而另一些突变则会改变病毒所编码蛋白质的氨基酸,非重要部位的氨基酸改变也不会影响病毒的活性,但关键部位的氨基酸变化会改变蛋白质的性质,使病毒的活性减弱或增加。
当病毒的突变发生在很关键位置的时候,使病毒失去活力,这样的病毒就 “绝种” ,人们也就无从知道它们的存在!
如果在病毒RNA 30000个核苷酸的某个区域没有发现任何突变,不是说从来都没有突变发生,而是因为突变是致死的!
人体被病毒感染后,经过数代病毒复制,那些活性弱的病毒会被淘汰掉,而活性增加的病毒会复制出更多,这就是病毒间的竞争,也是一种自然选择。
6)突变与病毒系谱
突变一旦发生了,就会传递给下一代的子病毒,不同的子病毒又会发生新的突变,这些变异就会积累起来,代代相传,代代增加新的突变!
现代的基因测序技术很容易发现这些突变,如下图:
在这里, A、B、C、D 代表四个携带了不同突变的病毒,淡蓝色的突变是全部四个病毒都共有的,所以这个突变是最早发生的突变;紫色的突变为 A、B、C 所共有,所以 A、B、C 拥有同一个祖先,而 D 则属于另外的一个分支。如果排成一个 “系谱树”,就是这样的:
根据病毒所携带的突变而建立的系谱关系也被称为 “进化树”。在全世界流行了12个月后,目前新冠病毒的 "进化树" 是这样的:
这么复杂的 "系谱树" 已经无法由人工构建,但计算机可以很容易做到。
7)突变与病毒追踪
如果病毒从一个地方传到了另一个地方,也可以根据它们所携带的突变,追踪它们的来源:
目前,全世界流行的新冠病毒 95% 源自意大利,就是这样确定的。
8)英国发现的 “新突变体”
英国的新冠病毒 “新突变体” 被命名为 VUI 202012/01(2020年12月调查的01株系), 也叫 B.1.1.7 谱系。
对于新冠病毒来说,突变随着时间的推移,基本以恒定的速度积累,约为每月1-2次突变。目前大部分毒株与原始毒株相比,在经历了12个月的大流行后,突变一般为 12-24 个。
B.1.1.7 谱系积累的突变位点主要有 6 个同义突变 (不改变氨基酸)、14 个非同义突变 (改变氨基酸)和 3 个缺失突变,如下图。
B.1.1.7谱系的突变位点
9)新突变体的分布
英国的新突变体,是通过监测数据库发现的。根据其突变特征,在系统发育树中被划分为一个新的支系 B.1.1.7。在过去的四周,该谱系频率迅速升高并在英国持续扩散。
B.1.1.7 谱系(黑框中)的国家:英国(橙色),澳大利亚(灰色)和丹麦(绿色)。其他颜色的国家/地区不在此株系中。
最早的两株,一株来自2020年9月20日的肯特,另一株来自2020年9月21日的大伦敦区。到2020年12月初,英国持续检测到 B.1.1.7谱系感染,截至12月15日,B.1.1.7谱系共上传了1623个基因组序列,其中519个在大伦敦区,555个在肯特,545个在英国其他地区(包括苏格兰和威尔士),还有4个在其他国家。
10)新突变体最关键的 N501Y 突变
在B.1.1.7谱系的 23 个突变位点中,有 8 个突变分布在刺突蛋白区域。 其中最值得注意的是突变位点 N501Y。
如前所述,新冠病毒进入细胞的第一步是刺突蛋白与受体 ACE2 结合。而突变位点 N501Y正是刺突蛋白与受体 ACE2 结合区域关键位点上的氨基酸突变,这个位点非常重要。
今年 7 月 30 日,中国科学家周育森等人发表在 Science 的研究表明,新冠病毒适应和感染野生型小鼠,正是因为有了这个 N501Y 突变。
N501Y大大增加了刺突蛋白与受体 ACE2 的亲和力,能使本来不感染小鼠的新冠病毒毒株变得能够感染小鼠。
美国福瑞德·哈金森癌症研究中心和华盛顿大学的科学家发现,新冠病毒受体结合区域相当多的氨基酸突变增强了与受体 ACE2 结合的能力。
九月,美国科学根据实验结果预测,在 N501F/T 位点的突变能增强与人受体 ACE2 的亲和力。现在的事实证明,他们的预测是对的。
由此可以进一步推测,起初不感染人的新冠病毒也可能是由于在这一区域的突变而获得了感染人类的能力,造成了全世界大流行!
11)高亲和力增加感染率
我们要知道,并不是只要有一粒病毒进入人体,人就会被感染。感染的建立,需要一定数量的病毒,这与各人的身体状况有关。
亲和力提高导致人更容易被感染,也就是说使病毒的传染力增加。打个比方,在美国,现在外面有很多病毒,你去外面走一圈回来,哪怕是戴着口罩,也难免会有一些病毒会钻进你的呼吸道。
如果你在纽约的大街上走一圈,要吸进去 100 个非 B.1.1.7系谱病毒才会被感染的话,那在伦敦你只要吸进去 30 个B.1.1.7系谱病毒就有可能被感染。
这是因为当 B.1.1.7系谱的病毒停留在人体呼吸道细胞表面时,病毒的刺突蛋白与人体细胞的 ACE-2 间由于亲和力更高,更容易互相结合,建立感染。
在同一地区,B.1.1.7系谱由于 “亲和力” 高,感染的人多,增加的速度会高于其他毒株,经过一段时间的发展,就会取代其他株系。事实上,几周前在伦敦这种 “突变体” 只占总病例的 10%~15%,而在上周已占到伦敦总病例的 60%。
根据英国12月18日发布的呼吸道病毒危机咨询小组会议纪要,新突变体毒株感染病例的增长率比其他毒株高71%。
12)新突变体对抗体药的影响
另一个值得关注的是,在B.1.1.7系谱 RNA 的 21765-21770 核苷酸之间竟然少了 6 个,造成刺突蛋白的 H69 和 V70 两个氨基酸缺失!
这一突变最早 7 月份在英国、荷兰、澳大利亚出现,后来因为在丹麦的水貂中频繁出现而引起广泛关注。其中在水貂中常伴随 Y453F 共同出现,而在人类中则常伴随 N439K 共同出现。
有研究表明,69-70 氨基酸缺失突变会使一些单克隆抗体失去中和作用,也会降低部分血清的中和敏感性。
美国FDA紧急批准的两种治疗新冠病毒感染的抗体药,就是那种一次给特朗普打了 8 克的 “抗体鸡尾酒” ,正是利用抗体与病毒的刺突蛋白结合 (如上图),去阻断病毒与人体细胞的结合,从而避免更多细胞被感染。
鉴于这样的原理,刺突蛋白上氨基酸的改变或缺少,势必会影响到抗体的结合。
现在还不清楚 B.1.1.7系谱刺突蛋白的 H69 和 V70 两个氨基酸缺失,会不会使现有的抗体药活性降低。
13)新突变体对致病性的影响
除了刺突蛋白外,新突变体在 ORF8 中编码第 27 个氨基酸的位置形成了一个 “无意义突变” (Q27stop), 使 ORF8 蛋白提前编码结束,失去功能。
在大流行早期,全球范围内分离出多个 ORF8 缺失突变毒株,也有多项研究对其阐述过,该毒株在人类原代气道细胞中轻微影响复制,并且与较轻的临床感染和较少的感染后炎症有关,即致病性有所减弱。
总体来说,毒性弱的病毒传播得更快。新冠病毒有高达 30-40% 的感染者没有任何症状,现在还不清楚在 B.1.1.7系谱感染的区域,无症状感染者的比例有没有变化。
但新突变体 B.1.1.7系谱的感染率增加,使传播速度大大加快。总的感染人数多了,住院的人就多,所以在英国造成了恐谎!
随着对新突变体研究的进一步深入,更多的数据积累,这个问题将会有更好的答案。
14)新突变体对疫苗的影响
病毒突变了,现在的疫苗还有效吗?这是大家最关心的一个问题。
B.1.1.7系谱的突变还不足以使现有的疫苗失活,所以目前的疫苗仍然有效。疫苗的作用除了类似与上述的抗体药,诱导人体免疫系统产生中和抗体,阻断病毒与人体细胞的结合外,还能诱导细胞免疫,直接杀死病毒。
但由于新冠病毒容易突变,当大批人接种了疫苗后,大流行的病毒不能传播,只有产生新突变、能绕开疫苗保护的病毒才能继续传播。在疫苗的 “选择压力” 下,未来病毒发生 “疫苗逃逸”的可能是存在的。
如果出现这种情况,那就要研制新的、针对新突变的疫苗。
15)新突变体对抗新冠药物的影响
目前被证明有效的抗新冠药有限,吉利德公司的瑞德西韦获得了 FDA 的紧急授权使用。瑞德西韦的作用机制是抑制病毒 “RNA聚合酶” 的活性,从而抑制 RNA 病毒的增殖:
瑞德西韦其实是一种类似核苷酸 “A” 的化学分子,在新冠病毒复制"负链RNA" 时,这种 "假A” 被掺杂进去,使带有 “假A” 的 "负链RNA" 无法复制出子代 “正链RNA”,从而阻止病毒的继续感染。所以,瑞德西韦的作用机制与病毒的突变无关,应该不受病毒突变的影响。
另一种能显著减低重症病人死亡率的消炎药地塞米松(dexamethasone)及其类似药物的作用机理则完全不同,这类药物不是针对病毒的,它们抑制人体的免疫系统。所以,病毒的突变对这类药物也不会有任何的影响。
对于抗病毒的抗体药,如上所述,现在可能还没有影响,但在将来随着新突变的产生和积累,抗体药失去作用的可能性是存在的。
希望你从本文中了解到新冠病毒突变的来龙去脉,解除了你对新突变体的恐慌!
祝你和家人安全健康,节日快乐!
参考文献: