1. Introduction
As of mid-May 2021, the SARS-CoV-2 pandemic has caused more than 160 million cases with more than 3.4 million deaths reported to the World Health Organization (https://covid19.who.int/). At the same time, over 1.4 million vaccine doses have been administered throughout the world, and a race with the virus has been engaged in which, as more people are immunized through natural infection or because of vaccination, new virus variants emerge and take over the previously dominating strains [1]. These variants are selected because they are more apt to circulate in the presence of herd immunity. It remains to understand how far the virus can evolve in the face of the human immune response while maintaining its fitness, and how efficient the current vaccines will be in the long term to stop its dissemination and the economic tall imposed on society.
The development of novel and efficient vaccines has been made at an unprecedented pace, in part because the timing was ripe to test novel strategies such as mRNA vaccines, which had only been tried as anti-cancer strategies [2, 3]. Or such as the use of adenovirus vectors, which had been advanced during the 2014–2016 Ebola outbreak in West Africa, an epidemic that had receded before large clinical vaccine trials could be deployed [4]. What these successful anti-Covid-19 vaccines have in common is the immunogen that they carry, obtained by applying new concepts of structure-based vaccine design [5]. The virus spike protein was thus stabilized in an inactive state mimicking its otherwise metastable “pre-fusion” form present at the surface of infectious virus particles. Indeed, the spike protein is the sole target of virus neutralizing antibodies, but is intrinsically metastable as is must come apart to allow virus entry into cells by inducing the fusion of the viral envelope with the target cell membrane. Structural biology played a very important role in devising strategies to cope with its instability by engineering stable versions that preserve the relevant epitopes to be presented to the immune system to elicit strongly neutralizing antibodies. Previous studies on other enveloped viruses, such as HIV and the respiratory syncytial virus (RSV, responsible for severe bronchiolitis in infants and the elderly or immunocompromised individuals), which also display a highly unstable envelope protein at their surface, had paved the way for the coronavirus work [6, 7]. For both HIV and RSV, the situation is more complex as the epitopes targeted by the most potently and broadly neutralizing antibodies are only present in the intact ectodomain folded in its pre-fusion form. We now know, however, that the most potently neutralizing antibodies against the SARS-like viruses are directed to the receptor binding domain (RBD). This domain has the advantage that it can be produced independently of the rest of the spike, presenting by itself relevant epitopes to the immune system to elicit neutralizing antibodies [8]. Yet the formulation used in the current vaccines, using the full-length spike protein stabilized with two internal proline mutations, has proven remarkably efficient to stimulate the production of protecting antibodies, especially when administered in an mRNA form [9, 10].
I provide below a description of the ACE2 receptor and the spike protein together with an analysis of the conservation of the surfaces of interaction in both proteins across mammals and across SARS-like coronaviruses. I also summarize the knowledge gathered over the years on the mechanism of membrane fusion driven by enveloped viruses and how they apply to SARS-CoV-2. I end by illustrating that the mutations observed in the variants of concern display a clear clustering on three regions of the spike. In particular, in the receptor binding domain, they map to a rim all around the surface of interaction with ACE2.
2. The sarbecoviruses
The Coronaviridae family is divided into two subfamilies. The classic coronaviruses are grouped within the sub-family Orthocoronavirinae, which contains four genera: α-, β-, γ- and δ-coronaviruses. Only the α- and -β-Coronavirus genera include human pathogenic viruses. The SARS-like viruses form a subgenus, termed Sarbecovirus, within the β-Coronavirus genus. Of the four subgenera in this genus, only a subset of the sarbecoviruses were found to use ACE2 as receptor [11]. In this context, it is interesting to note that the human NL63 seasonal coronavirus, which belongs to the α-Coronavirus genus and is therefore quite distant to the sarbecoviruses, also uses ACE2 as receptor [12], although its receptor binding domain and its mode of recognition of ACE2 are unrelated to those of the sarbecoviruses [13], suggesting a convergence in evolution to use the same receptor. Another finding worth mentioning is that, for most coronaviruses the receptor is a membrane bound peptidase. For instance, amino-peptidase N (APN) is used by the human seasonal α-coronavirus 229E [14] as well as the porcine α-coronaviruses [15]. APN is a metal-dependent aminopeptidase playing multiple physiological functions, pain regulation, blood pressure homeostasis, angiogenesis of tumor cells, among others [16]. Similarly, the β-coronavirus Middle-East respiratory syndrome virus (MERS-CoV) uses dipeptidyl peptidase 4 (DPP4) as receptor [17]. DPP4 is a serine protease cleaving at the N terminus of physiological peptides involved in controlling apoptosis, immune regulation and signal transduction [18, 19, 20]. The catalytic activity is not required for virus recognition of any of these peptidase receptors, and the binding site recognized by the spike protein is away from the catalytic site. Yet it is intriguing that various coronaviruses from different genera have converged to use cell-surface peptidases for entry, and the potential relations to their pathogenicity remain an open field of investigation [21].
3. The ACE2 receptor
In 2003 Farzan and colleagues identified the angiotensin-converting enzyme 2 (ACE2) as the main receptor for the severe acquired respiratory syndrome coronavirus (SARS-CoV) [22]. The new coronavirus, SARS-CoV-2, was shown to use the same receptor [23]. ACE2 is a type I single-pass trans-membrane protein present at the cell surface of multiple tissues in various organisms. It is a component of the renin–angiotensin system (RAS) that controls blood volume and systemic vascular resistance, playing a crucial role in protection from high blood pressure and cardiovascular disease [24]. The other components of this hormone system are the soluble aspartic protease renin and the angiotensinogen (AGT) precursor, as well as the membrane-bound angiotensin converting enzyme (ACE) and different G-protein coupled receptors (GPRs) specific for the various angiotensin peptides derived from AGT cleavage. Cleavage of AGT by renin is the rate-limiting step [25] and is tightly regulated to maintain normal blood pressure, avoiding hypertension and other cardiovascular diseases. AGT is a 452 amino acid (aa) long circulating protein belonging to the serpin family of protease inhibitors [26, 27], albeit with no inhibitor function. Renin cleaves AGT at its N-terminus to generate angiotensin I (Ang-I) [28, 29], a decapeptide that is the substrate for ACE, which converts it to Ang-II (Figure 1). The Ang II octapeptide hormone is important for blood pressure homeostasis through its interaction with the GPR AP1, leading to increased blood pressure. The role of the carboxypeptidase ACE2 is to remove the C-terminal phenylalanine residue of Ang II to make Ang (1-7) [30, 31, 32], which binds to the GPR Mas [33, 34]. The Ang (1, 7)/GPR Mas interaction leads to vasodilation and protection from excessive blood pressure, contributing to vascular pressure homeostasis. Infection by a virus is known to cause downregulation of the expression if its entry receptor, as seen for instance with HIV and its CD4 receptor [35]. The reason is that low amounts of receptor in infected cells helps virus propagation away from the site in which the virus was replicated within an organism to more easily reach other tissues. SARS-CoV-2 downregulation of the ACE2 receptor may thus result in an imbalance in the Ang II/Ang(1/7) peptide ratio, potentially contributing to its pathogenicity.
Human ACE2 was first identified in 2000 [30, 31] as a paralog of the angiotensin-converting enzyme (ACE), discovered in 1956 [38]. The corresponding gene, located at position p22.2 in the X chromosome, contains 18 exons, and gives rise to several ACE2 isoforms via alternative splicing. The longest isoform is 805 amino acids long and is expressed in a broad range of human tissues, including endothelial cells in blood vessels, enterocytes in the intestine, alveolar cells in the lung, nasal epithelial cells, all organs that are targeted by SARS-CoV-2. The organization of this ACE2 isoform is depicted in Figure 1B. Its ectodomain is composed of two structural domains [39]: an N-terminal catalytic domain with zinc metallopeptidase activity exhibiting 42% amino acid sequence identity with each the two catalytic domains of ACE [40] (Figure 2). The ACE2 protease domain is followed by a collectrin-like domain, which associates with the neutral amino acid transporter B0AT1 (Figure 1C), at least in intestinal epithelial cells. It has been shown that this association is required for expression of the transporter on the luminal surface of intestinal epithelial cells [41, 42]. The collectrin domain of human ACE2 shares 50% sequence identity with human collectrin, a type I single-pass trans-membrane glycoprotein that binds amino acid transporters of the B0 type, such as B0A1 and B0A3. These transporters, which belong to the solute carrier 6 (SLC6) family [43], are only active when collectrin is bound [44]. The activity of collectrin was also proposed to play a role in blood pressure homeostasis [45].
The spike protein binds at the membrane-distalmost surface of ACE2, away from the active site cleft (Figure 1C, right panels). Amino acid sequence comparisons show that the surface patch recognized by the RBD is variable across different mammalian species, contrary to the highly conserved cleft harboring the ACE2 catalytic site. The structure also shows that the two spike-interacting sites present in the (ACE2/B0A1) dimer are located such that two RBDs from the same spike cannot bind simultaneously, implying that two different spike trimers bind to one receptor dimer [37]. This situation has the potential of clustering the spikes on the virion side facing the cell membrane, where each spike trimer may bind up to three ACE2 dimers, each bound to a second spike and resulting in cluster formation. No study has so far addressed the stoichiometry of binding and whether the proposed clustering has a functional effect for virus entry, either in triggering fusion directly at the plasma membrane or by stimulating endocytosis with subsequent fusion in late endosomes.
3.1. The coronavirus spike glycoprotein
The sarbecovirus S polypeptide chain is roughly 1300 amino acids long with multiple asparagine-linked glycans in its ectodomain. It forms a trimer anchored to the viral membrane via a C-terminal transmembrane helix (Figure 2). S is activated by proteolytic cleavage to generate two subunits: S1 (roughly the N-terminal half of S), and S2, the membrane-anchored C-terminal half. SARS-CoV-2 features an insertion of a polybasic sequence at the S1/S2 cleavage site, which allows for S processing by furin, a trans-Golgi network resident protease in the virus producer cells. Cleavage by furin appears not to take place extensively, and most S trimers were reported to be only partially cleaved (i.e., cleavage occurring in only one or two of the three protomers of the trimer) [47]. Such partial cleavage may have functional consequences, as proposed in Figure 3B.
4. The furin cleavage site insertion
This spike polybasic site has been shown to be involved in interactions with neuropilin 1 [56, 57]. The neuropilins bind vascular endothelial growth factors (VEGFs) at the carboxyl-terminal sequence generated by furin cleavage of the VEGF precursor [58]. Neuropilins are present in the olfactory epithelium, and could play a role in the observed anosmia in Covid-19 patients [59] and potentially in the virus invasion of the central nervous system [60]. The same polybasic furin site has also been proposed to interact with the nicotinic acetylcholine receptor (nAChR) [61], by analogy to a similar motif present in the glycoprotein of rabies virus and in several snake neurotoxins [62]. No evidence has been provided so far, however, for a direct interaction between the nAChR and the polybasic site. Indirect evidence lies in the fact that ivermectin (IVM), an antiparasitic compound that is also a positive allosteric effector of the α7 neuronal nACHR [63] was shown to attenuate the neurological symptoms in the hamster model for Covid 19 [64]. IVM did not reduce the viral load in the infected hamsters, only the Covid 19 pathological symptoms, contradicting a previous report [57] suggesting that IVM had a direct antiviral effect. In any case, whatever the role of the polybasic sequence, independent studies have demonstrated that SARS-CoV-2 mutants in which it is deleted are less pathogenic than the parent virus [65, 66].
5. The spike protein on the viral membrane
The S trimer projects about 25 nm from the viral membrane, displaying a prominent, globular yet dynamic “head” and a flexible “stalk” region (Figure 2A). The three-dimensional (3D) structure of the spike head has been determined by cryogenic electron microscopy (cryo-EM) and single-particle averaging for several coronaviruses, the first of which were reported back in 2016 [67, 68] (reviewed in [69]) to resolutions of about 3 Å or better, including that of the SARS-CoV-2 spike [47, 70, 71]. The full spike has been visualized on SARS-CoV-2 virions by cryo-electron tomography analyses of inactivated virus particles using sub-tomogram averaging to reach a resolution beyond 1 nm [49, 50, 51]. S1, which remains non-covalently attached to S2 in the cleaved trimer, contains two structural domains, an N-terminal domain (NTD) and the RBD. The fold of both of these domains is independent of the rest of the chain (Figure 2). The structural studies have shown that the RBD displays a dynamic equilibrium between two conformations, termed “down” and “up”. The spike head trimer has thus been captured in four different forms, a completely closed form with all three RBDs in the down conformation, an open conformation with all three RBDs up, and intermediately open forms with one or two RBDs up [54, 52]. Only in the up conformation the RBD can engage ACE2, which shifts the equilibrium towards the open form of the spike.
5.1. The S2 subunit: a “class I” fusion protein
S2 is responsible for catalyzing the membrane fusion reaction required for entry. This reaction follows S1 dissociation from the spike trimer upon ACE2 binding, which releases S2 from important constrains derived by folding within the context of the S precursor. Structural studies have characterized three structural classes of viral membrane fusion proteins (reviewed by [72]). S2 belongs to class I, together with the fusion proteins found in multiple enveloped viruses, such as paramyxoviruses, influenza viruses, retroviruses and other viral families. All of them undergo a functional conformational change from a metastable pre-fusion to a highly stable post-fusion form to drive fusion. The energy stored in the metastable form is coupled to target-membrane binding to catalyze lipid merger. In particular, the proteins of the three classes were shown to adopt a highly stable “hairpin” conformation in the post-fusion form. In the prototypic class I proteins, such as influenza virus HA2 or HIV-1 gp41, the N-terminal half forms a long “N-helix” that makes a central, parallel trimeric coiled coil, while the C-terminal half runs antiparallel to the N helix (in some cases as a “C-helix, like in gp41) along the grooves of the coiled coil. The resulting “hairpin” is such that its N- and C-terminal ends are at the same end of a long trimeric rod. A hydrophobic segment termed “fusion peptide” (FP) is located immediately upstream the N helix. This segment is responsible for insertion into the target membrane during the first steps of the fusogenic conformational rearrangement, a step absolutely required to drive the fusion process, as outlined in Figure 3A. The prototypical class I fusion proteins, such as those in influenza virus or in retroviruses, have the fusion peptide at the N-terminal end, and the hairpin is formed exclusively by the region in between the FP and the C-terminal TM anchor. In the coronavirus spike protein, similar to the paramyxovirus counterpart, this is not the case as the fusion peptide is at the N-terminus of S2′, which is internal to S2 (see Figure 2A), and regions upstream the S2′ cleavage site are also present as part of the hairpin. The structural similarities between coronavirus S2 and the paramyxovirus fusion (F) protein suggest that they had a common origin [46], forming a distinct subclass compared to the prototypical class I proteins. There are two heptad-repeat regions in the S2′ moiety, termed HR1 and HR2 (labeled in Figure 2A), which have a strong potential to form alpha helices. In the prefusion S trimer, the HR1 region is spring-loaded in the form a bundle of short helical segments under a “crown” formed by the S1 moiety (Figure 3), while HR2 is part of the flexible stalk (Figure 2B). To stabilize the prefusion spike trimer used in the current vaccines was engineered to introduce proline residues at the connections between the short helices of the spring-loaded HR1 [73, 74, 75]. Because prolines are helix-breaking residues, the mutated HR1 cannot spring out to forming a long helix as shown in Figure 3C, resulting in an overall stabilized from that is non-fusogenic.
5.2. Membrane fusion mechanism
The S trimer becomes metastable upon proteolytic maturation into S1 and S2. Subsequent binding to ACE2 on cells shifts the equilibrium of the spike toward the open form, within which the S1/S2 interactions were shown to be weaker [54]. Since each spike is bound to more than one receptor, mechanical constraints have the potential of exerting forces pulling the S1 subunits in opposite directions, ripping off the spike head and releasing the receptor-bound S1 moiety from the spike surface (Figure 2B). Loss of the S1 crown on the activated spike in turn causes the HR1 moiety to spring out and form a long helix and projecting the FP a distance of about 15 nm to reach and stably insert into the target membrane (Figure 3C). This inserted form of S2, bridging the two membranes at a distance of about 30 nm, is a transient long extended intermediate trimer. The HR2 moiety, which is initially distantly located, near the viral membrane, eventually binds to the grooves of the trimeric HR1 coiled coil to make the trimer of hairpins observed in the post-fusion form (shown in Figure 3C, right panel, where only one protomer of the trimer is shown for clarity). In its final conformation, S2 thus forces viral and target membrane against each other, overcoming the repulsion between the two outer leaflets, as in steps (iv) and (v) in Figure 3A. Repulsion arises when two membranes are brought under 1 nm distance due to the required dehydration of the lipid heads to allow direct contact [76, 77]. The hairpin conformation of the fusion protein thus catalyzes the membrane fusion reaction by forcing the close apposition of the outer lipid bilayers, lowering the kinetic barrier for fusion, which is an overall exothermic reaction. Membrane fusion ensues via a hemifusion (step (v) in Figure 3A) in which only the outer leaflets merge, followed by formation of a fusion pore (step vi), which then broadens to make a single, fused membrane.
6. The spike protein in the SARS-CoV-2 variants of concern
New SARS-CoV-2 variants with mutations increasing inter-individual transmission or allowing immune evasion have emerged recently and are displacing the initial circulating viral strains [78, 79, 80, 81]. Genomic changes in these VOCs have been associated with increased person-to-person transmission and/or escape from post-infection or post-vaccination immunity. Although the mutations in VOCs occur throughout the viral genome, there are key mutations in the spike protein that control virus transmission and/or are targeted by neutralizing antibodies. The first variant identified presented the D614G mutation in the spike [82], a mutation has now become fixed in the circulating virus and was shown to increase virus transmissibility [83, 78, 84, 85, 86, 87]. As demonstrated recently for the B.1.1.7 variant [88], the variants may also cause more severe disease. The new variants are often referred to by country or region where they were first detected: B.1.1.7 is called the UK variant, B.1.351 the South Africa (SA) variant, P.1 the Brazil (BR) variant, B.1.429 the California variant. Novel variants have also emerged in India, which is undergoing a large surge of the Covid 19 epidemic. Although the predominant strain circulating there has been B.1.1.7, a new lineage, B.1.617, is taking over and is diversifying into several sub-lineages [89, 90, 91, 92, 93, 94, 95]. This variant has now reached other countries, notably the UK where about half of the new cases belong to variant 1.617.2.
Figure 4 lists the positions on the spike of the mutations that have appeared in the main VOCs, including the three new Indian sub-lineages. These mutations cluster in in several regions of the spike head, in particular the N-terminal domain. There is also clustering in the RBD and near the S1/S2 cleavage sites. Some mutations map to the HR1 helix and the chain reversal region in the post-fusion hairpin (between the red and blue halves of S2′ colored as in the diagram of Figure 3A). Although the majority of the mutations map to the trimer surface, a number of them affect contact residues buried at the trimer interface (see Figure 4B, right panels). This is the case for the mutations in the S2 moiety and those that are in S1 near the S1/S2 site (from residue 570 on). An analysis of the amino acid conservation of the spike protein among sarbecoviruses predicted to use ACE2 and infecting different mammals (Figure 5) showed that the location of the VOC mutations at the spike surface lies in variable regions, as expected. Importantly, although the most variable surface maps to the NTD, the ACE2 binding surface of the RBD is is also highly variable (compare the 4th and 5th columns in Figure 5A)—in line with the observation that the ACE2 patch that is recognized by the RBD is also variable across mammals (Figure 1C). The open spike exposes a conserved region of S2 at the spike top that corresponds to the spring-loaded S2 (Figure 5A, right panels). This region does not appear to be immunogenic, most likely because the completely open spike is exposed only transiently, immediately before its irreversible fusogenic conformational change, as indicated by arrows in Figure 5B. The location and relative orientation of the ACE2 binding surface of the RBD (yellow patch in Figure 5B, especially in the 5th panel) is also compatible with a “ripping off” effect wen more than one ACE2 is bound, as they can pull the RBD in opposite directions, thereby disrupting the spike and inducing the conformational change.
7. VOC mutations in the RBD and escape to neutralizing antibodies
Although the immune response against the spike is directed to multiple sites [97], the RBD has been shown to be the target of the vast majority of the most potent human neutralizing antibodies against SARS-CoV-2. Multiple reports describing the cloning and isolation of monoclonal antibodies (mAbs) from convalescent individuals and vaccinees, together with structural studies by X-ray crystallography and/or cryo-EM have been reported [98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 8, 108]. These studies attest to the potency of the RBD-specific mAbs. Overall, they have been categorized into four broad classes, depending on the location of their epitope at the RBD surface [98]. The most strongly neutralizing mAbs, acting with near picomolar efficiently, target the ACE2 binding patch (yellow surface in Figure 6) [103]. These antibodies are divided into two classes: those in class 1 require the RBD in the up conformation to bind, whereas those in class 2 bind irrespective of having the RBD up or down. The location of the corresponding epitopes is outlined in Figure 6D, which shows that the epitope lo class 1 mAbs includes a region that is buried in the closed conformation of the spike, whereas the class 2 does not (compare panel D, top with panel A, as well as the bottom panels of C and D). Two additional categories of antibodies have been identified in which the epitope is away from the ACE2 patch: class 3 mAbs target an exposed surface, whereas the epitope of class 4 is buried and require at least two RBDs in the up conformation for binding [109, 110, 111, 112]. Class 4 mAbs are among those with the broadest reactivity across sarbecoviruses, [101], as can be seen by comparing panels D and B of Figure 6. The mutations in the VOCs all result in reduced binding of the mAbs of classes 1 and 2, suggesting that these are the dominant form controlling virus circulation in the population in general.
The RBD mutations that have appeared in the VOCs are not randomly distributed: they make a rim all around the periphery of the ACE2 binding surface (Figure 6D, bottom panel). This is in contrast to the variability observed when comparing across sarbecoviruses, in which the whole surface is variable. The notion emerging from this analysis is that the virus samples all mutations that are still compatible with binding to the human ACE2 yet interfering with antibody binding. It remains to be seen how far the virus can continue this trend and escape the human immune response while still maintaining its fitness.
8. Concluding remarks
This review covers most of the structural information available on the coronavirus spike protein, its interaction with ACE2, and the mechanistic information that can be extracted from the structural studies. The location of the mutations in the new SARS-CoV-2 variants, distributed throughout the spike surface, further suggest that there is epistasis between them and also that a likely allosteric effect may expose differently the three cleavage sites to furin, a feature that appears to be functionally important. The mutations may also affect in multiple ways the conformational change triggered by receptor binding. The biology of the coronavirus spike is far from having revealed its secrets, and there remains a great deal to learn. Still, the amount of information gathered on this protein in 18 months of the pandemic has been unprecedented, as is the pandemic itself. Only by understanding the spike function in mechanistic detail—as well that of the other viral proteins involved in other steps of the viral cycle—can we expect to be better prepared to face future outbreaks of emerging zoonotic viruses such as novel coronaviruses.
Acknowledgments
I thank my colleagues in the structural virology unit for discussions and the members of the Pasteur Coronavirus Task Force for support. All the structural illustrations used were prepared with The PyMOL Molecular Graphics System, Version 2.1 Schrödinger, LLC. The plotting of amino acid conservation to the protein surface was done using EsPript [113]. I thank P. Guardado-Calvo for tips about using this software.
French version
1. Introduction
À la mi-mai 2021, la pandémie de SRAS-CoV-2 a provoqué plus de 160 millions de cas et plus de 3,4 millions de décès ont été signalés à l’Organisation mondiale de la santé (https://covid19.who.int/). Dans le même temps, plus de 1,4 million de doses de vaccin ont été administrées dans le monde et une course au virus s’est engagée, dans laquelle, à mesure que davantage de personnes sont immunisées par une infection naturelle ou grâce à la vaccination, de nouveaux variants du virus émergent et prennent le dessus sur les souches précédemment dominantes [1]. Ces variants sont sélectionnés parce qu’ils sont plus aptes à circuler en présence d’une immunité collective. Il reste à comprendre jusqu’à quel point le virus peut évoluer face à la réponse immunitaire humaine tout en conservant son aptitude, et quelle sera l’efficacité des vaccins actuels à long terme pour arrêter sa dissémination et le poids économique imposé à la société.
Le développement de vaccins nouveaux et efficaces s’est fait à un rythme sans précédent, en partie parce que le moment était propice pour tester de nouvelles stratégies telles que les vaccins à ARNm, qui n’avaient été essayés que comme stratégies anticancéreuses [2, 3]. Ou comme l’utilisation de vecteurs adénoviraux, qui avait été avancée lors de l’épidémie d’Ebola de 2014–2016 en Afrique de l’Ouest, une épidémie qui avait reculé avant que de grands essais cliniques de vaccins puissent être déployés [4]. Le point commun de ces vaccins anti-Covid-19 réussis est l’immunogène qu’ils portent, obtenu en appliquant de nouveaux concepts basés sur la structure de la protéine de spicule (S) [5]. Cette protéine a ainsi été stabilisée dans un état inactif imitant sa forme métastable « pré-fusion » présente à la surface des particules virales infectieuses. En effet, la protéine S est la seule cible des anticorps neutralisant le virus, mais elle est intrinsèquement métastable car elle doit se désagréger pour permettre l’entrée du virus dans les cellules en induisant la fusion de l’enveloppe virale avec la membrane de la cellule cible. La biologie structurale a joué un rôle très important dans la conception de stratégies permettant de faire face à son instabilité en élaborant des versions stables qui préservent les épitopes pertinents à présenter au système immunitaire pour susciter des anticorps fortement neutralisants. Des études antérieures sur d’autres virus enveloppés, tels que le VIH et le virus respiratoire syncytial (VRS, responsable de bronchiolites graves chez les nourrissons, les personnes âgées ou immunodéprimées), qui présentent également une protéine d’enveloppe très instable à leur surface, ont ouvert la voie aux travaux sur les coronavirus [6, 7]. Pour le VIH et le VRS, la situation est plus complexe car les épitopes ciblés par les anticorps les plus puissants et les plus largement neutralisants ne sont présents que dans l’ectodomaine intact plié sous sa forme de pré-fusion. Cependant, nous savons maintenant que les anticorps les plus puissants et les plus neutralisants contre les virus semblables au SRAS sont dirigés vers le domaine de liaison au récepteur (RBD). Ce domaine présente l’avantage de pouvoir être produit indépendamment du reste de la protéine, présentant par lui-même des épitopes pertinents pour le système immunitaire afin de susciter des anticorps neutralisants [8]. Cependant, la formulation utilisée dans les vaccins actuels, qui utilise la protéine S complète stabilisée par deux mutations internes en proline, s’est avérée remarquablement efficace pour stimuler la production d’anticorps protecteurs, en particulier lorsqu’elle est administrée sous forme d’ARNm [9, 10].
Je présente ci-dessous une description du récepteur ACE2 et de la protéine S ainsi qu’une analyse de la conservation des surfaces d’interaction des deux protéines chez les mammifères et chez les coronavirus du type SRAS. Je résume également les connaissances acquises au fil des ans sur le mécanisme de fusion membranaire piloté par les virus enveloppés et la manière dont elles s’appliquent au SRAS-CoV-2. Je termine en illustrant le fait que les mutations observées dans les variantes en cause présentent un regroupement clair sur trois régions de la pointe. En particulier, dans le domaine de liaison aux récepteurs, elles sont cartographiées sur un pourtour tout autour de la surface d’interaction avec l’ACE2.
2. Les Sarbecovirus
La famille des Coronaviridae est divisée en deux sous-familles. Les coronavirus classiques sont regroupés dans la sous-famille des Orthocoronavirinae, qui contient quatre genres : α-, β-, γ- et δ-coronavirus. Seuls les genres α- et -β-Coronavirus comprennent des virus pathogènes pour l’homme. Les virus semblables au SRAS forment un sous-genre, appelé Sarbecovirus, au sein du genre β-Coronavirus. Parmi les quatre sous-genres de ce genre, seul un sous-ensemble de sarbecovirus utilise l’ACE2 comme récepteur [11]. Dans ce contexte, il est intéressant de noter que le coronavirus saisonnier humain NL63, qui appartient au genre α-Coronavirus et qui est donc assez éloigné des sarbecovirus, utilise également l’ACE2 comme récepteur [12], bien que son domaine de liaison au récepteur et son mode de reconnaissance de l’ACE2 soient sans rapport avec ceux des sarbecovirus [13], ce qui suggère une convergence dans l’évolution pour utiliser le même récepteur. Un autre résultat qui mérite d’être mentionné est que, pour la plupart des coronavirus, le récepteur est une peptidase liée à la membrane. Par exemple, l’amino-peptidase N (APN) est utilisée par le α-coronavirus saisonnier humain 229E [14] ainsi que par les α-coronavirus porcins [15]. L’APN est une aminopeptidase métal-dépendante jouant de multiples fonctions physiologiques, régulation de la douleur, homéostasie de la pression sanguine, angiogenèse des cellules tumorales, entre autres [16]. De même, le β-coronavirus du syndrome respiratoire du Moyen-Orient (MERS-CoV) utilise la dipeptidyl peptidase 4 (DPP4) comme récepteur [17]. La DPP4 est une sérine protéase qui clive l’extrémité N-terminale des peptides physiologiques impliqués dans le contrôle de l’apoptose, la régulation immunitaire et la transduction des signaux [18, 19, 20]. L’activité catalytique n’est pas requise pour la reconnaissance par le virus de l’un de ces récepteurs peptidases, et le site de liaison reconnu par la protéine S est éloigné du site catalytique. Pourtant, il est frappant de constater que divers coronavirus de genres différents ont convergé pour utiliser des peptidases de surface cellulaire pour entrer dans la cellule, et les relations potentielles avec leur pathogénicité restent un champ d’investigation ouvert [21].
3. Le récepteur ACE2
En 2003, Farzan et ses collègues ont identifié l’enzyme 2 de conversion de l’angiotensine (ACE2) comme le principal récepteur du coronavirus du syndrome respiratoire acquis sévère (SARS-CoV) [22]. Il a été montré que le nouveau coronavirus, SARS-CoV-2, utilise le même récepteur [23]. L’ACE2 est une protéine transmembranaire à passage unique de type I présente à la surface des cellules de multiples tissus dans divers organismes. C’est un composant du système rénine–angiotensine (SRA) qui contrôle le volume sanguin et la résistance vasculaire systémique, jouant un rôle crucial dans la protection contre l’hypertension artérielle et les maladies cardiovasculaires [24]. Les autres composants de ce système hormonal sont la rénine, protéase aspartique soluble, et le précurseur de l’angiotensinogène (AGT), ainsi que l’enzyme de conversion de l’angiotensine (ECA) liée à la membrane et différents récepteurs couplés aux protéines G (GPR) spécifiques des divers peptides d’angiotensine dérivés du clivage de l’AGT. Le clivage de l’AGT par la rénine est l’étape limitant la vitesse de réaction [25] et est étroitement régulé pour maintenir une pression sanguine normale, évitant ainsi l’hypertension et d’autres maladies cardiovasculaires. L’AGT est une protéine circulante de 452 acides aminés (aa) qui appartient à la famille des serpins, des inhibiteurs de protéase [26, 27], bien qu’elle n’ait pas de fonction inhibitrice. La rénine clive l’AGT à son extrémité N-terminale pour générer l’angiotensine I (Ang-I) [28, 29], un décapeptide qui est le substrat de l’ECA, qui le convertit en Ang-II (Figure 1). L’hormone octapeptidique Ang II joue un rôle important dans l’homéostasie de la pression artérielle grâce à son interaction avec le GPR AP1, ce qui entraîne une augmentation de la pression artérielle. Le rôle de la carboxypeptidase ACE2 est d’éliminer le résidu phénylalanine C-terminal de l’Ang II pour produire l’Ang (1-7) [30, 31, 32], qui se lie au GPR Mas [33, 34]. L’interaction Ang (1, 7) / GPR Mas entraîne une vasodilatation et une protection contre une pression sanguine excessive, contribuant ainsi à l’homéostasie de la pression vasculaire. L’infection par un virus est connue pour provoquer une régulation négative de l’expression de son récepteur d’entrée, comme c’est le cas par exemple avec le VIH et son récepteur CD4 [35]. La raison en est que de faibles quantités de récepteurs dans les cellules infectées aident le virus à se propager loin du site où il s’est répliqué dans un organisme pour atteindre plus facilement d’autres tissus. La régulation à la baisse (downregulation) du récepteur ACE2 du SRAS-CoV-2 pourrait donc entraîner un déséquilibre du rapport entre les peptides Ang II / Ang(1/7), ce qui pourrait contribuer à sa pathogénicité.
L’ACE2 humaine a été identifiée pour la première fois en 2000 [30, 31] comme un paralogue de l’enzyme de conversion de l’angiotensine (ACE), découverte en 1956 [38]. Le gène correspondant, situé en position p22.2 sur le chromosome X, contient 18 exons et donne naissance à plusieurs isoformes d’ACE2 par épissage alternatif. L’isoforme la plus longue contient 805 acides aminés et est exprimée dans un large éventail de tissus humains, y compris les cellules endothéliales des vaisseaux sanguins, les entérocytes de l’intestin, les cellules alvéolaires du poumon, les cellules épithéliales nasales, tous des organes qui sont la cible du SRAS-CoV-2. L’organisation de cette isoforme de l’ACE2 est représentée sur la Figure 1B. Son ectodomaine est composé de deux domaines structurels [39] : un domaine catalytique N-terminal avec une activité zinc métallopeptidase présentant 42% d’identité de séquence d’acides aminés avec chacun des deux domaines catalytiques de l’ACE [40] (Figure 2). Le domaine protéase de l’ACE2 est suivi d’un domaine de type collectrine, qui s’associe avec le transporteur d’acides aminés neutres B0AT1 (Figure 1C), au moins dans les cellules épithéliales intestinales. Il a été démontré que cette association est nécessaire pour l’expression du transporteur sur la surface luminale des cellules épithéliales intestinales [41, 42]. Le domaine collectrine de l’ACE2 humain partage 50% d’identité de séquence avec la collectrine humaine, une glycoprotéine transmembranaire à passage unique de type I qui se lie aux transporteurs d’acides aminés de type B0, tels que B0A1 et B0A3. Ces transporteurs, qui appartiennent à la famille des transporteurs de solutés 6 (SLC6) [43], ne sont actifs que lorsque la collectrine est liée [44]. Il a également été proposé que l’activité de la collectrine joue un rôle dans l’homéostasie de la pression sanguine [45].
La protéine S se lie à la surface de l’ACE2 la plus distale de la membrane, loin de la fente du site actif (Figure 1C, panneaux de droite). Les comparaisons de séquences d’acides aminés montrent que le patch de surface reconnu par le RBD est variable à travers les différentes espèces de mammifères, contrairement à la fente hautement conservée qui abrite le site catalytique de l’ACE2. La structure montre également que les deux sites d’interaction avec S, présents dans le dimère (ACE2/B0A1) sont situés de telle sorte que deux RBDs du même spicule trimérique ne peuvent pas se lier simultanément, ce qui implique que deux spicules trimèriques différents se lient à un dimère du récepteur [37]. Cette situation a le potentiel de regrouper les spicules sur le côté du virion faisant face à la membrane cellulaire, où chaque spicule peut lier jusqu’à trois dimères ACE2, chacun étant lié à un second spicule, ce qui entraîne la formation de clusters. Jusqu’à présent, aucune étude ne s’est penchée sur la stœchiométrie de la liaison et sur la question de savoir si le regroupement proposé aurait un effet fonctionnel sur l’entrée du virus, soit en déclenchant la fusion directement au niveau de la membrane plasmique, soit en stimulant l’endocytose avec fusion ultérieure dans les endosomes tardifs.
3.1. La glycoprotéine S du coronavirus
La chaîne polypeptidique de S du sarbecovirus est longue d’environ 1300 acides aminés et comporte de multiples glycanes liés à l’asparagine dans son ectodomaine. Elle forme un trimère ancré à la membrane virale par une hélice transmembranaire C-terminale (Figure 2). S est activé par clivage protéolytique pour générer deux sous-unités : S1 (en gros la moitié N-terminale de S), et S2, la moitié C-terminale ancrée à la membrane. Le SARS-CoV-2 présente une insertion d’une séquence polybasique au niveau du site de clivage S1/S2, ce qui permet la protéolyse de S par la furine, une protéase résidant dans le réseau transgolgien dans les cellules productrices du virus. Le clivage par la furine ne semble pas avoir lieu de manière extensive, et la plupart des trimères de S ne sont que partiellement clivés (c’est-à-dire que le clivage ne se produit que dans un ou deux des trois protomères formant le trimère) [47]. Un tel clivage partiel peut avoir des conséquences fonctionnelles, comme le propose la Figure 3B.
4. L’insertion du site de clivage de la furine
Il a été montré que le site polybasique de S du SARS-CoV-2 est impliqué dans les interactions avec la neuropiline 1 [56, 57]. Les neuropilines lient les facteurs de croissance endothéliaux vasculaires (VEGFs) au niveau de la séquence carboxyl-terminale générée par le clivage par la furine du précurseur du VEGF [58]. Les neuropilines sont présentes dans l’épithélium olfactif et pourraient jouer un rôle dans l’anosmie observée chez les patients atteints de Covid-19 [59] et potentiellement dans l’invasion du système nerveux central par le virus [60]. Le même site polybasique de la furine a également été proposé pour interagir avec le récepteur nicotinique de l’acétylcholine (nAChR) [61], par analogie avec un motif similaire présent dans la glycoprotéine du virus de la rage et dans plusieurs neurotoxines de serpent [62]. Aucune preuve n’a cependant été apportée jusqu’à présent d’une interaction directe entre le nAChR et le site polybasique. Une preuve indirecte réside dans le fait que l’ivermectine (IVM), un composé antiparasitaire qui est également un effecteur allostérique positif du nAChR neuronal α7 [63], atténue les symptômes neurologiques dans le modèle hamster de Covid 19 [64]. L’IVM ne réduit la charge virale chez les hamsters infectés, mais uniquement les symptômes pathologiques du Covid 19, contredisant un rapport précédent [57] qui suggérait que l’IVM avait un effet antiviral direct. En tout état de cause, quel que soit le rôle de la séquence polybasique, des études indépendantes ont démontré que les mutants du SRAS-CoV-2 dans lesquels elle est supprimée sont moins pathogènes que le virus parent [65, 66].
5. La protéine S sur la membrane virale
Le trimère S dépasse d’environ 25 nm de la membrane virale, présentant une « tête » proéminente, globulaire mais dynamique, et une région « tige » flexible (Figure 2A). La structure tridimensionnelle (3D) de la tête du spicule a été déterminée par microscopie électronique cryogénique (cryo-EM) et moyennage de particules uniques pour plusieurs coronavirus, dont les premiers ont été rapportés en 2016 [67, 68] (revus dans [69]) à des résolutions d’environ 3 Å ou mieux, y compris celle du spicule du SRAS-CoV-2 [47, 70, 71]. Le spicule complet a été visualisé sur les virions de SARS-CoV-2 par des analyses de tomographie cryo-électronique de particules virales inactivées utilisant la moyennation des sous-tomogrammes pour atteindre une résolution supérieure à 1 nm [49, 50, 51]. S1, qui reste attaché de manière non covalente à S2 dans le trimère clivé, contient deux domaines structurels, un domaine N-terminal (NTD) et le RBD. Le repliement de ces deux domaines est indépendant du reste de la chaîne polypeptidique (Figure 2). Les études structurales ont montré que le RBD présente un équilibre dynamique entre deux conformations, « couché » et « debout ». La tête trimérique du spicule a donc été visualisée sous quatre formes différentes, une forme complètement fermée avec les trois RBD couchés, une conformation ouverte avec les trois RBD debout, et des formes intermédiairement ouvertes avec un ou deux RBD debout et les autres couchés [54, 52]. Ce n’est que dans la conformation debout que le RBD peut engager ACE2, ce qui déplace l’équilibre vers la forme ouverte du spicule.
5.1. La sous-unité S2 : une protéine de fusion de « classe I »
S2 est responsable de la catalyse de la réaction de fusion membranaire nécessaire à l’entrée. Cette réaction suit la dissociation de S1 du spicule lors de la liaison avec ACE2, ce qui libère S2 des contraintes dérivées de son repliement dans le contexte du précurseur S. Des études structurales ont permis de caractériser trois classes de protéines de fusion membranaire virale (examinées dans [72]). S2 appartient à la classe I, comme les protéines de fusion de nombreux virus enveloppés, tels que les paramyxovirus, les virus de la grippe, les rétrovirus et d’autres familles virales. Toutes ces protéines subissent un changement de conformation pour passer d’une forme métastable de pré-fusion à une forme hautement stable de post-fusion, afin d’entraîner la fusion membranaire. L’énergie stockée dans la forme métastable est couplée à la liaison de la membrane cible pour catalyser la fusion lipidique. En particulier, il a été démontré que les protéines des trois classes adoptent une conformation en « épingle à cheveux » très stable dans la forme post-fusion. Dans les protéines prototypiques de classe I, telles que la HA2 du virus de la grippe ou la gp41 du VIH-1, la moitié N-terminale forme une longue « hélice N » qui constitue Un trousseau trimérique torsadé d’hélices alpha parallèles, tandis que la moitié C-terminale est antiparallèle à l’hélice N (dans certains cas sous forme d’une « hélice C », comme dans la gp41) le long des rainures du trousseau. L’ « épingle à cheveux » qui en résulte est telle que ses extrémités N et C-terminales se trouvent du même côté d’une longue tige trimérique. Un segment hydrophobe, appelé « peptide de fusion » (FP), est situé immédiatement en amont de l’hélice N. Ce segment est responsable de l’insertion dans la membrane cellulaire pendant les premières étapes du réarrangement conformationnel fusogène, une étape absolument nécessaire pour conduire le processus de fusion, comme indiqué dans la Figure 3A. Les protéines de fusion prototypiques de classe I, comme celles du virus de la grippe ou des rétrovirus, ont le peptide de fusion à l’extrémité N-terminale, et l’épingle à cheveux est formée exclusivement par la région située entre le FP et l’ancre TM C-terminale. Dans la protéine du spicule des coronavirus, comme dans son homologue des paramyxovirus, ce n’est pas le cas car le peptide de fusion se trouve à l’extrémité N-terminale de S2′, qui est interne à S2 (voir Figure 2A), et les régions en amont du site de clivage de S2′ sont également présentes dans l’épingle à cheveux. Les similitudes structurelles entre la protéine S2 du coronavirus et la protéine de fusion (F) des paramyxovirus suggèrent qu’elles ont eu une origine commune [46], formant une sous-classe distincte par rapport aux protéines prototypiques de classe 1. Il existe deux régions à heptades répétées dans la partie S2′, appelées HR1 et HR2 (marquées sur la Figure 2A), qui ont un fort potentiel pour former des hélices alpha. Dans le trimère S de pré-fusion, la région HR1 est montée sur ressort sous la forme d’un faisceau de segments hélicoïdaux courts sous une « couronne » formée par la sous-unité S1 (Figure 3), tandis que HR2 fait partie de la tige flexible connectant à la membrane virale (Figure 2B). Pour stabiliser le spicule dans la forme pré-fusion utilisée dans les vaccins actuels, des mutations en proline ont été introduites aux connexions entre les hélices courtes de la HR1 chargée par ressort [73, 74, 75]. Les prolines étant des résidus de rupture d’hélice, le HR1 muté ne peut pas se déployer pour former une longue hélice, comme le montre la Figure 3C, ce qui donne un trimère globalement stabilisé qui n’est pas fusogène.
5.2. Mécanisme de fusion membranaire
Le trimère de S devient métastable après maturation protéolytique en S1 et S2. La liaison ultérieure à l’ACE2 sur les cellules déplace l’équilibre vers la forme ouverte, dans laquelle les interactions S1/S2 se sont avérées plus faibles [54]. Comme chaque spicule est lié à plus d’un récepteur, les contraintes mécaniques ont le potentiel d’exercer des forces tirant les sous-unités S1 dans des directions opposées, arrachant la tête du spicule et livrant la sous-unité S1 au récepteur (Figure 2B). La perte de la couronne S1 sur le spicule activé provoque à son tour l’érection de l’hélice HR1, qui projette le FP sur une distance d’environ 15 nm pour atteindre et s’insérer de manière stable dans la membrane cellulaire (Figure 3C). Cette forme insérée de S2, un long trimère qui relie les deux membranes à une distance d’environ 30 nm, est transitoire. La partie HR2, qui est initialement située à distance, près de la membrane virale, finit par se lier aux rainures du trousseau torsadé de HR1 pour former le trimère d’épingles à cheveux observé dans la forme post-fusion (illustrée sur la Figure 3C, panneau de droite, où seul un protomère du trimère est représenté pour plus de clarté). Dans sa conformation finale, S2 force donc la membrane virale et la membrane cible l’une contre l’autre, en surmontant la répulsion entre les deux feuillets externes, comme dans les étapes iv et v de la Figure 3A. Cette répulsion survient lorsque deux membranes sont amenées à moins de 1 nm de distance en raison de la déshydratation des têtes lipidiques requises pour permettre un contact direct [76, 77]. La conformation en épingle à cheveux de la protéine de fusion catalyse donc la réaction de fusion membranaire en forçant l’apposition étroite des bicouches lipidiques externes, abaissant ainsi la barrière cinétique de la fusion, qui est une réaction globalement exothermique. La fusion membranaire s’effectue par une hémi-fusion initiale (étape v de la Figure 3A) dans laquelle seuls les feuillets externes de la membrane fusionnent, suivie de la formation d’un pore par fusion des deux feuillets (étape vi), pore qui s’élargit ensuite pour former une seule membrane fusionnée.
6. La protéine S dans les variants préoccupants du SRAS-CoV-2
De nouveaux variants du SRAS-CoV-2 présentant des mutations augmentant la transmission interindividuelle ou permettant une évasion immunitaire sont apparus récemment et déplacent les souches virales circulantes initiales [78, 79, 80, 81]. Les modifications génomiques de ces variants ont été associées à une transmission interindividuelle accrue et/ou à un échappement à l’immunité post-infection ou post-vaccination. Bien que les mutations des variants se produisent dans tout le génome viral, des mutations clés dans la protéine S semblent contrôler la transmission du virus et/ou modifier des sites ciblés par les anticorps neutralisants. Le premier variant identifié présentait la mutation D614G dans S [82], une mutation qui s’est maintenant fixée dans le virus en circulation et dont on a montré qu’elle augmentait la transmissibilité du virus [83, 78, 84, 85, 86, 87]. Comme cela a été démontré récemment pour le variant B.1.1.7 [88], les nouveaux variants peuvent également provoquer des symptômes plus graves que ceux du virus de la souche Wuhan originale. Les nouveaux variants sont souvent désignés par le pays ou la région où ils ont été détectés pour la première fois : B.1.1.7 est appelé variant du Royaume-Uni, B.1.351 variant de l’Afrique du Sud (SA), P.1 variant du Brésil (BR), B.1.429 variant de la Californie. De nouveaux variants sont également apparus en Inde, qui connaît une forte poussée de l’épidémie de Covid 19. Bien que la souche prédominante qui y circule soit B.1.1.7, une nouvelle lignée, B.1.617, prend le relais et se diversifie en plusieurs sous-lignées [89, 90, 91, 92, 93, 94, 95]. Ce variant a maintenant atteint d’autres pays, notamment le Royaume-Uni où environ la moitié des nouveaux cas appartiennent au variant 1.617.2.
La Figure 4 énumère les positions sur S des mutations qui sont apparues dans les principaux variants préoccupants, y compris les trois nouvelles sous-lignées indiennes. Ces mutations se regroupent dans plusieurs régions de la tête du spicule, en particulier dans le domaine N-terminal. On observe également un regroupement dans le RBD et près du site de clivage S1/S2. Certaines mutations sont dans HR1 et dans la région d’inversion de chaîne dans l’épingle à cheveux post-fusion (entre les moitiés rouge et bleue de S2′, colorées comme dans le diagramme de la Figure 3A). Bien que la majorité des mutations se situent à la surface externe du trimère, un certain nombre d’entre elles affectent les résidus de contact enfouis à l’interface entre promères du trimère (voir Figure 4B, panneaux de droite). C’est le cas des mutations dans S2 et de celles qui dans S1 près du site de clivage S1/S2 (à partir du résidu 570). Une analyse de la conservation de la séquence en acides aminés de S parmi les sarbecovirus infectant d’autres mammifères et prédits pour utiliser l’ACE2 comme récepteur (Figure 5) a montré que l’emplacement des mutations des variants à la surface du spicule est dans des régions variables de la protéine S. Et même si la surface la plus variable correspond au NTD, la surface de liaison de l’ACE2 du RBD l’est aussi (comparez les 4e et 5e colonnes de la Figure 5A), ce qui est conforme à l’observation selon laquelle le patch d’ACE2 reconnu par le RBD est également variable chez les mammifères (Figure 1C). Le spicule ouvert expose une région conservée de S2 au sommet qui correspond à S2 chargé de ressort (Figure 5A, panneaux de droite). Cette région ne semble pas être immunogène, très probablement parce que le spicule complètement ouvert n’est exposé que de façon transitoire, immédiatement avant son changement de conformation irréversible ver la forme post-fusion, comme indiqué par les flèches dans la Figure 5B. L’emplacement et l’orientation relative de la surface de liaison ACE2 de la RBD (surface indiquée en jaune dans la Figure 5B, en particulier dans le 5e panneau) sont également compatibles avec un effet d’ « arrachage » lorsque plus d’un récepteur ACE2 est lié, car ils peuvent tirer le RBD (et S1) dans des directions opposées, perturbant ainsi le spicule et induisant le changement de conformation pour provoquer la fusion des membranes.
7. Mutations des variants dans le RBD et échappement aux anticorps neutralisants
Bien que la réponse immunitaire contre le spicule soit dirigée vers de multiples sites [97], il a été démontré que le RBD était la cible de la grande majorité des anticorps neutralisants humains les plus puissants contre le SRAS-CoV-2. De multiples rapports décrivant le clonage et l’isolement d’anticorps monoclonaux (AcM) provenant de personnes convalescentes et de personnes vaccinées, ainsi que des études structurales par radiocristallographie et/ou cryo-EM ont été rapportés [98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 8, 108]. Ces études attestent de la forte puissance de neutralisation des anticorps monoclonaux spécifiques du RBD. Globalement, ces anticorps ont été classés en quatre grandes catégories, en fonction de la localisation de leur épitope à la surface du RBD [98]. Les anticorps les plus fortement neutralisants, agissant avec une efficacité proche du picomolaire, ciblent le patch de liaison de l’ACE2 (surface jaune dans la Figure 6) [103]. Ces derniers sont divisés en deux classes : ceux de la classe 1 nécessitent que la RBD soit debout pour se lier, tandis que ceux de la classe 2 ne discriminent pas la conformation du spicule, que RBD soit couché ou debout. L’emplacement des épitopes correspondants est marqué dans la Figure 6D, qui montre que l’épitope des anticorps de classe 1 est partiellement enfoui dans la conformation fermée du spicule, alors que celui de classe 2 ne l’est pas (comparer le panneau supérieur de D avec A, ainsi que les panneaux inférieurs de C et D). Deux autres catégories d’anticorps ont été identifiées dans lesquelles l’épitope est en dehors du patch ACE2 : les anticorps de classe 3 ciblent une surface exposée, tandis que l’épitope de la classe 4 est enfoui dans le spicule fermé et nécessite au moins deux RBD debout pour la liaison [109, 110, 111, 112]. Les anticorps de classe 4 sont parmi ceux qui présentent la réactivité croisée la plus large parmi les sarbecovirus [101], comme on peut le voir en comparant les panneaux D et B de la Figure 6. Les mutations des variants récents entraînent toutes une réduction de la liaison des anticorps des classes 1 et 2, ce qui suggère que ces derniers constituent la forme dominante contrôlant la circulation du virus dans la population en général.
Les mutations sur le RBD apparues dans les variants récents ne sont pas distribuées de manière aléatoire : elles forment une couronne tout autour de la périphérie de la surface de liaison de l’ACE2 (Figure 6D, panneau inférieur). Ceci est en contraste avec la variabilité observée lors de la comparaison entre sarbecovirus, dans laquelle toute la surface est variable. La notion tirée de cette analyse est que le virus échantillonne toutes les mutations qui sont encore compatibles avec la liaison à l’ACE2 humaine tout en interférant avec la liaison des anticorps. Il reste à voir jusqu’à quel point le virus peut poursuivre cette tendance et échapper à la réponse immunitaire humaine tout en conservant sa virulence.
8. Remarques finales
Cette revue couvre la plupart des données structurales disponibles sur la protéine du spicule du SRAS-CoV-2, son interaction avec ACE2, et les inférences mécanistiques qui peuvent être tirées de ces études. La localisation des mutations dans les nouveaux variants du SRAS-CoV-2, distribuées sur toute la surface du spicule, suggère en outre un effet épistatique des mutations et qu’un effet allostérique pourrait contrôler une exposition différentielle des trois sites de clivage à la furine dans le trimère, ce qui semble avoir une importance fonctionnelle. Les mutations observées peuvent également affecter de multiples façons le changement de conformation déclenché par la liaison au récepteur. La biologie du spicule du coronavirus est ainsi loin d’avoir livré tous ses secrets. Néanmoins, la quantité d’informations recueillies sur cette protéine en 18 mois de pandémie a été sans précédent, tout comme la pandémie elle-même. Ce n’est qu’en comprenant la fonction du spicule dans ses moindres détails mécanistiques — ainsi que ceux des autres protéines virales impliquées dans d’autres étapes du cycle viral — que nous pourrons espérer être mieux préparés à faire face aux futures épidémies de virus zoonotiques émergents tels que les coronavirus.
Remerciements
Je remercie mes collègues de l’unité de virologie structurale pour les nombreuses discussions, et les membres de la Task Force Coronavirus de l’Institut Pasteur pour leur soutien. Toutes les illustrations structurales utilisées ont été préparées avec The PyMOL Molecular Graphics System, Version 2.1 Schrödinger, LLC. La représentation de la conservation de la séquence d’acides aminés sur à la surface des protéines ACE2 et S a été réalisé avec EsPript [113]. Je remercie P. Guardado-Calvo pour ses conseils sur l’utilisation de ce logiciel.