CRISPR le ciseaux pour l’ADN, une nouvelle ère en biologie moléculaire

Le développement de moyens efficaces et fiables pour apporter des changements précis et ciblés au génome des cellules vivantes est un objectif de longue date pour les chercheurs biomédicaux.

Récemment, un nouvel outil basé sur une nucléase protéique-9 bactérienne associée à CRISPR (Cas9) de Streptococcus pyogenesa généré une excitation considérable (1). Cela fait suite à plusieurs tentatives au cours des années pour manipuler la fonction du gène, y compris la recombinaison homologue (2) et l’interférence ARN (ARNi) (3).
 L’ARNi, en particulier, est devenu un aliment de base permettant une interrogation peu coûteuse et à haut débit de la fonction génique (4, 5), mais il est entravé par une inhibition temporaire de la fonction génique et des effets non ciblés imprévisibles (6). 
D’autres approches récentes de modification ciblée du génome – nucléases à doigt de zinc [ZFNs, (7)] et activateurs de transcription comme les nucléases effectrices [TALENs (8)] permettent aux chercheurs de générer des mutations permanentes en activant les voies de réparation. Ces approches sont coûteuses et longues à mettre au point, ce qui limite leur utilisation généralisée, en particulier pour les études à grande échelle et à haut débit.

Qu’est-ce que CRISPR / Cas9 ?

Les fonctions des gènes CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) et CRISPR (Cas) sont essentielles dans l’immunité adaptative de certaines bactéries et archées, ce qui permet aux organismes de réagir et d’éliminer le matériel génétique envahissant. 

Ces répétitions ont d’abord été découvertes dans les années 1980 chez E. coli (9), mais leur fonction n’a été confirmée qu’en 2007 par Barrangou et ses collègues, qui ont démontré que S. thermophilus pouvait acquérir une résistance contre un bactériophage en intégrant un fragment génomique d’un agent infectieux. virus dans son locus CRISPR (10).

Trois types de mécanismes CRISPR ont été identifiés, dont le type II est le plus étudié. Dans ce cas, l’ADN envahissant provenant de virus ou de plasmides est coupé en petits fragments et incorporé dans un locus CRISPR au milieu d’une série de courtes répétitions (environ 20 bps). Les loci sont ensuite transcrits, et les transcrits sont ensuite traités pour générer de petits ARN (ARNc – ARN CRISPR), qui sont utilisés pour guider les endonucléases effectrices qui ciblent l’ADN envahissant en fonction de la complémentarité des séquences (Figure 1) (11).

 

 

Figure 1. Cas9 in vivo : Immunité adaptative bactérienne

Cas9 in vivo: Immunité Adaptative Bactérienne

Dans la phase d’acquisition, l’ADN étranger est incorporé dans le génome bactérien aux locus CRISPR. Les locus CRISPR sont ensuite transcrits et transformés en ARNg pendant la biogenèse de l’ARNr. Pendant l’interférence, l’endonucléase Cas9 complexée avec un ARNc et un tracrRNA séparé clive l’ADN étranger contenant une séquence complémentaire d’ARNr de 20 nucléotides adjacente à la séquence PAM. (La figure n’est pas dessinée à l’échelle.)
Glossaire d'édition de génome

Une protéine Cas, Cas9 (également connue sous le nom de Csn1), a été montrée, à travers des expériences de knockdown et de sauvetage, comme un acteur clé dans certains mécanismes CRISPR (en particulier les systèmes CRISPR de type II). 

Le mécanisme CRISPR de type II est unique par rapport aux autres systèmes CRISPR, car une seule protéine Cas (Cas9) est nécessaire pour l’inactivation génique (12). Dans les systèmes de type II, Cas9 participe au traitement des ARNc (12) et est responsable de la destruction de l’ADN cible (11). 

La fonction de Cas9 dans ces deux étapes repose sur la présence de deux domaines de nucléase, un domaine de nucléase de type RuvC situé à l’extrémité amino et un domaine de nucléase de type HNH qui réside dans la région médiane de la protéine (13).

Pour obtenir une reconnaissance et un clivage de l’ADN spécifiques au site, Cas9 doit être complexé avec à la fois un ARNg et un ARNrr trans-activateur séparé (tracrRNA ou trRNA), qui est partiellement complémentaire de l’ARNg (11). Le tracrRNA est requis pour la maturation de l’ARNc à partir d’un transcrit primaire codant plusieurs pré-ARNrc. Cela se produit en présence de RNase III et Cas9 (12).

Pendant la destruction de l’ADN cible, les domaines nucléases HNH et RuvC coupent les deux brins d’ADN, générant des cassures double brin (DSB) à des sites définis par une séquence cible de 20 nucléotides dans un transcrit d’ARNr associé (11, 14). Le domaine HNH clive le brin complémentaire, tandis que le domaine RuvC clive le brin non-complémentaire.

L’activité endonucléase bicaténaire de Cas9 nécessite également qu’une courte séquence conservée, (2-5 nts) connue sous le nom de motif associé à un proto-récepteur (PAM), suit immédiatement 3 ‘de la séquence complémentaire d’ARNr (15). En fait, même des séquences totalement complémentaires sont ignorées par l’ARN Cas9 en l’absence d’une séquence PAM (16).

Cas9 et CRISPR comme un nouvel outil en biologie moléculaire

La simplicité de la nucléase CRISPR de type II, avec seulement trois composants requis (Cas9 avec le crRNA et le trRNA) rend ce système adaptable à l’édition du génome. Ce potentiel a été réalisé en 2012 par les laboratoires Doudna et Charpentier (11). 

Basé sur le système CRISPR de type II décrit précédemment, les auteurs ont développé un système simplifié à deux composants en combinant le trARN et l’ARNg en un seul ARN guide unique synthétique (sgRNA). sgRNAprogrammed Cas9 s’est avéré être aussi efficace que Cas9 programmé avec trRNA et crRNA séparés dans l’orientation des modifications de gènes ciblés (figure 2A).

À ce jour, trois variantes différentes de la nucléase Cas9 ont été adoptées dans les protocoles d’édition du génome. Le premier est Cas9 de type sauvage, qui peut cliver de manière spécifique au site l’ADN double brin, entraînant l’activation de la machinerie de réparation à rupture de double brin (DSB). 

Les DSB peuvent être réparés par la voie cellulaire (NHEJ) (17), ce qui entraîne des insertions et / ou des délétions (indels) qui perturbent le locus ciblé. En variante, si un modèle de donneur avec une homologie au locus ciblé est fourni, le DSB peut être réparé par la voie de réparation dirigée par homologie (HDR) permettant des mutations de remplacement précises (figure 2A) (17, 18).

Cong et ses collègues (1) ont poussé le système Cas9 vers une précision accrue en développant une forme mutante, connue sous le nom de Cas9D10A, avec seulement une activité de nickase. Cela signifie qu’il ne coupe qu’un seul brin d’ADN et n’active pas NHEJ. Au lieu de cela, lorsqu’elles sont fournies avec une matrice de réparation homologue, les réparations d’ADN sont effectuées uniquement via la voie HDR haute fidélité, ce qui entraîne des mutations indel réduites (1, 11, 19). 

Cas9D10A est encore plus attrayant en termes de spécificité de cible lorsque les locus sont ciblés par des complexes Cas9 appariés conçus pour générer des entailles d’ADN adjacentes (voir plus de détails sur les « paires de nickases » sur la figure 2B).

La troisième variante est une Cas9 déficient en nucléase (dCas9, Figure 2C) (21). Les mutations H840A dans le domaine HNH et D10A dans le domaine RuvC inactivent l’activité de clivage, mais n’empêchent pas la liaison de l’ADN (11, 22). 

Par conséquent, cette variante peut être utilisée pour cibler de manière spécifique toute région du génome sans clivage. Au lieu de cela, en fusionnant avec différents domaines effecteurs, dCas9 peut être utilisé soit comme un outil de silençage ou d’activation de gènes (21, 23-26).

 En outre, il peut être utilisé comme un outil de visualisation. Par exemple, Chen et ses collègues ont utilisé dCas9 fusionné à Enhanced Green Fluorescent Protein (EGFP) pour visualiser des séquences d’ADN répétitives avec un seul sgRNA ou des locus non répétitifs en utilisant plusieurs ARNsg (27).

Figure 2. Applications du système CRISPR / Cas9

Applications du système CRISPR / Cas9

 
A. Le site de nucléase Cas9 de type sauvage clive spécifiquement l’ADN double brin activant la machinerie de réparation de cassure à double brin. En l’absence d’un modèle de réparation homologue, une terminaison non homologue peut entraîner la rupture de la séquence cible par les indels.
 En variante, des mutations et des knock-ins précis peuvent être réalisés en fournissant un modèle de réparation homologue et en exploitant la voie de réparation dirigée vers l’homologie.
B. Mutée Cas9 réalise un pseudo à un seul brin spécifique au site. Deux ARNsg peuvent être utilisés pour introduire une rupture échelonnée double brin qui peut ensuite subir une réparation dirigée par homologie.
C. Cas9 déficient en Nucléase Cas9 peut être fusionné avec divers domaines effecteurs permettant une localisation spécifique. Par exemple, des activateurs transcriptionnels, des répresseurs et des protéines fluorescentes.

Cibler l’efficacité et les mutations hors cible

L’efficacité du ciblage, ou le pourcentage de mutation souhaitée, est l’un des paramètres les plus importants pour évaluer un outil d’édition du génome. L’efficacité de ciblage de Cas9 se compare favorablement avec des méthodes plus établies, telles que les TALEN ou les ZFN (8). Par exemple, dans les cellules humaines, les ZFN et les TALEN conçus sur mesure ne pouvaient atteindre des rendements allant de 1% à 50% (29-31). En revanche, le système Cas9 a été signalé pour avoir des efficacités allant jusqu’à> 70% chez le poisson-zèbre (32) et les plantes (33), et allant de 2-5% dans les cellules souches pluripotentes induites (34). 

En outre, Zhou et ses collègues ont réussi à améliorer le ciblage du génome jusqu’à 78% dans des embryons de souris unicellulaires, et ont obtenu une transmission germinale efficace grâce à l’utilisation de doubles ARNsg pour cibler simultanément un gène individuel (35).

Une méthode largement utilisée pour identifier les mutations est le test de détection de mutation T7 endonucléase I (36, 37) (figure 3). Ce test détecte l’ADN hétéroduplex qui résulte de l’annelage d’un brin d’ADN, y compris les mutations souhaitées, avec un brin d’ADN de type sauvage (37).

 

 

Figure 3. Essai d’efficacité de ciblage de l’endonucléase I T7

Test d'efficacité de ciblage de l'endonucléase I T7

L’ADN génomique est amplifié avec des amorces encadrant le locus modifié. Les produits de PCR sont ensuite dénaturés et recannés pour donner 3 structures possibles. Les duplex contenant un mésappariement sont digérés par l’endonucléase T7. L’ADN est ensuite séparé par électrophorèse et l’analyse des fragments est utilisée pour calculer l’efficacité du ciblage.

Un autre paramètre important est l’incidence des mutations hors cible. De telles mutations sont susceptibles d’apparaître dans des sites qui ont des différences de seulement quelques nucléotides par rapport à la séquence originale, tant qu’ils sont adjacents à une séquence PAM. 

Cela se produit car Cas9 peut tolérer jusqu’à 5 mésappariements de base dans la région protospacer (36) ou une seule différence de base dans la séquence PAM (38). Les mutations hors cible sont généralement plus difficiles à détecter, nécessitant un séquençage du génome entier pour les exclure complètement.

Des améliorations récentes du système CRISPR pour réduire les mutations hors cible ont été faites par l’utilisation d’ARNg tronqué (tronqué dans la séquence dérivée de l’ARNr) ou en ajoutant deux nucléotides supplémentaires de guanine (G) à l’extrémité 5 ‘(28, 37) . Les chercheurs ont également tenté de minimiser les effets hors cible en utilisant des «nickases appariées» (20).

 Cette stratégie utilise D10A Cas9 et deux sgARN complémentaires de la zone adjacente sur les brins opposés du site cible (figure 2B). Bien que cela induise des DSB dans l’ADN cible, on s’attend à ce qu’il ne crée que des entailles uniques dans des emplacements hors cible et, par conséquent, se traduise par des mutations hors cible minimales.

En tirant parti du calcul pour réduire les mutations hors cible, plusieurs groupes ont développé des outils basés sur le Web pour faciliter l’identification des sites cibles potentiels de CRISPR et évaluer leur potentiel de clivage hors cible. Les exemples incluent l’outil de conception CRISPR (38) et le targeter ZiFiT, version 4.2 (39, 40).

Applications en tant qu’outil d’édition de génome et outil de ciblage de génome

Après sa première démonstration en 2012 (9), le système CRISPR / Cas9 a été largement adopté. Cela a déjà été utilisé avec succès pour cibler des gènes importants dans de nombreuses lignées cellulaires et organismes, dont humains (34), bactéries (41), poissons zèbres (32), C. elegans (42), plantes (34), Xenopus tropicalis (43) , levure (44), drosophile(45), des singes (46), des lapins (47), des cochons (42), des rats (48) et des souris (49). Plusieurs groupes ont maintenant profité de cette méthode pour introduire des mutations ponctuelles (délétions ou insertions) dans un gène cible particulier, via un seul ARNg (14, 21, 29). 

En utilisant à la place une paire de nucléases Cas9 dirigées par l’ARNg, il est également possible d’induire de grandes délétions ou des réarrangements génomiques, tels que des inversions ou des translocations (50). Un développement récent intéressant est l’utilisation de la version dCas9 du système CRISPR / Cas9 pour cibler les domaines protéiques pour la régulation transcriptionnelle (26, 51, 52), la modification épigénétique (25) et la visualisation microscopique de locus spécifiques du génome (27).

Le système CRISPR / Cas9 ne nécessite que la refonte de l’ARNc pour modifier la spécificité de la cible. Cela contraste avec d’autres outils d’édition du génome, y compris le doigt de zinc et TALENs, où la refonte de l’interface protéine-ADN est nécessaire. En outre, CRISPR / Cas9 permet une interrogation rapide du génome sur la fonction génique en générant de grandes banques d’ARNg (51, 53) pour le criblage génomique.

L’avenir de CRISPR / Cas9

Les progrès rapides dans le développement de Cas9 en un ensemble d’outils pour la recherche en biologie cellulaire et moléculaire ont été remarquables, probablement en raison de la simplicité, de l’efficacité élevée et de la polyvalence du système. 

Parmi les systèmes de nucléase de concepteur actuellement disponibles pour l’ingénierie de génome de précision, le système CRISPR / Cas est de loin le plus convivial. Il est maintenant clair que le potentiel de Cas9 dépasse le clivage de l’ADN, et son utilité pour le recrutement de protéines spécifiques au locus du génome ne sera probablement limitée que par notre imagination.