L'édition génomique basée sur CRISPR-Cas9 est l'une des avancées les plus marquantes de la biologie moléculaire au cours des dernières décennies. Cette technologie permet des modifications précises et ciblées de l'ADN, offrant des possibilités révolutionnaires dans de nombreux domaines, allant de la recherche fondamentale à la médecine clinique.
CRISPR-Cas9 : Un Système de Défense Adaptatif
CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) et Cas9 (CRISPR-associated protein 9) constituent un système de défense bactérien adaptatif. Les bactéries utilisent ce système pour se protéger contre les virus (bactériophages) en intégrant des fragments de leur ADN dans leur propre génome sous forme de séquences CRISPR. Lorsque ces bactéries sont exposées à nouveau aux mêmes virus, elles utilisent une protéine appelée Cas9 pour cliver l'ADN viral, empêchant ainsi l'infection. Ce mécanisme a été détourné et adapté pour l'édition génétique des organismes eucaryotes.
Principe de l'édition avec CRISPR-Cas9
Le système CRISPR-Cas9 repose sur deux éléments clés :
- Le guide ARN (gRNA) : Ce petit ARN guide la protéine Cas9 vers une séquence spécifique de l'ADN cible, généralement une séquence de 20 nucléotides, située près d'un motif PAM (Protospacer Adjacent Motif) qui est essentiel pour l'activation de Cas9.
- La protéine Cas9 : Cas9 est une nucléase qui fait une coupure double brin à l'endroit précis où le gRNA l'a dirigée.
Cette capacité de Cas9 à couper l'ADN à des endroits spécifiques permet des modifications ciblées de génomes, par exemple, en créant des mutations, en insérant des gènes ou en supprimant des séquences génétiques.
La conception de gRNA est un élément crucial pour assurer la précision de l'édition génomique. Un gRNA doit être conçu pour être complémentaire à la séquence cible sur le gène d'intérêt, tout en respectant les critères du motif PAM, qui est généralement "NGG" pour Cas9. L'efficacité d'un gRNA dépend de plusieurs facteurs, notamment :
La spécificité : Le gRNA doit se lier précisément à la séquence cible sans entraîner de coupures hors cible (off-target), un problème majeur dans les applications thérapeutiques.
L'efficacité : Un gRNA efficace permet à Cas9 de cliver l'ADN avec une grande précision, ce qui est crucial pour des applications comme la correction de mutations spécifiques.
La Conception des gRNAs : Le Cœur de l'Édition Génomique
Applications de CRISPR-Cas9
1.Édition de gènes dans les modèles animaux : CRISPR-Cas9 est utilisé pour introduire des mutations spécifiques dans les génomes d'animaux modèles, comme les souris, afin d'étudier le rôle de gènes particuliers dans des maladies génétiques ou dans le développement.
2.Thérapie génique : L'une des applications les plus prometteuses de CRISPR est la correction de mutations génétiques responsables de maladies rares ou graves. Par exemple, la drépanocytose (anémie falciforme) et certaines formes de thalassémies peuvent potentiellement être traitées en modifiant les cellules souches du patient ex vivo, puis en réintroduisant ces cellules corrigées dans l'organisme.
3.Agriculture génétiquement modifiée : CRISPR permet de modifier des cultures végétales pour améliorer leur résistance aux maladies, leur rendement ou leurs qualités nutritionnelles, tout en réduisant la dépendance aux pesticides.
4.Recherche fondamentale et fonction des gènes : L'édition génomique permet d'explorer la fonction des gènes dans des processus biologiques complexes, notamment la régulation génétique, les voies de signalisation, et les mécanismes de réponse au stress ou aux maladies.
Outils Performants pour la Conception de Guide-ARN et l’Optimisation CRISPR
Trouver
Définissez une ou plusieurs régions génomiques dans lesquelles Protospacer effectuera des recherches. Tous les cibles Cas9 possibles avec le motif NGG seront rapportées. Vous pouvez ajouter des régions par coordonnées génomiques, par distance à une coordonnée, par identifiant de gène, par attribut/keyword de gène, ou par similarité de séquence. Toutes les régions seront tabulées et entièrement modifiables avec plusieurs outils arithmétiques génomiques (comme ceux de bedtools). Les régions peuvent être étendues si elles contiennent des "enfants", par exemple, étendre une région génétique à plusieurs régions exoniques. Des régions consécutives peuvent être fusionnées, par exemple, plusieurs exons peuvent être fusionnés pour créer des introns.
Évaluer
Les cibles peuvent être filtrées par contenu nucléotidique, par leur activité de clivage Cas9 (comme défini par le score d'activité Doench-Root dans Doench et al., 2014 Nat. Biotech.), ou par leur unicité au sein du génome. Des rapports détaillés pour chaque site cible peuvent être générés, montrant des informations de base telles que la position et les chevauchements de caractéristiques, ainsi que des métriques mesurant la performance du design de gRNA en relation avec des cibles secondaires. Les métriques pour plusieurs designs de gRNA peuvent être agrégées et classées. Plusieurs outils sont disponibles pour aider à identifier des gRNAs qui ciblent plusieurs sites.
Partager
Les bases de données Protospacer sont basées sur des fichiers. Les chercheurs peuvent partager l'intégralité des bases de données ou seulement les parties sur lesquelles ils travaillent. Le partage peut se faire via n'importe quel service de partage de fichiers, de l'email simple à un logiciel dédié. Par exemple, si une bibliothèque personnalisée a été conçue, elle peut être partagée sous forme de fichier compressé ; ou, si un collègue a besoin seulement d'un sous-ensemble de cibles, seules les cibles pertinentes peuvent être partagées. Un système basé sur des fichiers permet à tout groupe de synchroniser ses bases de données en utilisant des logiciels comme Dropbox. Bien qu'il faille prêter attention aux conflits de synchronisation de fichiers, cette option permet à un laboratoire ou un réseau de travailler collaborativement sur une liste de cibles unique.
Sécurisé
Tous les fichiers Protospacer sont liés au hash MD5 de la base de données dont ils ont été générés. Le hash lui-même est généré à partir de la séquence génomique. Les fichiers qui ne correspondent pas à la clé de hash de la base de données ne seront pas chargés. Cela signifie que les fichiers seront ignorés, sauf s'ils sont basés sur la même version du génome. Même un seul changement de nucléotide entraînera des clés différentes. Cette fonctionnalité de sécurité a été conçue pour assurer un partage sécurisé des données et la tranquillité d'esprit lors de ce partage.
Concevoir pour n'importe quel organisme
Les bases de données sont créées à partir de fichiers FASTA et, éventuellement, annotées à l'aide de fichiers au format GTF ou GFF. Par conséquent, des bases de données peuvent être créées à partir de n'importe quelle séquence et pas seulement à partir de noyaux d'assemblages de référence complets : différents assemblages de génomes, différentes souches, génomes partiels.
Gérer plusieurs bases de données
Protospacer permet un nombre illimité de bases de données pour tout organisme pour lequel des fichiers FASTA peuvent être obtenus. Cela signifie que des bases de données peuvent être créées pour plusieurs assemblages de génomes ou souches. Les utilisateurs peuvent créer des bases de données à partir de n'importe quel fichier FASTA ; des annotations peuvent être ajoutées à partir de fichiers au format GTF ou GFF ; des notes personnalisées peuvent être ajoutées lors de la création de la base de données. Les informations récapitulatives pour chaque base de données sont facilement consultables depuis l'écran d'information.
Flux de travail étape par étape
Une philosophie fondamentale de l'interface de Protospacer est de ne pas présumer des intentions des utilisateurs. Cela dit, l'interface utilisateur est conçue pour deux types d'utilisateurs : d'une part, le nouvel utilisateur cherchant à trouver un bon gRNA ou un ensemble de gRNAs pour une étude particulière, et d'autre part, l'utilisateur régulier qui cherche à reprendre son travail précédent ou à afficher/modifier une liste de cibles existante. Pour faciliter les deux types d'utilisateurs, l'écran principal est divisé en quatre onglets, représentant les quatre étapes consécutives du processus de conception : spécifier où chercher les sites cibles dans le génome (1), filtrer (2), marquer les sites cibles intéressants (3), puis évaluer les designs de gRNA (4). Dans cette dernière étape, une liste de cibles de haute qualité peut être élaborée et enregistrée. Les utilisateurs réguliers peuvent sauter les trois premières étapes en chargeant un fichier de sites cibles précédemment sauvegardé.
Rapports de guide-ARN
Un rapport détaillé pour chaque design de gRNA contient des tableaux de fréquence de cibles et de mésappariements, des classements de cibles où les meilleures cibles sont considérées comme susceptibles d'être liées par Cas9 avec une grande spécificité (selon les algorithmes de scoring de Hsu et al., 2013 et Doench et al., 2014), ainsi que des statistiques générales telles que le pourcentage de GC, la position et le chevauchement de caractéristiques.
Exportation de données
Copiez et collez directement les cibles dans Excel ou tout autre logiciel similaire. Copiez les sites cibles en format FASTA et travaillez avec eux dans vos outils préférés d'édition/visualisation de séquences. Exportez les sites hors cible potentiels dans un fichier délimité par des tabulations pour une post-analyse, la gestion des archives ou pour les recouper avec des expériences de vérification.
Outils tiers
L'alignement des séquences sur un génome est une tâche complexe. Il devient encore plus difficile en raison des taux d'erreur élevés qu'il faut prendre en compte pour les sites potentiels hors cible de Cas9. Il existe de nombreuses applications de mappage, mais elles n'ont pas été conçues spécifiquement pour CRISPR et chacune présente ses propres avantages et inconvénients pour la conception de gRNA. Protospacer utilise trois outils tiers puissants : (1) Bowtie, très rapide, avec une faible puissance, et qui rapporte les sites hors cibles avec une similarité gRNA de 85 % ou plus ; (2) Cas-offinder, relativement lent, mais puissant, et qui rapporte tous les sites hors cibles ; et (3) RazerS3, rapide, de puissance moyenne, et qui rapporte les sites hors cibles avec une similarité gRNA de 75 % ou plus.
Conception multi-cibles
Trouvez des cibles dans plusieurs régions simultanément, triez-les par similarité, concevez des gRNAs de consensus, testez un ou plusieurs designs de gRNA pour les sites hors cibles en dehors des régions cibles prévues. La conception multi-cibles est en développement continu et continuera à s'améliorer.
Gérer les listes de cibles
Sauvegardez les listes de cibles pour une utilisation ultérieure, une sauvegarde ou un partage avec un collègue. Les listes sauvegardées peuvent contenir des notes décrivant leur origine, leur utilité et pourquoi elles sont importantes. Les cibles peuvent être regroupées en sous-catégories, colorées et combinées/intersectées avec d'autres listes pour une gestion polyvalente des listes.