top of page
Les technologies de séquençage nouvelle génération

Les technologies de séquençage ont énormément évolué depuis le début des années 2000 avec la transition du séquençage Sanger aux méthodes de séquençage dites de seconde et troisième génération à haut débit (Next Generation Sequencing ou NGS). Une multitude de technologies parallèles ont été développées et sont actuellement utilisées dans les domaines de la recherche et du diagnostic clinique notamment. Les méthodes de seconde génération peuvent être regroupées en deux catégories, à savoir le séquençage par hybridation et le séquençage par synthèse (SBS).

​

La compagnie ThermoFisher a développé la technologie Ion Torrent utilisant le séquençage par synthèse. Tout comme pour lllumina, le matériel génétique est préparé pour créer une librairie avec des adaptateurs. Ces librairies sont ensuite déposées sur une matrice faite de millions de puits individuels qui vont contenir une polymérase. Théoriquement, une molécule unique de librairie sera présente dans chaque puits. Lorsque le séquençage est effectué, l’incorporation des nucléotides se fait séquentiellement (A puis G puis C puis T). Avec l’ajout d’une base par la polymérase, un ion H+ est relâché ce qui va faire diminuer le pH de ce puits. La variation de pH sera détectée et permettra de déterminer l’enchaînement des nucléotides (Slatko et al, 2018).

 

 

1. Séquençage par Hybridation

 

La première catégorie fait appel à des millions d’oligonucléotides simples brins (sondes) de séquences connues qui sont fixés sur une matrice appelée puce à ADN. L’ADN /ARN du spécimen préalablement fragmenté auquel un fluorochrome aura été ajouté est ensuite appliqué sur la matrice et va s’apparier aux sondes. En détectant les séquences selon l’emplacement où elles se sont hybridées, il est possible de déterminer la séquence du spécimen. Cette technologie est principalement utilisée pour détecter des SNP (Single Nucleotide Polymorphism), connaitre la variation du nombre de copies (CNV) ou encore les grands réarrangements chromosomiques (Lizardi, 2008). Cette méthode est notamment développée par la compagnie Affymetrix.

 

​

2. Séquençage par Synthèse

 

Le séquençage par synthèse est actuellement la méthode la plus employée à travers le monde, notamment celle de la compagnie d’Illumina qui occupe environ 90% du marché. Le matériel génomique (ADN ou ARN) du spécimen est préalablement fragmenté puis des adaptateurs (courtes séquences d’environ 60 nucléotides) sont ajoutés à chacun des fragments par ligation pour former une librairie. L’adaptateur qui se fixe en 3’ du fragment possède une séquence unique de 6 à 8 nucléotides à chacune des librairies (appelé code-barre). Ce code-barre servira à identifier les différentes librairies lors du séquençage permettant ainsi de séquencer beaucoup de librairies lors d’une même expérience. Les librairies sont hybridées sur une lame en verre où sont fixés des séquences d’adaptateur complémentaires. Le séquençage se fait par l’incorporation base par base, par une polymérase, de nucléotides marqués par un fluorochrome unique à chaque nucléotide. Lors de l’ajout d’un nucléotide, l’instrument prend une photo et détermine quel nucléotide a été incorporé selon la fluorescence détectée. Des millions, voire des milliards (pour l’instrument le plus performant à ce jour) de séquences allant de 50 à 300 nucléotides de long peuvent être générées (Slatko et al, 2018).

​

Que ce soit la technologie Illumina ou Ion Torrent, la taille des séquences produites est très courte (50 à 400 pb), ce qui peut poser problème dans le cas d’un assemblage De Novo.

 

​

3. Séquençage de troisième génération

 

Le séquençage de troisième génération a vu le jour avec le développement des technologies permettant d’obtenir de longs fragments. C’est notamment le cas du système Nanopore de la compagnie Oxford Nanopore Technology (ONT) (Montel, 2018):

Cette technologie repose sur les propriétés physiques des pores membranaires. Lorsqu’une molécule d’ADN est poussée à travers un pore membranaire par le biais d’une hélicase ou d’une polymérase, la déformation des protéines formant le pore, engendrée par le passage des nucléotides, induit un changement de l’intensité de courant électrique qui est spécifique au nucléotide présent. La mesure des variations d’intensité permet donc de déterminer la séquence qui passe à travers le pore. Des molécules allant jusqu’à 1 million de nucléotides peuvent ainsi être séquencées. De plus, ce type de séquenceur possède un très petit format comparativement aux séquenceurs utilisant une autre technologie, il est donc facilement transportable par un individu. Il a notamment été testé dans la station spatiale internationale. Des améliorations doivent cependant encore être apportées pour augmenter la fiabilité des données générées, comme en témoigne le résultat obtenu lors du dernier concours FDAPrecision.

​

Une autre technologie de troisième génération permettant d’obtenir de longs fragments a été développée par la compagnie Pacific Biosciences. Le séquençage PacBio génère deux types de séquences de grande longueur selon deux modes de fonctionnement: le séquençage continu de longs fragments (CLR) ou le séquençage de consensus circulaire (CCS).

Pour la méthode CLR, des adaptateurs circulaires sont fixés aux extrémités de l’ADN double-brin des spécimens afin de créer une librairie appelée SMRTBell (Single Real-Time Molecule). Chaque molécule est ensuite immobilisée dans un puits (ou Zero-Mode Waveguide ZMW) unique contenant une polymérase placée au fond de ce puits avec des nucléotides marqués par un fluorochrome. Lorsqu’un nucléotide est incorporé par la polymérase, une fluorescence est émise et détectée en temps réel. Ceci est répété en parallèle avec des milliers de ZMW. Des molécules allant jusqu’à 60 kb peuvent être séquencées (moyenne de 20kb) dans ce mode qui fonctionne avec un simple passage. De plus, la mesure de la cinétique de la polyméase en temps réel permet de détecter certaines modifications épigénétiques et ce, dans la même réaction. La précision finale varie entre 85 et 90%.

​

La technique CCS permet d’augmenter drastiquement la qualité de la séquence consensus obtenue en faisant de multiples lectures de la même molécule. La longueur des fragments est plus courte que les fragments CLR mais le consensus créé est fiable à plus de 99%.

Les CLR associés à des fragments CCS donnent une bonne couverture de tout le génome avec une fiabilité de plus de 99.999% selon les résultats obtenus lors du dernier concours FDA Precision de 2021.

Cette technologie est particulièrement recommandée dans le cas d’assemblages de génomes De Novo ou pour séquencer des régions difficiles à amplifier comme les télomères, régions centromériques qui possèdent de nombreuses répétitions qui posent des problèmes lors de l’alignement avec des fragments de courte longueur.

bottom of page