Il y a dix ans, une équipe de recherche internationale a achevé un ambitieux effort de lecture des 3 milliards de lettres d'informations génétiques présentes dans chaque cellule humaine. Le programme, connu sous le nom de projet du génome humain, a fourni le plan directeur pour la vie humaine, un exploit qui a été comparé à l’atterrissage d’un homme sur la lune.
Le Dr Eric D. Green a été impliqué dès le début en raffinant certaines des technologies clés utilisées dans le projet. À cette époque, il était stagiaire postdoctoral et résident en pathologie à la Washington University à St. Louis. Il a découpé ses 5% du génome en se concentrant sur la cartographie de l'ADN du chromosome 7. Aujourd'hui, Green est directeur de l'Institut national de recherche sur le génome humain, qui fait progresser la compréhension du génome humain grâce à la recherche en génomique.
Revenons au milieu et à la fin des années 1980, lorsque l’idée du projet du génome humain a été conçue. Quelle était la motivation à l'époque?
Cela dépend à qui vous demandez. Différentes personnes avaient différentes motivations. N'oubliez pas que les années 70 et le début des années 80 marquaient l'ère de la révolution de la biologie moléculaire. Des progrès significatifs dans les méthodes nous ont permis d’isoler et d’étudier l’ADN en laboratoire.
Aux États-Unis, par exemple, le Département de l’énergie s’intéresse beaucoup à l’idée d’étudier le génome en raison de son intérêt pour la mutation et du processus de mutation associé à certaines formes d’énergie, telles que l’énergie nucléaire.
Si vous vous adressez à des instituts nationaux de la santé, ou à des chercheurs en biomédecine et à des chercheurs du domaine de la santé, ils étaient très intéressés à pouvoir élucider les bases génétiques de la maladie. Parmi les nombreuses maladies génétiques envisagées, il y avait bien sûr le cancer.
De nombreuses personnes de la recherche biomédicale - même celles travaillant sur des organismes modèles, comme les mouches, les vers et la levure - ont reconnu que, si nous pouvions comprendre comment examiner de manière exhaustive les génomes complexes, en commençant par les mouches, les vers et la levure, puis en travaillant notre chemin vers les humains, il fournirait des informations fondamentales pour comprendre le fonctionnement du génome.
De nombreuses idées différentes ont coexisté, ce qui, avec l’avancée de progrès technologiques incrémentaux mais importants, donnait à penser que le problème du séquençage du génome humain et de la détermination de l’ordre de 3 milliards de lettres était réalisable.
D'où vient le matériel pour le projet génome? À qui appartenait le génome?
Lorsque le projet sur le génome a démarré, il était encore assez fragmentaire. Différentes personnes créaient différentes collections et fragments d'ADN appelés bibliothèques, qui ne sont que des fragments d'ADN clonés. Ils le feraient de n'importe qui: parfois ce serait la tête du laboratoire, parfois ce serait le stagiaire postdoctoral ou l'étudiant diplômé. Ils ne feraient que saisir l'ADN à l'époque, alors que cela n'aurait aucune incidence.
Mais ensuite, quand le moment est venu de créer les bibliothèques qui serviront au séquençage du génome humain dans le cadre du projet du génome humain, la personne la mieux qualifiée pour créer ces bibliothèques était un scientifique travaillant au Roswell Park Cancer Institute. à Buffalo, New York. [L’équipe] a obtenu le consentement éclairé d’environ 10 ou 20 donneurs de sang anonymes, puis en a choisi un au hasard, c’était la personne. Environ 60% de la séquence du génome humain générée par le projet du génome humain provenait d'un donneur de sang situé à Buffalo, dans l'État de New York.
Mais vous savez quoi, peu importe. Si vous parcourez la séquence du génome humain générée par le projet du génome humain, c'est comme une mosaïque. Vous pouvez aller chercher cent mille lettres et il se peut que ce soit une personne de Buffalo. Il se peut que vous finissiez avec les cent mille prochaines années et que ce soit quelqu'un d'autre. Et les cent mille suivants, quelqu'un d'autre. Tout ce qui a servi était une référence. Et comme tous les humains sont identiques à 99, 9% au niveau de la séquence, cette première séquence ne doit pas nécessairement être une personne réelle. Ce ne peut être qu'une référence hypothétique d'une personne.
De toutes ces informations, pourquoi avez-vous choisi de vous concentrer sur le chromosome 7 [le génome humain a 23 chromosomes]?
C'était un peu arbitraire. Nous voulions choisir un chromosome pas trop gros. Nous ne voulions pas en choisir un qui était trop petit. Nous savions qu'il y aurait beaucoup de travail, nous avons donc choisi un chromosome de taille moyenne.
Nous ne voulions pas en choisir un auquel beaucoup de personnes travaillaient déjà. À ce stade, le gène le plus célèbre du chromosome 7 était le gène de la fibrose kystique, découvert en 1989. Nous avions en fait isolé une partie de cette région et menions des études à titre pilote.
La vérité est que nous l’avons choisie parce qu’elle n’était pas trop grande, ni trop petite ni trop encombrée. C'était une façon arbitraire de commencer. à la fin du projet sur le génome, la plupart des études étaient menées à l'échelle du génome.
Comment le travail a-t-il changé pendant la durée de vie du projet?
Toute l'histoire de la génomique est celle du développement technologique. Si vous tracez où les énormes progrès ont été réalisés, chacun d’eux est associé à des avancées technologiques. Au début du projet sur le génome, nous avons constaté que nous avions de meilleurs moyens d’isoler de gros morceaux d’ADN.
Lors du séquençage de génomes d'organismes plus petits, tels que les drosophiles, nous avons essentiellement industrialisé le processus de séquençage, en le rendant de plus en plus automatisé.
Au début du projet sur le génome, l’idée était: «séquençons les génomes des mouches, des vers et de la levure, tous ces organismes plus petits, en utilisant la méthode du jour», méthode mise au point par Fred Sanger en 1977. L’idée était ne pousserait pas l'accélérateur à commencer à séquencer le génome humain jusqu'à ce qu'une nouvelle méthode de séquençage révolutionnaire soit disponible. Il y a donc eu beaucoup d'efforts pour développer de nouvelles méthodes folles de séquençage de l'ADN.
Lorsque le temps est venu, vers 1997 ou 1998, de penser à commencer à séquencer le génome humain, tout le monde a dit: «Peut-être n’avons-nous pas besoin d’attendre une méthode révolutionnaire, peut-être avons-nous progressivement amélioré la méthode traditionnelle assez pour qu’il puisse être utilisé », et c’est bien ce qui a été décidé.
Cela dit, depuis le projet sur le génome, ce qui a changé le visage de la génomique, ce sont les nouvelles technologies révolutionnaires de séquençage qui sont finalement apparues vers 2005.
Comment ces améliorations ont-elles changé le coût et le temps nécessaire au séquençage?
Le projet du génome humain a pris six à huit ans de séquençage actif et, en termes de séquençage actif, il a déboursé environ un milliard de dollars pour produire la première séquence du génome humain. Le jour où le projet sur le génome a pris fin, nous avons demandé à nos groupes de séquençage: «Très bien, si vous alliez séquencer un deuxième génome humain, hypothétiquement, combien de temps cela prendrait-il et combien coûterait-il?» calcul, ils ont dit: "Waouh, si vous nous donniez encore 10 à 50 millions de dollars, nous pourrions probablement le faire en trois ou quatre mois."
Mais maintenant, si vous allez là où nous en sommes, vous pouvez séquencer un génome humain en environ un jour ou deux. À la fin de cette année, ce sera environ un jour. Et cela ne coûtera que 3 000 à 5 000 dollars.
Quelles ont été les principales découvertes du premier génome et celles qui ont suivi?
Il y a de nouvelles découvertes qui viennent tous les jours. Au cours des dix premières années d'existence de la séquence du génome humain, je pense que nous accumulons chaque jour de plus en plus d'informations sur le fonctionnement du génome humain. Mais nous devrions reconnaître que même 10 ans après, nous n’en sommes qu’aux premiers stades d’interprétation de cette séquence. Dans quelques décennies, nous continuerons à l’interpréter et à le réinterpréter.
Parmi les premières choses que nous ayons apprises, par exemple: Nous avons beaucoup moins de gènes que ce que certaines personnes avaient prédit. Lorsque le génome a commencé, beaucoup de gens ont prédit que les humains auraient probablement 100 000 gènes et qu'ils auraient beaucoup plus de gènes que d'autres organismes, en particulier des organismes plus simples. Il s'avère que ce n'est pas vrai. Il s'avère que nous avons un nombre de gènes beaucoup plus bas. En fait, nous ressemblons probablement plus à 20 000 gènes. Et ce n'est que quelques milliers de plus que les mouches et les vers. Donc, notre complexité n'est pas dans notre numéro de gène. Notre complexité est ailleurs.
L'autre surprise est survenue lorsque nous avons commencé à séquencer d'autres mammifères, en particulier le génome de la souris, le génome du rat, le génome du chien, etc., et que nous avons séquencé 50, 60 ou 70 de ces génomes. Vous alignez ces séquences de génome dans un ordinateur et vous cherchez où sont les séquences très conservées, en d'autres termes, sur des dizaines de millions d'années d'évolution, là où les séquences n'ont pas du tout changé. Les séquences conservées hautement évolutives indiquent presque à coup sûr des séquences fonctionnelles. Ce sont des choses que la vie ne veut pas changer, alors ils les conservent car ils remplissent une fonction fondamentale essentielle à la biologie. Dans le cadre du projet sur le génome, nous pensions que la majorité des régions les plus conservées, qui étaient importantes sur le plan fonctionnel, se trouveraient dans les gènes - les parties du génome qui codent directement pour les protéines. Il s'avère que la majorité des séquences les plus hautement conservées et fonctionnellement inévitables ne se trouvent pas dans les régions codant pour la protéine; ils sont en dehors des gènes.
Alors que font-ils? Nous ne les connaissons pas tous. Mais nous savons que beaucoup d’entre eux sont essentiellement des commutateurs de circuit, comme des variateurs de luminosité, qui déterminent où, quand et combien de gènes sont activés. C'est beaucoup plus compliqué chez l'homme que chez les organismes inférieurs comme les mouches et les vers. Notre complexité biologique ne réside donc pas vraiment dans notre numéro de gène. Ce sont les commutateurs complexes, comme les variateurs de lumière, qui règlent où, quand et combien de gènes sont activés.
Que reste-t-il à découvrir?
Lorsque vous réfléchissez au fonctionnement du génome, vous réfléchissez à la manière dont il fonctionne couramment pour nous tous. Mais l’autre grand intérêt de la génomique, en particulier au cours des 10 dernières années, est de comprendre en quoi nos génomes sont différents. Vous pouvez ainsi souligner que 0, 1% de nos génomes sont différents les uns des autres et en quoi ces différences conduisent à des processus biologiques différents. Il est donc très important de comprendre la variation, puis de la corréler avec différentes conséquences, dont la maladie est une partie majeure.
Il y a eu des avancées remarquables, mais vraiment remarquables. Nous connaissons maintenant la base génomique de près de 5 000 maladies génétiques rares. Lorsque le projet sur le génome a commencé, il n’existait que quelques dizaines de maladies pour lesquelles nous avons compris ce que la mutation causait. C'est une énorme différence. Nous connaissons maintenant de très nombreuses centaines de régions du génome humain qui contiennent des variantes - nous ne savons pas encore quelles sont les variantes - qui présentent un risque de maladies génétiques plus complexes, telles que l'hypertension et le diabète et l'asthme, les maladies cardiovasculaires, etc. .
Nous sommes passés d'un manque total de connaissances sur l'endroit où chercher dans le génome de ces variants pour maintenant avoir des régions très discrètes dans lesquelles chercher. C'est donc une grande priorité de la génomique, qui consiste à essayer de comprendre quelles variantes sont pertinentes pour la maladie. et que faire à leur sujet.