Structure et fonction de l'ADN
98 tarjetasNotes sur la structure, les propriétés biochimiques et l'organisation du génome humain.
98 tarjetas
De la Molécule à la Cellule : De l'ADN à la Protéine
Ce cours explore les concepts fondamentaux de la biologie moléculaire, en partant de la structure de l'ADN jusqu'à son rôle central dans la génération des protéines, tout en reliant ces concepts à des applications pratiques en santé et en recherche. Il est basé sur les contenus de ce cours et peut être approfondi par la lecture de "Biologie moléculaire de la cellule" d'Alberts.
1. Purifier Chimiquement l'Hérédité : L'Évolution de la Compréhension Génétique
La purification chimique de l'hérédité est un jalon scientifique qui a commencé avec des observations abstraites pour aboutir à l'identification de la molécule d'ADN comme support de l'information génétique.
1.1. Les Lois de Mendel et le Matériel Héréditaire Abstrait
Le cheminement débute avec les travaux révolutionnaires de Gregor Mendel publiés en 1865 sur l'hybridation des pois. Ses observations ont posé les fondations de la génétique moderne, même s'il ne connaissait pas la nature chimique du matériel héréditaire.
- Les caractères génétiques sont discrets (ex: rouge vs blanc, grand vs petit), ce qui signifie qu'ils se manifestent sous des formes distinctes et non comme un mélange continu.
- Chaque caractère est déterminé par des formes alternatives, appelées allèles, dont un est hérité de chaque parent.
- Il existe des allèles dominants et récessifs, le dominant masquant l'expression du récessif dans une paire hétérozygote.
- Les allèles ségrègent aléatoirement lors de la formation des gamètes, de sorte que chaque gamète reçoit un seul allèle pour chaque gène.
- Les traits différents sont indépendants les uns des autres (ex: la taille de la plante est indépendante de la couleur de la fleur).
Ces règles ont établi la nécessité d'un "matériel héréditaire", mais sa nature physique restait alors un concept abstrait.
1.2. Localisation Chromosomique de l'Hérédité
Plusieurs scientifiques ont contribué à localiser l'information héréditaire dans les chromosomes :
- Nettie Stevens (1903) a découvert la corrélation entre les caractères chromosomiques et le sexe (chez le ver de farine), suggérant que les chromosomes portent des informations héréditaires.
- Thomas Hunt Morgan (1910-1911), travaillant sur la drosophile (mouche du vinaigre), a démontré que les caractères génétiques sont portés par les chromosomes. Son étudiant, Alfred Henry Sturtevant, a montré en 1911 que certains gènes migrent ensemble sur un même chromosome, posant les bases de la cartographie génétique.
- Hermann Muller (1920) a découvert que les rayons X affectent les caractères héréditaires, prouvant que le matériel héréditaire est bien constitué de matière physique et non d'une entité immatérielle.
Un quizz rappelle que les chromosomes sont constitués de protéines et d'acides nucléiques, ce qui souligne le débat initial sur le porteur réel de l'hérédité entre ces deux macromolécules.
1.3. La Découverte Biochimique des Acides Nucléiques
Parallèlement aux travaux génétiques, la biochimie a progressivement identifié l'ADN :
- 1869 : Friedrich Miescher isole la "nucléine" à partir de leucocytes, une substance riche en phosphore et en azote, qu'il trouve dans le noyau.
- 1879 : Albrecht Kossel découvre les bases organiques constitutives de la nucléine : adénine (A), guanine (G), cytosine (C) et thymine (T).
- 1889 : Richard Altmann purifie l'acide nucléique de la nucléine en éliminant la partie protéique.
- 1891 : Albrecht Kossel découvre la présence d'un sucre dans l'acide nucléique.
- 1908 : Phoebus Levene identifie ce sucre comme du D-ribose. Il faut attendre 1929 pour la caractérisation complète du 2'-désoxy-D-ribose, menant à la nomination de l'Acide Désoxyribonucléique (ADN). En 1910, une deuxième classe d'acide nucléique, l'Acide Ribonucléique (ARN), contenant du D-ribose, est caractérisée dans la levure.
1.4. Le Principe Transformant et la Preuve Incontrovertible de l'ADN
L'idée qu'une substance "transformante" pouvait transmettre des traits héréditaires est apparue après les travaux historiques :
- Avery, MacLeod et McCarty (1943) : Leurs expériences sur la transformation pneumococcique ont démontré qu'un "principe transformant" était transféré d'une bactérie "S" (virulente) tuée par la chaleur à une bactérie "R" (non virulente), la transformant en bactérie "S" virulente. Ils ont purifié biochimiquement cette substance et ont montré qu'elle était l'ADN. Ce fut la première preuve directe que l'ADN plutôt que les protéines était le matériel génétique.
- Hershey et Chase (1952) : Utilisant des bacteriophages (virus infectant les bactéries), ils ont marqué l'ADN des phages avec du phosphore radioactif () et les protéines avec du soufre radioactif (). Seul le (donc l'ADN) est entré dans la bactérie hôte, confirmant de manière décisive que l'ADN est le support de l'information génétique. Ces expériences ont solidifié la reconnaissance de l'ADN comme molécule de l'hérédité.
2. La Composition et la Structure de l'ADN
L'ADN est un polymère dont chaque monomère, appelé nucléotide, est constitué de trois composants principaux.
2.1. Composition des Nucléotides
Chaque nucléotide d'ADN est formé de :
- Un sucre : le 2'-désoxyribose, un pentose (sucre à 5 carbones) qui se distingue du ribose (présent dans l'ARN) par l'absence d'un groupe hydroxyle en position 2'.
- Une base azotée : il existe quatre types de bases, classées en deux catégories :
- Purines : Adénine (A) et Guanine (G), qui possèdent un double cycle.
- Pyrimidines : Thymine (T) et Cytosine (C), qui possèdent un simple cycle.
- Un groupe phosphate.
La structure d'un nucléotide est telle qu'il comporte un groupe phosphate qui permet la liaison du carbone 5' du sucre d'un nucléotide au carbone 3' du sucre d'un autre nucléotide, formant la chaîne polynucléotidique.
2.2. Les Règles de Chargaff
Les travaux d'Erwin Chargaff au milieu du 20ème siècle ont révélé des proportions spécifiques des bases dans l'ADN, connues sous le nom de Règles de Chargaff :
- La quantité d'adénine (A) est égale à la quantité de thymine (T) ().
- La quantité de cytosine (C) est égale à la quantité de guanine (G) ().
- Ces règles impliquent que le rapport purines/pyrimidines est toujours d'environ 1 ().
Ces observations ont été cruciales pour élucider la structure en double hélice de l'ADN.
| Source | Adénine à Guanine | Thymine à Cytosine | Adénine à Thymine | Guanine à Cytosine | Purines à Pyrimidines |
|---|---|---|---|---|---|
| Bœuf | 1.29 | 1.43 | 1.04 | 1.00 | 1.1 |
| Humain | 1.56 | 1.75 | 1.00 | 1.00 | 1.0 |
| Poulet | 1.45 | 1.29 | 1.06 | 0.91 | 0.99 |
| Saumon | 1.43 | 1.43 | 1.02 | 1.02 | 1.02 |
| Blé | 1.22 | 1.18 | 1.00 | 0.97 | 0.99 |
| Levure | 1.67 | 1.92 | 1.03 | 1.20 | 1.0 |
| Hemophilus influenzae | 1.74 | 1.54 | 1.07 | 0.91 | 1.0 |
| E.coli K2 | 1.05 | 0.95 | 1.09 | 0.99 | 1.0 |
| Bacille tuberculeux aviaire | 0.4 | 0.4 | 1.09 | 1.08 | 1.1 |
| Serratia marcescens | 0.7 | 0.7 | 0.95 | 0.86 | 0.9 |
| Bacillus schatz | 0.7 | 0.6 | 1.12 | 0.89 | 1.0 |
2.3. La Découverte de la Double Hélice (Watson et Crick, 1953) et le Rôle de Rosalind Franklin
La publication de James Watson et Francis Crick en 1953, grandement inspirée par les données de diffraction aux rayons X de Rosalind Franklin (notamment la "Photo 51") et les règles de Chargaff, a révélé la structure tridimensionnelle de l'ADN en double hélice. Leurs conclusions clés sont :
- L'ADN est constitué de deux chaînes hélicoïdales antiparallèles, orientées de 5' vers 3' et de 3' vers 5' respectivement.
- Les groupes phosphates et les sucres (désoxyribose) forment le squelette externe de la double hélice, ce qui rend la molécule chargée négativement et soluble dans l'eau.
- Les bases azotées sont situées à l'intérieur de l'hélice, empilées les unes sur les autres perpendiculairement à l'axe de la double hélice.
- L'appariement des bases est complémentaire et spécifique :
- L'adénine (A) s'apparie toujours avec la thymine (T) via deux ponts hydrogène.
- La guanine (G) s'apparie toujours avec la cytosine (C) via trois ponts hydrogène.
- La rupture des ponts hydrogène permet de séparer les brins d'ADN, et chaque brin peut ensuite servir de matrice pour la synthèse d'une nouvelle double hélice, suggérant ainsi un mécanisme de réplication du matériel génétique (comme l'ont noté Watson et Crick : "Il n'a pas échappé à notre attention que l'appariement spécifique des bases que nous avons proposé suggère immédiatement un mécanisme possible de réplication pour le matériel génétique").
2.4. Ponts Hydrogène et Complémentarité
Les ponts hydrogène sont la force clé qui maintient les deux brins d'ADN ensemble et assure la complémentarité des bases.
- Un pont hydrogène se forme lorsqu'un atome d'hydrogène est lié à un atome très électronégatif (comme N, O ou F) et est attiré par un autre atome électronégatif sur une molécule voisine.
- Dans l'ADN, l'appariement précis (A-T et G-C) est rendu possible par le nombre et le positionnement spécifiques des donneurs et accepteurs de ponts hydrogène sur chaque base.
- La présence de trois ponts hydrogène entre G et C confère une plus grande stabilité à cette paire par rapport à la paire A-T (deux ponts hydrogène). Par conséquent, plus une séquence d'ADN a une teneur élevée en G-C, plus elle est thermodynamiquement stable et plus il faut d'énergie pour la séparer.
2.5. Brins Antiparallèles et Réplication
La structure antiparallèle (un brin orienté 5'->3', l'autre 3'->5') et la complémentarité des bases sont fondamentales pour la réplication de l'ADN. Si les brins se séparent, chaque brin sert de modèle pour la synthèse d'un nouveau brin complémentaire, assurant une copie fidèle de l'information génétique.
2.6. Sillons Majeur et Mineur
La double hélice d'ADN n'est pas lisse. Elle présente des creux le long de son axe : le sillon majeur et le sillon mineur.
- Ces sillons exposent les bords des bases azotées, offrant des sites de reconnaissance spécifiques.
- La plupart des contacts entre l'ADN et les protéines (comme les facteurs de transcription) se produisent dans le sillon majeur, qui est plus large et plus profond, permettant aux protéines d'accéder aux motifs de liaison des bases sans avoir à ouvrir la double hélice.
- Les caractéristiques physico-chimiques des sillons (donneurs/accepteurs de ponts H, protubérances hydrophobes) sont utilisées par les protéines pour une reconnaissance spécifique de séquences.
2.7. Dénaturation et Rénaturation de l'ADN
Les brins d'ADN peuvent être séparés (dénaturation) et réassociés (rénaturation) :
- La dénaturation (ou "fusion") de l'ADN implique la rupture des ponts hydrogène entre les bases. Elle est généralement induite par la chaleur (température élevée) ou des agents chimiques. Elle ne casse pas les liaisons phosphodiester du squelette.
- La renaturation (ou "hybridation") est le processus inverse, où les brins d'ADN dénaturés se réassocient pour reformer une double hélice stable lorsque les conditions (température, concentration en sel) redeviennent favorables.
- La stabilité thermique de l'ADN est directement liée à sa fraction GC. Plus il y a de paires G-C (qui ont trois ponts hydrogène), plus la température nécessaire pour dénaturer l'ADN (température de fusion, ) est élevée.
- La renaturation est un procédé spécifique et réversible, ce qui est utilisé dans de nombreuses techniques de biologie moléculaire comme l'hybridation (PCR, Southern blot, FISH).
2.8. Autres Structures Possibles de l'ADN
Bien que la forme majoritaire de l'ADN génomique soit la forme B (canonique), d'autres structures peuvent exister in vivo, souvent liées à des séquences nucléotidiques spécifiques et pouvant jouer des rôles régulateurs :
- Forme Z-ADN : Une forme d'hélice gauche, plus allongée et plus fine que la forme B, observée dans des régions d'ADN alternant purines et pyrimidines (ex: CGCGTGTGCGCGTG).
- Forme H-ADN (triplex) : Une structure à trois brins qui peut se former dans des régions riches en polypurines ou polypyrimidines avec répétitions en miroir.
- Tétrades de G-quadruplex : Structures à quatre brins formées par des séquences riches en guanine (plus de trois guanines consécutives) et peuvent jouer des rôles dans la régulation génique et la stabilité télomérique.
Ces structures non canoniques, bien que difficiles à quantifier précisément dans le génome total, peuvent influencer des processus clés comme :
- L'initiation et la vitesse de réplication de l'ADN.
- L'apparition de variations génétiques (mutations).
- La densité en histones (protéines d'empaquetage de l'ADN).
- La vitesse de la transcription.
3. Principes d'Organisation du Génome Humain
Le génome humain haploïde (présent dans chaque gamète) est composé d'environ 3,3 milliards de paires de bases (pb).
3.1. Chromosomes Humains
- L'entier du génome est réparti sur 24 chromosomes : 22 autosomes (numérotés de 1 à 22) et 2 chromosomes sexuels (X et Y).
- Chaque cellule somatique humaine possède 46 chromosomes (22 paires d'autosomes, une paire de chromosomes sexuels - XX pour les femmes, XY pour les hommes), soit un génome diploïde.
- Les chromosomes sont constitués d'ADN et de protéines (principalement des histones).
- Les chromosomes sont des structures dynamiques. Durant la mitose et la méiose (phases de division cellulaire), ils se condensent fortement pour être facilement séparés. Durant l'interphase (90% du temps), l'ADN est bien moins condensé, ressemblant à une "pelote de laine", pour permettre l'accès aux machineries de réplication et de transcription.
3.2. L'ADN dans le Noyau : La Chromatine
L'ADN, en association avec des protéines (principalement des histones), forme la chromatine. Cette organisation permet d'empaqueter les longs brins d'ADN dans le petit volume du noyau cellulaire. La dynamique de la chromatine, y compris les niveaux de compaction et les modifications des histones, sera abordée plus en détail dans des cours ultérieurs.
4. Le Séquençage du Génome Humain
Le Projet Génome Humain (PGH) a été une initiative internationale monumentale visant à séquencer l'intégralité du génome humain.
4.1. L'Initiative Publique
- Début : 1990
- Coût estimé : 3 milliards de dollars.
- Participants : 20 institutions de 6 pays.
- Matériel génétique : un mélange de l'ADN de plusieurs individus pour obtenir une "séquence de référence".
La méthodologie générale de l'initiative publique (approche par "clonage hiérarchique") :
- Fragmentation de l'ADN génomique : L'ADN humain est coupé en grands fragments.
- Insertion dans des chromosomes artificiels de bactéries (BACs) : Ces fragments sont insérés dans des vecteurs BAC, transformés en bactéries et amplifiés par clonage.
- Fragmentation des clones individuels : Chaque clone BAC est ensuite coupé en fragments plus petits.
- Séquençage et assemblage des petits fragments : Ces petits fragments sont séquencés individuellement, puis assemblés grâce à leurs régions chevauchantes pour reconstituer la séquence de chaque clone BAC.
- Assemblage des clones entre eux : Les séquences des clones BAC sont à leur tour assemblées, toujours via des chevauchements, pour reconstruire la séquence complète d'un chromosome, puis du génome entier.
4.2. Historique des Publicatios et Versions
- Première version annoncée : juin 2000, publiée en février 2001.
- Version finale annoncée : avril 2003, publiée en octobre 2004.
- Dernière version "sans trou" (Telomere-to-Telomere Consortium) : publiée le 1er avril 2022, révélant les 8% restants du génome qui étaient auparavant difficiles à séquencer (régions répétées, centromères, télomères).
4.3. Surprises et Remise en Question
Le séquençage du génome humain a révélé des faits surprenants et a fondamentalement modifié notre compréhension de la génétique :
- Moins de gènes codant que prévu : Environ 20 000 gènes codant des protéines, comparable à d'autres animaux, ce qui est bien moins que les estimations initiales.
- Faible proportion du génome codant : Les gènes codant des protéines n'occupent qu'environ 1,2% du génome.
- Abondance de séquences répétées : Le génome contient une grande quantité de séquences répétées, rendant la première version incomplète et l'assemblage difficile.
- Millions de séquences régulatrices : Une part significative du génome est constituée de séquences non codantes mais régulatrices, jouant un rôle crucial dans l'expression génique.
- Importance de la régulation : Les changements de régulation sont considérés comme un moteur majeur de l'évolution des espèces.
4.4. Méthodes de Séquençage Actuelles
Le coût du séquençage a considérablement diminué grâce aux avancées technologiques, permettant l'utilisation de différentes méthodes :
- Short reads (Illumina) : Génèrent des fragments de 50 à 500 paires de bases, très précis et à faible coût, largement utilisés.
- Long reads (PACBIO, Nanopore Sequencing) : Génèrent des fragments de 5 000 à 1 000 000 paires de bases. Essentiels pour séquencer des régions répétées ou complexes où les short reads échouent, mais avec un coût plus élevé et un taux d'erreur potentiellement plus important.
5. Le Génome Humain : Applications
Les connaissances du génome humain ont des implications majeures dans de nombreux domaines, notamment en médecine.
5.1. Identification des Gènes de Maladies Monogéniques
Les maladies monogéniques (causées par la mutation d'un seul gène) ont vu leur nombre de gènes identifiés exploser :
- 1990 : 70 gènes identifiés.
- 2003 : 1700 gènes identifiés.
- 2020 : plus de 5000 gènes identifiés (ex: mucoviscidose, myopathie de Duchenne).
Cette identification est cruciale pour le diagnostic, le conseil génétique et le développement de thérapies ciblées.
5.2. Maladies Multifactorielles et Variants Génétiques
Pour les maladies multifactorielles (impliquant plusieurs gènes et des facteurs environnementaux, ex: diabète, schizophrénie), l'identification des variants génétiques a également progressé :
- 2003 : 8 variants identifiés, l'effet d'un variant étant souvent faible.
- Les avancées en méthodes de séquençage et l'augmentation de la taille des cohortes d'étude (rendue possible par la baisse du coût du séquençage) ont permis de détecter un grand nombre de variants.
- Variants fréquents : Diabète de type 2 (403), Maladies inflammatoires de l'intestin (273), Schizophrénie (245).
- Variants rares : Schizophrénie (10), Retard intellectuel (150).
- La compréhension des SNP (Single Nucleotide Polymorphism), des pseudogènes, des ARN non codants et des promoteurs est essentielle pour cerner la complexité de ces maladies.
5.3. Applications Cliniques et Médicales
- Diagnostic précoce et traitement : Projets de séquençage du génome de nouveau-nés pour identifier les problèmes génétiques traitables avant qu'ils ne se manifestent (ex: projet à New York et en Grande-Bretagne visant à séquencer 200 000 bébés).
- Médecine personnalisée : Séquençage du génome de tumeurs pour identifier les mutations spécifiques et choisir les médicaments les plus adaptés à chaque patient (thérapies ciblées en oncologie).
- Développement de médicaments : Depuis 2001, presque 100% des nouveaux médicaments autorisés ont des cibles protéiques identifiées, grâce à la connaissance accrue du génome.
En somme, le parcours de la compréhension du matériel héréditaire, de la molécule d'ADN à l'intégralité du génome humain, a transformé la biologie et la médecine, ouvrant des voies inouïes pour la compréhension, le diagnostic et le traitement des maladies.
Empezar cuestionario
Prueba tus conocimientos con preguntas interactivas