Structure, Organisation et Polymorphismes du Génome Humain
25 cartes25 cartes
Encadrement Réglementaire des Activités de Génétique en France
L'encadrement des activités de génétique en France repose sur plusieurs piliers juridiques et stratégiques, visant à garantir l'éthique, la sécurité et l'efficacité des pratiques.
1. La Convention d'Oviedo
La Convention d'Oviedo est le seul instrument juridique international contraignant en matière de bioéthique. Elle s'inspire largement des lois françaises de bioéthique.
- STCE n°164 : Convention pour la protection des Droits de l'Homme et de la dignité de l'être humain à l'égard des applications de la biologie et de la médecine.
- STCE n°203 : Protocole additionnel à la Convention sur les Droits de l'Homme et la biomédecine, relatif aux tests génétiques à des fins médicales.
2. Les Lois de Bioéthique Françaises
La Loi n°94-654 du 29 juillet 1994 a posé les premières bases de la bioéthique en France, régissant le don et l'utilisation des éléments et produits du corps humain, l'assistance médicale à la procréation et le diagnostic prénatal.
- Le terme "bioéthique" combine "bio" (vivant) et "éthique" (ce qui est bon pour l'homme).
Finalités des Examens Génétiques
Les examens génétiques peuvent être réalisés à trois fins principales :
- Médicale : Diagnostic, pronostic, dépistage.
- De recherche scientifique : Compréhension des maladies, développement de nouvelles thérapies.
- Judiciaire : Identification, preuve.
Types d'Examens Génétiques Médicaux
- Prénatal : Réalisé avant la naissance.
- Postnatal : Réalisé après la naissance.
Nature des Caractéristiques Génétiques Analysées
- Génétique constitutionnelle : Analyse des caractéristiques génétiques héritées ou acquises précocement (ex: maladies génétiques héréditaires).
- Génétique somatique : Recherche et analyse de caractéristiques génétiques dont le caractère hérité ou transmissible est initialement inconnu (ex: mutations tumorales).
Réglementation Spécifique
- Article L.1130-1 du Code de la Santé Publique : L'examen des caractéristiques génétiques constitutionnelles est soumis à l'article 16-10 du Code Civil.
- Article 16-10 du Code Civil :
- L'examen ne peut être entrepris qu'à des fins médicales ou de recherche scientifique.
- Il est subordonné au consentement exprès et écrit de la personne, recueilli après information complète sur :
- La nature et l'indication/objectif de l'examen.
- La possibilité de révéler incidemment des caractéristiques génétiques sans lien avec l'indication initiale, mais utiles pour la prévention ou les soins de la personne ou de sa famille.
- La possibilité de refuser la révélation de ces résultats fortuits et les risques pour la famille en cas d'anomalie grave.
- Le consentement est révocable à tout moment.
- Article L1131-3 du Code de la Santé Publique : Seuls les praticiens agréés par l'Agence de la Biomédecine sont habilités à réaliser des examens génétiques à des fins médicales.
- Article L1131-2-1 du Code de la Santé Publique : Les laboratoires de biologie médicale doivent être autorisés par l'Agence Régionale de Santé pour pratiquer ces examens.
- Article L.1130-2 du Code de la Santé Publique : Si un examen de caractéristiques génétiques somatiques révèle des caractéristiques constitutionnelles, la personne doit être orientée vers une consultation chez un médecin qualifié en génétique.
3. Plan France Médecine Génomique 2025 (PFMG 2025)
Ce plan vise à intégrer la médecine génomique dans le système de soins français, en développant le séquençage à haut débit et l'analyse des données génomiques pour le diagnostic et la prise en charge des maladies rares et des cancers.
Rappels : Structure de l'ADN, Taille des Génomes et Valeur C
1. Définition du Génome
Le génome désigne l'ensemble de l'information héréditaire d'un organisme, présente en totalité dans chaque cellule. Le support matériel de cette information est l'ADN (Adénine, Thymine, Guanine, Cytosine) ou, plus rarement, l'ARN (Adénine, Uracile, Guanine, Cytosine).
2. La Valeur C
La valeur C représente la taille d'un génome, exprimée en millions de paires de bases (Mb) ou en picogrammes (pg). 1 pg correspond à 978 Mb.
- La valeur C est extrêmement variable selon les espèces :
- Virus : quelques milliers de paires de bases.
- Bactéries : quelques millions de paires de bases.
- Mammifères : quelques milliards de paires de bases.
- Paradoxe de la valeur C : La taille du génome ne corrèle pas directement avec la complexité de l'organisme. Par exemple, certaines plantes ont des génomes bien plus grands que celui de l'homme.
Présentation Générale du Génome Humain Nucléaire et du Génome Mitochondrial
Le génome humain est composé de deux entités distinctes : le génome nucléaire et le génome mitochondrial.
1. Génome Nucléaire
- Taille : Environ 3,055 gigabases (Gb).
- Structure : Molécules linéaires organisées en chromosomes.
- Nombre de molécules d'ADN différentes : 23 dans les cellules XX et 24 dans les cellules XY.
- Nombre total de molécules d'ADN par cellule : 46 dans les cellules diploïdes, 23 dans les cellules haploïdes.
- Pourcentage GC : 41,5%.
- Protéines associées : Histones et protéines non-histones, formant la chromatine.
- Nombre de gènes codant des protéines : Environ 20 000.
- Nombre de gènes codant des ARN : Environ 25 000.
- Nombre de pseudogènes : Environ 15 000.
- Densité en gènes codant des protéines : Environ 1 gène pour 80 kb.
- Proportion d'ADN répété : Environ 54%.
- Transcription : De nombreux gènes sont transcrits de manière indépendante.
- Introns : Retrouvés dans la plupart des gènes codant des protéines et des ARN.
- Pourcentage d'ADN codant pour des protéines : Environ 1,1%.
- Code génétique : 61 codons pour les acides aminés + 3 codons stop.
- Transmission : Mendélienne pour les autosomes et le chromosome X ; paternelle pour le chromosome Y.
2. Génome Mitochondrial
- Origine : Les mitochondries proviennent de l'endosymbiose d'une α-protéobactérie il y a environ 1,5 milliard d'années.
- NUMTs (Nuclear Mitochondrial DNA sequences) : Séquences du génome mitochondrial retrouvées dans le génome nucléaire (environ 750 séquences incomplètes, soit 627 Kb). Ces événements sont anciens, les plus récents datant de plus de 60 millions d'années.
- Taille : 16,569 kilobases (kb).
- Structure : Molécule circulaire.
- Nombre de molécules d'ADN différentes : 1.
- Nombre total de molécules d'ADN par cellule : Plusieurs milliers de copies (varie selon les types cellulaires ; 2-10 par mitochondrie).
- Pourcentage GC : 44%.
- Protéines associées : Déplété en protéines.
- Nombre de gènes codant des protéines : 13.
- Nombre de gènes codant des ARN : 24.
- Nombre de pseudogènes : Aucun.
- Densité en gènes codant des protéines : Environ 1 gène pour 0,45 kb.
- Proportion d'ADN répété : Très peu.
- Transcription : Nombreux transcrits multigéniques produits à partir des deux brins.
- Introns : Absents.
- Pourcentage d'ADN codant pour des protéines : Environ 66%.
- Code génétique : 60 codons pour les acides aminés + 4 codons stop (4 codons interprétés différemment par rapport au génome nucléaire).
- Transmission : Exclusivement maternelle.
3. Organisation de l'ADN dans le Noyau : La Chromatine
Dans les noyaux des cellules eucaryotes, l'ADN est organisé en chromatine, un complexe d'ADN et de protéines (principalement des histones). Cette organisation est essentielle pour :
- Intégrité génomique : Compaction et protection de l'ADN.
- Régulation de l'expression génique : Établissement et maintien des états d'expression des gènes, déterminant l'identité cellulaire.
Types de Chromatine
- Euchromatine : Chromatine décondensée, transcriptionnellement active.
- Hétérochromatine : Chromatine très compactée, avec des régions d'ADN non-transcrit.
- Hétérochromatine constitutive : Portions de chromosomes apparemment inactives dans toutes les cellules (centromères et télomères), répliquées tardivement.
- Hétérochromatine facultative : Portions variables selon le type de cellule ou l'état de différenciation cellulaire.
Le Nucléosome
Le nucléosome est l'unité fondamentale de la chromatine. Il est composé de :
- Une région centrale : 146 paires de bases d'ADN enroulées autour d'un octamère protéique (deux copies de chaque histone H2A, H2B, H3 et H4).
- Une région inter-nucléosomique : Caractérisée par la présence de l'histone H1.
- Les extrémités N-terminales des histones dépassent de la structure et sont la cible de modifications post-traductionnelles, jouant un rôle clé dans la régulation de l'expression génique.
The Human Genome Project (HGP)
Le Projet Génome Humain (HGP), lancé en 1990 et achevé en 2003, a eu pour objectif de séquencer l'intégralité du génome humain.
1. Contexte et Pionniers
- Frederick Sanger et Walter Gilbert (Prix Nobel de Chimie 1980) ont développé des méthodes de séquençage de l'ADN.
- Leroy Hood a contribué au développement de séquenceurs automatiques.
- Le projet a été une collaboration internationale impliquant de nombreux scientifiques et instituts.
2. Évolution du Séquençage
- 2001 : Première ébauche du génome humain publiée (2,69 Gb assemblées avec environ 150 000 lacunes).
- 2003 : Achèvement du HGP. Coût initial estimé à 2,7 milliards de dollars sur 13 ans.
- 2008 (James Watson) : Séquençage de son propre génome en 4,5 mois pour environ 1,5 million de dollars.
- 2019 : Coût du séquençage d'un génome humain complet < 10 000 dollars. Record du monde de diagnostic génétique le plus rapide en 19,5 heures.
- 2022 : Record du monde de diagnostic génétique le plus rapide en 5 heures et 2 minutes.
3. Avancées Récentes
- 2021 : Publication du Genome Reference Consortium Human Build 38 patch release 13 (GRCh38.p13), avec 2,92 Gb assemblées et 151 Mb de séquences inconnues.
- 2022 : Le consortium T2T (Telomere-to-Telomere) publie la version T2T-CHM13 v1.1, un génome humain complet et sans lacunes, assemblant 3,055 Gb.
4. Contenu du Génome Humain (GENCODE release 39, GRCh38.p13)
- Gènes codant des protéines : 19 982
- Gènes ARN : 26 378 (dont 18 811 ARN longs non codants et 7 567 petits ARN non codants)
- Pseudogènes : 14 763 (dont 10 662 traités et 3 557 non traités)
- Autres : 544
- Total estimé : Environ 61 500 gènes.
5. Bases de Données de Polymorphismes
- gnomAD v2.1.1 (GRCh37) : Agrège 125 748 exomes et 15 708 génomes entiers.
- gnomAD v3.1.2 (GRCh38) : Agrège 76 156 génomes entiers d'ascendances diverses.
- gnomAD v4.1.0 (GRCh38) : Agrège 730 947 séquences d'exomes et 76 215 séquences de génomes entiers.
Présentation des Gènes Codant les Protéines : Définition de la Notion de Gène, Transcription, Épissage et Traduction
Les gènes codant les protéines sont des séquences d'ADN qui, via la transcription et la traduction, donnent naissance à des protéines.
1. Le Dogme Central de la Biologie Moléculaire
L'information génétique circule de l'ADN vers l'ARN messager (ARNm), puis vers les protéines :
- Réplication : L'ADN est copié.
- Transcription : L'ADN est transcrit en ARN primaire dans le noyau.
- Maturation de l'ARN : L'ARN primaire subit un coiffage (capping), un clivage/polyadénylation et un épissage pour former l'ARNm mature.
- Export : L'ARNm mature est exporté du noyau vers le cytoplasme.
- Traduction : L'ARNm est traduit en protéine dans le cytoplasme.
2. Caractéristiques des Gènes Codant les Protéines
- Environ 20 000 gènes codant des protéines dans le génome humain.
- Les exons de ces gènes occupent seulement 1,2% du génome.
- La taille des gènes est très variable : de moins de 1 kb (gène SRY) à plus de 2 Mb (gène DMD, RBFOX1).
- La plupart des gènes sont morcelés en exons (environ 325 000 exons) séparés par des introns. Le nombre d'introns varie de 0 à 363 par gène.
- Au total, le génome humain contient plus de 400 000 exons (incluant ceux des ARN non codants).
- Plus de 95% des gènes sont soumis à la transcription, à l'épissage et à la maturation 3' alternatifs.
Statistiques Moyennes des Gènes Humains Codant des Protéines
- Taille moyenne d'un gène : 66 kb (médiane : 26 kb).
- Nombre moyen d'exons par gène : Environ 12 (médiane : environ 9).
- Taille moyenne d'un exon codant : 160 bp (médiane : 120 bp).
- Taille moyenne d'un intron : Environ 7 kb (médiane : environ 1,75 kb). Aucun intron n'est inférieur à 30 bp.
3. Structure d'un Gène Codant une Protéine
Un gène est composé de plusieurs éléments clés :
- Promoteur : Région de l'ADN située en amont (en 5') du gène, indispensable à sa transcription. Il contient le site d'initiation de la transcription (+1) et les sites de fixation des facteurs de transcription et de l'ARN polymérase.
- ARN polymérase I : Transcrit les ARNr 28S, 5.8S, 18S.
- ARN polymérase II : Transcrit les ARNm, sncRNA (miRNA, siRNA, piRNA, snoRNA, snRNA), lncRNA, LINEs.
- ARN polymérase III : Transcrit les ARNt, ARNr 5S, ARN 7SL, SINEs.
- Enhancers : Régions de l'ADN où se fixent des facteurs de transcription pour activer la transcription des gènes. Ils agissent en cis et peuvent être situés jusqu'à 1 million de paires de bases en amont ou en aval des gènes régulés.
- Silencers : Régions de l'ADN où se fixent des facteurs de transcription pour inhiber la transcription des gènes. Ils agissent en cis.
- Insulators : Régions de l'ADN où se fixent des facteurs empêchant un enhancer (ou un silencer) d'activer (ou d'inhiber) la transcription d'un autre gène voisin.
- Exons : Parties du gène qui persistent après l'épissage de l'ARN primaire. Les exons ne sont pas tous codants et ne sont pas nécessairement des multiples de trois bases.
- Introns : Parties du gène situées entre les exons, excisées lors de l'épissage.
- UTR (Untranslated Transcribed Region) : Régions transcrites mais non traduites (5'UTR et 3'UTR).
- Séquences consensus : Séquences nucléotidiques impliquées dans des fonctions similaires, avec quelques variations.
4. Processus de Transcription et Maturation de l'ARNm
- Transcription : L'ARN polymérase synthétise un transcrit primaire à partir du brin matrice de l'ADN.
- Coiffage (Capping) : Ajout d'une coiffe en 5' (cap) au transcrit primaire.
- Clivage/Polyadénylation : Ajout d'une queue poly-A en 3' au transcrit primaire.
- Épissage (Splicing) : Excision des introns et ligature des exons pour former l'ARNm mature.
- Sites consensus d'épissage "traditionnels" :
- Site donneur (5' splice site) : Charrière exon/intron (souvent GT).
- Site accepteur (3' splice site) : Charrière intron/exon (souvent AG), précédé d'une région riche en pyrimidines et d'un site de branchement contenant un A.
- Épissage alternatif : Un même transcrit primaire peut être épissé de différentes manières pour produire plusieurs ARNm matures, codant des protéines différentes (isoformes). Ce mécanisme est régulé par des protéines régulatrices (activateurs et répresseurs) se fixant sur des séquences spécifiques dans les exons (ESE - Exonic Splicing Enhancers, ESS - Exonic Splicing Silencers) ou les introns (ISE, ISS).
- Conséquences des variations : Une variation nucléotidique dans un exon codant peut non seulement altérer la protéine, mais aussi affecter les motifs ESE ou ESS, entraînant un saut d'exon et potentiellement un décalage du cadre de lecture.
- Sites consensus d'épissage "traditionnels" :
5. Traduction
L'ARNm mature est traduit en protéine par les ribosomes dans le cytoplasme.
- Code génétique :
- Dégénéré : Plusieurs codons peuvent correspondre à un même acide aminé.
- Non ambigu : Un codon donné correspond à un seul acide aminé.
- Codon d'initiation : AUG (méthionine).
- Codons stop : UAA, UAG, UGA.
- Phase de lecture ouverte (ORF - Open Reading Frame) : Séquence nucléotidique multiple de trois bases entre deux codons STOP.
- Séquence codante (CDS - Coding Sequence) : Partie de l'ORF qui débute par un codon d'initiation (ATG) et se termine par un codon STOP.
- En théorie, chaque séquence nucléotidique a 6 phases de lecture possibles (3 pour chaque brin), mais une seule, sauf exception, est ouverte et contient une séquence codante.
Lancer un quiz
Teste tes connaissances avec des questions interactives