Structure, Organisation et Polymorphismes du Génome Humain

25 cartes

25 cartes

Réviser
La répétition espacée te présente chaque carte au moment optimal pour la mémoriser durablement, en espaçant les révisions de façon croissante.
Question
Quelle est la différence entre génétique somatique et constitutionnelle?
Réponse
La génétique constitutionnelle analyse les caractéristiques génétiques héritées ou acquises précocement, tandis que la génétique somatique recherche les caractéristiques génétiques dont le caractère hérité est inconnu.
Question
Qui est habilité à réaliser des examens génétiques à des fins médicales?
Réponse
Seuls les praticiens agréés par l’Agence de la Biomédecine et les laboratoires de biologie médicale autorisés par l’ARS sont habilités à réaliser des examens génétiques à des fins médicales.
Question
Définissez la valeur C du génome.
Réponse
La valeur C représente la quantité d'ADN dans un génome haploïde, mesurée en picogrammes ou en paires de bases.
Question
Quel est le paradoxe de la valeur C?
Réponse
Le paradoxe de la valeur C stipule que la taille du génome d\'une espèce ne corrèle pas avec sa complexité.
Question
Combien de gènes codent des protéines dans le génome nucléaire?
Réponse
Environ 20 000 gènes codent des protéines dans le génome nucléaire humain.
Question
Comparez la taille du génome nucléaire et mitochondrial.
Réponse
Le génome nucléaire humain est beaucoup plus grand que le génome mitochondrial. Il contient environ 3,05 milliards de paires de bases (3,05 Gb), tandis que le génome mitochondrial n'en contient que 16 569 (16,6 kb).
Question
Citez les trois finalités des examens génétiques en France.
Réponse
Les trois finalités des examens génétiques en France sont : médicale, judiciaire et de recherche scientifique.
Question
Qu'est-ce qu'un NUMT?
Réponse
Les NUMT (Nuclear Mitochondrial DNA sequences) sont des séquences d'ADN mitochondrial retrouvées dans le génome nucléaire.
Question
Quelle est la fonction principale de la chromatine?
Réponse
La chromatine compacte et protège l\'ADN, et régule l\'expression des gènes.
Question
Différenciez euchromatine et hétérochromatine.
Réponse
L'euchromatine est une forme décondensée et transcriptionnellement active de la chromatine, tandis que l'hétérochromatine est très compactée et généralement non transcrite.
Question
Qui a développé la méthode de séquençage de l'ADN?
Réponse
Frederick Sanger et Walter Gilbert ont développé la méthode de séquençage de l'ADN.
Question
Quel est l'objectif du Human Genome Project?
Réponse
L'objectif principal du Human Genome Project était de déterminer la séquence complète de l'ADN constituant le génome humain et d'identifier tous ses gènes.
Question
Qu'est-ce qu'un silencer?
Réponse
Un silencer est une région d'ADN sur laquelle se fixent des facteurs de transcription pour inhiber la transcription de gènes.
Question
Définissez un promoteur dans un gène.
Réponse
Région de l\'ADN, en amont d\'un gène, essentielle à sa transcription. Elle inclut le site d\'initiation et les points de fixation pour l\'ARN polymérase et les facteurs de transcription.
Question
Définissez un exon.
Réponse
Un exon est une séquence d\'ADN qui persiste lors de la maturation de l\'ARN messager. Il peut être codant ou non codant.
Question
Définissez un intron.
Réponse
Un intron est une séquence d\'ADN située à l\'intérieur d\'un gène qui est excisée lors de la maturation de l\'ARN primaire en ARNm.
Question
Quelle est la Convention d'Oviedo?
Réponse
La Convention d'Oviedo est le seul instrument juridique international contraignant en matière de bioéthique, s'inspirant des lois françaises.
Question
Décrivez la structure d'un nucléosome.
Réponse
Un nucléosome est composé d'ADN enroulé autour d'un octamère d'histones (H2A, H2B, H3, H4). Une région inter-nucléosomique contient l'histone H1.
Question
Quelle est la fonction d'un enhancer?
Réponse
Les enhancers sont des régions d'ADN qui activent la transcription de gènes en se liant à des facteurs de transcription. Ils peuvent agir à distance des gènes régulés.
Question
Qu'est-ce qu'une phase de lecture ouverte (ORF)?
Réponse
Une phase de lecture ouverte (ORF) est une séquence nucléotidique continue de trois bases, délimitée par des codons STOP, qui peut potentiellement être traduite en protéine.
Question
Qu'est-ce qu'une UTR?
Réponse
Les UTR (Untranslated Transcribed Regions) sont des régions transcrites mais non traduites d'un gène, situées aux extrémités 5' et 3' de l'ARNm.
Question
Quel est le rôle d'un insulator?
Réponse
Les régions d'ADN appelées "insulators" empêchent les "enhancers" ou "silencers" d'activer ou d'inhiber la transcription de gènes voisins.
Question
Quelle est la taille moyenne d'un gène humain?
Réponse
La taille des gènes humains est très variable, allant de moins de 1 kb pour le gène SRY à plus de 2 Mb pour les gènes DMD et RBFOX1. La taille moyenne est d'environ 66 kb.
Question
Expliquez le concept de dégénérescence du code génétique.
Réponse
Le code génétique est dit dégénéré car plusieurs codons (séquences de trois nucléotides) peuvent coder pour le même acide aminé, mais il n'est pas ambigu car un codon donné ne code que pour un seul acide aminé.
Question
Qu'est-ce que l'épissage alternatif?
Réponse
L'épissage alternatif est un mécanisme qui permet de générer différentes protéines à partir d'un même pré-ARN messager, en variant la manière dont les introns sont retirés et les exons sont assemblés.

Encadrement Réglementaire des Activités de Génétique en France

L'encadrement des activités de génétique en France repose sur plusieurs piliers juridiques et stratégiques, visant à garantir l'éthique, la sécurité et l'efficacité des pratiques.

1. La Convention d'Oviedo

La Convention d'Oviedo est le seul instrument juridique international contraignant en matière de bioéthique. Elle s'inspire largement des lois françaises de bioéthique.
  • STCE n°164 : Convention pour la protection des Droits de l'Homme et de la dignité de l'être humain à l'égard des applications de la biologie et de la médecine.
  • STCE n°203 : Protocole additionnel à la Convention sur les Droits de l'Homme et la biomédecine, relatif aux tests génétiques à des fins médicales.

2. Les Lois de Bioéthique Françaises

La Loi n°94-654 du 29 juillet 1994 a posé les premières bases de la bioéthique en France, régissant le don et l'utilisation des éléments et produits du corps humain, l'assistance médicale à la procréation et le diagnostic prénatal.

  • Le terme "bioéthique" combine "bio" (vivant) et "éthique" (ce qui est bon pour l'homme).

Finalités des Examens Génétiques

Les examens génétiques peuvent être réalisés à trois fins principales :

  1. Médicale : Diagnostic, pronostic, dépistage.
  2. De recherche scientifique : Compréhension des maladies, développement de nouvelles thérapies.
  3. Judiciaire : Identification, preuve.

Types d'Examens Génétiques Médicaux

  • Prénatal : Réalisé avant la naissance.
  • Postnatal : Réalisé après la naissance.

Nature des Caractéristiques Génétiques Analysées

  • Génétique constitutionnelle : Analyse des caractéristiques génétiques héritées ou acquises précocement (ex: maladies génétiques héréditaires).
  • Génétique somatique : Recherche et analyse de caractéristiques génétiques dont le caractère hérité ou transmissible est initialement inconnu (ex: mutations tumorales).

Réglementation Spécifique

  • Article L.1130-1 du Code de la Santé Publique : L'examen des caractéristiques génétiques constitutionnelles est soumis à l'article 16-10 du Code Civil.
  • Article 16-10 du Code Civil :
    • L'examen ne peut être entrepris qu'à des fins médicales ou de recherche scientifique.
    • Il est subordonné au consentement exprès et écrit de la personne, recueilli après information complète sur :
      • La nature et l'indication/objectif de l'examen.
      • La possibilité de révéler incidemment des caractéristiques génétiques sans lien avec l'indication initiale, mais utiles pour la prévention ou les soins de la personne ou de sa famille.
      • La possibilité de refuser la révélation de ces résultats fortuits et les risques pour la famille en cas d'anomalie grave.
    • Le consentement est révocable à tout moment.
  • Article L1131-3 du Code de la Santé Publique : Seuls les praticiens agréés par l'Agence de la Biomédecine sont habilités à réaliser des examens génétiques à des fins médicales.
  • Article L1131-2-1 du Code de la Santé Publique : Les laboratoires de biologie médicale doivent être autorisés par l'Agence Régionale de Santé pour pratiquer ces examens.
  • Article L.1130-2 du Code de la Santé Publique : Si un examen de caractéristiques génétiques somatiques révèle des caractéristiques constitutionnelles, la personne doit être orientée vers une consultation chez un médecin qualifié en génétique.

3. Plan France Médecine Génomique 2025 (PFMG 2025)

Ce plan vise à intégrer la médecine génomique dans le système de soins français, en développant le séquençage à haut débit et l'analyse des données génomiques pour le diagnostic et la prise en charge des maladies rares et des cancers.

Rappels : Structure de l'ADN, Taille des Génomes et Valeur C

1. Définition du Génome

Le génome désigne l'ensemble de l'information héréditaire d'un organisme, présente en totalité dans chaque cellule. Le support matériel de cette information est l'ADN (Adénine, Thymine, Guanine, Cytosine) ou, plus rarement, l'ARN (Adénine, Uracile, Guanine, Cytosine).

2. La Valeur C

La valeur C représente la taille d'un génome, exprimée en millions de paires de bases (Mb) ou en picogrammes (pg). 1 pg correspond à 978 Mb.

  • La valeur C est extrêmement variable selon les espèces :
    • Virus : quelques milliers de paires de bases.
    • Bactéries : quelques millions de paires de bases.
    • Mammifères : quelques milliards de paires de bases.
  • Paradoxe de la valeur C : La taille du génome ne corrèle pas directement avec la complexité de l'organisme. Par exemple, certaines plantes ont des génomes bien plus grands que celui de l'homme.

Présentation Générale du Génome Humain Nucléaire et du Génome Mitochondrial

Le génome humain est composé de deux entités distinctes : le génome nucléaire et le génome mitochondrial.

1. Génome Nucléaire

  • Taille : Environ 3,055 gigabases (Gb).
  • Structure : Molécules linéaires organisées en chromosomes.
  • Nombre de molécules d'ADN différentes : 23 dans les cellules XX et 24 dans les cellules XY.
  • Nombre total de molécules d'ADN par cellule : 46 dans les cellules diploïdes, 23 dans les cellules haploïdes.
  • Pourcentage GC : 41,5%.
  • Protéines associées : Histones et protéines non-histones, formant la chromatine.
  • Nombre de gènes codant des protéines : Environ 20 000.
  • Nombre de gènes codant des ARN : Environ 25 000.
  • Nombre de pseudogènes : Environ 15 000.
  • Densité en gènes codant des protéines : Environ 1 gène pour 80 kb.
  • Proportion d'ADN répété : Environ 54%.
  • Transcription : De nombreux gènes sont transcrits de manière indépendante.
  • Introns : Retrouvés dans la plupart des gènes codant des protéines et des ARN.
  • Pourcentage d'ADN codant pour des protéines : Environ 1,1%.
  • Code génétique : 61 codons pour les acides aminés + 3 codons stop.
  • Transmission : Mendélienne pour les autosomes et le chromosome X ; paternelle pour le chromosome Y.

2. Génome Mitochondrial

  • Origine : Les mitochondries proviennent de l'endosymbiose d'une α-protéobactérie il y a environ 1,5 milliard d'années.
  • NUMTs (Nuclear Mitochondrial DNA sequences) : Séquences du génome mitochondrial retrouvées dans le génome nucléaire (environ 750 séquences incomplètes, soit 627 Kb). Ces événements sont anciens, les plus récents datant de plus de 60 millions d'années.
  • Taille : 16,569 kilobases (kb).
  • Structure : Molécule circulaire.
  • Nombre de molécules d'ADN différentes : 1.
  • Nombre total de molécules d'ADN par cellule : Plusieurs milliers de copies (varie selon les types cellulaires ; 2-10 par mitochondrie).
  • Pourcentage GC : 44%.
  • Protéines associées : Déplété en protéines.
  • Nombre de gènes codant des protéines : 13.
  • Nombre de gènes codant des ARN : 24.
  • Nombre de pseudogènes : Aucun.
  • Densité en gènes codant des protéines : Environ 1 gène pour 0,45 kb.
  • Proportion d'ADN répété : Très peu.
  • Transcription : Nombreux transcrits multigéniques produits à partir des deux brins.
  • Introns : Absents.
  • Pourcentage d'ADN codant pour des protéines : Environ 66%.
  • Code génétique : 60 codons pour les acides aminés + 4 codons stop (4 codons interprétés différemment par rapport au génome nucléaire).
  • Transmission : Exclusivement maternelle.

3. Organisation de l'ADN dans le Noyau : La Chromatine

Dans les noyaux des cellules eucaryotes, l'ADN est organisé en chromatine, un complexe d'ADN et de protéines (principalement des histones). Cette organisation est essentielle pour :

  • Intégrité génomique : Compaction et protection de l'ADN.
  • Régulation de l'expression génique : Établissement et maintien des états d'expression des gènes, déterminant l'identité cellulaire.

Types de Chromatine

  • Euchromatine : Chromatine décondensée, transcriptionnellement active.
  • Hétérochromatine : Chromatine très compactée, avec des régions d'ADN non-transcrit.
    • Hétérochromatine constitutive : Portions de chromosomes apparemment inactives dans toutes les cellules (centromères et télomères), répliquées tardivement.
    • Hétérochromatine facultative : Portions variables selon le type de cellule ou l'état de différenciation cellulaire.

Le Nucléosome

Le nucléosome est l'unité fondamentale de la chromatine. Il est composé de :

  • Une région centrale : 146 paires de bases d'ADN enroulées autour d'un octamère protéique (deux copies de chaque histone H2A, H2B, H3 et H4).
  • Une région inter-nucléosomique : Caractérisée par la présence de l'histone H1.
  • Les extrémités N-terminales des histones dépassent de la structure et sont la cible de modifications post-traductionnelles, jouant un rôle clé dans la régulation de l'expression génique.

The Human Genome Project (HGP)

Le Projet Génome Humain (HGP), lancé en 1990 et achevé en 2003, a eu pour objectif de séquencer l'intégralité du génome humain.

1. Contexte et Pionniers

  • Frederick Sanger et Walter Gilbert (Prix Nobel de Chimie 1980) ont développé des méthodes de séquençage de l'ADN.
  • Leroy Hood a contribué au développement de séquenceurs automatiques.
  • Le projet a été une collaboration internationale impliquant de nombreux scientifiques et instituts.

2. Évolution du Séquençage

  • 2001 : Première ébauche du génome humain publiée (2,69 Gb assemblées avec environ 150 000 lacunes).
  • 2003 : Achèvement du HGP. Coût initial estimé à 2,7 milliards de dollars sur 13 ans.
  • 2008 (James Watson) : Séquençage de son propre génome en 4,5 mois pour environ 1,5 million de dollars.
  • 2019 : Coût du séquençage d'un génome humain complet < 10 000 dollars. Record du monde de diagnostic génétique le plus rapide en 19,5 heures.
  • 2022 : Record du monde de diagnostic génétique le plus rapide en 5 heures et 2 minutes.

3. Avancées Récentes

  • 2021 : Publication du Genome Reference Consortium Human Build 38 patch release 13 (GRCh38.p13), avec 2,92 Gb assemblées et 151 Mb de séquences inconnues.
  • 2022 : Le consortium T2T (Telomere-to-Telomere) publie la version T2T-CHM13 v1.1, un génome humain complet et sans lacunes, assemblant 3,055 Gb.

4. Contenu du Génome Humain (GENCODE release 39, GRCh38.p13)

  • Gènes codant des protéines : 19 982
  • Gènes ARN : 26 378 (dont 18 811 ARN longs non codants et 7 567 petits ARN non codants)
  • Pseudogènes : 14 763 (dont 10 662 traités et 3 557 non traités)
  • Autres : 544
  • Total estimé : Environ 61 500 gènes.

5. Bases de Données de Polymorphismes

  • gnomAD v2.1.1 (GRCh37) : Agrège 125 748 exomes et 15 708 génomes entiers.
  • gnomAD v3.1.2 (GRCh38) : Agrège 76 156 génomes entiers d'ascendances diverses.
  • gnomAD v4.1.0 (GRCh38) : Agrège 730 947 séquences d'exomes et 76 215 séquences de génomes entiers.

Présentation des Gènes Codant les Protéines : Définition de la Notion de Gène, Transcription, Épissage et Traduction

Les gènes codant les protéines sont des séquences d'ADN qui, via la transcription et la traduction, donnent naissance à des protéines.

1. Le Dogme Central de la Biologie Moléculaire

L'information génétique circule de l'ADN vers l'ARN messager (ARNm), puis vers les protéines :

  1. Réplication : L'ADN est copié.
  2. Transcription : L'ADN est transcrit en ARN primaire dans le noyau.
  3. Maturation de l'ARN : L'ARN primaire subit un coiffage (capping), un clivage/polyadénylation et un épissage pour former l'ARNm mature.
  4. Export : L'ARNm mature est exporté du noyau vers le cytoplasme.
  5. Traduction : L'ARNm est traduit en protéine dans le cytoplasme.

2. Caractéristiques des Gènes Codant les Protéines

  • Environ 20 000 gènes codant des protéines dans le génome humain.
  • Les exons de ces gènes occupent seulement 1,2% du génome.
  • La taille des gènes est très variable : de moins de 1 kb (gène SRY) à plus de 2 Mb (gène DMD, RBFOX1).
  • La plupart des gènes sont morcelés en exons (environ 325 000 exons) séparés par des introns. Le nombre d'introns varie de 0 à 363 par gène.
  • Au total, le génome humain contient plus de 400 000 exons (incluant ceux des ARN non codants).
  • Plus de 95% des gènes sont soumis à la transcription, à l'épissage et à la maturation 3' alternatifs.

Statistiques Moyennes des Gènes Humains Codant des Protéines

  • Taille moyenne d'un gène : 66 kb (médiane : 26 kb).
  • Nombre moyen d'exons par gène : Environ 12 (médiane : environ 9).
  • Taille moyenne d'un exon codant : 160 bp (médiane : 120 bp).
  • Taille moyenne d'un intron : Environ 7 kb (médiane : environ 1,75 kb). Aucun intron n'est inférieur à 30 bp.

3. Structure d'un Gène Codant une Protéine

Un gène est composé de plusieurs éléments clés :

  • Promoteur : Région de l'ADN située en amont (en 5') du gène, indispensable à sa transcription. Il contient le site d'initiation de la transcription (+1) et les sites de fixation des facteurs de transcription et de l'ARN polymérase.
    • ARN polymérase I : Transcrit les ARNr 28S, 5.8S, 18S.
    • ARN polymérase II : Transcrit les ARNm, sncRNA (miRNA, siRNA, piRNA, snoRNA, snRNA), lncRNA, LINEs.
    • ARN polymérase III : Transcrit les ARNt, ARNr 5S, ARN 7SL, SINEs.
  • Enhancers : Régions de l'ADN où se fixent des facteurs de transcription pour activer la transcription des gènes. Ils agissent en cis et peuvent être situés jusqu'à 1 million de paires de bases en amont ou en aval des gènes régulés.
  • Silencers : Régions de l'ADN où se fixent des facteurs de transcription pour inhiber la transcription des gènes. Ils agissent en cis.
  • Insulators : Régions de l'ADN où se fixent des facteurs empêchant un enhancer (ou un silencer) d'activer (ou d'inhiber) la transcription d'un autre gène voisin.
  • Exons : Parties du gène qui persistent après l'épissage de l'ARN primaire. Les exons ne sont pas tous codants et ne sont pas nécessairement des multiples de trois bases.
  • Introns : Parties du gène situées entre les exons, excisées lors de l'épissage.
  • UTR (Untranslated Transcribed Region) : Régions transcrites mais non traduites (5'UTR et 3'UTR).
  • Séquences consensus : Séquences nucléotidiques impliquées dans des fonctions similaires, avec quelques variations.

4. Processus de Transcription et Maturation de l'ARNm

  1. Transcription : L'ARN polymérase synthétise un transcrit primaire à partir du brin matrice de l'ADN.
  2. Coiffage (Capping) : Ajout d'une coiffe en 5' (cap) au transcrit primaire.
  3. Clivage/Polyadénylation : Ajout d'une queue poly-A en 3' au transcrit primaire.
  4. Épissage (Splicing) : Excision des introns et ligature des exons pour former l'ARNm mature.
    • Sites consensus d'épissage "traditionnels" :
      • Site donneur (5' splice site) : Charrière exon/intron (souvent GT).
      • Site accepteur (3' splice site) : Charrière intron/exon (souvent AG), précédé d'une région riche en pyrimidines et d'un site de branchement contenant un A.
    • Épissage alternatif : Un même transcrit primaire peut être épissé de différentes manières pour produire plusieurs ARNm matures, codant des protéines différentes (isoformes). Ce mécanisme est régulé par des protéines régulatrices (activateurs et répresseurs) se fixant sur des séquences spécifiques dans les exons (ESE - Exonic Splicing Enhancers, ESS - Exonic Splicing Silencers) ou les introns (ISE, ISS).
    • Conséquences des variations : Une variation nucléotidique dans un exon codant peut non seulement altérer la protéine, mais aussi affecter les motifs ESE ou ESS, entraînant un saut d'exon et potentiellement un décalage du cadre de lecture.

5. Traduction

L'ARNm mature est traduit en protéine par les ribosomes dans le cytoplasme.

  • Code génétique :
    • Dégénéré : Plusieurs codons peuvent correspondre à un même acide aminé.
    • Non ambigu : Un codon donné correspond à un seul acide aminé.
    • Codon d'initiation : AUG (méthionine).
    • Codons stop : UAA, UAG, UGA.
  • Phase de lecture ouverte (ORF - Open Reading Frame) : Séquence nucléotidique multiple de trois bases entre deux codons STOP.
  • Séquence codante (CDS - Coding Sequence) : Partie de l'ORF qui débute par un codon d'initiation (ATG) et se termine par un codon STOP.
  • En théorie, chaque séquence nucléotidique a 6 phases de lecture possibles (3 pour chaque brin), mais une seule, sauf exception, est ouverte et contient une séquence codante.

Lancer un quiz

Teste tes connaissances avec des questions interactives