Genome organization and structure
Nessuna cartaThis note covers the organization and structure of genomes, including nuclear and mitochondrial DNA, genes, exons, introns, and repetitive sequences. It also touches on genome evolution and the differences between prokaryotic and eukaryotic genomes.
Organisation du Génome
L'organisation du génome fait référence à la manière dont l'information génétique est structurée et compactée au sein d'une cellule, influençant son expression et sa transmission.
Historique et Découvertes Clés
1953: Découverte de la structure de l'ADN par Watson et Crick.
1977: Séquençage de l'ADN par Sanger.
1983: Invention de la PCR par Mullis.
1987: Développement des séquenceurs automatiques par Hood.
1990: Émergence de la bioinformatique (Lipman).
1995: Première carte physique du génome humain (Généthon).
2000/2001: Premier brouillon du génome humain.
Définitions Fondamentales
Gène: Ensemble des séquences d'acides nucléiques contenant l'information nécessaire pour la synthèse d'un ARNm et d'une protéine.
Génome: Désigne la totalité de l'information génétique ou le contenu en ADN des cellules. Le génome humain englobe le génome nucléaire et le génome mitochondrial.
Exon: Séquence d'un gène qui est transcrite et non excisée, se retrouvant sur l'ARNm mature.
Intron: Séquence d'ADN non codante qui est transcrite puis excisée lors de l'épissage. Elle n'est pas présente dans l'ARNm mature.
Épissage: Ensemble de réactions de maturation où les introns sont éliminés et les exons sont rattachés bout à bout pour former l'ARN mature.
Le Génome de Différentes Espèces
L'organisation du génome varie considérablement entre les procaryotes, les eucaryotes et les virus.
Génome des Procaryotes (Bactéries)
Organisme unicellulaire sans noyau.
Chromosome unique: Généralement cytoplasmique, circulaire et fermé sur lui-même.
Contient plusieurs millions de nucléotides.
Structure plus flexible et accessible, permettant une division cellulaire rapide.
Présence de protéines de type histones (protéines HU).
Plasmides: Parfois présents, extrachromosomiques, circulaires et de petite taille. Leur réplication est indépendante du chromosome bactérien.
Transcription et traduction sont souvent simultanées.
ADN majoritairement codant.
Génome des Eucaryotes
ADN: Contenu dans le noyau.
Chromosomes: Linéaires et fortement compactés, associés à des protéines (histones).
Contient plusieurs milliards de nucléotides.
Moins accessible (nucléosomes), ce qui entraîne une division cellulaire plus lente.
Possède de nombreuses origines de réplication.
Seulement 1,5% de l'ADN est codant.
Génome des Virus
Contient de l'acide nucléique qui peut être de l'ADN ou de l'ARN, double brin ou simple brin.
Incapables de se multiplier seuls; ils parasitent des cellules hôtes pour se répliquer.
Le Génome Mitochondrial (ADNmt)
L'ADNmt est un composant essentiel de l'information génétique, caractérisé par sa structure unique et son mode de transmission.
Structure et Caractéristiques
Circulaire et bicaténaire.
Très petite taille (16 569 pb chez l'humain).
Présent en grand nombre d'exemplaires dans la matrice mitochondriale (ex: 10 molécules d'ADN pour 100 mitochondries dans une cellule humaine).
Dépourvu d'histones.
Code génétique différent de l'ADN nucléaire.
Transmission maternelle uniquement.
Deux brins d'ADN avec des compositions différentes: brin lourd H (riche en G) et brin léger L (riche en C).
Génome très compact (93% entièrement codant).
Ne contient pas d'introns; la boucle D est la seule région non codante et contient l'origine de réplication du brin H.
Est exprimé de manière complète et symétrique (un seul promoteur sur chaque brin).
Gènes de la Mitochondrie
Le génome mitochondrial humain contient 37 gènes (28 sur le brin H et 9 sur le brin L).
13 gènes codent pour 4 des 5 complexes respiratoires.
22 gènes codent pour des ARNt.
2 gènes codent pour des ARNr.
Les autres protéines mitochondriales sont codées par le génome nucléaire, ce qui témoigne d'une autonomie limitée du génome mitochondrial.
Constituants du système de la phosphorylation oxydative:
Codé par le génome mitochondrial | Codé par le génome nucléaire | |
Constituants du système de la phosphorylation oxydative | 13 sous-unités | > 80 sous-unités |
I NADH déshydrogénase | 7 sous-unités | > 41 sous-unités |
II Succinate CoQ réductase | 0 sous-unité | 4 sous-unités |
III Complexe du cytochrome b-c1 | 1 sous-unité | 10 sous-unités |
IV Complexe de la cytochrome c oxydase | 3 sous-unités | 10 sous-unités |
V Complexe de l'ATP synthase | 2 sous-unités | 14 sous-unités |
Constituants de l'appareil de synthèse des protéines | 2 ARNr, 22 ARNt | Toutes les protéines mitochondriales ribosomales |
Autres protéines mitochondriales | Aucune | Toutes |
Code Génétique Mitochondrial
L'information portée par les ARNm mitochondriaux utilise un code génétique légèrement modifié par rapport au code nucléaire standard.
2 codons Met au lieu d'un (AUA pour Ile).
2 codons Trp au lieu d'un (UGA pour Stop).
AGA et AGG ne codent plus pour l'Arginine mais pour Stop.
Résulte en 4 codons Arg au lieu de 6, et 4 codons Stop au lieu de 3.
Le Génome Nucléaire
Le génome nucléaire contient la majeure partie de l'information génétique et est fortement organisé pour tenir dans le noyau.
Organisation du Génome Nucléaire
Compaction de l'ADN
L'ADN n'est pas nu dans le noyau, mais associé à des protéines (principalement des histones) pour former la chromatine.
Niveaux de repliement:
Nucléosome: Unité de base de la chromatine, structure perlée ou en chapelet (100 Å de diamètre). Composé d'un octamère d'histones autour duquel 146 paires de bases d'ADN s'enroulent. L'extrémité N-terminale des histones, riche en acides aminés basiques, fait saillie à l'extérieur.
Fibre de chromatine de 30 nm: Le chapelet de nucléosomes s'enroule en solénoïde (environ 6 nucléosomes par tour).
Boucles d'ADN superenroulé: Fibres de 30 nm repliées en grandes boucles de 300 nm (visible en mitose/méiose).
Chromosomes: Forme la plus compactée de la chromatine, visible en métaphase.
Chromatine à l'interphase:
Euchromatine: Réseau fibrillaire lâche et actif, riche en gènes.
Hétérochromatine:
Constitutive: Toujours condensée et inactive, riche en séquences répétées et dépourvue de gènes codants (ex: centromères, télomères).
Facultative: Peut être condensée/inactive ou lâche/active selon les besoins cellulaires.
La Structure d'un Gène Eucaryote
Un gène eucaryote possède une structure complexe avec des régions codantes et non codantes.
La région 5' (régulatrice):
Séquence non transcrite mais essentielle à la transcription.
Contient la région promotrice (ex: boîte TATA, GC box, CAAT) où l'ARN polymérase II se fixe.
Le promoteur détermine le site de départ et la direction de la transcription.
Certains gènes "domestiques" peuvent ne pas avoir de boîte TATA mais une boîte GC.
Le site d'initiation de la transcription: Point de départ de la synthèse de l'ARNm.
Région non codante: Variable en longueur, jusqu'au codon initiateur ATG.
La séquence codante (ORF - Open Reading Frame):
Partie transcrite, constituée d'exons et d'introns.
La séquence codante est discontinue.
Le site d'arrêt de la traduction: Signalé par un codon stop (UAA, UAG, UGA).
Signal de polyadénylation: Séquence consensus AAUAAA (10-30 nucléotides) qui signale la coupure du transcrit primaire.
La région 3': Rôle de régulation, mais moins bien caractérisée.
Organisation des Gènes
Les gènes sont distribués sur 23 paires de chromosomes et leur organisation est hétérogène.
Classement des chromosomes: Basé sur leur taille et la position du centromère.
Bandes chromosomiques (coloration Giemsa):
Bandes sombres (bandes G): Riches en AT, insensibles à la DNase, pauvres en gènes, riches en répétitions LINE.
Bandes claires (bandes R): Riches en GC, sensibles à la DNase, riches en gènes, riches en répétitions Alu.
La densité génique est variable: élevée dans les régions subtélomériques.
Taille des génomes: Généralement, la taille du génome augmente avec la complexité de l'organisme (avec des exceptions pour certaines plantes et amphibiens).
Arguments pour l'augmentation de la taille du génome: Duplication, pseudogènes, variations des introns, séquences répétées intragéniques.
Nombre de gènes: Environ 25 000 gènes chez l'homme, représentant seulement 1% de l'ADN codant.
ADN non codant: Comprend les introns, les séquences régulatrices, les séquences non traduites et l'ADN espaceur.
Taille des gènes: Très variable (de quelques centaines de nucléotides à plusieurs mégabases). La taille moyenne d'un exon est de 100 à 200 pb.
Densité génique: Environ 1 gène pour 40 à 54 kb d'ADN chez l'homme. Le gène de la dystrophine est le plus grand.
Séquences Répétées
Elles constituent une part significative du génome et se divisent en séquences à fonction connue et sans fonction connue.
Séquences répétées à fonction connue:
Familles de gènes: Gènes identiques ou très voisins codant pour des produits spécifiques (ex: histones, ARNt, ARNr). Peuvent inclure des pseudogènes.
Superfamilles de gènes: Dérivent d'un gène ancestral unique par duplication.
Séquences répétées sans fonction connue:
Séquences fortement répétées (répétitions en tandem):
Microsatellites: fragments courts (1 à 5 pb), par exemple (AC ou AT)n (0,5% du génome humain). Utilisés en criminologie, paternité.
Minisatellites: fragments longs (14 à 500 pb). Utilisés en génétique des populations.
Satellites: fragments courts (5 à 100 pb), souvent aux centromères.
Séquences modérément répétées (répétitions dispersées): Éléments transposables ou éléments génétiques mobiles.
Transposons: Transposent via un intermédiaire ADN.
Rétrotransposons: Transposent via un intermédiaire ARN, se divisent en LINE et SINE.
LINEs (Long Interspersed Nucleotides Elements):
17% du génome humain (850 000 copies), L1 est le plus commun (6kb).
L'ARN LINE s'auto-traduit, puis sa transcriptase inverse rétrotranscrit l'ARN en ADN qui s'insère dans le génome.
Souvent tronquées.
La machinerie LINE est également responsable de la rétrotranscription des éléments SINE.
Seule la famille LINE1 est active chez l'homme.
SINEs (Short Interspersed Nucleotides Elements):
13% du génome humain, ALU la seule SINE active (290 bp).
Contiennent un promoteur pol-III mais pas d'ORF; dépendent des LINE pour la transposition.
On les trouve souvent dans les introns ou les UTR des ARNm, mais rarement dans les régions codantes.
Séquences d'ADN non Répétées (Copie Unique)
Renferment la plus grande quantité d'information génétique.
Codent pour toutes les protéines, à l'exception des histones.
L'ADN codant (exons) en copie unique code pour les ARNm (protéines).
Réflexions sur les Familles de Gènes
Les gènes ont souvent des fonctions identiques ou très voisines, et leur localisation peut être groupée ou dispersée.
Les gènes apparentés divergent au niveau de leurs introns.
Exemple: la famille génique de la β-globine présente une organisation conservée.
Exemple d'hémoglobines humaines:
Hb embryonnaire (; ; ; )
Hb Fœtale ()
HbA ()
HbA2 ()
Points Clés à Retenir
Le génome est la totalité de l'information génétique, incluant les génomes nucléaire et mitochondrial.
La structure des génomes varie considérablement entre procaryotes, eucaryotes et virus.
Le génome mitochondrial est circulaire, transmis par la mère, compact et utilise un code génétique légèrement différent.
Le génome nucléaire est organisé en chromatine, se compactant en nucléosomes, fibres de 30 nm et chromosomes.
Un gène eucaryote est composé de régions régulatrices (5'), codantes (exons et introns), et de terminaison (3').
L'ADN non codant représente la majeure partie du génome eucaryote et contient des séquences répétées ayant divers rôles.
Inizia un quiz
Testa le tue conoscenze con domande interattive