Génome humain : Structure, Réplication et Expression

Nessuna carta

Structure et métabolisme des acides nucléiques, ADN, ARN, réplication, transcription, traduction, et régulation de l'expression génique.

I. Structure et métabolisme des acides nucléiques

A. Les acides nucléiques

Les acides nucléiques sont l'unité de base des structures du génome. Il en existe deux types, distingués par la structure de l'ose qui les compose :

L'ADN : acide désoxyribonucléique.
L'ARN : acide ribonucléique.

Le ribose se trouve dans les acides nucléiques de l'ARN et le désoxyribose (perte du OH en 2') dans ceux de l'ADN. Ces molécules sont rendues acides par la présence d'acide phosphorique, leur conférant une charge négative. On les trouve principalement dans le noyau, mais aussi dans le cytoplasme (ARN) ou les mitochondries (ADN).
L'ADN et l'ARN sont des macropolymères dont l'unité de base est le nucléotide, chargé négativement à pH physiologique.
Un nucléotide est formé de :

Un nucléoside, lui-même composé d'un ose (ribose ou désoxyribose) et d'une base azotée.
Un groupement phosphate, relié par une liaison ester à l'ose.

Moyen mnémotechnique : '
NucléoSide : Seulement ose + base azotée.
NucléoTide : Tout (ose + base azotée + P).

Les bases azotées peuvent être :

Puriques : Adénine et Guanine.
Pyrimidiques : Cytosine et Thymine (ADN), ou Uracile (ARN).

Les molécules d'ADN sont extrêmement longues (environ 2 mètres), ce qui nécessite une forte condensation dans le noyau.

B. Structure de l'ose

ARN : L'ARN est une molécule fragile, susceptible d'être dégradée par des nucléases. Sa stabilité est faible et sa durée de vie est courte.
ADN : L'ADN est plus stable que l'ARN grâce à la perte du OH en 2', ce qui le protège contre les nucléases. L'ADN est environ 100 fois plus stable que l'ARN.

Le C1' de l'ose se lie à la base, et les C5' et C3' créent des liaisons avec des phosphates (esters phosphoriques).
Notation des C : Les carbones des sucres sont notés avec un chiffre suivi d'un «'» pour les différencier de ceux des bases azotées.

C. Structure des bases azotées

On distingue deux classes de bases azotées :

Bases pyrimidiques

La cytosine existe dans l'ADN et l'ARN. La thymine n'existe que dans l'ADN, remplacée par l'uracile dans l'ARN. Elles partagent un noyau pyrimidique.

Bases puriques

= hétérocycles aromatiques possédant des liaisons conjuguées —> absorption dans les UV.

Elles ont en commun leur noyau purique

Forme tautomère des bases azotées

Les tautomères sont des couples d'isomères (isomérie céto-énolique). La réaction de tautomérie implique la migration d'un atome d'hydrogène et un changement de localisation d'une double liaison.
Deux formes tautomères existent :

Forme lactame (céto) : forme prédominante.
Forme lactime (énol) : OH sur carbone sp².

Les structures de la guanine et de la cytosine sont complémentaires, permettant la formation de liaisons H. Ainsi, une guanine est liée à une cytosine (idem pour A/T et A/U).

D. Structure des nucléosides

La base (purique ou pyrimidique) et l'ose (ribose ou 2'-désoxyribose) sont liés par une liaison N-glycosidique sur C1', avec N9 des bases puriques ou N1 des bases pyrimidiques.

E. Structure des nucléotides

Le nucléotide résulte de l'estérification de la fonction alcool OH en 5' par un acide phosphorique. Il peut être triphosphate (stockage d'énergie, synthèse d'ADN/ARN), diphosphate (ex: GDP, ADP), ou monophosphate.

F. Rôles biologiques des nucléotides

Polynucléotides :
- Synthèse d'ADN (dATP, dTTP, dGTP, dCTP).
- Synthèse d'ARN (ATP, UTP, GTP, CTP).
Dinucléotides :
- Structures de coenzymes (NAD, etc.).
- Transport et stockage d'énergie (ATP, GTP).
- Activation de molécules.
Mononucléotides :
- Transmission de l'information (AMPc, GMPc) pour la signalisation intracellulaire.
- Transport de groupements phosphate.

G. Nucléotides « médicaments »

1) 5-FU : fluorouracile

Le 5-FU est un anti-cancéreux qui inhibe la thymidylate synthase en se fixant sur son site actif. Cela bloque la production de thymine, rendant la synthèse d'ADN impossible. Il est utile pour limiter la progression des tumeurs en ciblant les cellules cancéreuses qui se répliquent beaucoup.

2) AZT : azidothymidine

L'AZT est un anti-rétroviral qui entre en compétition avec les nucléosides naturels et bloque la reverse transcriptase, une enzyme qui traduit l'ARN en ADN. Il est utilisé pour bloquer la réplication des rétrovirus à ARN (ex: VIH).

H. Métabolisme des nucléotides

Le 5'phosphoribosyl-1'-pyrophosphate (PRPP) est le précurseur commun à la synthèse des nucléotides puriques et pyrimidiques, nécessitant de l'ATP.

Le principe est d'ajouter un pyrophosphate sur le OH du C1' du ribose, rendant le ribose plus réactif pour accepter une base.
Les nucléotides peuvent être synthétisés par :

La synthèse de novo (voie secondaire, consommatrice d'ATP).
La récupération de nucléosides (voie principale, moins coûteuse en énergie).

La récupération de nucléosides conduit à la formation de purines et pyrimidines, qui suivent des catabolismes différents. L'accumulation de purines et pyrimidines exerce un rétrocontrôle négatif, inhibant la synthèse de PRPP et donc la synthèse de novo.

Schéma récapitulatif du métabolisme des acides nucléiques

I. Récupération de nucléotides

Cette méthode, moins coûteuse en énergie, se fait par :

Des pyrimidine-nucléoside kinases pour les nucléotides pyrimidiques (C, U et T) :
Nucléoside + ATP Nucléotide
Des phosphoribosyl-transférases pour les nucléotides puriques (A et G) :
Base + PRPP Nucléotide

J. La maladie goutteuse

La maladie goutteuse est due à une hyperuricémie, c'est-à-dire une précipitation d'acide urique sous forme de cristaux d'urate de sodium dans les articulations, provoquant une inflammation.

L'hyperuricémie peut être causée par une surconsommation de viande (excès de bases azotées) ou un dérèglement métabolique. Les bases puriques ont l'acide urique comme produit de dégradation.

II. Structure de l'ADN

L'ADN est une structure bicaténaire (2 brins) en double hélice, avec deux brins antiparallèles (orientés de façon anti-sens) liés par des liaisons hydrogène et hydrophobes, à orientation 5'3' et 3'5'. Un chromosome correspond à une molécule d'ADN.
L'ADN est globalement hydrophile, mais ses parties hydrophobes sont orientées vers l'intérieur, renforçant la cohésion entre les brins.

La synthèse d'ADN se fait TOUJOURS de 5' en 3'. Les sillons de la molécule d'ADN sont des sites importants de régulation des gènes.

A. Appariement des bases

Dans l'ADN, les bases T s'apparient avec les A, et les bases G avec les C. Il y a donc autant de A que de T, et autant de C que de G.
liaisons H entre A et T
liaisons H entre C et G
Il est plus difficile de rompre une liaison G-C qu'une liaison A-T, ce qui affecte la stabilité de l'ADN en fonction de sa séquence.

B. Conformation de l'ADN

Il existe différentes conformations tridimensionnelles de l'ADN, dépendant de la séquence, de l'hydratation et de la conformation de la base.

Conformation B : La plus répandue in vivo. Hélice droite, spirale régulière, bases espacées de 0,34 nm. Un tour d'hélice compte 10 paires de bases. Elle présente deux sillons : un grand (large et profond, pour la régulation) et un petit. Les protéines interagissent principalement avec le grand sillon.
Conformation Z : Existe dans les zones riches en GC avec méthylation en C5 du C. L'axe de l'hélice est en zig-zag. Elle n'a qu'un sillon étroit et joue un rôle dans l'absorption des contraintes des superenroulements.
Conformation A : Forme plus resserrée que la forme B. Existe dans les hybrides ADN/ARN (lors de la réplication et de la transcription).

III. Structure de l'ARN

L'ose est le ribose. Les ARN sont formés d'uracile à la place de la thymine et sont monocaténaires (un seul brin). Ils peuvent avoir une structure secondaire (repliements intrachaînes). Les ARN sont plus instables et sensibles aux nucléases, ce qui permet une régulation de leur expression.

A. Les ARNr

Les ARNr sont les ARN les plus nombreux. Ils interviennent dans la formation du ribosome (protéines et ARNr reliés non-covalemment) et dans la traduction des protéines. Ils constituent notamment :

La petite sous-unité du ribosome (ARN 18S + 33 protéines).
La grande sous-unité du ribosome (ARNr 5S ; 5,8S ; 28S + 50 protéines).

B. Les ARNt

Les ARNt transportent les acides aminés jusqu'au ribosome lors de la synthèse des protéines. Ils contiennent des nucléotides atypiques modifiés. Ce sont des adaptateurs pour la synthèse des protéines. Bien que monocaténaires, ils possèdent une conformation tridimensionnelle en forme de trèfle. L'anticodon reconnaît son complémentaire dans l'ARNm et définit l'acide aminé à transférer.

C. Les ARNm

Les ARNm transfèrent l'information génétique de l'ADN (noyau) au ribosome (cytoplasme). Ils sont synthétisés sous forme d'ARN pré-messagers, puis maturés. Ils portent une queue poly-A en 3' (sauf ceux codant pour les histones), permettant leur isolement.

En pratique :
Pour isoler les ARNm, on peut les faire passer dans une colonne avec une queue poly-T qui va les fixer, puis rompre les liaisons hydrogène pour les récupérer.

D. Les ARNsn

Les ARNsn (ARN small nuclear) interviennent dans la maturation des ARNm. Ils synthétisent l'ARN à double brin et permettent de détruire les ARNm non traduits. Ils sont riches en bases U.

E. Les ARNmi, naturels

Les ARNmi (ARN micro) sont de petits ARN synthétisés pour inhiber certains ARNm, limitant la production de protéines. Des micro-ARN complémentaires à l'ARNm sont synthétisés pour "piéger" et dégrader les ARNm.

F. Les ARNsi, artificiels

Les ARNsi (ARN small interferent) sont des ARN double brins synthétisés artificiellement pour inhiber certains ARNm. Ils fonctionnent sur le même principe que les ARNmi mais sont utilisés à des fins de recherche ou thérapeutique.

IV. Catabolisme des acides nucléiques

Les acides nucléiques sont dégradés par des désoxyribonucléases (DNAses) ou des ribonucléases (RNAses). Ces nucléases peuvent agir en bout de chaîne (exonucléases) ou en intra-chaîne (endonucléases).
Les nucléotides formés sont clivés par une phosphatase (nucléoside + phosphate), puis une nucléosidase clive la liaison entre l'ose et la base azotée.

V. Organisation du génome

A. Organisation générale du génome

Le génome est l'ensemble de l'information génétique contenue dans l'ADN des cellules. Chez l'Homme, on compte environ 26 000 gènes nucléaires et 37 gènes mitochondriaux. Un gène peut coder pour plusieurs protéines (environ 300 000 protéines pour 26 000 gènes), ce qui signifie qu'il n'y a pas de relation linéaire entre la quantité de gènes et celle de protéines.

B. Génome mitochondrial

La mitochondrie possède son propre génome : un ADN circulaire (16 569 pb) ressemblant à un génome bactérien. Il est transmis uniquement par la mère. Il y a plusieurs copies par mitochondrie et plusieurs mitochondries par cellule, soit des centaines de copies par cellule.

Il code pour 13 gènes des sous-unités des protéines de la chaîne respiratoire, 22 ARNt et 2 ARNr. Il contient peu de parties non codantes (introns). Une lésion ou mutation de l'ADN mitochondrial a donc un impact potentiellement plus direct sur le métabolisme.

Le faible nombre d'introns augmente le risque de pathologie en cas de mutation. Cependant, la multiplicité des copies d'ADN et des mitochondries peut compenser certaines mutations.

C. Génome nucléaire

Le noyau contient 22 paires de chromosomes (molécules d'ADN) plus les chromosomes sexuels. La taille du génome nucléaire est de paires de base (2 mètres d'ADN par cellule), codant pour 26 000 gènes. Environ 6% du génome nucléaire est sous forme d'hétérochromatine (non fonctionnelle car trop condensée).

Remarque :
La taille des gènes est souvent exprimée en bases et non en paires de bases, mais cela ne change rien du fait de la structure en double hélice.

VI. Compaction de l'ADN

A. Structure de la chromatine

Une compaction de l'ADN est nécessaire pour "ranger" 2 mètres d'ADN dans un noyau de 5 à 8 µm. Cette compaction se fait sous forme de chromatine, qui existe sous deux formes :

Euchromatine : Partie active du génome, potentiellement transcriptible et organisée en nucléosomes.
Hétérochromatine : Partie du génome très condensée (difficilement accessible), hyperméthylée et riche en GC méthylés sur C. Elle peut contenir des gènes, mais ceux-ci ne s'expriment pas.

La compaction de l'ADN varie selon les cellules et les gènes. Plus un gène est condensé, moins il s'exprime. La double hélice s'enroule autour d'histones pour former des nucléosomes, puis la compaction continue pour former un chromosome.

B. Le nucléosome

Le nucléosome est un octamère de protéines appelées histones. Il a la forme d'un disque de 10 nm de diamètre et 6 nm d'épaisseur, autour duquel 150 à 200 pb d'ADN s'enroulent. On trouve 20 à 60 pb entre deux nucléosomes. Cela permet une compaction d'un facteur 6. Le nucléosome n'est pas figé et peut glisser pour "libérer" de l'ADN.

C. Les histones

Les histones sont des protéines riches en acides aminés basiques (Lys, Arg), donc chargées positivement. L'ADN, chargé négativement par les phosphates, est attiré par les histones et s'enroule autour d'elles. Ces interactions faibles électrostatiques permettent l'empaquetage de l'ADN en chromatine.

Enroulement de l'ADN autour d'un nucléosome

Un octamère d'histones est composé de 2 histones H2A + 2 H2B + 2 H3 + 2 H4.
La partie N-terminale (queue NH2) de l'histone est accessible à des modifications enzymatiques post-traductionnelles :

L'acétylation (perte d'une charge +) par des acétyltransférases, diminuant la cohésion avec l'ADN.
La phosphorylation par des kinases, apportant des charges négatives qui diminuent la cohésion avec l'ADN et facilitent la transcription.
La méthylation par des méthylases, qui augmentent la cohésion avec l'ADN.

Ces modifications régulent l'accessibilité de l'ADN aux facteurs de transcription. L'histone H1 permet une compaction supplémentaire par un facteur 40.

D. Les compactions supplémentaires

Les filaments de 30 nm forment des boucles qui s'enroulent en hélice pour former les deux chromatides du chromosome (compaction par 10 000).

E. Régulation de l'assemblage de la chromatine

Les facteurs d'assemblage sont des protéines nucléaires nécessaires à l'assemblage des histones et régulent la condensation de la chromatine. Les enzymes responsables des modifications post-transcriptionnelles (méthylases, acétyltransférases, kinases) permettent le remodelage de la chromatine via :

Un glissement d'octamères pour rendre accessibles des séquences d'ADN.
Une ouverture de la chromatine par décompaction (l'acétylation des histones neutralise les charges + et diminue les interactions avec l'ADN).

Chromatine fermée : Transcriptionnellement inactive, condensée (30 nm).

HDAC = Histone désacétylase. Partie N-terminale des histones : méthylée, déacétylée, déphosphorylée.
Chromatine ouverte : Transcriptionnellement active, décondensée.

HAT = Histone acétylase (oncogène). Partie N-terminale des histones : déméthylée, acétylée, phosphorylée.

F. Organisation physique du génome

Une grande partie du génome est non codante.

L'hétérochromatine ne contient pas de gènes exprimés, mais des gènes peuvent y être présents. L'euchromatine contient seulement 1% de gènes codant pour des protéines. Un tiers des chromosomes s'organise en gènes (ADN génique), mais tous ne sont pas codants.
La quantité de gènes transcrits varie : beaucoup dans une cellule peu différenciée, très peu dans une cellule spécialisée.

1) L'hétérochromatine

L'hétérochromatine est surtout répartie autour des centromères, dans les bras courts des chromosomes acrocentriques (13, 14, 15, 21, 22) ou dans le chromosome Y. Elle est non codante.

2) L'ADN génique

Le gène est l'unité physique minimale de l'ADN capable de délivrer l'information nécessaire à la production d'une molécule de fonction définie (polypeptide ou ARN). Moins d'un tiers du génome code pour les gènes. La molécule produite est souvent une enzyme (kinases), des facteurs de transcription, des proto-oncogènes ou des protéines du cytosquelette.

Un gène contient une partie promotrice (non codante) et des introns (non transcrits). La partie codante représente environ 5% du gène.

G. Les classes de gènes

Certains gènes codent pour des ARN (4800 gènes) :

ARNr : 800 gènes codent pour les (4) ARNr, alignés en tandem.
ARNt : 600 gènes répétés 1 à 40 fois.
ARNsn : Environ 100 gènes.
ARNmi : ARN de petite taille (21 à 23 nt), leur nombre évolue.

D'autres gènes codent pour des polypeptides :

Tailles variables (30 Kb en moyenne).
Informations morcelées (9 exons par gène en moyenne).
La partie codante représente environ 5% du gène.

Le promoteur et les introns forment la partie non-codante (environ 95%).

H. Organisation de gènes codant pour les polypeptides

Ces gènes ont souvent plusieurs copies et sont organisés en familles de gènes (homologies de séquence). Ces familles sont regroupées en clusters pouvant être :

Chevauchants (sur 2 brins différents).
Nichés, c'est-à-dire dans l'intron d'un autre gène.

Il existe aussi des pseudo-gènes, copies dépourvues de certaines séquences, produisant des protéines inactives.

I. ADN répété non-codant

1) ADN satellite

Fonction exacte inconnue, mais rôle probable dans la structure. Blocs de séquences d'ADN répétées en tandem, surtout dans l'hétérochromatine (centromère). Ex: 170 pb répétées jusqu'à 5000 fois.

2) ADN mini-satellite

Blocs de séquences de 6 à 24 pb répétées en tandem 1000 à 2000 fois. Hautement polymorphes, utilisés pour les tests de parentalité. Localisés au niveau des télomères (séquence TTAGGG) et cibles d'événements de recombinaison homologue.

3) ADN micro-satellite

Blocs de courtes séquences (2 à 6 pb) répétées en tandem 5 à 50 fois (ex: (CA)n). Représentent environ 2% du génome. Leur existence s'explique par un dérapage de la réplication. Leur polymorphisme élevé les rend utiles comme marqueurs de maladies génétiques et pour l'identification individuelle.

4) Rétrotransposons

Séquences qui se recopient dans le génome grâce aux ARN.

Séquences LINES (long interspersed elements) : 6 Kb, codant pour une protéine avec activité transcriptase inverse et endonucléase.
Séquences SINE (short interspersed elements) : 100 à 400 pb, éléments courts dispersés (ex: séquence Alu).

5) Transposons

Blocs de 2 à 3 Kb codant pour une transposase (couper-coller). Éléments inactifs issus d'un ADN ancestral, représentant 3% du génome.

6) ADN très conservé non-codant

481 blocs de séquences de 1 à 29 Kb, représentant 7% du génome. Très conservés chez les mammifères, près des régions régulatrices des gènes. Leur rôle est encore à l'étude (régulation de l'expression des gènes, appariement des chromatides).

VII. Réplication de l'ADN

La réplication est le mécanisme de duplication de l'information génétique en vue de la division cellulaire. Elle précède la mitose et se fait en 2 étapes :

Dissociation de la double hélice par rupture des liaisons H.
Synthèse du brin complémentaire (synthèse bidirectionnelle, de 5' en 3') à partir d'un 3'OH.

Chaque cellule fille reçoit un brin parental et un brin néo-synthétisé (à partir du brin parental). La réplication est dite semi-conservative.

A. Structure de l'ADN

L'ADN est une structure bicaténaire à orientation inverse. La présence d'une extrémité OH libre sur le 3' est nécessaire pour débuter la duplication.

B. Initiation de la réplication

Des protéines spécifiques se fixent sur la ou les origine(s) de réplication, dans un œil de réplication. Des hélicases (enzymes qui coupent les liaisons H) dissocient les brins. Les protéines SSB (single string binding proteins) stabilisent l'ADN simple brin. L'initiation est l'étape limitante car elle nécessite beaucoup d'énergie.

C. Elongation

La synthèse du brin complémentaire est asymétrique. L'enzyme qui synthétise le brin complémentaire est l'ADN polymérase III (chez les procaryotes). La synthèse se fait de 5' en 3'.

L'ADN polymérase III nécessite :

Un brin matrice.
Des dNTP (désoxyribo-nucléotide triphosphates).
Une amorce (OH libre en 3' nécessaire).

La réaction élémentaire commence par une attaque nucléophile de l'oxygène du C3' du dernier nucléotide sur le phosphore du phosphate α du nouveau nucléotide.
La processivité de l'ADN polymérase est plus lente chez les eucaryotes (50 b/sec) que chez les procaryotes (500 b/sec).
Une primase synthétise une amorce d'ARN (10 à 60 bases) qui apporte le 3'OH nécessaire. L'ADN polymérase poursuit ensuite l'élongation.

D. La fonction correction d'épreuves

L'ADN polymérase III possède une activité "correction d'épreuves". Si l'appariement des bases est incorrect, elle digère le nucléotide (activité 3' 5' exonucléasique), puis continue la synthèse.

E. La terminaison

À un signal de terminaison, la polymérase se détache. Les amorces d'ARN sont digérées par la RNAse H. Les lacunes sont comblées par l'ADN polymérase I (qui fait plus d'erreurs). Une ligase lie les fragments (liaison phosphodiester).

F. La réplication eucaryote

Les eucaryotes ont de nombreuses origines de réplication (20 000 à 30 000). Une unité de réplication compte entre 100 et 200 Kb. Des protéines de protection de la réplication de l'ADN sont dégradées en phase S. La durée réelle de la réplication est de 6h (contre 1h théorique) en raison des arrêts pour réparation.

G. Synthèse des extrémités télomériques

Au niveau des télomères, les amorces d'ARN ne sont pas synthétisables à l'extrémité 3', entraînant un raccourcissement des chromosomes à chaque réplication. Pour éviter cela, il existe des séquences répétées TTAGGG (2000 fois), non codantes.

La télomérase synthétise des séquences TTAGGG sans matrice d'ADN. Elle possède une séquence d'ARN AAUCCC et une activité rétrotranscriptase. L'ARN sert de matrice à la synthèse des séquences télomériques.

La télomérase est exprimée dans les cellules germinales et cancéreuses. Son expression faible dans les cellules somatiques entraîne un raccourcissement des télomères avec l'âge.

VIII. Mutation et réparation de l'ADN

A. Généralités et définition

L'information génétique est stable mais pas entièrement. L'instabilité permet l'adaptation évolutive. Toute modification stable d'une séquence d'ADN est transmise aux générations cellulaires (mutation somatique) ou humaines (mutation germinale). Il peut s'agir de réarrangements de grande taille ou de modifications ponctuelles.

B. Conséquences des mutations

Les conséquences sont variables :

Aucune conséquence biologique détectable (fréquent) : mutation silencieuse (synonyme) dans un intron ou région non codante, protéine fonctionnelle, compensation génique ou métabolique.
Aucune conséquence pour l'organisme : mutation à l'origine d'un suicide cellulaire (apoptose).
Apparition de cancers : mutation somatique.
Apparition de maladies héréditaires : mutation germinale.
Mutation létale : incompatible avec la vie.

C. Les types de mutations

Mutations ponctuelles (quelques nucléotides) :
- Substitutions nucléotidiques :
  - Synonymes (même AA).
  - Faux-sens (AA différent).
  - Non-sens (codon STOP, raccourcissement du peptide).
- Insertions courtes.
- Délétions courtes.

Un décalage du cadre de lecture (si non multiple de 3) peut être catastrophique.

D. Les causes de mutations

Agents physiques (ex: rayonnements ionisants comme les UV).
Agents chimiques :
- Exogènes (ex: aflatoxine B1, hydrocarbures aromatiques du tabac).
- Endogènes (ex: ROS générées lors de processus inflammatoires).
Virus qui insèrent leur séquence dans l'ADN hôte.
Erreurs de réplication non corrigées (rare).
Recombinaison.

E. Mécanisme d'action des rayonnements

L'énergie des rayonnements peut provoquer :

Des cassures de l'ADN (apoptose).
Des pontages ADN-protéine.
Des pontages ADN-ADN (ex: dimères de thymine par UV).

F. Mécanisme d'action des ROS

Les ROS (reactive oxygen species) sont des espèces chimiques oxygénées très réactives (radicaux libres, ions oxygénés, peroxydes). Elles provoquent :

Des pontages ADN-protéine.
Des adduits à l'ADN (fixation covalente de molécules).

Exemple d'adduit : l'oxydation de la guanine en 8-oxo-guanine, qui s'apparie avec C ou A.

G. Induction des systèmes de réparation des mutations

Suite à la détection de dommages importants par la protéine P53 ("gardienne du génome"), il y a deux possibilités :

Activation des systèmes de réparation après blocage du cycle cellulaire.
Entrée en apoptose (si les dommages sont trop importants).

Un blocage de la p53 peut causer des cancers.

H. Les différents systèmes de réparation

1) Lésions simple brin

a) Réparation des erreurs d'appariement

Le système MMR (mismatch repair) corrige les anomalies d'appariement après la réplication et avant la méthylation. Le brin parental est méthylé, le brin néosynthétisé non. Le brin non-méthylé est coupé, puis resynthétisé par ADN polymérase et ligase.

b) Réparation par excision de base

Le système BER (base excision repair) reconnaît et corrige les anomalies sur les bases de l'ADN (désamination, oxydation). Il implique :

Digestion N-glycosidique créant un site AP (apurique ou apyrimidique).
Intervention d'une endonucléase sur le site AP.
Synthèse d'une base complémentaire par une ADN polymérase.
Rétablissement de la continuité par une ADN ligase.

c) Réparation par excision de nucléotide

Le système NER (nucleotide excision repair) reconnaît et corrige les anomalies sur les bases de l'ADN (dimères de thymine, pontages covalents inter-brins). Il implique :

Fixation des protéines XP-A sur la lésion.
Recrutement de facteurs protéiques.
Excision de 29 nucléotides.
Resynthèse par une ADN polymérase.
Intervention d'une ligase.

2) Lésions double brin

a) Réparation non-homologue

Concerne les cassures double brin. Protection de la cassure, puis action d'une ligase pour restaurer la continuité.

b) Recombinaison homologue

Se produit quand une mutation est présente sur les deux brins. L'information est récupérée sur une autre chromatide ou chromosome. Elle a lieu pendant la mitose ou la méiose. Implique la création d'une coupure double brin, stabilisation par protéines SSB, échange de brins complémentaires (chiasma), puis intervention d'une ligase.

IX. Transcription des ARN messagers

Le dogme de la génétique est "ébréché" par la découverte de l'épissage alternatif, permettant la synthèse de différentes protéines à partir d'un même ARN.

A. L'ARN polymérase

L'ARN polymérase recopie une partie de l'ADN en ARN messager. Elle démarre au "site de démarrage de la transcription" (+1). La partie promotrice du gène module la transcription. L'ARN polymérase progresse le long du gène en transcrivant un des deux brins jusqu'au site de terminaison. La maturation de l'ARN pré-messager implique l'excision des introns et l'épissage des exons.

Explication du schéma :L'ARN polymérase se positionne sur le gène grâce à des bases qui lui permettent de trouver le site de démarrage de la transcription (+1). Elle progresse le long du gène et le transcrit, produisant l'ARN pré-messager.
L'ARNpm mature via des enzymes nucléaires par :

Formation d'une coiffe.
Ajout d'une queue poly A sur le site de polyadénylation.
Excision des introns et épissage des exons.

L'ARNm mature traverse les pores nucléaires vers le cytoplasme pour être traduit en protéines. Ces protéines peuvent subir des modifications post-traductionnelles et être ciblées vers leur site d'action.

B. Réaction élémentaire

La réaction élémentaire est une polymérisation :

Elle est irréversible grâce à l'utilisation d'un NTP et d'une pyrophosphatase.

Réaction élémentaire de polymérisation de l'ARN

Cette polymérisation repose sur une attaque nucléophile de l'OH en 3' du GU sur le phosphate α du GTP, créant une liaison phosphodiester.
Contrairement à l'ADN polymérase, l'ARN polymérase nécessite une matrice d'ADN mais pas d'amorce. Elle synthétise l'ARN de 5' en 3', en se déplaçant sur le brin matrice de 3' en 5'.
Le brin matrice est l'ADN copié, complémentaire de l'ARNm. Le brin codant est l'autre brin, identique en séquence à l'ARNm (avec T U).

Il existe différentes ARN polymérases :

ARN pol I : transcrit les gènes de classe I (ARNr sauf 5S).
ARN pol II : transcrit les gènes de classe II (ARNm, ARNsn, ARNmi), inhibée par l'α-amanitine.
ARN pol III : transcrit les gènes de classe III (ARNt et ARN 5S).

C. Initiation de la transcription

La machinerie transcriptionnelle (plusieurs protéines) se lie à des séquences consensus ("boîtes") en amont du site de démarrage de la transcription (promoteur proximal). L'ADN est déroulé sur 17 pb (bulle de transcription) et la synthèse démarre. C'est l'étape limitante.
Il existe 2 promoteurs :

Le promoteur proximal : près de +1, permet le positionnement de la machinerie (boîte TATA, boîte CG, boîte CAAT).
Le promoteur distal : régule l'expression du gène.

1) Machinerie transcriptionnelle

Composée de la polymérase, des facteurs généraux de transcription (TFIIA, TFIIB, TFIID, TFIIE, TFIIF, TFIIH) et d'un complexe protéique : le médiateur.
Les facteurs généraux de transcription positionnent la machinerie et initient la transcription. Le médiateur coordonne les étapes.

2) Structure de TFIID

TFIID permet la fixation de la machinerie. Il est composé d'un polypeptide, la TATA binding protein (TBP), qui se lie à la TATA box, et de plus de 14 polypeptides additionnels, les TPB Associated Factors (TAF).

3) Structure de l'ARN polymérase procaryote

La reconnaissance des séquences du promoteur proximal passe par le facteur σ, qui se fixe sur l'ADN et permet le désenroulement. Le facteur σ est indispensable à l'initiation et se détache quand la transcription commence.

D. Elongation de la transcription

La machinerie transcriptionnelle se déplace vers l'extrémité 3' du brin codant. Les topoisomérases coupent l'ADN pour éviter les torsions, puis une ligase relie les coupures. L'hybride ADN/ARN ne dépasse pas 8 à 9 pb. De nombreuses ARN polymérases peuvent transcrire l'ADN simultanément (figures en arbre de Noël).

1) L'élongation de la transcription procaryote

Après l'ajout de 8 à 10 ribonucléotides, le facteur σ est relargué et la polymérase s'éloigne du promoteur.

Elongation de la transcription procaryote

E. Correcteurs d'erreurs lors de la transcription

La polymérase crée des erreurs. La machinerie transcriptionnelle clive le dernier nucléotide s'il est incorrect, puis relie les 3 ou 4 derniers nucléotides. Elle digère l'ARN incorrect avant de recommencer sa synthèse (correction sur épreuve).

F. Terminaison de la transcription

La transcription se termine lorsque la machinerie arrive à une séquence en GC suivie d'une région riche en U (riche en A sur l'ADN matrice). L'ARN forme une épingle à cheveux stable qui se dissocie de l'ADN. L'ARN polymérase est déstabilisée. La richesse en U permet la création de liaisons U-A plus faciles à casser que les liaisons C-G.

X. L'ARN pré-messager et sa maturation

L'ARN transcrit est un transcrit primaire (ARN pré-messager). Il comprend :

Les régions codantes (exons).
Les introns (très longs).
Une partie 5' non traduite (5'UTR).
Une partie 3' non traduite (3'UTR).

Les parties 3' et 5' non traduites seront enlevées lors de la maturation.

A. Maturation de l'ARN pré-messager

La maturation de l'ARN pré-messager concerne uniquement les eucaryotes et a lieu dans le noyau. Elle comprend :

Formation de la coiffe (caping).
Formation d'une queue poly A.
Excision des introns et épissage des exons.

1) Formation de la coiffe

La coiffe est l'ajout en 5' d'une guanine méthylée par une liaison 5'-5' à partir du GTP. C'est un phénomène cotranscriptionnel. La coiffe protège l'ARN des ribonucléases, joue un rôle dans le transport de l'ARNm et permet sa reconnaissance par le ribosome.

2) Addition de la queue poly-A

La séquence 5'AAUAAA3' de la région 3' de l'ARNpm est un signal de clivage et de polyadénylation par la poly-A-polymérase. Quelques centaines de A sont ajoutés à partir d'ATP. La queue polyA stabilise l'ARNm.

3) Excision-épissage des ARNm

L'excision-épissage consiste à éliminer les introns et à "rabouter" les exons. Les limites exons/introns sont repérées par des séquences consensus.

Le mécanisme d'épissage se fait en 2 étapes :

Attaque du groupement 2'OH libre du A du site de branchement sur la liaison phosphodiester du G du site donneur : formation d'un lasso.
L'OH de l'extrémité 3' de l'exon 1 attaque la liaison phosphodiester du G du site accepteur. Clivage de l'intron et jonction des exons 1 et 2 par liaison 3' 5 phosphodiester.

B. Le spliceosome

L'épissage et l'excision sont réalisés dans le noyau par le spliceosome. C'est un complexe ribonucléoprotéique contenant de nombreuses protéines et 5 ARNsn (U1, U2, U4, U5, U6). Ce complexe forme les SnRNP.

1) Les SnRNP

Chaque SnRNP est formée d'une molécule d'ARN (100 à 300 nt, riche en uridines) et d'une dizaine de protéines.

2) Intervention des SnRNP

Les ribonucléoprotéines de SnRNP ont différents sites de fixation :

U1 se lie sur le site 5'.
U2 se fixe sur le site de branchement A.
Les autres SnRNP se fixent pour catalyser les transestérifications.

3) Epissage alternatif des ARNpm

L'épissage alternatif permet de générer des ARN différents à partir de la même séquence d'ARNpm, diversifiant ainsi les protéines. Il est différent selon le type cellulaire, le moment et les besoins de la cellule. On estime que le génome humain génère 5 fois plus de protéines différentes grâce à ce mécanisme.

XI. Régulation de l'expression des gènes

Dans toutes les cellules, seuls 20% des gènes sont exprimés. Cette expression dépend du type cellulaire, des signaux, du métabolisme, du cycle cellulaire et de l'état de différenciation.

A. Les différentes classes de gènes

Gènes de classe I (ARNpol I) : ARNr (sauf 5S).
Gènes de classe II (ARNpol II) : protéines.
Gènes de classe III (ARNpol III) : ARNt et petits ARN (dont l'ARNr 5S).

Les gènes peuvent être :

Les gènes de ménage : ubiquitaires, non soumis à régulation (actine).
Les gènes s'exprimant dans quelques types cellulaires : soumis à régulation.

B. Les différents niveaux de régulation

1) Transcriptionnel

Régulation selon l'accessibilité de la chromatine et les facteurs de transcription interagissant avec la machinerie transcriptionnelle.

2) Post-transcriptionnel

Dépend de la stabilité du messager (épissage alternatif, RNA editing).

3) Post-traductionnel

Repose sur des modifications de la protéine : repliement ("folding"), translocation, dimérisation, phosphorylation/déphosphorylation, farnésylation, etc.

C. Définitions

1) Généralités

La régulation de la transcription repose sur l'effet collectif de facteurs trans (protéines) et de facteurs cis (séquences sur l'ADN).

Si la chromatine est ouverte, le facteur trans reconnaît le facteur cis, s'y fixe et interagit avec la machinerie transcriptionnelle.
La transcription de base nécessite :

Le promoteur proximal (éléments cis) : TATA box, CAAT box.
La machinerie transcriptionnelle : facteurs généraux de transcription et facteurs trans.

Cette transcription est modulée par :

Des séquences enhancers (éléments cis) : stimulent.
Des séquences silencers (éléments cis) : inhibent.
Des éléments de réponse aux hormones.
Des protéines se fixant sur des séquences (facteurs trans activateurs ou répresseurs).

2) Structure d'un promoteur

L'interaction des facteurs trans avec la machinerie transcriptionnelle nécessite la courbure de l'ADN.

Les éléments cis sont souvent dans le promoteur distal, en 5' du site d'initiation, mais aussi en 3' ou dans les introns. Ils peuvent être activateurs (enhancers) ou inhibiteurs (silencers).
Les facteurs trans sont des protéines qui se lient sur les éléments cis et peuvent interagir directement ou indirectement avec la machinerie transcriptionnelle.

Les facteurs trans possèdent :

Un domaine de liaison à l'ADN.
Un domaine de transactivation.
Un domaine de liaison à une hormone (pour les récepteurs nucléaires).

Quatre types de structures sont possibles pour le domaine de liaison à l'ADN :

Hélice-tour-hélice (HTH).
Doigt de zinc (zinc finger).
Fermeture éclair de leucine (leucine zipper).
Hélice-boucle-hélice (HLH).

3) Motif hélice-tour-hélice, ou HTH

Le domaine de liaison à l'ADN est constitué de liaisons H et de bases de la séquence consensus dans le grand sillon. Ex: protéines régulant le développement embryonnaire.

4) Motif doigt de zinc

Deux doigts de zinc générés par des atomes de zinc interagissant avec 4 cystéines. Des acides aminés interagissent avec les bases de la séquence consensus de l'ADN. Ex: récepteurs nucléaires aux hormones hydrophobes.

5) Motif fermeture éclair de leucine

Protéines dimériques exposant leurs leucines. Les leucines d'hélices alpha interagissent par liaisons hydrophobes. Les hélices alpha interagissent avec des bases de la séquence consensus dans le grand sillon par liaisons ioniques.

6) Motif hélice-boucle-hélice, ou HLH

Deux hélices α séparées par une boucle non-hélicoïdale. Hélice dimérisées par liaisons hydrophobes. Un domaine basique permet la liaison à l'ADN. Ex: transcription de gènes comme MyoD1.

7) Facteurs de remodelage de la chromatine

L'activité transcriptionnelle dépend de la présence des facteurs trans et de l'accessibilité des éléments cis. Des mécanismes de régulation de l'accessibilité de l'ADN affectent l'état de méthylation et les modifications post-traductionnelles des histones.

8) Méthylation de l'ADN

Des ADN méthyltransférases peuvent méthyler les cytosines de certaines séquences (GC) en 5-méthylcytosines.

Les séquences GC hyperméthylées dans les promoteurs des gènes inhibent leur expression. Il existe une relation inversement proportionnelle entre la méthylation d'un gène et son expression.

Des agents chimiques hypométhylants peuvent être cancérogènes en favorisant l'expression anarchique de gènes.

9) Modifications épigénétiques

Modification épigénétique : la séquence d'ADN reste identique. La méthylation de l'ADN est une modification épigénétique, modifiée par l'environnement et réversible. L'état de méthylation est maintenu au cours de la division cellulaire et potentiellement chez les gamètes (méthylation trans-générationnelle).

10) Conservation du profil de méthylation

Exemple d'effet épigénétique : les souris dont le gène Avy (couleur jaune) est plus ou moins méthylé ont des couleurs différentes malgré une séquence unique.

11) Modifications post-traductionnelles des histones

Des enzymes peuvent modifier les histones au niveau de l'extrémité N-terminale de manière réversible :

Phosphorylation hausse de l'expression.
Méthylation baisse de l'expression.
Acétylation hausse de l'expression.

Ces modifications changent la conformation de la chromatine et l'accessibilité de l'ADN aux facteurs trans.

12) Régulations post-transcriptionnelles de l'expression des gènes

La demi-vie de l'ARNm influe sur la quantité de protéines traduites.

D. Mécanismes de régulation post-transcriptionnelle

Divers paramètres influencent la stabilité et la demi-vie de l'ARN :

La maturation de l'ARN.
L'ARN interférence.
Le RNA editing.

1) Maturation de l'ARN

La régulation de l'épissage de l'ARNm se fait via le splicing alternatif des ARNpm, diversifiant les protéines. Des éléments cis et des facteurs trans contrôlent ce splicing.

2) ARN interférence, ou micro-ARN

La régulation par ARN interférence se fait grâce à des micro-ARN (ARNmi) de petite taille (18-24 nt). Ces ARNmi sont complémentaires de séquences d'ARNm cibles et forment des ARN double brin. Ces ARN double brin recrutent le complexe protéique RISC (RNA-induced silencing complex) qui les dégrade, inhibant l'expression du gène.
Il existe deux types d'ARNm :

Ceux dont la demi-vie est courte (<30min) : codent pour des protéines régulatrices.
Ceux dont la demi-vie est longue (>10h) : codent pour des protéines de structure.

3) RNA editing

La régulation par RNA editing est une modification d'une base après la transcription de l'ARN (ex: C U par désamination), ou l'insertion/délétion d'une base. La désamination d'une cytosine en uracile peut générer un codon stop, produisant une isoforme de protéine plus courte.

XII. Code génétique et traduction

A. Traduction de l'ARN messager

La séquence nucléotidique de l'ARNm est utilisée pour synthétiser la structure primaire de la protéine. La traduction se fait au niveau du ribosome, dans le cytoplasme.

Après le passage de la membrane nucléaire, les ARN sont orientés vers le REG (protéines sécrétées ou de surface) ou vers les ribosomes libres.

B. Code génétique

1) Code génétique

Le code génétique établit la correspondance entre un triplet nucléotidique (codon) et un acide aminé. Il est dégénéré (plusieurs triplets pour un même AA), non-chevauchant (lu de triplet en triplet), direct (lu de 5' en 3') et universel (sauf exceptions).

2) Codon

Un codon est un ensemble de trois nucléotides consécutifs dans la séquence d'un acide nucléique. Chaque codon permet l'incorporation d'un acide aminé. Il y a triplets possibles pour 20 acides aminés, d'où la dégénérescence du code.

3) Wobble

Le wobble (flottement) décrit le fait que la troisième base du codon a souvent peu d'importance dans la reconnaissance de l'AA, limitant l'impact des mutations.

4) Codons particuliers

Codons STOP : UAA, UAG et UGA.
Codon AUG : codon pour la méthionine et signal d'initiation de la traduction.

C. Eléments nécessaires à la traduction

Un ARNm mature dans le cytoplasme.
Des ARNt portant les acides aminés (aminoacyl-ARNt).
Des ribosomes.
Des facteurs protéiques.
De l'énergie.

1) Organisation de l'ARNm

L'ARNm est la molécule matrice du système de traduction. L'enchaînement des codons définit l'ORF (Open Reading Frame), entre le premier codon (+1) et le codon stop. Il porte une coiffe en 5' et une queue polyA en 3'.

2) Structure des ARNt

Les ARNt sont de petits ARN (75 à 95 nt) avec une structure secondaire en feuille de trèfle. Leur extrémité 3'OH se termine par la séquence CCA, site d'attachement de l'acide aminé. Ils contiennent des bases rares.

3) Aminoacyl-ARNt

4) Structure du ribosome

Le ribosome est un organite gros et complexe, contenant 4 ARNr (5S ; 5,8S ; 18S et 28S) et des protéines. Chaque ARNm peut être traduit simultanément par plusieurs ribosomes (polysome).

Structure du ribosome chez les procaryotes

Structure du ribosome chez les eucaryotes

La structure du ribosome diffère entre procaryotes et eucaryotes, permettant le ciblage par des antibiotiques.

5) Sites de fixation du ribosome

Chaque ribosome possède 3 sites de fixation pour les ARNt :

Le site A : lie le complexe aminoacyl-ARNt (ARNt-AA).
Le site E : lie l'ARNt libre (sans AA).
Le site P : lie le complexe peptidyl-ARNt (premier site occupé).

6) Facteurs protéiques nécessaires à la traduction

De nombreux facteurs protéiques sont requis pour :

L'initiation (étape limitante) : eIF (eukaryotic initiation factors).
L'élongation : eEF (eukaryotic elongation factors).
La terminaison : eRF (eukaryotic release factors).

D. Etapes de la traduction

1) Activation de l'acide aminé

L'activation de l'AA par l'ATP forme une liaison riche en énergie avec l'ARNt (liaison ester).

AA + ATP Aminoacyl-AMP + PPi
Aminoacyl-AMP + ARNt Aminoacyl-ARNt + AMP

L'enzyme impliquée est l'aminoacyl-ARNt synthétase.

2) Initiation de la traduction

L'initiation est l'étape limitante. Elle positionne le ribosome sur le codon initiateur (AUG) et comprend :

Chargement d'un ARNt initiateur sur le site P de la petite SU.
Fixation de l'ARNm.
Fixation de la grande SU du ribosome.

La coiffe de l'ARNm est reconnue par la petite SU, puis l'ARNm glisse jusqu'au codon AUG. Des facteurs d'initiation liés au GTP interviennent. L'ARNt avec l'anticodon UAC (lié à la Met) se fixe, le GTP est hydrolysé et la grosse SU s'associe.

3) Elongation de la traduction

Un deuxième complexe aminoacyl-ARNt se fixe sur le site A. Une liaison peptidique est formée par une peptidyltransférase entre le CO de l'AA n°1 et le NH2 de l'AA n°2. L'ARNm se déplace le long du ribosome et le site A est libéré.

De nombreux facteurs protéiques d'élongation sont nécessaires. L'activité peptidyltransférase dépend de l'ARN28S de la grande SU (activité ribozyme). L'ATP et le GTP sont consommés.

4) Terminaison de la traduction

Au niveau du codon stop (UGA), aucun aminoacyl-ARNt ne peut entrer dans le site A. Des facteurs de libération reconnaissent le codon stop et hydrolysent le peptide. Les SU du ribosome et l'ARNt sont libérés.

a) Orientation des séquences

b) Régulation de la traduction

La vitesse de traduction est d'environ 3 acides aminés par seconde. La quantité de protéines synthétisées dépend de la stabilité de l'ARNm et des facteurs de régulation de la traduction.
La régulation se fait principalement à l'initiation, par phosphorylation des facteurs protéiques ou par liaison à des répresseurs protéiques dans les régions 5' ou 3' non codantes de l'ARNm.
Exemple de la régulation de la traduction dans le métabolisme martial (fer) :
Deux protéines sont impliquées : le récepteur à la transferrine (entrée du fer) et la ferritine (stockage du fer). Leur traduction est régulée par la fixation de la protéine IRP (Iron Regulatory Protein) en 3' ou 5' de leur ARNm.
En cas de déficit en fer, l'IRP se fixe sur le récepteur de la transferrine et le stabilise, augmentant la synthèse des transporteurs. L'IRP se fixe aussi sur l'ARNm de la ferritine et empêche le stockage du fer.

En cas de surplus de fer, l'IRP n'est pas synthétisée.

c) Composés inhibiteurs de la traduction

Des composés artificiels/synthétiques, comme les antibiotiques, ciblent la traduction des procaryotes. Exemples :

La streptomycine empêche la fixation de l'ARNt.
Le chloramphénicol inhibe la peptidyltransférase.
L'érythromycine bloque la terminaison.
La toxine diphtérique inhibe un facteur protéique d'élongation.

d) Modifications post-traductionnelles

Pour être pleinement active, la protéine peut nécessiter des modifications post-traductionnelles : phosphorylation, glycosylation, palmitoylation, myristoylation, isoprénylation, dimérisation, clivage protéolytique, repliement ("folding"), etc.

Inizia un quiz

Testa le tue conoscenze con domande interattive