Les cellules interagissent avec leur environnement, elles peuvent s'adapter pour utiliser les ressources du milieu de manière optimale, ou elles peuvent se différencier les unes des autres
- nos cellules, qui possédent un matériel génétique identique, expriment leurs gènes de manière différente
En fonction des besoins de la cellule, les gènes sont allumés (ils s'expriment) ou éteints (réprimés). Exprimer un gène, c'est lire l'information qu'il contient et fabriquer la protéine correspondante
À partir de nos 20 000 gènes, les cellules sont capables de produire plus de 100 000 protéines. L'expression des gènes est régulée selon la position des cellules et selon le moment de leur vie ou de la vie du corps : régulation spatiotemporelle
On distingue 3 grandes familles de gènes
- Gènes « domestiques » -> exprimés tout le temps dans toutes les cellules
- Gènes spécifiques -> exprimés tout le temps dans certaines cellules
- Gènes régulés -> exprimés à certains moments dans certaines cellules
-> PROTEINES, présentes partout dans et hors de la cellule, acteurs des fonctions biologiques
- Nécessité d'un intermédiaire pour porter le message
-> ADN (Acide DésoxyriboNucléique), dans le noyau de la cellule, porteur de l'information génétique (les gênes)
Protéines
Toutes les protéines sont construites à partir d'une combinaison spécifique de 20 acides aminés (ils ont la même structure). La forme des protéines détermine leur fonction. Elle est conditionnée par leur séquence en acides aminés
AA
-> liaison peptidique
Les acides aminés (ou peptides) s'associent en longues chaines par des liaisons peptidiques covalentes pour former un polypeptide = une protéine
-> 3 étapes pour exprimer un gène
- transcription, maturation, traduction
Transcription de l'ADN en ARN
- Un gène est transcrit en ARNm
À partir d'une molécule énorme, complexe et statique, la cellule produit une molécule petite, simple, opérationnelle et transportable qui va pouvoir passer dans le cytoplasme. Le principe de la transcription est basé sur la complémentarité des bases -> l'information génétique est conservée
Les ARN sont aussi constitués de nucléotides, mais ils ont plusieurs différences avec l'ADN
-> La séquence du gène est transcrite en ARN messager primaire, cette séquence est appelée unité de transcription
-> Les séquences de contrôle sont le promoteur et le terminateur, de part et d'autre de l'unité de transcription
Nb: seul un brin d'ADN est transcrit
Les ARNm subissent 2 étapes de "maturation" dans le noyau avant d'être exportés vers le cytoplasme:
- Protection de chacune des extrémités pour ne pas être dégradés trop vite
- Coiffe sur le premier nucléotide
- Queue de polyA accrochée sur le dernier nucléotides
- Epissage des introns = élimination des introns et raboutage des exons
Partie d'un gène
- Unité de transcription : partie de l'ADN transcrite qui va donner un ARN primaire
- Promoteur : signal de démarrage de transcription
- Terminateur : signal de fin de transcription
- Exon: partie qui sera conservée lors de la maturation de l'ARNm
- Intron : partie qui sera éliminée lors de la maturation de l'ARNm, par épissage
- Régions régulatrices: parties pas toujours définies qui contrôlent et modulent l'expression
les introns ne contiennent pas de séquence codant pour la protéine, tous les gènes des eucaryotes ne contiennent pas forcément d'introns mais la plupart en ont. Le nombre d'introns est très variable d'un gène à l'autre. Les gènes des procaryotes ne contiennent pas d'introns
-> En plus de l'épissage « classique », les ARN primaires subissent de l'épissage « alternatif »
-> L'épissage ôte non seulement les introns, mais peut également supprimer des exons dans certains ARNm
Ainsi, à partir d'un même gène, d'un même ARN primaire, on peut produire plusieurs ARNm matures différents -> plusieurs protéines
Application du code génétique
Les bases de l'ARN (ou des parties codantes de l'ADN) se lisent 3 par 3. 3 nucléotides forment un mot : un CODON
- ADN -> Acide Amine (élément de base de la protéine)
- ATG -> Méthionine (= aussi START)
- GAG -> Acide Glutamique (Glu)
- GTG -> Valine (Val)
- CICh -> ...
Statistiquement : 4 x 4 x 4 = 64 possibilités de codons différents. Or, il existe « seulement » 20 acides aminés différents
- AUG = Codon de démarrage de la traduction (START)
- UAA, UAG, UGA = Codon d'arrêt de la traduction (STOP)
Code génétique
Un même acide aminé peut être codé par plusieurs codons différents (il y a plus de codons que d'acides aminés)
- le code est dit REDONDANT (ou DÉGÉNÉRÉ)
Pour un codon donné, il ne peut y avoir qu'un acide aminé correspondant
- le code est dit NON AMBIGU
Il est le même de la levure au pétunia en passant par le chat ou le directeur d'IFSI...
- le code est dit UNIVERSEL
Traduction des protéines
= phénomène qui permet la synthèse des protéines à partir des ARNm matures, dans le cytoplasme
C'est un processus impliquant les ribosomes et les ARNt, qui apportent les AA à lier ensemble. La synthèse d'une protéine est aussi un processus ORIENTE
L'ordre des AA reflète directement la séquence de l'ADN et de l'ARNm, grâce au code génétique
- Le ribosome "lit" un codon du messager et sélectionne l'ARNt complémentaire : celui qui a l'anticodon correspondant
- Cet ARNt a fixé un acide aminé spécifique
- Le ribosome avance d'un codon et recommence jusqu'à tomber sur un codon STOP
- Les AA sont accrochés les uns aux autres (par liaison peptidique) et les ARNt libérés au fur et à mesure
- Au codon STOP, le processus s'arrête et la protéine est libérée
Cadre de lecture
Toutes les parties des exons ne sont pas codantes ! Il faut trouver le bon cadre de lecture
Il peut y avoir 3 cadres de lecture selon la base choisie comme 1ere base de la traduction, mais un seul est le bon
Le cadre de lecture correspond à la séquence de l'ARNm qui sera effectivement traduite en protéine. C'est le premier travail du ribosome qui « scanne » l'ARNm pour y trouver le bon cadre
Pour "lire" la séquence complète de la protéine sur l'ARNm, il faut donc :
- Trouver un AUG (ATG sur le brin codant d'ADN)
- Trouver un codon STOP (UAG, UGA ou UAA)
- (Ne pas trouver d'autre STOP entre ces 2 codons)
La correspondance ADN -> protéine n'est pas directe. Donc, la séquence d'un gène n'est pas uniquement composée de codons pour fabriquer la protéine
Il existe des signaux de contrôle pour chacune des étapes qui mènent à la protéine (transcription, maturation et traduction)
- Le gène porte toutes ces informations de contrôle dans sa séquence
- Lors de la transcription de l'ADN, la séquence entière de l'UT est transcrite (exons + introns)
- Lors de la maturation de l'ARNm, seuls les exons sont conservés, les introns sont épissés
- Lors de la traduction de l'ARNm, seule la partie correspondant au cadre de lecture est traduite en protéine
Les gènes eucaryotes apparaissent « morcelés »
Variations normales du génome
Si l'on analyse la succession de nucléotides d'un chromosome, on va s'apercevoir que d'un individu à l'autre, les séquences ne sont pas rigoureusement identiques. Au total, le génome de 2 personnes prises au hasard est identique à 99,9%
-> Nous avons environ 3 millions de différences ponctuelles (un seul nucléotide concerné) avec les autres humains
- On les appelle POLYMORPHISMES, Ils sont un des moteurs de l'évolution et de la biodiversité
Les polymorphismes peuvent être situés dans ou hors des gènes (avec des conséquences fonctionnelles différentes). La plupart n'ont pas de conséquence en pathologie, mais dans leur ensemble, ils façonnent notre identité génétique
Par exemple, la séquence du gène KRT1, codant la kératine de nos cheveux, n'est pas la même chez tout le monde : nous avons des cheveux très différents
- Ces différentes versions du même gène sont appelées ALLELES
- Les allèles ne diffèrent en général que de quelques nucléotides
Variation pathologique du génome
Le génome peut présenter des variations de séquence à l'origine de maladies + on parle alors plutôt de mutations (même si la tendance actuelle est à l'uniformisation et à l'emploi plus neutre du terme variant ou variation -> variant pathogène)
Certains variants rares et pathogènes sont à l'origine de maladies héréditaires ils se transmettent de génération en génération) ou prédisposent à une maladie multifactorielle (ils sont associés à une augmentation du risque de développer un cancer, par exemple)
Devant une nouvelle variation de séquence, le généticien doit déterminer sa pathogénicité
L'impact sur la protéine correspondante peut être:
- bénéfique
- neutre
- néfaste -> variant pathogène
Souvent, on ne sait pas interpréter cet effet! -> variant « de signification inconnue »
Ne pas confondre
Pathologie héréditaire / congénitale
Maladie génétique / infectieuse
Maladie génétique / héréditaire
Une femme enceinte qui consomme de l'alcool peut avoir un enfant souffrant d'une malformation CONGENITALE, mais cela n'est pas HEREDITAIRE, ni GENETIQUE
Le SIDA est une maladie INFECTIEUSE due à un virus, mais qui peut se TRANSMETTRE de la mère à l'enfant pendant la grossesse
Le cancer est une maladie GENETIQUE, mais comme il concerne des cellules somatiques, il ne se TRANSMET pas
Les lésions de mutations
Les mutations sont des lésions de l'ADN. Elles sont spontanées, par exemple : erreur lors de la réplication Ou induites : conséquence d'une agression de l'ADN (agents chimiques, mutagènes, UV, rayons, solvants, nicotine...). Les bases sont modifiées ou supprimées -› la séquence est changée. En règle générale, une machinerie cellulaire détecte ces erreurs et les répare efficacement
-> Mais parfois, une mutation est fixée : elle n'est pas réparée efficacement. La séquence d'ADN est modifiée définitivement pour les prochains cycles cellulaires
-> Les mutations qui surviennent pendant la vie de l'individu dans une cellule somatique sont appelées
- mutations acquises, ou somatiques
-> Les cancers sont dus à des mutations acquises dont l'effet pathogène transforme les cellules des tissus touchés en cellules tumorales. Ils ne sont pas héréditaires. Pour étudier la mutation, il faut faire un prélèvement de la tumeur
-> Une mutation survenant dans l'ADN d'un gamète sera transmise à la descendance et sera présente dans toutes les cellules du corps du bébé
- c'est une mutation constitutionnelle, détectable par test génétique chez enfant
Les mutations constitutionnelles ont trois origines
- Soit elles sont présentes chez un ou chez les deux parents (transmission héréditaire dans la famille)
- Soit elles se produisent dans l'ADN d'un gamète ou d'une cellule souche germinale -> mutation DE NOVO
- Soit elles se produisent au tout début du développement embryonnaire
Dans tous les cas, il est possible d'estimer le risque de transmission à la génération suivante en consultation de conseil génétique
Il existe 2 grands types de pathologies de l'ADN
- Les problèmes à l'échelle de la séquence d'ADN, qui concernent un seul (ou parfois quelques) gène(s) - les MUTATIONS
- Les problèmes à l'échelle des chromosomes (trisomie, monosomies, délétions, insertions, duplications, translocations...) qui concernent souvent des dizaines ou des centaines de gènes ensemble
Mutations ponctuelle
Il en existe trois types
- Remplacement d'un nucléotide par un autre = substitution
- Les conséquences des substitutions ponctuelles dans la région codante sont de 3 types (synonyme, faux-sens, non-sens)
- Elles n'ont pas forcément un effet sur la synthèse de la protéine
- Ajout d'un nucléotide = addition (= insertion)
- Retrait d'un nucléotide = délétion
- Les conséquences des additions ou délétions ponctuelles dans la région codante sont toujours de DECALER le cadre de lecture de la protéine
- Soit la protéine produite est tronquée, soit elle est allongée, soit elle est détruite
Il faut bien distinguer
- Le type de mutation
- Leur effet sur la synthèse de la protéine
-> Hémoglobine
Une mutation de la séquence du gène de l'alpha-globine entraine un changement de la séquence de la protéine d'hémoglobine différente (Hbs), moins active. Les globules rouges se déforment et meurent
Épigénétique
-> La variation d'expression des gènes est sous le contrôle de l'environnement et de nombreux facteurs
-> C'est l'épigénétique : « autour de la génétique »
-> Contrairement aux informations de séquence intrinsèques à l'ADN, les marques épigénétiques sont réversibles
-> Elles peuvent être transmises
Anomalies chromosomiques
Si les modifications de la séquence concernent des milliers ou des millions de nucléotides d'ADN, on passe à l'échelle chromosomique. On étudie les chromosomes
- soit en faisant un caryotype
- soit en analyse sur puce à ADN (ACPA)
Deux types d'anomalies possibles:
- variants de structure: duplication, délétion, inversion, translocation, translocation robertsonienne
- anomalies de nombre: trisomie 21