Vous êtes ici : Accueil > L'UMR > PredAlgo, un outil de prédiction de localisation subcellulaire des protéines chez les Algues vertes

Fait marquant

PredAlgo, un outil de prédiction de localisation subcellulaire des protéines chez les Algues vertes


​​​​​​​​​Afin d’améliorer les rendements de production des biocarburants de 3ème génération, les biologistes cherchent à domestiquer les processus de conversion et de stockage de l’énergie solaire par les microalgues. Les études se portent en particulier sur le chloroplaste, un organite où se déroule la photosynthèse à l’origine de la production des réserves énergétiques (l’amidon ou les lipides). Dans le cadre du projet ALGOMICS, nous avons [collaboration] développé un outil pour annoter les protéines de l’algue modèle Chlamydomonas reinhardtii, afin de suivre leur localisation dans les différents compartiments cellulaires (dont le chloroplaste).​​

Publié le 4 septembre 2012
Un aspect important contribuant à notre compréhension des mécanismes cellulaires est l'assignation de la localisation des protéines dans les différents compartiments subcellulaires. Chez les eucaryotes, des organelles comme la mitochondrie et le chloroplaste ont une origine endosymbiotique bactérienne. Les gènes de cette bactérie ancestrale ont migré vers le noyau de la cellule et leurs produits, les protéines, sont synthétisés dans le cytoplasme. C'est pourquoi la biogenèse et le fonctionnement de la mitochondrie ou du chloroplaste impliquent la migration de ces protéines depuis le cytoplasme vers l'organelle en traversant le système membranaire le délimitant. Pour la plupart, ces protéines ont acquis une « séquence signal » appelée séquence d'import qui leur permettent d'être correctement adressées dans le compartiment sub-cellulaire adéquat.

Prédire la présence d'une séquence d'import est une composante clé de l'annotation de localisation subcellulaire d'une protéine. Cependant, les outils existants, développés à partir des séquences d'organismes animaux ou de plantes supérieures terrestres, s'avèrent inadaptés pour les Algues vertes. Dans cette nouvelle étude, l'objectif de l'équipe EDyP du laboratoire de Biologie à Grande Échelle de notre institut a été de concevoir un logiciel spécifiquement dédié aux algues vertes, appelé PredAlgo [1].

L'organisme modèle Chlamydomonas reinhardtii a été choisi comme source de données expérimentales pour l'apprentissage du logiciel. C'est en effet la seule algue verte pour laquelle il existe un inventaire suffisamment grand de protéines dont la localisation subcellulaire est connue. De telles protéines ont leur séquence d'import clivée lors de leur passage dans le chloroplaste ou la mitochondrie. L'identification précise des séquences d'import (i.e. au niveau du site de clivage) de ces protéines a pu être obtenue en ré-analysant les données de spectrométrie de masse en tandem (Figure 1) précédemment acquises pour l'élaboration des protéomes mitochondrial [2] et chloroplastique [3].



Figure 1 : Identification des peptides N-terminaux des protéines en spectrométrie de masse.

Dans une analyse classique de spectrométrie de masse en tandem (MS/MS), l’échantillon est digéré par la trypsine ce qui génère des peptides présentant un site-consensus de coupure par la trypsine ( ) aux deux extrémités N- et Cter. Seul un peptide situé à l'une des extrémité de la protéine ne présente qu'une coupure trypsique. Afin d'identifier les peptides N-terminaux des protéines (peptide en vert), la recherche est paramétrée en exigeant la présence du seul site trypsique côté Cter. Étant donné que les protéines transférées dans la mitochondrie ou le chloroplaste ont été clivées au niveau de leur peptide de transit, il est possible de déterminer avec précision ce site de clivage et la séquence d'import (en bleu clair) par soustraction entre la séquence entière de la protéine (issue des banques de données) et le peptide N-terminal de la protéine de l'échantillon.

L'analyse des séquences adjacentes aux sites de clivage identifiés révèle des tendances générales (Figure 2) qui ne permettent pas d'extraire de consensus explicites, distinctifs des compartiments chloroplastiques ou mitochondriaux. En conséquence, PredAlgo a été développé sur le principe des " réseaux neuronaux ", boîte noire dans laquelle l'apprentissage optimise des règles de décision qui ne sont pas interprétables par l'humain.



Figure 2 : Fréquence d'apparition des acides aminés sur une fenêtre de 10 positions de part et d’autre du site de clivage (flèche) : ces schémas ont été générés sur la base des protéines du chloroplaste et de la mitochondrie utilisées pour l’apprentissage de PredAlgo.

En comparaison des logiciels existants, PredAlgo offre de bien meilleures performances pour les algues, notamment dans la discrimination entre les protéines mitochondriales et chloroplastiques. L'outil se révèle pertinent non seulement chez Chlamydomonas mais également chez des algues vertes proches. Il serait moins prédictif dans le cas de la localisation de protéines mitochondriales chez les algues plus éloignées.

Les algues vertes sont de plus en plus reconnues comme source potentielle de biocarburants dit de 3 ème génération (acides gras, sucres, hydrogène) dont la production est associée au métabolisme du chloroplaste. PredAlgo représente un outil plus sûr de prédiction de la localisation subcellulaire chez ces organismes et devrait accélérer la compréhension des métabolismes et de leur compartimentation, socles de connaissances indispensables à des fins d'ingénierie des algues vertes.

Haut de page