intro-bioinfo-L2-SV-AMU-SSV3U15_public

Cours d'introduciton à la bioinformatique, 2ème licence en Sciences de la vie, Aix-Marseille Université (L2 SV AMU)

View the Project on GitHub jvanheld/intro-bioinfo-L2-SV-AMU-SSV3U15_public

TP 3 : Du gène au génome

Table des matières

Auteurs

  1. Jacques van Helden
  2. Bénédicte Wirth

Introduction

But du TP

Utiliser des ressources bioinformatiques pour explorer les génomes d’organismes modèles, afin de comprendre la structuration et la composition de ces génomes.

Concepts

Exemples traités

Détermination de la formation de l’oeil des métazoaires (PAX6, aniridia, eyeless)

Le gène PAX6 humain (également appelé aniridia) code pour un facteur transcriptionnel qui s’exprime dans certains tissus pendant l’embryogenèse, et contrôle la formation de l’œil. Des mutations de PAX6 suscitent des malformations de l’oeil. On trouve des homologues du gène PAX6 dans les génomes des métazoaires (animaux pluricellulaires).

Notions mises en pratique dans ce TP


Ressources bioinformatiques

Ressource Lien Description
UCSC genome browser genome.ucsc.edu Navigateur génomique présentant un vaste choix de types d’annotations
NCBI ORFfinder www.ncbi.nlm.nih.gov/orffinder Détection de cadre ouverts de lecture (ORFs) dans des séquences nucléiques
RegulonDB regulondb.ccg.unam.mx/ base de connaissance sur la régulation transcriptionnelle chez la bactérie Escherichia coli: facteurs transcriptionnels, sites de liaison, régulons, opérons

Exercice 1 - Annotations génomiques dans la région du gène humain PAX6

Nous allons utiliser le navigateur de génomes UCSC genome browser pour consulter différents types d’annotations génomiques dans la région du gène humain PAX6.

La page de résultat affiche une série d’annotations de PAX6 dans différentes bases de données de référence pour le génome humain. Comment choisir ? En première instance, le mieux est de se fier aux annotations du consortium international HUGO, responsable de la nomenclature des gènes humains.

Le navigateur de génomes UCSC Genome Browser affiche un vaste choix de pistes d’annotation. La carte génomique en affiche un sous-ensemble, qui s’adaptent en fonction de vos consultations précédentes. Nous allons restreindre la visualisation aux pistes d’annotations utilisées pour ce TP.

Vous pouvez à tout moment reconfigurer le mode d’affichage d’une piste d’annotation, en cliquant droit (contrôle-clic) sur la figure. Ceci vous affichera un menu avec des modes d’affichages de plus en plus détaillés : hide, dense, squish, pack, full.

Observez la disposition du gène PAX6. Notez qu’il chevauche ses voisins de gauche (ELP4) et de droite (PAX6-AS1, où AS indique qu’il s’agit d’un gène antisens).

Questionnaire TP3 – Exercice 1

Sur Ametice, ouvrez le questionnaire du TP3 et répondez aux questions de l’Exercice 1 “Annotations génomiques dans la région du gène humain PAX6”.


Exercice 2 - Conservation du gène PAX6 dans les génomes de vertébrés

Dans la figure qui apparaît, la carte de conservation génomique comporte deux parties.

  1. La partie supérieure affiche un profil de conservation calculé à partir de l’alignement de 100 génomes de vertébrés. La hauteur du profil indique le pourcentage de positions identiques (PPI) à chaque position du génome. Notez que l’échelle verticale va de 50% à 100%, pour mieux faire ressortir les régions conservées.

  2. La partie inférieure indique, sous forme d’une échelle de gris, le pourcentage de conservation par position chez chacune des espèces que vous avez sélectionnées.

Questionnaire TP3 – Exercice 2

Sur Ametice, ouvrez le questionnaire du TP3 et répondez aux questions de l’Exercice 2 “Conservation de la région génomique PAX6 chez les vertébrés”.


Exercice 3 - Profil tissulaire de transcription de PAX6

Nous allons maintenant ajouter à notre carte génomique une piste d’annotation de la base de données GTEx (Genotype-Tissue Expression). GTEx contient des données de transcriptome (mesure quantitative de tous les transcrits produits par un génome) dans des échantillons de 54 tissus prélevés chez 948 personnes adultes.

Interprétation du graphique

Les profils sont affichés sous forme de “boîte à moustaches” (box plot en anglais) pour chaque tissu.

Questionnaire TP3 – Exercice 3

Sur Ametice, ouvrez le questionnaire du TP3 et répondez aux questions de l’Exercice 3 “Profil d’expression tissulaire de PAX6”.


Annotation d’un fragment chromosomique bactérien


Nous disposons d’un fragment chromosomique bactérien, qu’on peut récupérer en cliquant ici.

Ouvrez ce fichier dans un onglet séparé. Pour l’étape suivante, vous pourrez soit le copier à partir de cet onglet, soit le sauvegarder sur votre ordinateur et l’ouvrir avec un éditeur de texte de votre choix.

Nous allons utiliser quelques outils bioinformatiques pour annoter ce fragment d’ADN chromosomique. La première étape consiste à localiser les gènes sur ce fragment d’ADN. Il faudra ensuite essayer de trouver la fonction assurée par ces gènes.

Exercice 4-5 - Recherche des cadres ouverts de lecture

Afin de localiser les gènes sur ce fragment d’ADN chromosomique, nous allons effectuer une recherche de cadres ouverts de lecture (open reading frames, ORFs), en utilisant l’outil ORFinder du NCBI.

  1. Connectez-vous à l’outil ORFinder du NCBI.
  2. Collez la séquence du fragment chromosomique bactérien dans l’encadré “Enter Query Sequence”.
  3. Dans la section, “Choose Search Parameters” :

    • Fixez la longueur minimale des ORFs recherchés à 300 pb.
    • Choisissez le code génétique le plus approprié.
    • Pour le codon start à utiliser pour la recherche, choisissez “ATG only”.
    • Cliquez Submit.
  4. Sur la fenêtre de résultats de la recherche d’ORFs, cliquez sur “Six-frame translation”, puis sur “Display six-frame translation”.

Questionnaire TP3 – Exercice 4: Annotation d’une séquence bactérienne - traduction sur 6 phases

Qu’observez-vous dans la fenêtre qui s’affiche ? En particulier

Fermez la fenêtre “Six frame translation”, puis relancez la traduction sur 6 phases avec une option alternative, en cliquant sur Six-frame translation puis sur Add six-frame translation track. Qu’observez-vous dans la fenêtre qui s’affiche ?

Astuce : pour répondre aux questions 2 et 3, zoomez sur la carte jusqu’à faire apparaître l’enchaînement des résidus (acides aminés et nucléotides).

Questionnaire TP3 – Exercice 5: Pistes de traduction sur les 6 phases de lecture

Exercice 6 - Tailles des régions intergéniques

Vous allez maintenant déterminer la taille des régions intergéniques (RI) entre ces ORFs.

*Astuce: sous la carte des ORF, ORFfinder affiche un tableau indiquant les coordonnées génomiques et la taille des ORFs détectés. Vous pouvez récupérer les valeurs de ce tableau pour calculer la taille des régions intergéniques. *

Questionnaire TP3 – Exercice 6: Tailles des régions intergéniques

Quelles conclusions peut-on tirer à partir des tailles de ces RI ?

Exercice 7 - Assignation de fonction par recherche de similarité

Vous allez maintenant vous intéresser à l’annotation fonctionnelle de ces ORFs détectés dans le fragment d’ADN chromosomique étudié. Pour cela, le plus simple est de faire une recherche par similarité dans une base de données (outil BLAST), afin de comparer les ORFs identifiés aux séquences déjà connues et répertoriées dans les bases de données.

Vous allez ainsi vérifier à quel gène pourraient correspondre les ORF1 et 10.

Questionnaire TP3 – Exercice 7: Assignation de fonction par recherche de similarité

Identification du gène correspondant à ORF1

Vous allez maintenant rechercher le nom du gène correspondant à l’ORF1.

Question (Hors questionnaire)

Fonction et identification de l’ORF10

L’ORF10 chevauche étonnamment l’ORF8 de manière importante, sur une grande partie de sa longueur. Afin de tenter de déterminer à quel gène pourrait correspondre cet ORF10, vous allez donc faire, pour l’ORF10, la même manipulation que celle faite pour l’ORF1.

Questions (Hors questionnaire)

Exercice 8 - Recherche d’information sur RegulonDB

Questionnaire TP3 – Exercice 8: Consultation de RegulonDB

Comparez votre prédiction d’ORFs avec ORFinder à la carte de l’opéron sur RegulonDB.

Qu’avez-vous acquis au terme de ce TP ?

Au cours de ce TP, vous avez utilisé des outils de navigation génomique et d’analyse de séquences pour explorer les régions génomiques humaines (autour du gène humain PAX6) et bactériennes (opéron his chez Escherichia coli).

Ceci vous a amenés à mettre en pratique une série de concepts biologiques en manipulant des séquences et annotations génomiques avec deux des navigateurs génomiques les plus utilisés en biologie : UCSC Genome Browser et NCBI (que vous aviez commencé à utiliser au TP2).

L’exploration des annotations génomiques de PAX6 vous a permis d’acquérir les compétences suivantes

L’analyse de la séquence génomique vous a placés dans la situation des biologistes qui disposent de nouvelles séquences génomiques bactériennes. Vous avez appris à manipuler une série d’outils en ligne qui permettent de réaliser facilement les premières étapes de cette démarche d’annotation :