Biopython - Analyse du génome
Un génome est un ensemble complet d'ADN, y compris tous ses gènes. L'analyse du génome fait référence à l'étude des gènes individuels et de leurs rôles dans l'hérédité.
Diagramme du génome
Le diagramme du génome représente les informations génétiques sous forme de graphiques. Biopython utilise le module Bio.Graphics.GenomeDiagram pour représenter GenomeDiagram. Le module GenomeDiagram nécessite l'installation de ReportLab.
Étapes de création d'un diagramme
Le processus de création d'un diagramme suit généralement le modèle simple ci-dessous -
Créez un FeatureSet pour chaque ensemble distinct d'entités que vous souhaitez afficher et ajoutez-leur des objets Bio.SeqFeature.
Créez un GraphSet pour chaque graphique que vous souhaitez afficher et ajoutez-y des données graphiques.
Créez une piste pour chaque piste que vous souhaitez sur le diagramme, et ajoutez des GraphSets et FeatureSets aux pistes dont vous avez besoin.
Créez un diagramme et ajoutez-y les pistes.
Dites au diagramme de dessiner l'image.
Écrivez l'image dans un fichier.
Prenons un exemple de fichier GenBank d'entrée -
https://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/ls_orchid.gbket lisez les enregistrements de l'objet SeqRecord, puis dessinez enfin un diagramme du génome. Il est expliqué ci-dessous,
Nous allons d'abord importer tous les modules comme indiqué ci-dessous -
>>> from reportlab.lib import colors
>>> from reportlab.lib.units import cm
>>> from Bio.Graphics import GenomeDiagram
Maintenant, importez le module SeqIO pour lire les données -
>>> from Bio import SeqIO
record = SeqIO.read("example.gb", "genbank")
Ici, l'enregistrement lit la séquence à partir du fichier genbank.
Maintenant, créez un diagramme vide pour ajouter une piste et un ensemble de fonctionnalités -
>>> diagram = GenomeDiagram.Diagram(
"Yersinia pestis biovar Microtus plasmid pPCP1")
>>> track = diagram.new_track(1, name="Annotated Features")
>>> feature = track.new_set()
Maintenant, nous pouvons appliquer des changements de thème de couleur en utilisant des couleurs alternatives du vert au gris comme défini ci-dessous -
>>> for feature in record.features:
>>> if feature.type != "gene":
>>> continue
>>> if len(feature) % 2 == 0:
>>> color = colors.blue
>>> else:
>>> color = colors.red
>>>
>>> feature.add_feature(feature, color=color, label=True)
Vous pouvez maintenant voir la réponse ci-dessous sur votre écran -
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dc90>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dfd0>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x1007627d0>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57290>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57050>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57390>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57590>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57410>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57490>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d574d0>
Dessinez un diagramme pour les enregistrements d'entrée ci-dessus -
>>> diagram.draw(
format = "linear", orientation = "landscape", pagesize = 'A4',
... fragments = 4, start = 0, end = len(record))
>>> diagram.write("orchid.pdf", "PDF")
>>> diagram.write("orchid.eps", "EPS")
>>> diagram.write("orchid.svg", "SVG")
>>> diagram.write("orchid.png", "PNG")
Après avoir exécuté la commande ci-dessus, vous pouvez voir l'image suivante enregistrée dans votre répertoire Biopython.
** Result **
genome.png
Vous pouvez également dessiner l'image au format circulaire en apportant les modifications ci-dessous -
>>> diagram.draw(
format = "circular", circular = True, pagesize = (20*cm,20*cm),
... start = 0, end = len(record), circle_core = 0.7)
>>> diagram.write("circular.pdf", "PDF")
Présentation des chromosomes
La molécule d'ADN est emballée dans des structures filiformes appelées chromosomes. Chaque chromosome est composé d'ADN étroitement enroulé plusieurs fois autour de protéines appelées histones qui soutiennent sa structure.
Les chromosomes ne sont pas visibles dans le noyau de la cellule - même pas au microscope - lorsque la cellule ne se divise pas. Cependant, l'ADN qui compose les chromosomes devient plus compact pendant la division cellulaire et est alors visible au microscope.
Chez l'homme, chaque cellule contient normalement 23 paires de chromosomes, pour un total de 46. Vingt-deux de ces paires, appelées autosomes, se ressemblent aussi bien chez les hommes que chez les femmes. La 23e paire, les chromosomes sexuels, diffèrent entre les hommes et les femmes. Les femelles ont deux copies du chromosome X, tandis que les mâles ont un chromosome X et un chromosome Y.