Biopython - Análisis del genoma

Un genoma es un conjunto completo de ADN, incluidos todos sus genes. El análisis del genoma se refiere al estudio de genes individuales y su papel en la herencia.

Diagrama del genoma

El diagrama del genoma representa la información genética en forma de gráficos. Biopython utiliza el módulo Bio.Graphics.GenomeDiagram para representar GenomeDiagram. El módulo GenomeDiagram requiere que ReportLab esté instalado.

Pasos para crear un diagrama

El proceso de creación de un diagrama generalmente sigue el siguiente patrón simple:

  • Cree un FeatureSet para cada conjunto de características que desee mostrar y agrégueles objetos Bio.SeqFeature.

  • Cree un GraphSet para cada gráfico que desee mostrar y agrégueles datos de gráficos.

  • Cree una pista para cada pista que desee en el diagrama y agregue GraphSets y FeatureSets a las pistas que necesite.

  • Cree un diagrama y agréguele las pistas.

  • Dile al Diagrama que dibuje la imagen.

  • Escribe la imagen en un archivo.

Tomemos un ejemplo de archivo GenBank de entrada:

https://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/ls_orchid.gbky leer registros del objeto SeqRecord y finalmente dibujar un diagrama del genoma. Se explica a continuación,

Primero importaremos todos los módulos como se muestra a continuación:

>>> from reportlab.lib import colors 
>>> from reportlab.lib.units import cm 
>>> from Bio.Graphics import GenomeDiagram

Ahora, importe el módulo SeqIO para leer datos:

>>> from Bio import SeqIO 
record = SeqIO.read("example.gb", "genbank")

Aquí, el registro lee la secuencia del archivo genbank.

Ahora, cree un diagrama vacío para agregar una pista y un conjunto de características:

>>> diagram = GenomeDiagram.Diagram(
   "Yersinia pestis biovar Microtus plasmid pPCP1") 
>>> track = diagram.new_track(1, name="Annotated Features") 
>>> feature = track.new_set()

Ahora, podemos aplicar cambios de tema de color utilizando colores alternativos de verde a gris como se define a continuación:

>>> for feature in record.features: 
>>>    if feature.type != "gene": 
>>>       continue 
>>>    if len(feature) % 2 == 0: 
>>>       color = colors.blue 
>>>    else: 
>>>       color = colors.red 
>>> 
>>>    feature.add_feature(feature, color=color, label=True)

Ahora puede ver la siguiente respuesta en su pantalla:

<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dc90> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dfd0> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x1007627d0> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57290> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57050> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57390> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57590> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57410> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57490> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d574d0>

Dibujemos un diagrama para los registros de entrada anteriores:

>>> diagram.draw(
   format = "linear", orientation = "landscape", pagesize = 'A4', 
   ... fragments = 4, start = 0, end = len(record)) 
>>> diagram.write("orchid.pdf", "PDF") 
>>> diagram.write("orchid.eps", "EPS") 
>>> diagram.write("orchid.svg", "SVG") 
>>> diagram.write("orchid.png", "PNG")

Después de ejecutar el comando anterior, podría ver la siguiente imagen guardada en su directorio de Biopython.

** Result **
genome.png

También puede dibujar la imagen en formato circular realizando los siguientes cambios:

>>> diagram.draw(
   format = "circular", circular = True, pagesize = (20*cm,20*cm), 
   ... start = 0, end = len(record), circle_core = 0.7) 
>>> diagram.write("circular.pdf", "PDF")

Descripción general de los cromosomas

La molécula de ADN está empaquetada en estructuras en forma de hilo llamadas cromosomas. Cada cromosoma está formado por ADN fuertemente enrollado muchas veces alrededor de proteínas llamadas histonas que sostienen su estructura.

Los cromosomas no son visibles en el núcleo de la célula, ni siquiera bajo un microscopio, cuando la célula no se está dividiendo. Sin embargo, el ADN que forma los cromosomas se vuelve más compacto durante la división celular y luego es visible al microscopio.

En los seres humanos, cada célula normalmente contiene 23 pares de cromosomas, para un total de 46. Veintidós de estos pares, llamados autosomas, tienen el mismo aspecto tanto en hombres como en mujeres. El par 23, los cromosomas sexuales, difieren entre hombres y mujeres. Las mujeres tienen dos copias del cromosoma X, mientras que los hombres tienen un cromosoma X y uno Y.