Biopython - Analiza genomu

Genom to kompletny zestaw DNA, w tym wszystkie jego geny. Analiza genomu odnosi się do badania poszczególnych genów i ich roli w dziedziczeniu.

Diagram genomu

Diagram genomu przedstawia informacje genetyczne w postaci wykresów. Biopython używa modułu Bio.Graphics.GenomeDiagram do reprezentowania GenomeDiagram. Moduł GenomeDiagram wymaga zainstalowania ReportLab.

Kroki tworzenia diagramu

Proces tworzenia diagramu zasadniczo przebiega według poniższego prostego wzoru -

  • Utwórz FeatureSet dla każdego oddzielnego zestawu funkcji, które chcesz wyświetlić, i dodaj do nich obiekty Bio.SeqFeature.

  • Utwórz zestaw wykresów dla każdego wykresu, który chcesz wyświetlić, i dodaj do nich dane wykresu.

  • Utwórz ścieżkę dla każdej ścieżki, którą chcesz na diagramie i dodaj GraphSets i FeatureSets do żądanych ścieżek.

  • Utwórz diagram i dodaj do niego ścieżki.

  • Powiedz Diagramowi, aby narysował obraz.

  • Zapisz obraz do pliku.

Weźmy przykład wejściowego pliku GenBank -

https://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/ls_orchid.gbki odczytaj rekordy z obiektu SeqRecord, a następnie narysuj diagram genomu. Jest to wyjaśnione poniżej,

Najpierw zaimportujemy wszystkie moduły, jak pokazano poniżej -

>>> from reportlab.lib import colors 
>>> from reportlab.lib.units import cm 
>>> from Bio.Graphics import GenomeDiagram

Teraz zaimportuj moduł SeqIO, aby odczytać dane -

>>> from Bio import SeqIO 
record = SeqIO.read("example.gb", "genbank")

Tutaj rekord odczytuje sekwencję z pliku genbank.

Teraz utwórz pusty diagram, aby dodać ścieżkę i zestaw funkcji -

>>> diagram = GenomeDiagram.Diagram(
   "Yersinia pestis biovar Microtus plasmid pPCP1") 
>>> track = diagram.new_track(1, name="Annotated Features") 
>>> feature = track.new_set()

Teraz możemy zastosować zmiany motywu kolorystycznego, używając alternatywnych kolorów od zielonego do szarego, jak zdefiniowano poniżej -

>>> for feature in record.features: 
>>>    if feature.type != "gene": 
>>>       continue 
>>>    if len(feature) % 2 == 0: 
>>>       color = colors.blue 
>>>    else: 
>>>       color = colors.red 
>>> 
>>>    feature.add_feature(feature, color=color, label=True)

Teraz możesz zobaczyć poniższą odpowiedź na ekranie -

<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dc90> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dfd0> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x1007627d0> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57290> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57050> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57390> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57590> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57410> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57490> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d574d0>

Narysujmy diagram dla powyższych rekordów wejściowych -

>>> diagram.draw(
   format = "linear", orientation = "landscape", pagesize = 'A4', 
   ... fragments = 4, start = 0, end = len(record)) 
>>> diagram.write("orchid.pdf", "PDF") 
>>> diagram.write("orchid.eps", "EPS") 
>>> diagram.write("orchid.svg", "SVG") 
>>> diagram.write("orchid.png", "PNG")

Po wykonaniu powyższego polecenia możesz zobaczyć następujący obraz zapisany w twoim katalogu Biopython.

** Result **
genome.png

Możesz także narysować obraz w formacie okrągłym, wprowadzając poniższe zmiany -

>>> diagram.draw(
   format = "circular", circular = True, pagesize = (20*cm,20*cm), 
   ... start = 0, end = len(record), circle_core = 0.7) 
>>> diagram.write("circular.pdf", "PDF")

Przegląd chromosomów

Cząsteczka DNA jest upakowana w nitkowate struktury zwane chromosomami. Każdy chromosom składa się z DNA, wielokrotnie zwiniętego ciasno wokół białek zwanych histonami, które wspierają jego strukturę.

Chromosomy nie są widoczne w jądrze komórki - nawet pod mikroskopem - gdy komórka się nie dzieli. Jednak DNA, z którego składają się chromosomy, staje się ściślej upakowane podczas podziału komórki i jest następnie widoczne pod mikroskopem.

U ludzi każda komórka zwykle zawiera 23 pary chromosomów, w sumie 46. Dwadzieścia dwie z tych par, zwanych autosomami, wyglądają tak samo zarówno u mężczyzn, jak iu kobiet. Dwudziesta trzecia para, chromosomy płci, różni się między mężczyznami i kobietami. Kobiety mają dwie kopie chromosomu X, podczas gdy mężczyźni mają jeden chromosom X i jeden chromosom Y.