Биопайтон - анализ генома

Геном - это полный набор ДНК, включая все ее гены. Геномный анализ относится к изучению отдельных генов и их роли в наследовании.

Схема генома

Диаграмма генома представляет генетическую информацию в виде диаграмм. Biopython использует модуль Bio.Graphics.GenomeDiagram для представления GenomeDiagram. Для модуля GenomeDiagram требуется установка ReportLab.

Шаги по созданию диаграммы

Процесс создания диаграммы обычно следует следующему простому шаблону -

  • Создайте FeatureSet для каждого отдельного набора функций, которые вы хотите отобразить, и добавьте к ним объекты Bio.SeqFeature.

  • Создайте GraphSet для каждого графика, который вы хотите отобразить, и добавьте к ним данные графика.

  • Создайте трек для каждого трека, который вы хотите на диаграмме, и добавьте GraphSets и FeatureSets к нужным трекам.

  • Создайте диаграмму и добавьте к ней треки.

  • Скажите диаграмме нарисовать изображение.

  • Запишите изображение в файл.

Давайте возьмем пример входного файла GenBank -

https://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/ls_orchid.gbkи прочитать записи из объекта SeqRecord, а затем, наконец, нарисовать диаграмму генома. Это объясняется ниже,

Сначала мы импортируем все модули, как показано ниже -

>>> from reportlab.lib import colors 
>>> from reportlab.lib.units import cm 
>>> from Bio.Graphics import GenomeDiagram

Теперь импортируйте модуль SeqIO для чтения данных -

>>> from Bio import SeqIO 
record = SeqIO.read("example.gb", "genbank")

Здесь запись считывает последовательность из файла genbank.

Теперь создайте пустую диаграмму, чтобы добавить трек и набор функций -

>>> diagram = GenomeDiagram.Diagram(
   "Yersinia pestis biovar Microtus plasmid pPCP1") 
>>> track = diagram.new_track(1, name="Annotated Features") 
>>> feature = track.new_set()

Теперь мы можем применить изменения цветовой темы, используя альтернативные цвета от зеленого до серого, как определено ниже -

>>> for feature in record.features: 
>>>    if feature.type != "gene": 
>>>       continue 
>>>    if len(feature) % 2 == 0: 
>>>       color = colors.blue 
>>>    else: 
>>>       color = colors.red 
>>> 
>>>    feature.add_feature(feature, color=color, label=True)

Теперь вы можете увидеть на экране следующий ответ -

<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dc90> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dfd0> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x1007627d0> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57290> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57050> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57390> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57590> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57410> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57490> 
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d574d0>

Нарисуем диаграмму для вышеуказанных входных записей -

>>> diagram.draw(
   format = "linear", orientation = "landscape", pagesize = 'A4', 
   ... fragments = 4, start = 0, end = len(record)) 
>>> diagram.write("orchid.pdf", "PDF") 
>>> diagram.write("orchid.eps", "EPS") 
>>> diagram.write("orchid.svg", "SVG") 
>>> diagram.write("orchid.png", "PNG")

После выполнения указанной выше команды вы могли увидеть следующее изображение, сохраненное в вашем каталоге Biopython.

** Result **
genome.png

Вы также можете нарисовать изображение в круговом формате, внеся следующие изменения:

>>> diagram.draw(
   format = "circular", circular = True, pagesize = (20*cm,20*cm), 
   ... start = 0, end = len(record), circle_core = 0.7) 
>>> diagram.write("circular.pdf", "PDF")

Обзор хромосом

Молекула ДНК упакована в нитевидные структуры, называемые хромосомами. Каждая хромосома состоит из ДНК, много раз плотно намотанной вокруг белков, называемых гистонами, которые поддерживают ее структуру.

Хромосомы не видны в ядре клетки - даже под микроскопом - когда клетка не делится. Однако ДНК, из которой состоят хромосомы, становится более плотно упакованной во время деления клетки и затем становится видимой под микроскопом.

У человека каждая клетка обычно содержит 23 пары хромосом, всего 46. Двадцать две из этих пар, называемых аутосомами, выглядят одинаково как у мужчин, так и у женщин. 23-я пара, половые хромосомы, различаются у мужчин и женщин. У женщин есть две копии Х-хромосомы, а у мужчин - одна Х-хромосома и одна Y-хромосома.