Biopython-ゲノム分析
ゲノムは、そのすべての遺伝子を含むDNAの完全なセットです。ゲノム解析とは、個々の遺伝子とその遺伝における役割の研究を指します。
ゲノム図
ゲノム図は、遺伝情報をグラフで表したものです。Biopythonは、Bio.Graphics.GenomeDiagramモジュールを使用してGenomeDiagramを表します。GenomeDiagramモジュールには、ReportLabがインストールされている必要があります。
ダイアグラムを作成する手順
ダイアグラムを作成するプロセスは、通常、以下の単純なパターンに従います。
表示する機能の個別のセットごとにFeatureSetを作成し、それらにBio.SeqFeatureオブジェクトを追加します。
表示するグラフごとにGraphSetを作成し、グラフデータを追加します。
ダイアグラム上で必要なトラックごとにトラックを作成し、必要なトラックにGraphSetsとFeatureSetsを追加します。
ダイアグラムを作成し、それにトラックを追加します。
ダイアグラムに画像を描画するように指示します。
画像をファイルに書き込みます。
入力GenBankファイルの例を見てみましょう-
https://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/ls_orchid.gbkSeqRecordオブジェクトからレコードを読み取り、最後にゲノム図を描画します。以下に説明します、
以下に示すように、最初にすべてのモジュールをインポートします-
>>> from reportlab.lib import colors
>>> from reportlab.lib.units import cm
>>> from Bio.Graphics import GenomeDiagram
ここで、SeqIOモジュールをインポートしてデータを読み取ります-
>>> from Bio import SeqIO
record = SeqIO.read("example.gb", "genbank")
ここで、レコードはgenbankファイルからシーケンスを読み取ります。
次に、空の図を作成して、トラックと機能セットを追加します-
>>> diagram = GenomeDiagram.Diagram(
"Yersinia pestis biovar Microtus plasmid pPCP1")
>>> track = diagram.new_track(1, name="Annotated Features")
>>> feature = track.new_set()
これで、以下に定義するように、緑から灰色への代替色を使用して、色のテーマの変更を適用できます。
>>> for feature in record.features:
>>> if feature.type != "gene":
>>> continue
>>> if len(feature) % 2 == 0:
>>> color = colors.blue
>>> else:
>>> color = colors.red
>>>
>>> feature.add_feature(feature, color=color, label=True)
これで、画面に次の応答が表示されます-
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dc90>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dfd0>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x1007627d0>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57290>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57050>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57390>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57590>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57410>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57490>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d574d0>
上記の入力レコードの図を描きましょう-
>>> diagram.draw(
format = "linear", orientation = "landscape", pagesize = 'A4',
... fragments = 4, start = 0, end = len(record))
>>> diagram.write("orchid.pdf", "PDF")
>>> diagram.write("orchid.eps", "EPS")
>>> diagram.write("orchid.svg", "SVG")
>>> diagram.write("orchid.png", "PNG")
上記のコマンドを実行すると、Biopythonディレクトリに保存されている次の画像が表示されます。
** Result **
genome.png
以下の変更を加えることで、画像を円形で描画することもできます-
>>> diagram.draw(
format = "circular", circular = True, pagesize = (20*cm,20*cm),
... start = 0, end = len(record), circle_core = 0.7)
>>> diagram.write("circular.pdf", "PDF")
染色体の概要
DNA分子は染色体と呼ばれる糸のような構造にパッケージされています。各染色体は、その構造を支えるヒストンと呼ばれるタンパク質の周りに何度もしっかりと巻かれたDNAで構成されています。
細胞が分裂していないときは、顕微鏡下でも、染色体は細胞の核に見えません。しかし、染色体を構成するDNAは、細胞分裂中にさらに密に詰まり、顕微鏡で見ることができます。
人間の場合、各細胞には通常23対の染色体があり、合計で46対です。常染色体と呼ばれるこれらの対のうち22対は、男性と女性の両方で同じように見えます。23番目のペアである性染色体は、男性と女性で異なります。女性はX染色体の2つのコピーを持っていますが、男性は1つのX染色体と1つのY染色体を持っています。