Biopython - Objek Motif
Motif urutan adalah pola urutan nukleotida atau asam amino. Motif urutan dibentuk oleh susunan tiga dimensi asam amino yang mungkin tidak berdekatan. Biopython menyediakan modul terpisah, Bio.motifs untuk mengakses fungsi motif urutan seperti yang ditentukan di bawah ini -
from Bio import motifs
Membuat Motif DNA Sederhana
Mari kita buat urutan motif DNA sederhana menggunakan perintah di bawah ini -
>>> from Bio import motifs
>>> from Bio.Seq import Seq
>>> DNA_motif = [ Seq("AGCT"),
... Seq("TCGA"),
... Seq("AACT"),
... ]
>>> seq = motifs.create(DNA_motif)
>>> print(seq) AGCT TCGA AACT
Untuk menghitung nilai urutan, gunakan perintah di bawah ini -
>>> print(seq.counts)
0 1 2 3
A: 2.00 1.00 0.00 1.00
C: 0.00 1.00 2.00 0.00
G: 0.00 1.00 1.00 0.00
T: 1.00 0.00 0.00 2.00
Gunakan kode berikut untuk menghitung 'A' dalam urutan -
>>> seq.counts["A", :]
(2, 1, 0, 1)
Jika Anda ingin mengakses kolom hitungan, gunakan perintah di bawah ini -
>>> seq.counts[:, 3]
{'A': 1, 'C': 0, 'T': 2, 'G': 0}
Membuat Logo Urutan
Sekarang kita akan membahas cara membuat Logo Urutan.
Pertimbangkan urutan di bawah ini -
AGCTTACG
ATCGTACC
TTCCGAAT
GGTACGTA
AAGCTTGG
Anda dapat membuat logo Anda sendiri menggunakan tautan berikut - http://weblogo.berkeley.edu/
Tambahkan urutan di atas dan buat logo baru dan simpan gambar bernama seq.png di folder biopython Anda.
seq.png
Setelah membuat gambar, sekarang jalankan perintah berikut -
>>> seq.weblogo("seq.png")
Motif urutan DNA ini direpresentasikan sebagai logo urutan untuk motif pengikat LexA.
Database JASPAR
JASPAR adalah salah satu database paling populer. Ini menyediakan fasilitas format motif apa pun untuk membaca, menulis dan memindai urutan. Ini menyimpan informasi meta untuk setiap motif.The module Bio.motifs contains a specialized class jaspar.Motif to represent meta-information attributes.
Ini memiliki jenis atribut penting berikut -
- matrix_id - ID motif JASPAR yang unik
- name - Nama motif
- tf_family - Keluarga motif, misalnya 'Helix-Loop-Helix'
- data_type - tipe data yang digunakan dalam motif.
Mari kita buat format situs JASPAR bernama dalam sample.sites di folder biopython. Ini didefinisikan di bawah -
sample.sites
>MA0001 ARNT 1
AACGTGatgtccta
>MA0001 ARNT 2
CAGGTGggatgtac
>MA0001 ARNT 3
TACGTAgctcatgc
>MA0001 ARNT 4
AACGTGacagcgct
>MA0001 ARNT 5
CACGTGcacgtcgt
>MA0001 ARNT 6
cggcctCGCGTGc
Pada file di atas, kami telah membuat contoh motif. Sekarang, mari kita buat objek motif dari contoh di atas -
>>> from Bio import motifs
>>> with open("sample.sites") as handle:
... data = motifs.read(handle,"sites")
...
>>> print(data)
TF name None
Matrix ID None
Matrix:
0 1 2 3 4 5
A: 2.00 5.00 0.00 0.00 0.00 1.00
C: 3.00 0.00 5.00 0.00 0.00 0.00
G: 0.00 1.00 1.00 6.00 0.00 5.00
T: 1.00 0.00 0.00 0.00 6.00 0.00
Di sini, data membaca semua contoh motif dari file sample.sites.
Untuk mencetak semua contoh dari data, gunakan perintah di bawah ini -
>>> for instance in data.instances:
... print(instance)
...
AACGTG
CAGGTG
TACGTA
AACGTG
CACGTG
CGCGTG
Gunakan perintah di bawah ini untuk menghitung semua nilai -
>>> print(data.counts)
0 1 2 3 4 5
A: 2.00 5.00 0.00 0.00 0.00 1.00
C: 3.00 0.00 5.00 0.00 0.00 0.00
G: 0.00 1.00 1.00 6.00 0.00 5.00
T: 1.00 0.00 0.00 0.00 6.00 0.00
>>>