Biopython - Pendahuluan

Biopython adalah paket bioinformatika terbesar dan terpopuler untuk Python. Ini berisi sejumlah sub-modul yang berbeda untuk tugas bioinformatika umum. Ini dikembangkan oleh Chapman dan Chang, terutama ditulis dengan Python. Ini juga berisi kode C untuk mengoptimalkan bagian komputasi kompleks dari perangkat lunak. Ini berjalan di Windows, Linux, Mac OS X, dll.

Pada dasarnya, Biopython adalah kumpulan modul python yang menyediakan fungsi untuk menangani operasi urutan DNA, RNA & protein seperti pelengkap terbalik dari string DNA, menemukan motif dalam urutan protein, dll. Ini menyediakan banyak parser untuk membaca semua database genetik utama seperti GenBank, SwissPort, FASTA, dll., serta pembungkus / antarmuka untuk menjalankan perangkat lunak / alat bioinformatika populer lainnya seperti NCBI BLASTN, Entrez, dll., di dalam lingkungan python. Ini memiliki proyek saudara seperti BioPerl, BioJava dan BioRuby.

fitur

Biopython portabel, jelas dan memiliki sintaks yang mudah dipelajari. Beberapa fitur yang menonjol tercantum di bawah ini -

  • Ditafsirkan, interaktif dan berorientasi objek.

  • Mendukung FASTA, PDB, GenBank, Blast, SCOP, PubMed / Medline, format terkait ExPASy.

  • Pilihan untuk menangani format urutan.

  • Alat untuk mengelola struktur protein.

  • BioSQL - Kumpulan tabel SQL standar untuk menyimpan urutan plus fitur dan anotasi.

  • Akses ke layanan dan database online, termasuk layanan NCBI (Blast, Entrez, PubMed) dan layanan ExPASY (SwissProt, Prosite).

  • Akses ke layanan lokal, termasuk Blast, Clustalw, EMBOSS.

Tujuan

Tujuan Biopython adalah untuk menyediakan akses yang sederhana, standar dan ekstensif ke bioinformatika melalui bahasa python. Tujuan spesifik Biopython tercantum di bawah ini -

  • Menyediakan akses standar ke sumber daya bioinformatika.

  • Modul dan skrip berkualitas tinggi yang dapat digunakan kembali.

  • Manipulasi array cepat yang dapat digunakan pada kode Cluster, PDB, NaiveBayes dan Model Markov.

  • Analisis data genomik.

Keuntungan

Biopython membutuhkan kode yang sangat sedikit dan menghasilkan keuntungan sebagai berikut -

  • Menyediakan tipe data microarray yang digunakan dalam pengelompokan.

  • Membaca dan menulis file tipe Tree-View.

  • Mendukung data struktur yang digunakan untuk parsing, representasi, dan analisis PDB.

  • Mendukung data jurnal yang digunakan dalam aplikasi Medline.

  • Mendukung database BioSQL, yang merupakan database standar yang banyak digunakan di antara semua proyek bioinformatika.

  • Mendukung pengembangan parser dengan menyediakan modul untuk mengurai file bioinformatika ke dalam format objek rekaman tertentu atau kelas generik urutan plus fitur.

  • Dokumentasi yang jelas berdasarkan gaya buku masak.

Contoh Studi Kasus

Mari kita periksa beberapa kasus penggunaan (genetika populasi, struktur RNA, dll.,) Dan coba memahami bagaimana Biopython memainkan peran penting dalam bidang ini -

Genetika Populasi

Genetika populasi adalah studi tentang variasi genetik dalam suatu populasi, dan melibatkan pemeriksaan dan pemodelan perubahan frekuensi gen dan alel dalam populasi selama ruang dan waktu.

Biopython menyediakan modul Bio.PopGen untuk genetika populasi. Modul ini berisi semua fungsi yang diperlukan untuk mengumpulkan informasi tentang genetika populasi klasik.

Struktur RNA

Tiga makromolekul biologis utama yang penting bagi kehidupan kita adalah DNA, RNA, dan Protein. Protein adalah tenaga kerja sel dan memainkan peran penting sebagai enzim. DNA (asam deoksiribonukleat) dianggap sebagai "cetak biru" sel. Ia membawa semua informasi genetik yang dibutuhkan sel untuk tumbuh, menyerap nutrisi, dan berkembang biak. RNA (asam ribonukleat) bertindak sebagai "fotokopi DNA" di dalam sel.

Biopython menyediakan objek Bio.Sequence yang mewakili nukleotida, bahan penyusun DNA dan RNA.