Biopython - การเรียนรู้ของเครื่อง

ชีวสารสนเทศศาสตร์เป็นพื้นที่ที่ยอดเยี่ยมในการประยุกต์ใช้อัลกอริทึมการเรียนรู้ของเครื่อง ที่นี่เรามีข้อมูลทางพันธุกรรมของสิ่งมีชีวิตจำนวนมากและไม่สามารถวิเคราะห์ข้อมูลทั้งหมดนี้ด้วยตนเองได้ หากใช้อัลกอริทึมการเรียนรู้ของเครื่องที่เหมาะสมเราสามารถดึงข้อมูลที่เป็นประโยชน์จำนวนมากจากข้อมูลเหล่านี้ได้ Biopython มีชุดอัลกอริทึมที่มีประโยชน์ในการทำแมชชีนเลิร์นนิงภายใต้การดูแล

การเรียนรู้ภายใต้การดูแลขึ้นอยู่กับตัวแปรอินพุต (X) และตัวแปรเอาต์พุต (Y) มันใช้อัลกอริทึมเพื่อเรียนรู้ฟังก์ชันการทำแผนที่จากอินพุตไปยังเอาต์พุต มีการกำหนดไว้ด้านล่าง -

Y = f(X)

วัตถุประสงค์หลักของวิธีนี้คือการประมาณฟังก์ชันการทำแผนที่และเมื่อคุณมีข้อมูลอินพุตใหม่ (x) คุณสามารถคาดเดาตัวแปรเอาต์พุต (Y) สำหรับข้อมูลนั้นได้

แบบจำลองการถดถอยโลจิสติก

การถดถอยโลจิสติกเป็นอัลกอริทึมการเรียนรู้ของเครื่องที่อยู่ภายใต้การดูแล ใช้เพื่อค้นหาความแตกต่างระหว่างคลาส K โดยใช้ผลรวมถ่วงน้ำหนักของตัวแปรทำนาย คำนวณความน่าจะเป็นของการเกิดเหตุการณ์และสามารถใช้ในการตรวจหามะเร็งได้

Biopython มีโมดูล Bio.LogisticRegression เพื่อทำนายตัวแปรตามขั้นตอนวิธีการถดถอยโลจิสติก ปัจจุบัน Biopython ใช้อัลกอริทึมการถดถอยโลจิสติกสำหรับสองคลาสเท่านั้น (K = 2)

k- เพื่อนบ้านที่ใกล้ที่สุด

k- เพื่อนบ้านที่ใกล้ที่สุดยังเป็นอัลกอริธึมแมชชีนเลิร์นนิงที่อยู่ภายใต้การดูแล ทำงานโดยจัดหมวดหมู่ข้อมูลตามเพื่อนบ้านที่ใกล้ที่สุด Biopython มีโมดูล Bio.KNN เพื่อทำนายตัวแปรตามอัลกอริธึมเพื่อนบ้านที่ใกล้ที่สุด k

ไร้เดียงสา Bayes

ตัวแยกประเภท Naive Bayes คือชุดของอัลกอริธึมการจำแนกตาม Bayes 'Theorem ไม่ใช่อัลกอริทึมเดียว แต่เป็นกลุ่มของอัลกอริทึมที่พวกเขาทั้งหมดมีหลักการร่วมกันกล่าวคือทุกคู่ของคุณสมบัติที่ถูกจัดประเภทจะเป็นอิสระจากกัน Biopython มีโมดูล Bio.NaiveBayes เพื่อทำงานร่วมกับอัลกอริทึม Naive Bayes

Markov Model

แบบจำลอง Markov เป็นระบบทางคณิตศาสตร์ที่กำหนดให้เป็นชุดของตัวแปรสุ่มซึ่งมีประสบการณ์ในการเปลี่ยนจากสถานะหนึ่งไปเป็นอีกสถานะหนึ่งตามกฎความน่าจะเป็นบางประการ Biopython ให้Bio.MarkovModel and Bio.HMM.MarkovModel modules to work with Markov models.