Agile Data Science - บทบาทของการทำนาย

ในบทนี้เราจะได้รับเกี่ยวกับบทบาทของการคาดการณ์ในวิทยาศาสตร์ข้อมูลแบบว่องไว รายงานเชิงโต้ตอบจะแสดงข้อมูลในแง่มุมต่างๆ การคาดการณ์เป็นชั้นที่สี่ของการวิ่งแบบว่องไว

เมื่อทำการคาดการณ์เรามักจะอ้างถึงข้อมูลในอดีตและใช้เป็นข้อมูลอ้างอิงสำหรับการทำซ้ำในอนาคต ในกระบวนการที่สมบูรณ์นี้เราจะเปลี่ยนข้อมูลจากการประมวลผลข้อมูลในอดีตเป็นชุดข้อมูลแบบเรียลไทม์เกี่ยวกับอนาคต

บทบาทของการคาดการณ์มีดังต่อไปนี้ -

  • การคาดการณ์ช่วยในการพยากรณ์ การคาดการณ์บางอย่างขึ้นอยู่กับการอนุมานทางสถิติ คำทำนายบางส่วนเป็นไปตามความคิดเห็นของเกจิ

  • การอนุมานทางสถิติเกี่ยวข้องกับการคาดการณ์ทุกชนิด

  • บางครั้งการคาดการณ์ก็แม่นยำในขณะที่บางครั้งการคาดการณ์อาจไม่ถูกต้อง

Predictive Analytics

การวิเคราะห์เชิงคาดการณ์ประกอบด้วยเทคนิคทางสถิติที่หลากหลายตั้งแต่การสร้างแบบจำลองเชิงคาดการณ์การเรียนรู้ของเครื่องและการขุดข้อมูลซึ่งวิเคราะห์ข้อเท็จจริงในปัจจุบันและในอดีตเพื่อคาดการณ์เกี่ยวกับเหตุการณ์ในอนาคตและที่ไม่รู้จัก

การวิเคราะห์เชิงคาดการณ์ต้องการข้อมูลการฝึกอบรม ข้อมูลที่ผ่านการฝึกอบรมประกอบด้วยคุณสมบัติที่เป็นอิสระและขึ้นอยู่กับ คุณลักษณะที่อ้างอิงคือค่าที่ผู้ใช้พยายามคาดเดา คุณสมบัติอิสระคือคุณสมบัติที่อธิบายถึงสิ่งที่เราต้องการทำนายโดยอิงจากคุณสมบัติที่อ้างอิง

การศึกษาคุณสมบัติเรียกว่าวิศวกรรมคุณลักษณะ นี่เป็นสิ่งสำคัญในการคาดการณ์ การสร้างภาพข้อมูลและการวิเคราะห์ข้อมูลเชิงสำรวจเป็นส่วนหนึ่งของวิศวกรรมคุณลักษณะ สิ่งเหล่านี้เป็นแกนกลางของAgile data science.

การทำนาย

มีสองวิธีในการคาดการณ์ใน Agile Data Science -

  • Regression

  • Classification

การสร้างการถดถอยหรือการจำแนกประเภททั้งหมดขึ้นอยู่กับข้อกำหนดทางธุรกิจและการวิเคราะห์ การทำนายตัวแปรต่อเนื่องนำไปสู่แบบจำลองการถดถอยและการทำนายตัวแปรเชิงหมวดหมู่นำไปสู่รูปแบบการจำแนก

การถดถอย

การถดถอยพิจารณาตัวอย่างที่ประกอบด้วยคุณลักษณะและด้วยเหตุนี้จึงสร้างผลลัพธ์ที่เป็นตัวเลข

การจำแนกประเภท

การจัดประเภทจะนำข้อมูลเข้าและสร้างการจำแนกประเภท

Note - ชุดข้อมูลตัวอย่างที่กำหนดการป้อนข้อมูลในการทำนายทางสถิติและทำให้เครื่องสามารถเรียนรู้ได้เรียกว่า "ข้อมูลการฝึกอบรม"