ปัญญาประดิษฐ์ - โครงข่ายประสาทเทียม

อีกหนึ่งงานวิจัยใน AI คือเครือข่ายประสาทเทียมได้รับแรงบันดาลใจจากโครงข่ายประสาทตามธรรมชาติของระบบประสาทของมนุษย์

โครงข่ายประสาทเทียม (ANN) คืออะไร?

ผู้คิดค้นระบบประสาทคอมพิวเตอร์เครื่องแรกดร. โรเบิร์ตเฮชท์ - นีลเซนได้ให้คำจำกัดความของเครือข่ายประสาทว่า -

"... ระบบคอมพิวเตอร์ประกอบด้วยองค์ประกอบการประมวลผลที่เรียบง่ายและเชื่อมต่อกันสูงจำนวนมากซึ่งประมวลผลข้อมูลโดยการตอบสนองของสภาวะไดนามิกต่ออินพุตภายนอก"

โครงสร้างพื้นฐานของ ANN

ความคิดของ ANN ตั้งอยู่บนความเชื่อที่ว่าการทำงานของสมองมนุษย์โดยการเชื่อมต่อที่ถูกต้องสามารถเลียนแบบได้โดยใช้ซิลิกอนและสายไฟเป็นสิ่งมีชีวิต neurons และ dendrites.

สมองของมนุษย์ประกอบด้วยเซลล์ประสาท 86 พันล้านเซลล์ที่เรียกว่า neurons. พวกมันเชื่อมต่อกับเซลล์อื่น ๆ นับพันเซลล์โดย Axons.สิ่งเร้าจากสิ่งแวดล้อมภายนอกหรือปัจจัยนำเข้าจากอวัยวะรับความรู้สึกได้รับการยอมรับจากเดนไดรต์ อินพุตเหล่านี้สร้างแรงกระตุ้นไฟฟ้าซึ่งเดินทางผ่านเครือข่ายประสาทอย่างรวดเร็ว จากนั้นเซลล์ประสาทสามารถส่งข้อความไปยังเซลล์ประสาทอื่นเพื่อจัดการปัญหาหรือไม่ส่งต่อไป

ANN ประกอบด้วยหลายรายการ nodesซึ่งเลียนแบบทางชีววิทยา neuronsของสมองมนุษย์ เซลล์ประสาทเชื่อมต่อกันด้วยลิงก์และมีปฏิสัมพันธ์ซึ่งกันและกัน โหนดสามารถรับข้อมูลอินพุตและดำเนินการง่ายๆกับข้อมูล ผลลัพธ์ของการดำเนินการเหล่านี้จะถูกส่งต่อไปยังเซลล์ประสาทอื่น ๆ เอาต์พุตที่แต่ละโหนดเรียกว่าactivation หรือ node value.

แต่ละลิงก์เชื่อมโยงกับ weight.ANN มีความสามารถในการเรียนรู้ซึ่งเกิดขึ้นโดยการปรับเปลี่ยนค่าน้ำหนัก ภาพประกอบต่อไปนี้แสดง ANN ง่ายๆ -

ประเภทของโครงข่ายประสาทเทียม

โทโพโลยีเครือข่ายประสาทเทียมมีสองแบบ - FeedForward และ Feedback.

ฟีดไปข้างหน้า ANN

ใน ANN นี้กระแสข้อมูลเป็นแบบทิศทางเดียว หน่วยส่งข้อมูลไปยังหน่วยอื่นซึ่งไม่ได้รับข้อมูลใด ๆ ไม่มีลูปข้อเสนอแนะ ใช้ในการสร้างรูปแบบ / การจดจำ / การจำแนกประเภท พวกเขามีอินพุตและเอาต์พุตคงที่

FeedBack ANN

ที่นี่อนุญาตให้ใช้ลูปข้อเสนอแนะ ใช้ในความทรงจำที่สามารถระบุแอดเดรสเนื้อหาได้

การทำงานของ ANN

ในแผนภาพโทโพโลยีที่แสดงลูกศรแต่ละอันแสดงถึงการเชื่อมต่อระหว่างเซลล์ประสาทสองเซลล์และระบุเส้นทางสำหรับการไหลของข้อมูล การเชื่อมต่อแต่ละครั้งมีน้ำหนักเป็นจำนวนเต็มที่ควบคุมสัญญาณระหว่างเซลล์ประสาททั้งสอง

หากเครือข่ายสร้างเอาต์พุตที่ "ดีหรือต้องการ" ก็ไม่จำเป็นต้องปรับน้ำหนัก อย่างไรก็ตามหากเครือข่ายสร้างเอาต์พุตที่“ ไม่ดีหรือไม่ต้องการ” หรือเกิดข้อผิดพลาดระบบจะปรับเปลี่ยนน้ำหนักเพื่อปรับปรุงผลลัพธ์ที่ตามมา

แมชชีนเลิร์นนิงใน ANN

ANN มีความสามารถในการเรียนรู้และจำเป็นต้องได้รับการฝึกฝน มีกลยุทธ์การเรียนรู้หลายประการ -

  • Supervised Learning- เกี่ยวข้องกับครูที่มีความเชี่ยวชาญมากกว่าแอนเอง ตัวอย่างเช่นครูป้อนข้อมูลตัวอย่างที่ครูทราบคำตอบอยู่แล้ว

    ตัวอย่างเช่นการจดจำรูปแบบ ANN มาพร้อมกับการคาดเดาในขณะที่รับรู้ จากนั้นครูให้คำตอบแก่ ANN จากนั้นเครือข่ายจะเปรียบเทียบการเดากับคำตอบที่ "ถูกต้อง" ของครูและทำการปรับเปลี่ยนตามข้อผิดพลาด

  • Unsupervised Learning- จำเป็นเมื่อไม่มีชุดข้อมูลตัวอย่างพร้อมคำตอบที่ทราบ ตัวอย่างเช่นค้นหารูปแบบที่ซ่อนอยู่ ในกรณีนี้การจัดกลุ่มเช่นการแบ่งชุดขององค์ประกอบออกเป็นกลุ่มตามรูปแบบที่ไม่รู้จักจะดำเนินการตามชุดข้อมูลที่มีอยู่ในปัจจุบัน

  • Reinforcement Learning- กลยุทธ์นี้สร้างขึ้นจากการสังเกต ANN ตัดสินใจโดยการสังเกตสภาพแวดล้อม หากการสังเกตเป็นลบเครือข่ายจะปรับน้ำหนักเพื่อให้สามารถตัดสินใจได้ตามต้องการในครั้งต่อไป

ย้อนกลับอัลกอริทึมการเผยแพร่

เป็นขั้นตอนวิธีการฝึกอบรมหรือการเรียนรู้ มันเรียนรู้จากตัวอย่าง หากคุณส่งตัวอย่างสิ่งที่คุณต้องการให้เครือข่ายทำอัลกอริทึมก็จะเปลี่ยนน้ำหนักของเครือข่ายเพื่อให้สามารถสร้างเอาต์พุตที่ต้องการสำหรับอินพุตเฉพาะในการจบการฝึกอบรม

เครือข่ายการเผยแพร่ย้อนกลับเหมาะอย่างยิ่งสำหรับการจดจำรูปแบบและงานการทำแผนที่

เครือข่าย Bayesian (BN)

นี่คือโครงสร้างกราฟิกที่ใช้เพื่อแสดงความสัมพันธ์ที่น่าจะเป็นระหว่างชุดของตัวแปรสุ่ม เรียกอีกอย่างว่าเครือข่ายแบบเบย์Belief Networks หรือ Bayes Nets. BNs เหตุผลเกี่ยวกับโดเมนที่ไม่แน่นอน

ในเครือข่ายเหล่านี้แต่ละโหนดแสดงถึงตัวแปรสุ่มที่มีข้อเสนอเฉพาะ ตัวอย่างเช่นในโดเมนการวินิจฉัยทางการแพทย์โหนดมะเร็งแสดงถึงข้อเสนอที่ว่าผู้ป่วยเป็นมะเร็ง

ขอบที่เชื่อมต่อกับโหนดแสดงถึงความน่าจะเป็นที่พึ่งพาระหว่างตัวแปรสุ่มเหล่านั้น หากจากสองโหนดหนึ่งมีผลต่ออีกโหนดหนึ่งก็จะต้องเชื่อมต่อโดยตรงในทิศทางของเอฟเฟกต์ ความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรจะถูกคำนวณโดยความน่าจะเป็นที่เกี่ยวข้องกับแต่ละโหนด

มีข้อ จำกัด เพียงอย่างเดียวเกี่ยวกับส่วนโค้งใน BN ที่คุณไม่สามารถกลับไปที่โหนดได้เพียงแค่ทำตามส่วนโค้งที่กำหนด ดังนั้น BN จึงเรียกว่า Directed Acyclic Graphs (DAGs)

BN สามารถจัดการตัวแปรหลายค่าได้พร้อมกัน ตัวแปร BN ประกอบด้วยสองมิติ -

  • ช่วงของคำบุพบท
  • ความน่าจะเป็นที่กำหนดให้กับแต่ละคำบุพบท

พิจารณาเซต จำกัด X = {X 1 , X 2 , …, X n } ของตัวแปรสุ่มแบบไม่ต่อเนื่องโดยที่ตัวแปรX iแต่ละตัวอาจรับค่าจากเซต จำกัด ซึ่งแสดงด้วยVal (X i ) หากมีการเชื่อมโยงกำกับจากตัวแปรX ฉันจะตัวแปรX J ,แล้วตัวแปรX ฉันจะเป็นแม่ของตัวแปรX แสดงอ้างอิงโดยตรงระหว่างตัวแปร

โครงสร้างของ BN เหมาะอย่างยิ่งสำหรับการรวมความรู้เดิมและข้อมูลที่สังเกตได้ BN สามารถใช้เพื่อเรียนรู้ความสัมพันธ์เชิงสาเหตุและทำความเข้าใจโดเมนปัญหาต่างๆและทำนายเหตุการณ์ในอนาคตแม้ในกรณีที่ข้อมูลขาดหายไป

การสร้างเครือข่าย Bayesian

วิศวกรความรู้สามารถสร้างเครือข่ายแบบเบย์ มีหลายขั้นตอนที่วิศวกรความรู้ต้องดำเนินการในขณะสร้าง

Example problem- มะเร็งปอด ผู้ป่วยมีอาการหายใจไม่ออก เขาไปพบแพทย์โดยสงสัยว่าเขาเป็นมะเร็งปอด แพทย์ทราบดีว่าการรักษามะเร็งปอดยังมีโรคอื่น ๆ อีกมากมายที่ผู้ป่วยอาจมีเช่นวัณโรคและหลอดลมอักเสบ

Gather Relevant Information of Problem

  • ผู้ป่วยสูบบุหรี่หรือไม่? ถ้าใช่แสดงว่ามีโอกาสเป็นมะเร็งและหลอดลมอักเสบสูง
  • ผู้ป่วยสัมผัสกับมลพิษทางอากาศหรือไม่? ถ้าใช่มลพิษทางอากาศประเภทใด
  • การเอกซเรย์ X-Ray ผลบวกอาจบ่งชี้ว่าเป็นวัณโรคหรือมะเร็งปอด

Identify Interesting Variables

วิศวกรความรู้พยายามตอบคำถาม -

  • โหนดใดที่จะแสดง
  • พวกเขาสามารถรับค่าอะไรได้บ้าง? พวกเขาสามารถอยู่ในสถานะใด

ในตอนนี้ให้เราพิจารณาโหนดโดยมีค่าที่ไม่ต่อเนื่องเท่านั้น ตัวแปรต้องรับค่าเหล่านี้ทีละค่า

Common types of discrete nodes are -

  • Boolean nodes - แสดงถึงประพจน์โดยใช้ค่าไบนารี TRUE (T) และ FALSE (F)

  • Ordered values- โหนดมลพิษอาจเป็นตัวแทนและรับค่าจาก {ต่ำปานกลางสูง} ที่อธิบายระดับการสัมผัสกับมลพิษของผู้ป่วย

  • Integral values- โหนดที่เรียกว่าอายุอาจแสดงถึงอายุของผู้ป่วยโดยมีค่าที่เป็นไปได้ตั้งแต่ 1 ถึง 120 แม้ในช่วงแรกนี้จะมีการเลือกแบบจำลอง

โหนดและค่าที่เป็นไปได้สำหรับตัวอย่างมะเร็งปอด -

ชื่อโหนด ประเภท มูลค่า การสร้างโหนด
ขัด ไบนารี่ {ต่ำสูงปานกลาง}
สูบบุหรี่ บูลีน {TRUE FASLE}
โรคมะเร็งปอด บูลีน {TRUE FASLE}
เอ็กซ์เรย์ ไบนารี่ {บวกลบ}

Create Arcs between Nodes

โทโพโลยีของเครือข่ายควรจับความสัมพันธ์เชิงคุณภาพระหว่างตัวแปร

ตัวอย่างเช่นอะไรทำให้ผู้ป่วยเป็นมะเร็งปอด? - มลพิษและการสูบบุหรี่ จากนั้นเพิ่มส่วนโค้งจากโหนดPollutionและ node SmokerไปยังโหนดLung-Cancer

ในทำนองเดียวกันหากผู้ป่วยเป็นมะเร็งปอดผลเอกซเรย์จะเป็นบวก จากนั้นเพิ่มส่วนโค้งจากโหนดมะเร็งปอดไปยังโหนดX-Ray

Specify Topology

โดยทั่วไปแล้ว BN จะถูกจัดวางเพื่อให้ส่วนโค้งชี้จากบนลงล่าง ชุดของโหนดพาเรนต์ของโหนด X กำหนดโดยพาเรนต์ (X)

ปอดมะเร็งโหนดมีพ่อแม่ทั้งสอง (เหตุผลหรือสาเหตุ): มลพิษและสูบบุหรี่ในขณะที่โหนดสูบบุหรี่เป็นancestorของโหนดX-Ray ในทำนองเดียวกันX-Rayเป็นลูก (ผลที่ตามมาหรือผลกระทบ) ของมะเร็งปอดและมะเร็งต่อมลูกหมากsuccessorจำนวนโหนดผู้สูบบุหรี่และมลพิษ

Conditional Probabilities

ตอนนี้หาจำนวนความสัมพันธ์ระหว่างโหนดที่เชื่อมต่อ: ทำได้โดยระบุการแจกแจงความน่าจะเป็นแบบมีเงื่อนไขสำหรับแต่ละโหนด เนื่องจากมีการพิจารณาเฉพาะตัวแปรที่ไม่ต่อเนื่องที่นี่จึงอยู่ในรูปของไฟล์Conditional Probability Table (CPT).

อันดับแรกสำหรับแต่ละโหนดเราต้องดูชุดค่าผสมที่เป็นไปได้ทั้งหมดของโหนดหลักเหล่านั้น แต่ละชุดดังกล่าวเรียกว่าinstantiationของชุดหลัก สำหรับการสร้างอินสแตนซ์ที่แตกต่างกันของค่าโหนดพาเรนต์แต่ละครั้งเราจำเป็นต้องระบุความน่าจะเป็นที่ลูกจะรับ

ตัวอย่างเช่นพ่อแม่ของโหนดมะเร็งปอดเป็นมลพิษและการสูบบุหรี่ โดยรับค่าที่เป็นไปได้ = {(H, T), (H, F), (L, T), (L, F)} พคท. ระบุความน่าจะเป็นของมะเร็งสำหรับแต่ละกรณีเหล่านี้เป็น <0.05, 0.02, 0.03, 0.001> ตามลำดับ

แต่ละโหนดจะมีความน่าจะเป็นตามเงื่อนไขที่เกี่ยวข้องดังนี้ -

การประยุกต์ใช้ Neural Networks

พวกเขาสามารถทำงานที่ง่ายสำหรับมนุษย์ แต่ยากสำหรับเครื่องจักร -

  • Aerospace - เครื่องบินขับอัตโนมัติการตรวจจับความผิดพลาดของเครื่องบิน

  • Automotive - ระบบแนะนำรถยนต์

  • Military - การวางแนวอาวุธและการบังคับเลี้ยวการติดตามเป้าหมายการแยกแยะวัตถุการจดจำใบหน้าการระบุสัญญาณ / ภาพ

  • Electronics - การทำนายลำดับรหัส, รูปแบบชิป IC, การวิเคราะห์ความล้มเหลวของชิป, การมองเห็นของเครื่องจักร, การสังเคราะห์เสียง

  • Financial - การประเมินอสังหาริมทรัพย์, ที่ปรึกษาเงินกู้, การคัดกรองการจำนอง, การจัดอันดับพันธบัตรขององค์กร, โปรแกรมการซื้อขายผลงาน, การวิเคราะห์ทางการเงินขององค์กร, การทำนายมูลค่าสกุลเงิน, ผู้อ่านเอกสาร, ผู้ประเมินการสมัครสินเชื่อ

  • Industrial - การควบคุมกระบวนการผลิตการออกแบบและวิเคราะห์ผลิตภัณฑ์ระบบการตรวจสอบคุณภาพการวิเคราะห์คุณภาพการเชื่อมการทำนายคุณภาพกระดาษการวิเคราะห์การออกแบบผลิตภัณฑ์ทางเคมีการสร้างแบบจำลองระบบกระบวนการทางเคมีแบบไดนามิกการวิเคราะห์การบำรุงรักษาเครื่องจักรการเสนอราคาโครงการการวางแผนและการจัดการ

  • Medical - การวิเคราะห์เซลล์มะเร็งการวิเคราะห์ EEG และ ECG การออกแบบขาเทียมเครื่องมือเพิ่มประสิทธิภาพเวลาในการปลูกถ่าย

  • Speech - การรู้จำเสียงการจำแนกเสียงการแปลงข้อความเป็นคำพูด

  • Telecommunications - การบีบอัดรูปภาพและข้อมูลบริการข้อมูลอัตโนมัติการแปลภาษาพูดแบบเรียลไทม์

  • Transportation - การวินิจฉัยระบบเบรกรถบรรทุกการตั้งเวลายานพาหนะระบบเส้นทาง

  • Software - การจดจำรูปแบบในการจดจำใบหน้าการรู้จำอักขระด้วยแสง ฯลฯ

  • Time Series Prediction - ANN ใช้ในการคาดการณ์หุ้นและภัยพิบัติตามธรรมชาติ

  • Signal Processing - โครงข่ายประสาทเทียมสามารถฝึกให้ประมวลผลสัญญาณเสียงและกรองสัญญาณได้อย่างเหมาะสมในเครื่องช่วยฟัง

  • Control - ANN มักใช้ในการตัดสินใจบังคับเลี้ยวของยานพาหนะทางกายภาพ

  • Anomaly Detection - เนื่องจาก ANN มีความเชี่ยวชาญในการจดจำรูปแบบจึงสามารถได้รับการฝึกอบรมให้สร้างผลลัพธ์เมื่อมีสิ่งผิดปกติเกิดขึ้นซึ่งทำให้รูปแบบไม่ตรงกับรูปแบบ