ปัญญาประดิษฐ์ - โครงข่ายประสาทเทียม
อีกหนึ่งงานวิจัยใน AI คือเครือข่ายประสาทเทียมได้รับแรงบันดาลใจจากโครงข่ายประสาทตามธรรมชาติของระบบประสาทของมนุษย์
โครงข่ายประสาทเทียม (ANN) คืออะไร?
ผู้คิดค้นระบบประสาทคอมพิวเตอร์เครื่องแรกดร. โรเบิร์ตเฮชท์ - นีลเซนได้ให้คำจำกัดความของเครือข่ายประสาทว่า -
"... ระบบคอมพิวเตอร์ประกอบด้วยองค์ประกอบการประมวลผลที่เรียบง่ายและเชื่อมต่อกันสูงจำนวนมากซึ่งประมวลผลข้อมูลโดยการตอบสนองของสภาวะไดนามิกต่ออินพุตภายนอก"
โครงสร้างพื้นฐานของ ANN
ความคิดของ ANN ตั้งอยู่บนความเชื่อที่ว่าการทำงานของสมองมนุษย์โดยการเชื่อมต่อที่ถูกต้องสามารถเลียนแบบได้โดยใช้ซิลิกอนและสายไฟเป็นสิ่งมีชีวิต neurons และ dendrites.
สมองของมนุษย์ประกอบด้วยเซลล์ประสาท 86 พันล้านเซลล์ที่เรียกว่า neurons. พวกมันเชื่อมต่อกับเซลล์อื่น ๆ นับพันเซลล์โดย Axons.สิ่งเร้าจากสิ่งแวดล้อมภายนอกหรือปัจจัยนำเข้าจากอวัยวะรับความรู้สึกได้รับการยอมรับจากเดนไดรต์ อินพุตเหล่านี้สร้างแรงกระตุ้นไฟฟ้าซึ่งเดินทางผ่านเครือข่ายประสาทอย่างรวดเร็ว จากนั้นเซลล์ประสาทสามารถส่งข้อความไปยังเซลล์ประสาทอื่นเพื่อจัดการปัญหาหรือไม่ส่งต่อไป
ANN ประกอบด้วยหลายรายการ nodesซึ่งเลียนแบบทางชีววิทยา neuronsของสมองมนุษย์ เซลล์ประสาทเชื่อมต่อกันด้วยลิงก์และมีปฏิสัมพันธ์ซึ่งกันและกัน โหนดสามารถรับข้อมูลอินพุตและดำเนินการง่ายๆกับข้อมูล ผลลัพธ์ของการดำเนินการเหล่านี้จะถูกส่งต่อไปยังเซลล์ประสาทอื่น ๆ เอาต์พุตที่แต่ละโหนดเรียกว่าactivation หรือ node value.
แต่ละลิงก์เชื่อมโยงกับ weight.ANN มีความสามารถในการเรียนรู้ซึ่งเกิดขึ้นโดยการปรับเปลี่ยนค่าน้ำหนัก ภาพประกอบต่อไปนี้แสดง ANN ง่ายๆ -
ประเภทของโครงข่ายประสาทเทียม
โทโพโลยีเครือข่ายประสาทเทียมมีสองแบบ - FeedForward และ Feedback.
ฟีดไปข้างหน้า ANN
ใน ANN นี้กระแสข้อมูลเป็นแบบทิศทางเดียว หน่วยส่งข้อมูลไปยังหน่วยอื่นซึ่งไม่ได้รับข้อมูลใด ๆ ไม่มีลูปข้อเสนอแนะ ใช้ในการสร้างรูปแบบ / การจดจำ / การจำแนกประเภท พวกเขามีอินพุตและเอาต์พุตคงที่
FeedBack ANN
ที่นี่อนุญาตให้ใช้ลูปข้อเสนอแนะ ใช้ในความทรงจำที่สามารถระบุแอดเดรสเนื้อหาได้
การทำงานของ ANN
ในแผนภาพโทโพโลยีที่แสดงลูกศรแต่ละอันแสดงถึงการเชื่อมต่อระหว่างเซลล์ประสาทสองเซลล์และระบุเส้นทางสำหรับการไหลของข้อมูล การเชื่อมต่อแต่ละครั้งมีน้ำหนักเป็นจำนวนเต็มที่ควบคุมสัญญาณระหว่างเซลล์ประสาททั้งสอง
หากเครือข่ายสร้างเอาต์พุตที่ "ดีหรือต้องการ" ก็ไม่จำเป็นต้องปรับน้ำหนัก อย่างไรก็ตามหากเครือข่ายสร้างเอาต์พุตที่“ ไม่ดีหรือไม่ต้องการ” หรือเกิดข้อผิดพลาดระบบจะปรับเปลี่ยนน้ำหนักเพื่อปรับปรุงผลลัพธ์ที่ตามมา
แมชชีนเลิร์นนิงใน ANN
ANN มีความสามารถในการเรียนรู้และจำเป็นต้องได้รับการฝึกฝน มีกลยุทธ์การเรียนรู้หลายประการ -
Supervised Learning- เกี่ยวข้องกับครูที่มีความเชี่ยวชาญมากกว่าแอนเอง ตัวอย่างเช่นครูป้อนข้อมูลตัวอย่างที่ครูทราบคำตอบอยู่แล้ว
ตัวอย่างเช่นการจดจำรูปแบบ ANN มาพร้อมกับการคาดเดาในขณะที่รับรู้ จากนั้นครูให้คำตอบแก่ ANN จากนั้นเครือข่ายจะเปรียบเทียบการเดากับคำตอบที่ "ถูกต้อง" ของครูและทำการปรับเปลี่ยนตามข้อผิดพลาด
Unsupervised Learning- จำเป็นเมื่อไม่มีชุดข้อมูลตัวอย่างพร้อมคำตอบที่ทราบ ตัวอย่างเช่นค้นหารูปแบบที่ซ่อนอยู่ ในกรณีนี้การจัดกลุ่มเช่นการแบ่งชุดขององค์ประกอบออกเป็นกลุ่มตามรูปแบบที่ไม่รู้จักจะดำเนินการตามชุดข้อมูลที่มีอยู่ในปัจจุบัน
Reinforcement Learning- กลยุทธ์นี้สร้างขึ้นจากการสังเกต ANN ตัดสินใจโดยการสังเกตสภาพแวดล้อม หากการสังเกตเป็นลบเครือข่ายจะปรับน้ำหนักเพื่อให้สามารถตัดสินใจได้ตามต้องการในครั้งต่อไป
ย้อนกลับอัลกอริทึมการเผยแพร่
เป็นขั้นตอนวิธีการฝึกอบรมหรือการเรียนรู้ มันเรียนรู้จากตัวอย่าง หากคุณส่งตัวอย่างสิ่งที่คุณต้องการให้เครือข่ายทำอัลกอริทึมก็จะเปลี่ยนน้ำหนักของเครือข่ายเพื่อให้สามารถสร้างเอาต์พุตที่ต้องการสำหรับอินพุตเฉพาะในการจบการฝึกอบรม
เครือข่ายการเผยแพร่ย้อนกลับเหมาะอย่างยิ่งสำหรับการจดจำรูปแบบและงานการทำแผนที่
เครือข่าย Bayesian (BN)
นี่คือโครงสร้างกราฟิกที่ใช้เพื่อแสดงความสัมพันธ์ที่น่าจะเป็นระหว่างชุดของตัวแปรสุ่ม เรียกอีกอย่างว่าเครือข่ายแบบเบย์Belief Networks หรือ Bayes Nets. BNs เหตุผลเกี่ยวกับโดเมนที่ไม่แน่นอน
ในเครือข่ายเหล่านี้แต่ละโหนดแสดงถึงตัวแปรสุ่มที่มีข้อเสนอเฉพาะ ตัวอย่างเช่นในโดเมนการวินิจฉัยทางการแพทย์โหนดมะเร็งแสดงถึงข้อเสนอที่ว่าผู้ป่วยเป็นมะเร็ง
ขอบที่เชื่อมต่อกับโหนดแสดงถึงความน่าจะเป็นที่พึ่งพาระหว่างตัวแปรสุ่มเหล่านั้น หากจากสองโหนดหนึ่งมีผลต่ออีกโหนดหนึ่งก็จะต้องเชื่อมต่อโดยตรงในทิศทางของเอฟเฟกต์ ความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรจะถูกคำนวณโดยความน่าจะเป็นที่เกี่ยวข้องกับแต่ละโหนด
มีข้อ จำกัด เพียงอย่างเดียวเกี่ยวกับส่วนโค้งใน BN ที่คุณไม่สามารถกลับไปที่โหนดได้เพียงแค่ทำตามส่วนโค้งที่กำหนด ดังนั้น BN จึงเรียกว่า Directed Acyclic Graphs (DAGs)
BN สามารถจัดการตัวแปรหลายค่าได้พร้อมกัน ตัวแปร BN ประกอบด้วยสองมิติ -
- ช่วงของคำบุพบท
- ความน่าจะเป็นที่กำหนดให้กับแต่ละคำบุพบท
พิจารณาเซต จำกัด X = {X 1 , X 2 , …, X n } ของตัวแปรสุ่มแบบไม่ต่อเนื่องโดยที่ตัวแปรX iแต่ละตัวอาจรับค่าจากเซต จำกัด ซึ่งแสดงด้วยVal (X i ) หากมีการเชื่อมโยงกำกับจากตัวแปรX ฉันจะตัวแปรX J ,แล้วตัวแปรX ฉันจะเป็นแม่ของตัวแปรX ญแสดงอ้างอิงโดยตรงระหว่างตัวแปร
โครงสร้างของ BN เหมาะอย่างยิ่งสำหรับการรวมความรู้เดิมและข้อมูลที่สังเกตได้ BN สามารถใช้เพื่อเรียนรู้ความสัมพันธ์เชิงสาเหตุและทำความเข้าใจโดเมนปัญหาต่างๆและทำนายเหตุการณ์ในอนาคตแม้ในกรณีที่ข้อมูลขาดหายไป
การสร้างเครือข่าย Bayesian
วิศวกรความรู้สามารถสร้างเครือข่ายแบบเบย์ มีหลายขั้นตอนที่วิศวกรความรู้ต้องดำเนินการในขณะสร้าง
Example problem- มะเร็งปอด ผู้ป่วยมีอาการหายใจไม่ออก เขาไปพบแพทย์โดยสงสัยว่าเขาเป็นมะเร็งปอด แพทย์ทราบดีว่าการรักษามะเร็งปอดยังมีโรคอื่น ๆ อีกมากมายที่ผู้ป่วยอาจมีเช่นวัณโรคและหลอดลมอักเสบ
Gather Relevant Information of Problem
- ผู้ป่วยสูบบุหรี่หรือไม่? ถ้าใช่แสดงว่ามีโอกาสเป็นมะเร็งและหลอดลมอักเสบสูง
- ผู้ป่วยสัมผัสกับมลพิษทางอากาศหรือไม่? ถ้าใช่มลพิษทางอากาศประเภทใด
- การเอกซเรย์ X-Ray ผลบวกอาจบ่งชี้ว่าเป็นวัณโรคหรือมะเร็งปอด
Identify Interesting Variables
วิศวกรความรู้พยายามตอบคำถาม -
- โหนดใดที่จะแสดง
- พวกเขาสามารถรับค่าอะไรได้บ้าง? พวกเขาสามารถอยู่ในสถานะใด
ในตอนนี้ให้เราพิจารณาโหนดโดยมีค่าที่ไม่ต่อเนื่องเท่านั้น ตัวแปรต้องรับค่าเหล่านี้ทีละค่า
Common types of discrete nodes are -
Boolean nodes - แสดงถึงประพจน์โดยใช้ค่าไบนารี TRUE (T) และ FALSE (F)
Ordered values- โหนดมลพิษอาจเป็นตัวแทนและรับค่าจาก {ต่ำปานกลางสูง} ที่อธิบายระดับการสัมผัสกับมลพิษของผู้ป่วย
Integral values- โหนดที่เรียกว่าอายุอาจแสดงถึงอายุของผู้ป่วยโดยมีค่าที่เป็นไปได้ตั้งแต่ 1 ถึง 120 แม้ในช่วงแรกนี้จะมีการเลือกแบบจำลอง
โหนดและค่าที่เป็นไปได้สำหรับตัวอย่างมะเร็งปอด -
ชื่อโหนด | ประเภท | มูลค่า | การสร้างโหนด |
---|---|---|---|
ขัด | ไบนารี่ | {ต่ำสูงปานกลาง} |
|
สูบบุหรี่ | บูลีน | {TRUE FASLE} | |
โรคมะเร็งปอด | บูลีน | {TRUE FASLE} | |
เอ็กซ์เรย์ | ไบนารี่ | {บวกลบ} |
Create Arcs between Nodes
โทโพโลยีของเครือข่ายควรจับความสัมพันธ์เชิงคุณภาพระหว่างตัวแปร
ตัวอย่างเช่นอะไรทำให้ผู้ป่วยเป็นมะเร็งปอด? - มลพิษและการสูบบุหรี่ จากนั้นเพิ่มส่วนโค้งจากโหนดPollutionและ node SmokerไปยังโหนดLung-Cancer
ในทำนองเดียวกันหากผู้ป่วยเป็นมะเร็งปอดผลเอกซเรย์จะเป็นบวก จากนั้นเพิ่มส่วนโค้งจากโหนดมะเร็งปอดไปยังโหนดX-Ray
Specify Topology
โดยทั่วไปแล้ว BN จะถูกจัดวางเพื่อให้ส่วนโค้งชี้จากบนลงล่าง ชุดของโหนดพาเรนต์ของโหนด X กำหนดโดยพาเรนต์ (X)
ปอดมะเร็งโหนดมีพ่อแม่ทั้งสอง (เหตุผลหรือสาเหตุ): มลพิษและสูบบุหรี่ในขณะที่โหนดสูบบุหรี่เป็นancestorของโหนดX-Ray ในทำนองเดียวกันX-Rayเป็นลูก (ผลที่ตามมาหรือผลกระทบ) ของมะเร็งปอดและมะเร็งต่อมลูกหมากsuccessorจำนวนโหนดผู้สูบบุหรี่และมลพิษ
Conditional Probabilities
ตอนนี้หาจำนวนความสัมพันธ์ระหว่างโหนดที่เชื่อมต่อ: ทำได้โดยระบุการแจกแจงความน่าจะเป็นแบบมีเงื่อนไขสำหรับแต่ละโหนด เนื่องจากมีการพิจารณาเฉพาะตัวแปรที่ไม่ต่อเนื่องที่นี่จึงอยู่ในรูปของไฟล์Conditional Probability Table (CPT).
อันดับแรกสำหรับแต่ละโหนดเราต้องดูชุดค่าผสมที่เป็นไปได้ทั้งหมดของโหนดหลักเหล่านั้น แต่ละชุดดังกล่าวเรียกว่าinstantiationของชุดหลัก สำหรับการสร้างอินสแตนซ์ที่แตกต่างกันของค่าโหนดพาเรนต์แต่ละครั้งเราจำเป็นต้องระบุความน่าจะเป็นที่ลูกจะรับ
ตัวอย่างเช่นพ่อแม่ของโหนดมะเร็งปอดเป็นมลพิษและการสูบบุหรี่ โดยรับค่าที่เป็นไปได้ = {(H, T), (H, F), (L, T), (L, F)} พคท. ระบุความน่าจะเป็นของมะเร็งสำหรับแต่ละกรณีเหล่านี้เป็น <0.05, 0.02, 0.03, 0.001> ตามลำดับ
แต่ละโหนดจะมีความน่าจะเป็นตามเงื่อนไขที่เกี่ยวข้องดังนี้ -
การประยุกต์ใช้ Neural Networks
พวกเขาสามารถทำงานที่ง่ายสำหรับมนุษย์ แต่ยากสำหรับเครื่องจักร -
Aerospace - เครื่องบินขับอัตโนมัติการตรวจจับความผิดพลาดของเครื่องบิน
Automotive - ระบบแนะนำรถยนต์
Military - การวางแนวอาวุธและการบังคับเลี้ยวการติดตามเป้าหมายการแยกแยะวัตถุการจดจำใบหน้าการระบุสัญญาณ / ภาพ
Electronics - การทำนายลำดับรหัส, รูปแบบชิป IC, การวิเคราะห์ความล้มเหลวของชิป, การมองเห็นของเครื่องจักร, การสังเคราะห์เสียง
Financial - การประเมินอสังหาริมทรัพย์, ที่ปรึกษาเงินกู้, การคัดกรองการจำนอง, การจัดอันดับพันธบัตรขององค์กร, โปรแกรมการซื้อขายผลงาน, การวิเคราะห์ทางการเงินขององค์กร, การทำนายมูลค่าสกุลเงิน, ผู้อ่านเอกสาร, ผู้ประเมินการสมัครสินเชื่อ
Industrial - การควบคุมกระบวนการผลิตการออกแบบและวิเคราะห์ผลิตภัณฑ์ระบบการตรวจสอบคุณภาพการวิเคราะห์คุณภาพการเชื่อมการทำนายคุณภาพกระดาษการวิเคราะห์การออกแบบผลิตภัณฑ์ทางเคมีการสร้างแบบจำลองระบบกระบวนการทางเคมีแบบไดนามิกการวิเคราะห์การบำรุงรักษาเครื่องจักรการเสนอราคาโครงการการวางแผนและการจัดการ
Medical - การวิเคราะห์เซลล์มะเร็งการวิเคราะห์ EEG และ ECG การออกแบบขาเทียมเครื่องมือเพิ่มประสิทธิภาพเวลาในการปลูกถ่าย
Speech - การรู้จำเสียงการจำแนกเสียงการแปลงข้อความเป็นคำพูด
Telecommunications - การบีบอัดรูปภาพและข้อมูลบริการข้อมูลอัตโนมัติการแปลภาษาพูดแบบเรียลไทม์
Transportation - การวินิจฉัยระบบเบรกรถบรรทุกการตั้งเวลายานพาหนะระบบเส้นทาง
Software - การจดจำรูปแบบในการจดจำใบหน้าการรู้จำอักขระด้วยแสง ฯลฯ
Time Series Prediction - ANN ใช้ในการคาดการณ์หุ้นและภัยพิบัติตามธรรมชาติ
Signal Processing - โครงข่ายประสาทเทียมสามารถฝึกให้ประมวลผลสัญญาณเสียงและกรองสัญญาณได้อย่างเหมาะสมในเครื่องช่วยฟัง
Control - ANN มักใช้ในการตัดสินใจบังคับเลี้ยวของยานพาหนะทางกายภาพ
Anomaly Detection - เนื่องจาก ANN มีความเชี่ยวชาญในการจดจำรูปแบบจึงสามารถได้รับการฝึกอบรมให้สร้างผลลัพธ์เมื่อมีสิ่งผิดปกติเกิดขึ้นซึ่งทำให้รูปแบบไม่ตรงกับรูปแบบ