ฝึกแมชชีนเลิร์นนิงเพื่อประโยชน์ของชุมชนผู้มีสายตาเลือนราง

May 04 2023
เอกสารสำคัญโดยนักเรียน CDS ที่สำรวจว่าโมเดล AI สามารถจดจำวัตถุเพื่อช่วยเหลือผู้พิการทางสายตาได้ดีขึ้นได้อย่างไร ได้รับการยอมรับในการประชุม IEEE-EMBC ปี 2023 ปัญญาประดิษฐ์ได้แสดงศักยภาพที่สำคัญในการพัฒนาเทคโนโลยีเพื่อประโยชน์ของผู้ที่มีความพิการทางสายตาหรือสายตาเลือนราง โดยทั่วไป แบบจำลองการตรวจจับวัตถุเหล่านี้ได้รับการฝึกฝนเกี่ยวกับข้อมูลทั่วไป แทนที่จะเป็นชุดข้อมูลเฉพาะสำหรับความต้องการของผู้ที่ตาบอด

เอกสารสำคัญโดยนักเรียน CDS ที่สำรวจว่าโมเดล AI สามารถจดจำวัตถุเพื่อช่วยเหลือผู้พิการทางสายตาได้ดีขึ้นได้อย่างไร ได้รับการยอมรับในการประชุม IEEE-EMBC ปี 2023

ธารันจินี ซันกานารายานัน​ (ซ้าย), เคฟนา ปาริกห์​ (กลาง)​, เลฟ ปาซิโอร์คอฟสกี้​ (ขวา)​

ปัญญาประดิษฐ์ได้แสดงศักยภาพที่สำคัญในการพัฒนาเทคโนโลยีเพื่อประโยชน์ของผู้พิการทางสายตาหรือสายตาเลือนราง โดยทั่วไป แบบจำลองการตรวจจับวัตถุเหล่านี้ได้รับการฝึกฝนเกี่ยวกับข้อมูลทั่วไป แทนที่จะเป็นชุดข้อมูลเฉพาะสำหรับความต้องการของผู้ที่ตาบอด ทีมนักวิจัยของ NYU รวมถึงนักศึกษาระดับปริญญาโทของ CDS Tharangini Sankarnarayanan , Lev Paciorkowski และKhevna Parikhจัดการปัญหานี้สำหรับโครงการขั้นสูงสุดของพวกเขา โดยพัฒนาชุดข้อมูลของวัตถุที่มักพบโดยผู้ที่มีสายตาเลือนราง

บทความเรื่อง “Training AI to Recognize Objects of Interest to the Blind and Low Vision Community” มีกำหนดการเผยแพร่ใน PubMed และได้รับการยอมรับในการประชุมนานาชาติประจำปีครั้งที่ 45 ของ IEEE Engineering in Medical Biology Society (IEEE-EMBC) ที่จัดขึ้นในซิดนีย์ ตั้งแต่วันที่ 24 กรกฎาคมถึง 27 กรกฎาคม

ผู้ร่วมเขียนผลงาน ได้แก่ Postdoctoral Fellow ที่ NYU Grossman School of Medicine Giles Hamilton-Fletcher , ผู้ช่วยศาสตราจารย์ที่ NYU Tandon Chen Feng , นักศึกษาปริญญาโทที่ NYU Tandon Diwei Sheng, ผู้ช่วยศาสตราจารย์วิจัยที่ NYU Grossman Todd E. Hudson , Ilse Melamid Associate ศาสตราจารย์ด้านเวชศาสตร์ฟื้นฟูที่ NYU Grossman John-Ross Rizzoและผู้ช่วยศาสตราจารย์และผู้อำนวยการห้องปฏิบัติการ Neuroimaging and Visual Science ที่ NYU Grossman Kevin C. Chan งานนี้ได้รับการสนับสนุนเพิ่มเติมโดยโครงการวิจัยวิสัยทัศน์ของกระทรวงกลาโหมสหรัฐ และทุนวิจัยเพื่อป้องกันตาบอดให้กับ NYU Langone Health Department of Ophthalmology

ด้วยการใช้ความคิดเห็นของผู้ใช้เป็นศูนย์กลาง นักวิจัยได้ระบุวัตถุ 35 รายการที่จำเป็นต่อผู้ที่ตาบอด พวกเขารวบรวมรูปภาพของวัตถุจากชุดข้อมูลที่เปิดเผยต่อสาธารณะและฝึกโมเดล YOLOv5x ให้จดจำรายการที่เลือก จากการเรียกใช้โมเดล พวกเขาพบว่าสามารถระบุวัตถุต่างๆ เช่น ถ้วยกาแฟ มีด ส้อม และแก้วได้ดีกว่ารุ่นก่อนหน้าอย่างเห็นได้ชัด นักวิจัยยังพบว่าการมีวัตถุประเภทต่างๆ ในจำนวนที่สมดุลในชุดข้อมูลการฝึกอบรมยังช่วยเพิ่มความสามารถของแบบจำลองในการตรวจจับวัตถุรวมถึงความเร็วด้วย

“เป็นเรื่องน่าตื่นเต้นที่ได้เห็นความก้าวหน้าอย่างรวดเร็วของเทคโนโลยีการมองเห็นด้วยคอมพิวเตอร์ประเภทนี้ และศักยภาพของมันสำหรับชุมชนคนตาบอด” ผู้เขียน CDS กล่าว “ความท้าทายที่ยิ่งใหญ่ที่สุดในปัจจุบันดูเหมือนจะเป็นการได้มาซึ่งชุดข้อมูลการฝึกอบรมคุณภาพสูงที่แสดงถึงสภาพแวดล้อมในโลกแห่งความเป็นจริงที่โมเดลดังกล่าวจะถูกนำไปใช้อย่างถูกต้อง ในอนาคต เราคิดว่าควรให้ความสนใจมากขึ้นกับภาพการฝึกอบรมที่ใช้และที่มาของภาพ”

นอกจากการปรับปรุงข้อมูลที่มีอยู่สำหรับการพัฒนาโมเดลแมชชีนเลิร์นนิงที่ช่วยผู้พิการทางสายตาแล้ว งานวิจัยยังแสดงให้เห็นถึงความสำคัญของการจัดการข้อมูลการฝึกอบรมสำหรับเทคโนโลยีช่วยเหลือที่ตอบสนองความต้องการของผู้ใช้แต่ละราย

โดย Meryl Phair