AI dengan Python - Computer Vision
Visi komputer berkaitan dengan pemodelan dan replikasi visi manusia menggunakan perangkat lunak dan perangkat keras komputer. Dalam bab ini, Anda akan mempelajari hal ini secara detail.
Visi Komputer
Visi komputer adalah disiplin ilmu yang mempelajari cara merekonstruksi, menginterupsi, dan memahami pemandangan 3d dari gambar 2d-nya, dalam kaitannya dengan sifat-sifat struktur yang ada dalam pemandangan tersebut.
Hirarki Visi Komputer
Visi komputer dibagi menjadi tiga kategori dasar sebagai berikut -
Low-level vision - Ini termasuk gambar proses untuk ekstraksi fitur.
Intermediate-level vision - Ini termasuk pengenalan objek dan interpretasi pemandangan 3D
High-level vision - Ini termasuk deskripsi konseptual dari sebuah adegan seperti aktivitas, niat dan perilaku.
Computer Vision Vs Pemrosesan Gambar
Pengolahan citra mempelajari transformasi citra ke citra. Input dan output dari pengolahan citra keduanya adalah citra.
Visi komputer adalah konstruksi deskripsi eksplisit dan bermakna dari objek fisik dari gambar mereka. Keluaran computer vision berupa deskripsi atau interpretasi dari struktur dalam scene 3D.
Aplikasi
Visi komputer menemukan aplikasi di bidang berikut -
Robotics
Lokalisasi-menentukan lokasi robot secara otomatis
Navigation
Menghindari rintangan
Perakitan (pasak dalam lubang, pengelasan, pengecatan)
Manipulasi (misalnya manipulator robot PUMA)
Interaksi Robot Manusia (HRI): Robotika cerdas untuk berinteraksi dan melayani orang
Medicine
Klasifikasi dan deteksi (misalnya lesi atau klasifikasi sel dan deteksi tumor)
Segmentasi 2D / 3D
Rekonstruksi organ manusia 3D (MRI atau ultrasound)
Operasi robotika yang dipandu visi
Security
- Biometrik (iris, sidik jari, pengenalan wajah)
- Surveilans-mendeteksi aktivitas atau perilaku tertentu yang mencurigakan
Transportation
- Kendaraan otonom
- Keamanan, misalnya, pemantauan kewaspadaan pengemudi
Industrial Automation Application
- Inspeksi industri (deteksi cacat)
- Assembly
- Pembacaan kode batang dan label paket
- Penyortiran objek
- Pemahaman dokumen (misalnya OCR)
Menginstal Paket Berguna
Untuk Computer vision dengan Python, Anda dapat menggunakan pustaka populer bernama OpenCV(Visi Komputer Sumber Terbuka). Ini adalah pustaka fungsi pemrograman yang terutama ditujukan untuk visi komputer waktu nyata. Itu ditulis dalam C ++ dan antarmuka utamanya dalam C ++. Anda dapat menginstal paket ini dengan bantuan perintah berikut -
pip install opencv_python-X.X-cp36-cp36m-winX.whl
Di sini X mewakili versi Python yang diinstal pada mesin Anda serta win32 atau 64 bit yang Anda miliki.
Jika Anda menggunakan anaconda lingkungan, kemudian gunakan perintah berikut untuk menginstal OpenCV -
conda install -c conda-forge opencv
Membaca, Menulis dan Menampilkan Gambar
Sebagian besar aplikasi CV membutuhkan gambar sebagai input dan menghasilkan gambar sebagai output. Di bagian ini, Anda akan mempelajari cara membaca dan menulis file gambar dengan bantuan fungsi yang disediakan oleh OpenCV.
Fungsi OpenCV untuk Membaca, Menampilkan, Menulis File Gambar
OpenCV menyediakan fungsi berikut untuk tujuan ini -
imread() function- Ini adalah fungsi untuk membaca gambar. OpenCV imread () mendukung berbagai format gambar seperti PNG, JPEG, JPG, TIFF, dll.
imshow() function- Ini adalah fungsi untuk menampilkan gambar di jendela. Jendela secara otomatis menyesuaikan dengan ukuran gambar. OpenCV imshow () mendukung berbagai format gambar seperti PNG, JPEG, JPG, TIFF, dll.
imwrite() function- Ini adalah fungsi untuk menulis gambar. OpenCV imwrite () mendukung berbagai format gambar seperti PNG, JPEG, JPG, TIFF, dll.
Contoh
Contoh ini menunjukkan kode Python untuk membaca gambar dalam satu format - menampilkannya di jendela dan menulis gambar yang sama dalam format lain. Pertimbangkan langkah-langkah yang ditunjukkan di bawah ini -
Impor paket OpenCV seperti yang ditunjukkan -
import cv2
Sekarang, untuk membaca gambar tertentu, gunakan fungsi imread () -
image = cv2.imread('image_flower.jpg')
Untuk menampilkan gambar, gunakan imshow()fungsi. Nama jendela tempat Anda dapat melihat gambar ituimage_flower.
cv2.imshow('image_flower',image)
cv2.destroyAllwindows()
Sekarang, kita dapat menulis gambar yang sama ke dalam format lain, katakanlah .png dengan menggunakan fungsi imwrite () -
cv2.imwrite('image_flower.png',image)
Output True berarti gambar telah berhasil ditulis sebagai file .png juga dalam folder yang sama.
True
Catatan - Fungsi destroyallWindows () hanya menghancurkan semua jendela yang kita buat.
Konversi Ruang Warna
Di OpenCV, gambar tidak disimpan dengan menggunakan warna RGB konvensional, melainkan disimpan dalam urutan terbalik yaitu dalam urutan BGR. Karenanya kode warna default saat membaca gambar adalah BGR. ItucvtColor() fungsi konversi warna untuk mengubah gambar dari satu kode warna ke kode warna lainnya.
Contoh
Pertimbangkan contoh ini untuk mengonversi gambar dari BGR ke skala abu-abu.
Impor OpenCV paket seperti yang ditunjukkan -
import cv2
Sekarang, untuk membaca gambar tertentu, gunakan fungsi imread () -
image = cv2.imread('image_flower.jpg')
Sekarang, jika kita melihat gambar ini menggunakan imshow() berfungsi, maka kita dapat melihat bahwa gambar ini ada di BGR.
cv2.imshow('BGR_Penguins',image)
Sekarang, gunakan cvtColor() berfungsi untuk mengubah gambar ini menjadi grayscale.
image = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv2.imshow('gray_penguins',image)
Deteksi Tepi
Manusia, setelah melihat sketsa kasar, dengan mudah dapat mengenali berbagai jenis objek dan posenya. Itulah mengapa edge memainkan peran penting dalam kehidupan manusia serta dalam aplikasi computer vision. OpenCV menyediakan fungsi yang sangat sederhana dan berguna yang disebutCanny()untuk mendeteksi tepi.
Contoh
Contoh berikut menunjukkan identifikasi tepi yang jelas.
Impor paket OpenCV seperti yang ditunjukkan -
import cv2
import numpy as np
Sekarang, untuk membaca gambar tertentu, gunakan imread() fungsi.
image = cv2.imread('Penguins.jpg')
Sekarang, gunakan Canny () berfungsi untuk mendeteksi tepi gambar yang sudah dibaca.
cv2.imwrite(‘edges_Penguins.jpg’,cv2.Canny(image,200,300))
Sekarang, untuk menampilkan gambar dengan tepi, gunakan fungsi imshow ().
cv2.imshow(‘edges’, cv2.imread(‘‘edges_Penguins.jpg’))
Program Python ini akan membuat gambar bernama edges_penguins.jpg dengan deteksi tepi.
Deteksi wajah
Deteksi wajah adalah salah satu aplikasi menarik dari computer vision yang membuatnya lebih realistis sekaligus futuristik. OpenCV memiliki fasilitas built-in untuk melakukan deteksi wajah. Kami akan menggunakanHaar pengklasifikasi kaskade untuk deteksi wajah.
Data Haar Cascade
Kami membutuhkan data untuk menggunakan pengklasifikasi kaskade Haar. Anda dapat menemukan data ini di paket OpenCV kami. Setelah menginstal OpenCv, Anda dapat melihat nama foldernyahaarcascades. Akan ada file .xml untuk aplikasi yang berbeda. Sekarang, salin semuanya untuk penggunaan yang berbeda dan tempel kemudian di folder baru di bawah proyek saat ini.
Example
Berikut ini adalah kode Python yang menggunakan Haar Cascade untuk mendeteksi wajah Amitabh Bachan yang ditunjukkan pada gambar berikut -
Impor OpenCV paket seperti yang ditunjukkan -
import cv2
import numpy as np
Sekarang, gunakan HaarCascadeClassifier untuk mendeteksi wajah -
face_detection=
cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/
haarcascade_frontalface_default.xml')
Sekarang, untuk membaca gambar tertentu, gunakan imread() fungsi -
img = cv2.imread('AB.jpg')
Sekarang, ubah menjadi grayscale karena akan menerima gambar abu-abu -
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
Sekarang, menggunakan face_detection.detectMultiScale, lakukan deteksi wajah yang sebenarnya
faces = face_detection.detectMultiScale(gray, 1.3, 5)
Sekarang, gambar persegi panjang di sekitar seluruh wajah -
for (x,y,w,h) in faces:
img = cv2.rectangle(img,(x,y),(x+w, y+h),(255,0,0),3)
cv2.imwrite('Face_AB.jpg',img)
Program Python ini akan membuat gambar bernama Face_AB.jpg dengan deteksi wajah seperti yang ditunjukkan
Deteksi Mata
Deteksi mata adalah aplikasi menarik lainnya dari computer vision yang membuatnya lebih realistis dan juga futuristik. OpenCV memiliki fasilitas built-in untuk melakukan deteksi mata. Kami akan menggunakanHaar cascade pengklasifikasi untuk deteksi mata.
Contoh
Contoh berikut memberikan kode Python menggunakan Haar Cascade untuk mendeteksi wajah Amitabh Bachan yang diberikan pada gambar berikut -
Impor paket OpenCV seperti yang ditunjukkan -
import cv2
import numpy as np
Sekarang, gunakan HaarCascadeClassifier untuk mendeteksi wajah -
eye_cascade = cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/haarcascade_eye.xml')
Sekarang, untuk membaca gambar tertentu, gunakan imread() fungsi
img = cv2.imread('AB_Eye.jpg')
Sekarang, ubah menjadi grayscale karena akan menerima gambar abu-abu -
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
Sekarang dengan bantuan eye_cascade.detectMultiScale, lakukan deteksi wajah yang sebenarnya
eyes = eye_cascade.detectMultiScale(gray, 1.03, 5)
Sekarang, gambar persegi panjang di sekitar seluruh wajah -
for (ex,ey,ew,eh) in eyes:
img = cv2.rectangle(img,(ex,ey),(ex+ew, ey+eh),(0,255,0),2)
cv2.imwrite('Eye_AB.jpg',img)
Program Python ini akan membuat gambar bernama Eye_AB.jpg dengan deteksi mata seperti yang ditunjukkan -