AI dengan Python - Computer Vision

Visi komputer berkaitan dengan pemodelan dan replikasi visi manusia menggunakan perangkat lunak dan perangkat keras komputer. Dalam bab ini, Anda akan mempelajari hal ini secara detail.

Visi Komputer

Visi komputer adalah disiplin ilmu yang mempelajari cara merekonstruksi, menginterupsi, dan memahami pemandangan 3d dari gambar 2d-nya, dalam kaitannya dengan sifat-sifat struktur yang ada dalam pemandangan tersebut.

Hirarki Visi Komputer

Visi komputer dibagi menjadi tiga kategori dasar sebagai berikut -

  • Low-level vision - Ini termasuk gambar proses untuk ekstraksi fitur.

  • Intermediate-level vision - Ini termasuk pengenalan objek dan interpretasi pemandangan 3D

  • High-level vision - Ini termasuk deskripsi konseptual dari sebuah adegan seperti aktivitas, niat dan perilaku.

Computer Vision Vs Pemrosesan Gambar

Pengolahan citra mempelajari transformasi citra ke citra. Input dan output dari pengolahan citra keduanya adalah citra.

Visi komputer adalah konstruksi deskripsi eksplisit dan bermakna dari objek fisik dari gambar mereka. Keluaran computer vision berupa deskripsi atau interpretasi dari struktur dalam scene 3D.

Aplikasi

Visi komputer menemukan aplikasi di bidang berikut -

Robotics

  • Lokalisasi-menentukan lokasi robot secara otomatis

  • Navigation

  • Menghindari rintangan

  • Perakitan (pasak dalam lubang, pengelasan, pengecatan)

  • Manipulasi (misalnya manipulator robot PUMA)

  • Interaksi Robot Manusia (HRI): Robotika cerdas untuk berinteraksi dan melayani orang

Medicine

  • Klasifikasi dan deteksi (misalnya lesi atau klasifikasi sel dan deteksi tumor)

  • Segmentasi 2D / 3D

  • Rekonstruksi organ manusia 3D (MRI atau ultrasound)

  • Operasi robotika yang dipandu visi

Security

  • Biometrik (iris, sidik jari, pengenalan wajah)
  • Surveilans-mendeteksi aktivitas atau perilaku tertentu yang mencurigakan

Transportation

  • Kendaraan otonom
  • Keamanan, misalnya, pemantauan kewaspadaan pengemudi

Industrial Automation Application

  • Inspeksi industri (deteksi cacat)
  • Assembly
  • Pembacaan kode batang dan label paket
  • Penyortiran objek
  • Pemahaman dokumen (misalnya OCR)

Menginstal Paket Berguna

Untuk Computer vision dengan Python, Anda dapat menggunakan pustaka populer bernama OpenCV(Visi Komputer Sumber Terbuka). Ini adalah pustaka fungsi pemrograman yang terutama ditujukan untuk visi komputer waktu nyata. Itu ditulis dalam C ++ dan antarmuka utamanya dalam C ++. Anda dapat menginstal paket ini dengan bantuan perintah berikut -

pip install opencv_python-X.X-cp36-cp36m-winX.whl

Di sini X mewakili versi Python yang diinstal pada mesin Anda serta win32 atau 64 bit yang Anda miliki.

Jika Anda menggunakan anaconda lingkungan, kemudian gunakan perintah berikut untuk menginstal OpenCV -

conda install -c conda-forge opencv

Membaca, Menulis dan Menampilkan Gambar

Sebagian besar aplikasi CV membutuhkan gambar sebagai input dan menghasilkan gambar sebagai output. Di bagian ini, Anda akan mempelajari cara membaca dan menulis file gambar dengan bantuan fungsi yang disediakan oleh OpenCV.

Fungsi OpenCV untuk Membaca, Menampilkan, Menulis File Gambar

OpenCV menyediakan fungsi berikut untuk tujuan ini -

  • imread() function- Ini adalah fungsi untuk membaca gambar. OpenCV imread () mendukung berbagai format gambar seperti PNG, JPEG, JPG, TIFF, dll.

  • imshow() function- Ini adalah fungsi untuk menampilkan gambar di jendela. Jendela secara otomatis menyesuaikan dengan ukuran gambar. OpenCV imshow () mendukung berbagai format gambar seperti PNG, JPEG, JPG, TIFF, dll.

  • imwrite() function- Ini adalah fungsi untuk menulis gambar. OpenCV imwrite () mendukung berbagai format gambar seperti PNG, JPEG, JPG, TIFF, dll.

Contoh

Contoh ini menunjukkan kode Python untuk membaca gambar dalam satu format - menampilkannya di jendela dan menulis gambar yang sama dalam format lain. Pertimbangkan langkah-langkah yang ditunjukkan di bawah ini -

Impor paket OpenCV seperti yang ditunjukkan -

import cv2

Sekarang, untuk membaca gambar tertentu, gunakan fungsi imread () -

image = cv2.imread('image_flower.jpg')

Untuk menampilkan gambar, gunakan imshow()fungsi. Nama jendela tempat Anda dapat melihat gambar ituimage_flower.

cv2.imshow('image_flower',image)
cv2.destroyAllwindows()

Sekarang, kita dapat menulis gambar yang sama ke dalam format lain, katakanlah .png dengan menggunakan fungsi imwrite () -

cv2.imwrite('image_flower.png',image)

Output True berarti gambar telah berhasil ditulis sebagai file .png juga dalam folder yang sama.

True

Catatan - Fungsi destroyallWindows () hanya menghancurkan semua jendela yang kita buat.

Konversi Ruang Warna

Di OpenCV, gambar tidak disimpan dengan menggunakan warna RGB konvensional, melainkan disimpan dalam urutan terbalik yaitu dalam urutan BGR. Karenanya kode warna default saat membaca gambar adalah BGR. ItucvtColor() fungsi konversi warna untuk mengubah gambar dari satu kode warna ke kode warna lainnya.

Contoh

Pertimbangkan contoh ini untuk mengonversi gambar dari BGR ke skala abu-abu.

Impor OpenCV paket seperti yang ditunjukkan -

import cv2

Sekarang, untuk membaca gambar tertentu, gunakan fungsi imread () -

image = cv2.imread('image_flower.jpg')

Sekarang, jika kita melihat gambar ini menggunakan imshow() berfungsi, maka kita dapat melihat bahwa gambar ini ada di BGR.

cv2.imshow('BGR_Penguins',image)

Sekarang, gunakan cvtColor() berfungsi untuk mengubah gambar ini menjadi grayscale.

image = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv2.imshow('gray_penguins',image)

Deteksi Tepi

Manusia, setelah melihat sketsa kasar, dengan mudah dapat mengenali berbagai jenis objek dan posenya. Itulah mengapa edge memainkan peran penting dalam kehidupan manusia serta dalam aplikasi computer vision. OpenCV menyediakan fungsi yang sangat sederhana dan berguna yang disebutCanny()untuk mendeteksi tepi.

Contoh

Contoh berikut menunjukkan identifikasi tepi yang jelas.

Impor paket OpenCV seperti yang ditunjukkan -

import cv2
import numpy as np

Sekarang, untuk membaca gambar tertentu, gunakan imread() fungsi.

image = cv2.imread('Penguins.jpg')

Sekarang, gunakan Canny () berfungsi untuk mendeteksi tepi gambar yang sudah dibaca.

cv2.imwrite(‘edges_Penguins.jpg’,cv2.Canny(image,200,300))

Sekarang, untuk menampilkan gambar dengan tepi, gunakan fungsi imshow ().

cv2.imshow(‘edges’, cv2.imread(‘‘edges_Penguins.jpg’))

Program Python ini akan membuat gambar bernama edges_penguins.jpg dengan deteksi tepi.

Deteksi wajah

Deteksi wajah adalah salah satu aplikasi menarik dari computer vision yang membuatnya lebih realistis sekaligus futuristik. OpenCV memiliki fasilitas built-in untuk melakukan deteksi wajah. Kami akan menggunakanHaar pengklasifikasi kaskade untuk deteksi wajah.

Data Haar Cascade

Kami membutuhkan data untuk menggunakan pengklasifikasi kaskade Haar. Anda dapat menemukan data ini di paket OpenCV kami. Setelah menginstal OpenCv, Anda dapat melihat nama foldernyahaarcascades. Akan ada file .xml untuk aplikasi yang berbeda. Sekarang, salin semuanya untuk penggunaan yang berbeda dan tempel kemudian di folder baru di bawah proyek saat ini.

Example

Berikut ini adalah kode Python yang menggunakan Haar Cascade untuk mendeteksi wajah Amitabh Bachan yang ditunjukkan pada gambar berikut -

Impor OpenCV paket seperti yang ditunjukkan -

import cv2
import numpy as np

Sekarang, gunakan HaarCascadeClassifier untuk mendeteksi wajah -

face_detection=
cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/
haarcascade_frontalface_default.xml')

Sekarang, untuk membaca gambar tertentu, gunakan imread() fungsi -

img = cv2.imread('AB.jpg')

Sekarang, ubah menjadi grayscale karena akan menerima gambar abu-abu -

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

Sekarang, menggunakan face_detection.detectMultiScale, lakukan deteksi wajah yang sebenarnya

faces = face_detection.detectMultiScale(gray, 1.3, 5)

Sekarang, gambar persegi panjang di sekitar seluruh wajah -

for (x,y,w,h) in faces:
   img = cv2.rectangle(img,(x,y),(x+w, y+h),(255,0,0),3)
cv2.imwrite('Face_AB.jpg',img)

Program Python ini akan membuat gambar bernama Face_AB.jpg dengan deteksi wajah seperti yang ditunjukkan

Deteksi Mata

Deteksi mata adalah aplikasi menarik lainnya dari computer vision yang membuatnya lebih realistis dan juga futuristik. OpenCV memiliki fasilitas built-in untuk melakukan deteksi mata. Kami akan menggunakanHaar cascade pengklasifikasi untuk deteksi mata.

Contoh

Contoh berikut memberikan kode Python menggunakan Haar Cascade untuk mendeteksi wajah Amitabh Bachan yang diberikan pada gambar berikut -

Impor paket OpenCV seperti yang ditunjukkan -

import cv2
import numpy as np

Sekarang, gunakan HaarCascadeClassifier untuk mendeteksi wajah -

eye_cascade = cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/haarcascade_eye.xml')

Sekarang, untuk membaca gambar tertentu, gunakan imread() fungsi

img = cv2.imread('AB_Eye.jpg')

Sekarang, ubah menjadi grayscale karena akan menerima gambar abu-abu -

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

Sekarang dengan bantuan eye_cascade.detectMultiScale, lakukan deteksi wajah yang sebenarnya

eyes = eye_cascade.detectMultiScale(gray, 1.03, 5)

Sekarang, gambar persegi panjang di sekitar seluruh wajah -

for (ex,ey,ew,eh) in eyes:
   img = cv2.rectangle(img,(ex,ey),(ex+ew, ey+eh),(0,255,0),2)
cv2.imwrite('Eye_AB.jpg',img)

Program Python ini akan membuat gambar bernama Eye_AB.jpg dengan deteksi mata seperti yang ditunjukkan -