SciPy - एनडिमेज
SciPy ndimage submodule इमेज प्रोसेसिंग के लिए समर्पित है। यहाँ, ndimage का अर्थ है n- आयामी छवि।
इमेज प्रोसेसिंग में सबसे आम कार्यों में से कुछ इस प्रकार हैं & miuns;
- इनपुट / आउटपुट, छवियों को प्रदर्शित करना
- मूल जोड़तोड़ - काट-छाँट करना, झपटना, घुमाना आदि।
- छवि को छानना - डी-शोर करना, तेज करना, आदि।
- छवि विभाजन - अलग-अलग वस्तुओं के अनुरूप पिक्सेल लेबलिंग
- Classification
- सुविधा निकासी
- Registration
आइए चर्चा करें कि SciPy का उपयोग करके इनमें से कुछ को कैसे प्राप्त किया जा सकता है।
छवि फ़ाइलों को खोलना और लिखना
misc packageSciPy में कुछ छवियां आती हैं। हम छवि जोड़तोड़ को जानने के लिए उन छवियों का उपयोग करते हैं। आइए हम निम्नलिखित उदाहरण पर विचार करें।
from scipy import misc
f = misc.face()
misc.imsave('face.png', f) # uses the Image module (PIL)
import matplotlib.pyplot as plt
plt.imshow(f)
plt.show()
उपरोक्त कार्यक्रम निम्न आउटपुट उत्पन्न करेगा।
इसके कच्चे प्रारूप में कोई भी चित्र मैट्रिक्स प्रारूप में संख्याओं द्वारा दर्शाए गए रंगों का संयोजन है। एक मशीन केवल उन नंबरों के आधार पर छवियों को समझती है और उनमें हेरफेर करती है। RGB प्रतिनिधित्व का एक लोकप्रिय तरीका है।
आइए हम उपरोक्त छवि की सांख्यिकीय जानकारी देखें।
from scipy import misc
face = misc.face(gray = False)
print face.mean(), face.max(), face.min()
उपरोक्त कार्यक्रम निम्न आउटपुट उत्पन्न करेगा।
110.16274388631184, 255, 0
अब, हम जानते हैं कि छवि संख्याओं से बनी है, इसलिए संख्या के मूल्य में कोई भी परिवर्तन मूल छवि को बदल देता है। आइए हम छवि पर कुछ ज्यामितीय रूपांतरण करते हैं। बुनियादी ज्यामितीय संचालन फसल है
from scipy import misc
face = misc.face(gray = True)
lx, ly = face.shape
# Cropping
crop_face = face[lx / 4: - lx / 4, ly / 4: - ly / 4]
import matplotlib.pyplot as plt
plt.imshow(crop_face)
plt.show()
उपरोक्त कार्यक्रम निम्न आउटपुट उत्पन्न करेगा।
हम कुछ बुनियादी ऑपरेशन भी कर सकते हैं जैसे कि नीचे बताए गए चित्र को उल्टा करना।
# up <-> down flip
from scipy import misc
face = misc.face()
flip_ud_face = np.flipud(face)
import matplotlib.pyplot as plt
plt.imshow(flip_ud_face)
plt.show()
उपरोक्त कार्यक्रम निम्न आउटपुट उत्पन्न करेगा।
इसके अलावा, हमारे पास है rotate() function, जो एक निर्दिष्ट कोण के साथ छवि को घुमाता है।
# rotation
from scipy import misc,ndimage
face = misc.face()
rotate_face = ndimage.rotate(face, 45)
import matplotlib.pyplot as plt
plt.imshow(rotate_face)
plt.show()
उपरोक्त कार्यक्रम निम्न आउटपुट उत्पन्न करेगा।
फिल्टर
आइए चर्चा करते हैं कि फ़िल्टर इमेज प्रोसेसिंग में कैसे मदद करते हैं।
इमेज प्रोसेसिंग में फ़िल्टरिंग क्या है?
फ़िल्टरिंग एक छवि को संशोधित करने या बढ़ाने के लिए एक तकनीक है। उदाहरण के लिए, आप कुछ विशेषताओं पर जोर देने या अन्य सुविधाओं को हटाने के लिए एक छवि को फ़िल्टर कर सकते हैं। फ़िल्टरिंग के साथ कार्यान्वित छवि प्रसंस्करण कार्यों में स्मूथिंग, शार्पनिंग और एज एन्हांसमेंट शामिल हैं।
फ़िल्टरिंग एक पड़ोसी ऑपरेशन है, जिसमें आउटपुट इमेज में दिए गए किसी भी पिक्सेल का मूल्य संबंधित इनपुट पिक्सेल के पड़ोस में पिक्सेल के मूल्यों के लिए कुछ एल्गोरिदम लागू करके निर्धारित किया जाता है। आइए अब हम SciPy ndimage का उपयोग करके कुछ ऑपरेशन करते हैं।
धुंधला
छवि में शोर को कम करने के लिए ब्लरिंग का व्यापक रूप से उपयोग किया जाता है। हम एक फिल्टर ऑपरेशन कर सकते हैं और छवि में परिवर्तन देख सकते हैं। आइए हम निम्नलिखित उदाहरण पर विचार करें।
from scipy import misc
face = misc.face()
blurred_face = ndimage.gaussian_filter(face, sigma=3)
import matplotlib.pyplot as plt
plt.imshow(blurred_face)
plt.show()
उपरोक्त कार्यक्रम निम्न आउटपुट उत्पन्न करेगा।
सिग्मा मान पांच के पैमाने पर धब्बा के स्तर को इंगित करता है। हम सिग्मा मान को ट्यून करके छवि की गुणवत्ता में बदलाव देख सकते हैं। धुंधला होने के अधिक विवरण के लिए, → DIP (डिजिटल इमेज प्रोसेसिंग) ट्यूटोरियल पर क्लिक करें।
किनारे का पता लगाना
आइए चर्चा करें कि एज डिटेक्शन इमेज प्रोसेसिंग में कैसे मदद करता है।
एज डिटेक्शन क्या है?
एज डिटेक्शन छवियों के भीतर वस्तुओं की सीमाओं को खोजने के लिए एक इमेज प्रोसेसिंग तकनीक है। यह चमक में असंतोष का पता लगाकर काम करता है। एज डिटेक्शन का उपयोग इमेज प्रोसेसिंग, कंप्यूटर विजन और मशीन विजन जैसे क्षेत्रों में छवि विभाजन और डेटा निष्कर्षण के लिए किया जाता है।
सबसे अधिक इस्तेमाल किए जाने वाले एज डिटेक्शन एल्गोरिदम में शामिल हैं
- Sobel
- Canny
- Prewitt
- Roberts
- फजी लॉजिक तरीके
आइए हम निम्नलिखित उदाहरण पर विचार करें।
import scipy.ndimage as nd
import numpy as np
im = np.zeros((256, 256))
im[64:-64, 64:-64] = 1
im[90:-90,90:-90] = 2
im = ndimage.gaussian_filter(im, 8)
import matplotlib.pyplot as plt
plt.imshow(im)
plt.show()
उपरोक्त कार्यक्रम निम्न आउटपुट उत्पन्न करेगा।
छवि रंगों के एक वर्ग ब्लॉक की तरह दिखती है। अब, हम उन रंगीन ब्लॉकों के किनारों का पता लगाएंगे। यहाँ, ndimage नामक एक फ़ंक्शन प्रदान करता हैSobelइस ऑपरेशन को अंजाम देने के लिए। जबकि, NumPy प्रदान करता हैHypot दो परिणामी मैट्रिक्स को एक में मिलाने का कार्य।
आइए हम निम्नलिखित उदाहरण पर विचार करें।
import scipy.ndimage as nd
import matplotlib.pyplot as plt
im = np.zeros((256, 256))
im[64:-64, 64:-64] = 1
im[90:-90,90:-90] = 2
im = ndimage.gaussian_filter(im, 8)
sx = ndimage.sobel(im, axis = 0, mode = 'constant')
sy = ndimage.sobel(im, axis = 1, mode = 'constant')
sob = np.hypot(sx, sy)
plt.imshow(sob)
plt.show()
उपरोक्त कार्यक्रम निम्न आउटपुट उत्पन्न करेगा।