छवि छँटाई प्रयोग

May 09 2023
छवि देखने की दक्षता को अधिकतम करना: विज़ुअल सॉर्टिंग टीएलडीआर की मदद कैसे कर सकता है: जनवरी 2022 में, हमने - एचटीडब्ल्यू बर्लिन में विजुअल कंप्यूटिंग ग्रुप - ने इमेज सॉर्टिंग का मूल्यांकन करने के लिए एक प्रयोग किया। यह दिखाया गया था कि क्रमबद्ध व्यवस्था में छवियां बहुत अधिक तेज़ी से पाई जाती हैं।

अधिकतम छवि देखने की क्षमता: दृश्य छँटाई कैसे मदद कर सकती है

256 IKEA बरतन आइटम, बाईं ओर: यादृच्छिक क्रम में और दाईं ओर: समानता द्वारा क्रमबद्ध।

TLDR: जनवरी 2022 में, हम - HTW बर्लिन में विजुअल कंप्यूटिंग ग्रुप - ने इमेज सॉर्टिंग का मूल्यांकन करने के लिए एक प्रयोग किया। यह दिखाया गया था कि क्रमबद्ध व्यवस्था में छवियां बहुत अधिक तेज़ी से पाई जाती हैं। छवि छँटाई के मूल्यांकन के लिए हमारा नया उपाय उन लोगों की तुलना में काफी बेहतर साबित हुआ, जिनका उपयोग आमतौर पर मनुष्यों द्वारा कथित छँटाई की गुणवत्ता का वर्णन करने के लिए किया जाता है। इसके अतिरिक्त, हमारी प्रस्तावित छँटाई विधियाँ अन्य विधियों की तुलना में बहुत अधिक कुशलता से उच्च-गुणवत्ता वाली छवि छँटाई करने में सक्षम थीं।

हमारे प्रयोग में 2000 से अधिक प्रतिभागियों ने भाग लिया, और हम उन्हें यहाँ फिर से धन्यवाद देना चाहेंगे। प्रकाशित लेख (https://onlinelibrary.wiley.com/doi/epdf/10.1111/cgf.14718) गैर-विशेषज्ञों के लिए प्रयोग के परिणामों को समझना कठिन हो सकता है। इसलिए, हम यहां समझने योग्य तरीके से प्रयोग की प्रेरणा, कार्यान्वयन और परिणामों को संक्षेप में प्रस्तुत करने का प्रयास करेंगे।

कई छवियों को एक साथ पहचानने में लोगों को कठिनाई होती है

हालाँकि मनुष्य जटिल छवियों को जल्दी से देख और समझ सकते हैं, उन्हें एक साथ कई छवियों को पहचानने में कठिनाई होती है। ई-कॉमर्स वेबसाइटों पर फोटो संग्रह या उत्पादों में छवियों की खोज करते समय यह समस्या उत्पन्न होती है। ऐसे मामलों में, प्रासंगिक छवियों की संख्या बहुत बड़ी होने पर खोज अक्सर बहुत कठिन होती है। चूँकि स्क्रीन पर एक बार में केवल 10-20 छवियों को देखा जा सकता है, वांछित छवि या उत्पाद को खोजने के लिए असंरचित सूचियों के माध्यम से अंतहीन स्क्रॉल करना अक्सर आवश्यक होता है।

जब छवियों को एक क्रमबद्ध क्रम में प्रदर्शित किया जाता है तो मनुष्य छवियों को अधिक आसानी से देख सकते हैं। ऊपर की छवि 256 IKEA बरतन आइटम दिखाती है, बाईं ओर एक यादृच्छिक क्रम में और दाईं ओर समानता द्वारा क्रमबद्ध। किसी विशिष्ट छवि की खोज करते समय, अवर्गीकृत स्थिति में, छवियों को पंक्ति दर पंक्ति "स्कैन" करने का एकमात्र विकल्प होता है। क्रमबद्ध व्यवस्था में, उपयुक्त क्षेत्र को शीघ्रता से पहचाना जा सकता है, और खोज को उस क्षेत्र पर केंद्रित किया जा सकता है।

प्रयोग के लक्ष्य

आयोजित प्रयोग का लक्ष्य यह निर्धारित करना था कि किस हद तक लोग छवियों की उपयुक्त छँटाई के माध्यम से एक साथ अधिक छवियों को देखने में सक्षम हैं, और यह कैसे छवियों को खोजने में लगने वाले समय को कम कर सकता है। विशेष रूप से, निम्नलिखित प्रश्नों को संबोधित किया गया था:

  • किस प्रकार की छवि छँटाई लोगों को सुखद और सहायक लगती है?
  • लोगों द्वारा देखी गई दृश्य छँटाई की गुणवत्ता को निष्पक्ष रूप से कैसे मापा जा सकता है?
  • लोगों की प्राथमिकताओं से मेल खाने वाली क्रमबद्ध व्यवस्थाओं को कुशलतापूर्वक बनाने के लिए कौन सी विधियाँ सबसे उपयुक्त हैं?

ऊपर वर्णित प्रश्नों के प्रयोग में प्राप्त उत्तरों को प्रस्तुत करने से पहले, हम एक सरल उदाहरण का उपयोग करके छँटाई के सिद्धांत की व्याख्या करना चाहेंगे। यदि संख्या 6, 5, 2, 8, और 3 को उनके आकार के अनुसार क्रमबद्ध करना है, तो इसका अर्थ है कि हमें संख्याओं को इस प्रकार व्यवस्थित करना होगा कि प्रत्येक संख्या पिछली संख्या से बड़ी हो।

पाँच संख्याओं की छँटाई

सामान्य तौर पर, 1∙2∙3 ∙ … ∙ n = n! ("एन फैक्टोरियल" पढ़ें) एन ऑब्जेक्ट्स को व्यवस्थित करने के तरीके। हमारे पांच नंबरों के मामले में, पहले से ही 120 संभावित व्यवस्थाएं होंगी, जिनमें से केवल दो को क्रमबद्ध किया गया है (आरोही या अवरोही)। संख्याओं के बड़े सेट के लिए, छँटाई (इष्टतम व्यवस्था) निर्धारित करने के लिए कुशल एल्गोरिदम हैं।

छवियों को कैसे क्रमबद्ध करें?

जब छवियों को क्रमबद्ध करने की बात आती है, तो यह स्पष्ट नहीं होता है कि एक अच्छी छँटाई वास्तव में कैसी दिखती है या इसे कैसे निर्धारित किया जाए। छँटाई संख्याओं की तुलना में, दो मुख्य अंतर हैं: सबसे पहले, छवियों की उपस्थिति और सामग्री का वर्णन अलग-अलग संख्याओं द्वारा नहीं किया जाता है, बल्कि तथाकथित फीचर वैक्टर द्वारा किया जाता है। इसका मतलब यह है कि प्रत्येक छवि को एक उच्च-आयामी स्थान में एक वेक्टर द्वारा दर्शाया जाता है, समान छवियों के वैक्टर आमतौर पर एक दूसरे के करीब स्थित होते हैं। दूसरे, सॉर्ट की गई छवियों को आमतौर पर 2D ग्रिड पर व्यवस्थित किया जाता है, जिसका अर्थ है कि क्षैतिज और ऊर्ध्वाधर दोनों दिशाओं में पड़ोसी हैं। छवियों की संख्या के साथ संभावित व्यवस्थाओं की संख्या फिर से तथ्यात्मक रूप से बढ़ती है। 10×10 ग्रिड पर 100 छवियों की व्यवस्था के लिए, पहले से ही 100 हैं! = 9.3∙10¹⁵⁷ संभावनाएँ (158 अंकों वाली एक संख्या) उन्हें व्यवस्थित करने के लिए। इतनी बड़ी संख्या को देखते हुए, यहां तक ​​कि सबसे तेज कंप्यूटर के लिए सभी प्रकारों को आजमाना असंभव है। यहां तक ​​कि अगर सभी व्यवस्थाओं की तुलना करना संभव होता, तो भी यह स्पष्ट नहीं होता कि कौन सी सबसे अच्छी तरह से व्यवस्थित है।

छँटाई छवियों के सिद्धांत को स्पष्ट करने के लिए, रंगों की द्वि-आयामी छँटाई एक उदाहरण के रूप में काम कर सकती है। रंगों को उनके लाल, हरे और नीले घटकों द्वारा वर्णित किया जाता है और इस प्रकार उन्हें 3डी वैक्टर के रूप में दर्शाया जा सकता है। रंगों को द्वि-आयामी रूप से क्रमबद्ध करने के लिए, इन 3डी वैक्टरों को 2डी ग्रिड पर एक स्थिति निर्दिष्ट की जानी चाहिए। निम्नलिखित आंकड़ा 27 ∙ 27 (= 729) स्थितियों के साथ 2डी ग्रिड पर 9 ∙ 9 ∙ 9 (= 729) आरजीबी रंगों की संभावित क्रमबद्ध व्यवस्था दिखाता है।

3डी आरजीबी कलर स्पेस में 729 रंग ➞ 2डी ग्रिड पर 729 रंग व्यवस्थित हैं।

ऊपर वर्णित रंग उदाहरण की तुलना में छवियों की दृश्य छँटाई के बीच का अंतर केवल इतना है कि छवियों के फीचर वैक्टर के आयाम बहुत अधिक हैं। एक छवि के दृश्य स्वरूप का वर्णन करने के लिए 100 से कम आयाम पर्याप्त हैं, जबकि छवि की सामग्री का वर्णन करने के लिए हजारों आयामों की आवश्यकता हो सकती है। छँटाई प्रक्रिया तब समान छवियों को एक दूसरे के करीब रखने की कोशिश करती है। यदि आप जानना चाहते हैं कि छँटाई छवियों के लिए एल्गोरिदम वास्तव में कैसे काम करते हैं, तो आप इसके बारे में हमारे लेख में पढ़ सकते हैं।

प्रयुक्त छवि सेट

प्रयोग करने से पहले, हमने विभिन्न आकारों के विभिन्न छवि सेटों के साथ परीक्षण किए। यह पता चला कि बहुत अधिक छवियों के साथ, उनमें से कुछ को खोजना बहुत मुश्किल था, चाहे उनकी छँटाई कुछ भी हो। इससे निश्चित रूप से प्रयोग में खोज कार्यों के दौरान कई प्रतिभागियों की समाप्ति हुई होगी। दूसरी ओर, बहुत छोटे सेटों के साथ, छवियों की छँटाई का खोज समय पर बहुत कम प्रभाव पड़ा, क्योंकि वांछित छवियों को आमतौर पर पहचाना जाता था और तुरंत मिल जाता था।

प्रयोग में चार अलग-अलग सेटों का इस्तेमाल किया गया। पहले में 1024 बेतरतीब ढंग से उत्पन्न आरजीबी रंग शामिल थे और इसका उपयोग केवल विभिन्न छँटाई विधियों की कथित गुणवत्ता निर्धारित करने के लिए किया गया था। तीन अन्य छवि सेटों के लिए, वांछित छवियों को खोजने का समय भी रिकॉर्ड किया गया था। इन तीन सेटों को इस तरह से चुना गया था कि वे एक ओर अलग-अलग खोज परिदृश्यों का प्रतिनिधित्व करते हैं, और दूसरी ओर क्रमबद्ध और यादृच्छिक व्यवस्थाओं के बीच खोज की गति में अभी भी महत्वपूर्ण अंतर था। पहले सेट में 169 ट्रैफ़िक संकेत शामिल थे क्योंकि उन्हें सिंहावलोकन बोर्डों पर चित्रित किया जा सकता था। दूसरा सेट आईकेईए बरतन वस्तुओं की 256 छवियों का था, क्योंकि वे आम तौर पर ई-कॉमर्स वेबसाइटों पर प्रस्तुत किए जाते हैं। अंतिम सेट 70 असंबद्ध खोज शब्दों के लिए 400 छवियों से बना था जिन्हें इंटरनेट से क्रॉल किया गया था। यह सेट व्यक्तिगत तस्वीरों का प्रतिनिधित्व कर सकता है।

प्रयोग के चार परीक्षण सेट: 1024 आरजीबी रंग, 169 ट्रैफ़िक संकेत, 256 बरतन आइटम और इंटरनेट से 70 खोज शब्दों के लिए 400 छवियां

प्रयोग का कार्यान्वयन

प्रयोग में दो भाग शामिल थे। पहले भाग में, प्रतिभागियों की वरीयताओं को क्रमबद्ध छवि व्यवस्थाओं के जोड़े को देखने के लिए कहकर दर्ज किया गया था और तय किया गया था कि वे किस दो व्यवस्थाओं को पसंद करते हैं। पसंदीदा व्यवस्थाएँ वे थीं जो "एक स्पष्ट संरचना है, एक बेहतर अवलोकन प्रदान करती हैं, और खोजी गई छवियों को ढूंढना आसान बनाती हैं।" प्रयोग के दूसरे भाग में, प्रतिभागियों को जितनी जल्दी हो सके क्रमबद्ध व्यवस्था में खोजी गई छवियों को खोजने के लिए कहा गया था। यह जांच की गई कि क्या प्रतिभागियों की छँटाई वरीयताएँ भी तेज़ खोज को सक्षम बनाती हैं। इसके अलावा, हमने जांच की कि छँटाई की गुणवत्ता का उपयोग करके खोज समय का कितना अच्छा अनुमान लगाया जा सकता है।

छँटाई विधियों और गुणवत्ता उपायों की जाँच की

हमारे प्रयोगों में, हमने क्रमबद्ध व्यवस्थाएँ उत्पन्न करने के लिए विभिन्न विधियों का उपयोग किया। सेल्फ ऑर्गनाइजिंग मैप्स (SOM) के अलावा , हमने सेल्फ सॉर्टिंग मैप्स (SSM), IsoMatch और असतत t-SNE प्रोजेक्शन का इस्तेमाल किया । हमने इन विधियों की तुलना अपने स्वयं के दृष्टिकोण रैखिक असाइनमेंट सॉर्टिंग (LAS) और फास्ट लीनियर असाइनमेंट सॉर्टिंग से की(एफएलएएस)। प्रत्येक विधि के लिए उपयोग किए जाने वाले एल्गोरिदम पर अधिक विवरण हमारे पूर्वोक्त प्रकाशन में पाया जा सकता है। जब भी संभव हो, हमने प्रत्येक विधि के लिए अलग-अलग पैरामीटर सेटिंग्स का उपयोग करके कई व्यवस्थाएँ तैयार कीं। तुलना के लिए कम गुणवत्ता वाली छँटाई के उदाहरण रखने के लिए, कुछ खराब क्रमबद्ध व्यवस्थाएँ भी उत्पन्न की गईं ("निम्न गुणवत्ता" के रूप में नामित)। यादृच्छिक व्यवस्थाओं का उपयोग नहीं किया गया था क्योंकि वे प्रयोग में रुकावटें पैदा कर सकते थे, क्योंकि छवियों को ढूंढना बहुत कठिन होता।

2डी व्यवस्थाओं के मूल्यांकन के लिए उपाय हैं, लेकिन कोई अध्ययन नहीं दिखा रहा है कि वे मनुष्यों द्वारा कथित गुणवत्ता को कितनी अच्छी तरह दर्शाते हैं। ये गुणवत्ता उपाय 2D ग्रिड पर छवियों की परिणामी दूरी के साथ उच्च आयामीता में फीचर वैक्टर की दूरी की तुलना करते हैं। आमतौर पर, क्रॉस-सहसंबंध या सामान्यीकृत ऊर्जा फ़ंक्शन का उपयोग किया जाता है, लेकिन दोनों समान व्यवहार करते हैं, इसलिए हमने केवल बाद वाले की तुलना की। हमने 2D व्यवस्थाओं के मूल्यांकन के लिए " दूरी संरक्षण गुणवत्ता " (DPQ) नामक एक नया उपाय प्रस्तावित किया ।

कथित छँटाई गुणवत्ता

अगला आंकड़ा प्रयोग के पहले भाग का एक स्क्रीनशॉट दिखाता है। सभी प्रतिभागियों को व्यवस्थाओं के 16 जोड़े दिखाए गए, और उन्हें यह तय करने के लिए कहा गया कि क्या वे बाएं या दाएं व्यवस्था को पसंद करते हैं या उन दोनों को समकक्ष मानते हैं।

प्रयोग के पहले भाग का स्क्रीनशॉट

अर्थहीन मूल्यांकन के संभावित प्रभाव को बाहर करने के लिए, प्रत्येक प्रयोग में अत्यंत भिन्न गुणवत्ता छँटाई की एक जोड़ी प्रस्तुत की गई थी। यदि कोई प्रतिभागी इस जोड़ी में काफी खराब छँटाई पसंद करता है, तो सभी छँटाई के लिए उनके मूल्यांकन को खारिज कर दिया गया। कुल मिलाकर, रंग सेट के लिए 32 छँटाई और तीन छवि सेटों में से प्रत्येक के लिए 23 छँटाई की जाँच की गई। जर्मन फ़ुटबॉल बुंडेसलिगा के अनुरूप, जहां एक सीज़न में कुल 18 टीमें और 18∙17 = 306 खेल होते हैं, जो 153 अलग-अलग मैचअप से मेल खाते हैं, इस प्रयोग में रंग सेट के लिए 496 संभावित जोड़े और प्रत्येक के लिए 253 संभावित जोड़े थे तीन छवि सेटों में से।

फुटबॉल के लिए एक समान दृष्टिकोण का उपयोग सभी तुलनाओं का मूल्यांकन करने के लिए किया गया था, जहां एक मैच जीत, हार या टाई के साथ समाप्त हो सकता है। दो छँटाई की तुलना में, पसंदीदा छँटाई को एक अंक प्राप्त हुआ। यदि दोनों छँटाई को समान रूप से आंका गया, तो दोनों को आधा अंक प्राप्त हुआ। फ़ुटबॉल के विपरीत, जहां प्रति सीज़न में दो टीमों के बीच दो गेम होते हैं, प्रत्येक सॉर्टिंग जोड़ी का विभिन्न प्रतिभागियों द्वारा कम से कम 35 बार मूल्यांकन किया गया था। इन मूल्यांकनों से, जोड़ी में प्रत्येक छँटाई के लिए औसत स्कोर निर्धारित किया गया था। ये दो अंक, जो 1 तक जोड़ते हैं, उस अनुपात का वर्णन करते हैं जिसमें एक छँटाई को दूसरे से बेहतर दर्जा दिया गया था। सभी छँटाई की समग्र तुलना के लिए, सभी जोड़ी तुलनाओं से उनके प्राप्त अंकों को जोड़ा गया।

छँटाई की गुणवत्ता का मूल्यांकन करने वाला गुणवत्ता माप उपयोगकर्ताओं के गुणवत्ता मूल्यांकन के अनुरूप होना चाहिए। जांचे गए दो गुणवत्ता उपायों की तुलना में निम्नलिखित आंकड़े सॉर्टिंग (उपयोगकर्ता स्कोर) की औसत उपयोगकर्ता रेटिंग के सहसंबंध को दर्शाते हैं। यहाँ, E'1 सामान्य रूप से उपयोग किए जाने वाले "सामान्यीकृत ऊर्जा कार्य" के लिए है, और DPQ हमारे द्वारा प्रस्तावित "दूरी संरक्षण गुणवत्ता" के लिए है। प्रतीक रंग विभिन्न छँटाई विधियों का प्रतिनिधित्व करते हैं।

1024 आरजीबी रंग: उपयोगकर्ता रेटिंग और सामान्यीकृत ऊर्जा फ़ंक्शन (बाएं) और दूरी संरक्षण गुणवत्ता (दाएं) के बीच संबंध। यह देखा जा सकता है कि मनुष्यों द्वारा उच्च रेटिंग वाली छँटाई को "सामान्यीकृत ऊर्जा कार्य" द्वारा खराब माना जाता है। इसके विपरीत, बेहतर रेटेड सॉर्टिंग के लिए "दूरी संरक्षण गुणवत्ता" मान (दाएं) बढ़ते हैं।
छवि सेट: उपयोगकर्ता रेटिंग और सामान्यीकृत ऊर्जा फ़ंक्शन (बाएं) और हमारी दूरी संरक्षण गुणवत्ता (दाएं) के बीच संबंध। प्रतीक आकार छवि सेट की पहचान करते हैं: ट्रैफ़िक संकेत (⬢), बरतन आइटम (▲), और इंटरनेट छवियां (★)।

दो आंकड़े बताते हैं कि हमारे नए DPQ माप का उपयोगकर्ता रेटिंग के साथ उच्च संबंध है, जिसका अर्थ है कि यह मनुष्यों द्वारा अनुमानित सॉर्टिंग गुणवत्ता की भविष्यवाणी करने के लिए बेहतर अनुकूल है।

खोज समय

प्रयोग के दूसरे भाग में, उपयोगकर्ताओं को विभिन्न क्रमबद्ध व्यवस्थाएँ दिखाई गईं, जिनमें से प्रत्येक में चार यादृच्छिक चित्र पाए जाने थे। एक बार छवि मिलने के बाद, अगला तुरंत प्रदर्शित किया गया था। प्रयोग की गई छंटाई प्रयोग के पहले भाग की तरह ही थी।

प्रयोग के दूसरे भाग का स्क्रीनशॉट

बेशक, छवियों को खोजने में कठिनाई दृढ़ता से खोजी गई छवियों पर निर्भर करती है, क्योंकि कुछ छवियां दूसरों की तुलना में अधिक ध्यान देने योग्य होती हैं। इसके अलावा, प्रतिभागी अपनी खोज क्षमताओं में भिन्न होते हैं। केवल कुछ परीक्षणों के साथ, ये दो पहलू परिणामों को महत्वपूर्ण रूप से विकृत कर सकते हैं। हालाँकि, इनमें से कुल 28,000 से अधिक खोज कार्य किए गए थे। इसका अर्थ है कि प्रत्येक प्रकार के लिए, प्रत्येक चार छवियों के लिए 400 से अधिक खोजें की गईं। इस उच्च संख्या ने खोज कार्यों की बदलती कठिनाई और प्रतिभागियों की असमान क्षमताओं दोनों के लिए मुआवजा दिया।

अगले आंकड़े यातायात संकेतों और इंटरनेट छवियों (वेब ​​छवियों) के सेट के लिए 23 विभिन्न छंटाई के लिए खोज समय के वितरण को दिखाते हैं। विभिन्न छँटाई के लिए खोज समय के माध्य मान को रंगीन मार्कर के रूप में दिखाया गया है। फिर से, यह सामान्यीकृत ऊर्जा कार्य की तुलना में हमारे DPQ माप के साथ खोज समय के मजबूत (नकारात्मक) सहसंबंध को दर्शाता है।

सामान्यीकृत ऊर्जा कार्य (बाएं) और हमारी दूरी संरक्षण गुणवत्ता (दाएं) के साथ औसत खोज समय का सहसंबंध।

उन छँटाई की तुलना करते समय जो अत्यधिक रेट किए गए छँटाई के साथ तेजी से खोज को सक्षम करते हैं, एक मजबूत समझौता भी देखा गया। हालाँकि, त्वरित खोज के लिए, यह अधिक महत्वपूर्ण था कि सभी समान छवियों को एक-दूसरे के बहुत करीब व्यवस्थित किया गया था, भले ही छँटाई की वैश्विक व्यवस्था को परिणाम के रूप में थोड़ा खराब दर्जा दिया गया हो। बाईं ओर का अगला आंकड़ा उस छंटाई को दिखाता है जिसे वेब छवियों के सेट के लिए उच्चतम रेट किया गया था, और दाईं ओर वह छँटाई है जहाँ छवियों को सबसे तेज़ पाया गया था। बाईं ओर, संक्रमण अधिक सहज हैं, जबकि दाईं ओर, सभी संबंधित छवियां एक साथ निकट हैं, जिसके परिणामस्वरूप कुछ कठोर संक्रमण होते हैं।

बाएँ: वह छँटाई जिसे सर्वोत्तम दर्जा दिया गया था; दाएँ: वह छँटाई जिसमें खोजे गए चित्र सबसे तेज़ पाए गए।

छँटाई के तरीकों की तुलना

अंतिम चरण विभिन्न छँटाई विधियों के प्रदर्शन की बेहतर समझ हासिल करना था। चूंकि रनटाइम दृढ़ता से हार्डवेयर पर निर्भर करता है, इसलिए दिया गया समय केवल संदर्भ मान के रूप में कार्य करता है। चूंकि दूरी संरक्षण गुणवत्ता का उपयोगकर्ता की प्राथमिकताओं के साथ उच्च संबंध है, इसलिए इसका उपयोग आवश्यक संगणना समय के आधार पर एल्गोरिदम की छँटाई गुणवत्ता की तुलना करने के लिए किया गया था।

अगला आंकड़ा विधि मापदंडों को बदलते हुए जांच की गई विधियों के लिए आवश्यक संगणना समय की तुलना में प्राप्त छँटाई गुणवत्ता को दर्शाता है। 256 बरतन छवियों जैसे छोटे डेटासेट के लिए, हमारी FLAS विधि गुणवत्ता और संगणना समय के बीच सबसे अच्छा समझौता प्रदान करती है। LAS और t-SNE थोड़ा अधिक गुण प्रदान कर सकते हैं लेकिन 10 से 100 गुना धीमे हैं। 1024 यादृच्छिक आरजीबी रंगों के लिए, हमारे एलएएस और एफएलएएस विधियों ने उच्चतम सॉर्टिंग गुण प्राप्त किए।

256 बरतन छवियों (शीर्ष) और 1024 आरजीबी रंगों (नीचे) की छँटाई के लिए विभिन्न पैरामीटर सेटिंग्स के लिए औसत रनटाइम की तुलना में औसत छँटाई गुणवत्ता (DPQ)।

एक अन्य जांच यह जांचने के लिए थी कि अलग-अलग आकार के छवि सेटों के लिए गुणवत्ता और संगणना समय कैसे व्यवहार करता है। इस उद्देश्य के लिए पिछले आंकड़े में ⦿ के साथ चिह्नित पैरामीटर सेटिंग्स को चुना गया था। जबकि SOM, SSM, LAS, और FLAS अधिक छवियों के लिए बेहतर छँटाई उत्पन्न कर सकते हैं, t-SNE और IsoMatch के लिए छँटाई बदतर हो गई।

विभिन्न छँटाई विधियों के लिए 256 (.), 1024 (•), और 4096 (⚈) आरजीबी यादृच्छिक रंगों के लिए आवश्यक संगणना समय के कार्य के रूप में माध्य प्राप्त छँटाई गुणवत्ता।

प्रयोग के परिणाम

कुल मिलाकर, हम प्रयोग के परिणामों से बहुत संतुष्ट थे, क्योंकि पहले पूछे गए प्रश्नों का उत्तर स्पष्ट रूप से दिया जा सकता था। यह दिखाया गया है कि मानव क्रमबद्ध व्यवस्था में छवियों को काफी तेजी से ढूंढ सकता है। छवि छँटाई का विश्लेषण करते समय जो लोगों को सुखद और सहायक लगता है, यह पाया गया कि सभी छवियों के समानता संबंधों को विश्व स्तर पर बनाए रखने की तुलना में पड़ोसी छवियों की उच्च स्थानीय समानता अधिक महत्वपूर्ण है। इसके अलावा, छवि छँटाई के एक नए गुणवत्ता मूल्यांकन के लिए हमारा प्रस्ताव मनुष्यों द्वारा कथित गुणवत्ता को दर्शाने के पिछले तरीकों की तुलना में काफी बेहतर था।

यह स्पष्ट हो गया कि हमारी प्रस्तावित छँटाई विधियाँ LAS और FLAS उच्च गुणवत्ता वाली छँटाई कर सकती हैं और FLAS भी बहुत कुशल है। इसके अलावा, हमारे तरीके छँटाई को प्रभावित करने के लिए कई प्रकार के विकल्प प्रदान करते हैं, जैसे कि कुछ छवियों की निश्चित स्थिति या आयताकार के अलावा अन्य लेआउट का उपयोग करने की क्षमता। FLAS पद्धति (छवि ग्राफ़ के साथ) इतनी तेज़ है कि लाखों छवियों को नेत्रहीन रूप से एक्सप्लोर करना संभव हो जाता है। Navigu.net ऐसे विजुअल इमेज एक्सप्लोरेशन टूल का एक उदाहरण है।

हमारे शोध के बारे में अधिक जानकारी के लिए, www.visual-computing.com पर जाएँ ।

बाएं: निचले केंद्र की स्थिति में तय किए गए अमेरिकी ध्वज के साथ क्रमबद्ध झंडे। दाएं: 2404 आरजीबी रंग दिल के आकार में छांटे गए।