LensStudio में दृष्टिहीन उपयोगकर्ताओं के लिए सुलभ SnapAR लेंस बनाना
संवर्धित वास्तविकता की दुनिया तेजी से सोशल मीडिया प्लेटफॉर्म जैसे Instagram, TikTok और SnapChat के साथ AR फ़िल्टर निर्माण टूल में निवेश कर रही है। उनमें से, SnapChat, LensStudio प्रदान करके सबसे अलग है, एक ऐसा एप्लिकेशन जो अपने उपयोगकर्ताओं को सैकड़ों निःशुल्क टेम्पलेट प्रदान करके AR लेंस बनाने में सक्षम बनाता है। हालाँकि, अधिकांश एआर लेंस दृश्य-आधारित हैं, जो नेत्रहीन उपयोगकर्ताओं को समीकरण से बाहर कर देते हैं।
कुछ लोग यह तर्क दे सकते हैं कि AR का उपयोग नेत्रहीन लोगों द्वारा कभी नहीं किया जाना चाहिए और हमें अनपेक्षित उपयोगकर्ताओं के लिए इस कठिन समस्या को हल करने के बारे में चिंता नहीं करनी चाहिए। हालाँकि, ऐसा नहीं है। नेत्रहीन उपयोगकर्ताओं को इस नए इमर्सिव मीडिया से बाहर रखा गया है, इसलिए नहीं कि उनमें रुचि की कमी है, बल्कि इसलिए कि हम केवल दृष्टिबाधित लोगों के लिए डिजाइन करते हैं। समुदाय में मेरे शोध और अंधे और दृष्टिबाधित कार्यक्रमों में शिक्षकों के साथ बातचीत से पता चलता है कि नेत्रहीन और दृष्टिबाधित लोग अपने दोस्तों के संपर्क में रहने के लिए SnapChat का उपयोग करते हैं। दुर्भाग्य से, एआर रचनाकारों के रूप में, अभिगम्यता के बारे में हमारी जागरूकता की कमी का मतलब है कि नेत्रहीन उपयोगकर्ता अपने सबसे रोमांचक आविष्कार - एआर लेंसों में से एक का उपभोग या अनुभव करने में असमर्थ हैं।
एआर लेंस निर्माता के रूप में, आपके पास इसे बदलने की शक्ति है। इस पोस्ट में, मैं आपके लेंस को अंधेपन वाले उपयोगकर्ताओं के लिए अधिक सुलभ बनाने के तरीके पर चार युक्तियां (उदाहरण के लिए मेरे द्वारा बनाए गए लेंस) साझा करूंगा। तो चलो शुरू हो जाओ!
विषयसूची
- पाठ से वाक् के साथ अपने दृश्य का वर्णन करें
- स्थानिक ऑडियो का प्रयोग करें
- स्पीच रिकग्निशन का उपयोग करके वॉयस कमांड को एकीकृत करें
- बातचीत में ध्वनि प्रतिक्रिया जोड़ें
1. टेक्स्ट-टू-स्पीच के साथ अपने दृश्य का वर्णन करें
क्या
अभिगम्यता की दुनिया में, दृश्यों का वर्णन करने को अक्सर ऑडियो विवरण (AD) कहा जाता है। इसका उपयोग अंधे और दृष्टिबाधित उपभोक्ताओं के लाभ के लिए मीडिया कार्य में प्रमुख दृश्य तत्वों के बारे में जानकारी प्रदान करने के लिए किया जाता है।
क्यों
जब आपके उपयोगकर्ता देख नहीं सकते हैं, तो उन्हें बताना महत्वपूर्ण है कि क्या हो रहा है। कहानी कहने वाले लेंसों के लिए यह विशेष रूप से महत्वपूर्ण है। एक स्नैप लेंस एक लघु फिल्म, साथ ही इंटरैक्शन की तरह है। यदि आपका लेंस केवल दृश्य कहानी कहने पर निर्भर करता है, तो दृष्टिहीन उपयोगकर्ताओं को बाहर कर दिया जाएगा।
उदाहरण
कैसे
संक्षेप में, मैं लेंस के अपने मैन्युअल-इनपुट विवरणों को ऑडियो विवरण में बदलने के लिए टेक्स्ट टू स्पीच (टीटीएस) का उपयोग करता हूं। LensStudio में TTS करने के एक से अधिक तरीके हैं, और कृपया LenStudio द्वारा प्रदान किए गए TTS संसाधन पैकेज का बेझिझक उपयोग करें , या TTS टेम्पलेट मार्गदर्शिका का पालन करें । लेकिन मुझे इस सबसे आवश्यक एक्सेसिबिलिटी सुविधा को एकीकृत करने के एक त्वरित तरीके के रूप में नौसिखिए रचनाकारों (जैसे 3 महीने पहले!) द्वारा समझा जाने का अपना तरीका आसान लगा। यदि आप इसे मेरे तरीके से करना चाहते हैं तो साथ में अनुसरण करें:
- दृश्य में, "विवरण" नामक एक दृश्य वस्तु बनाएँ। एक पाठ घटक बनाएं, और पाठ इनपुट क्षेत्र में प्रमुख दृश्य तत्वों को लिखें
// @input Asset.TextToSpeechModule tts {"label": "Text To Speech"}
// @input Component.AudioComponent audio
// @input Component.Text text
//TTS Audio State
var ttsStart = false;
var onTTSCompleteHandler = function(audioTrackAsset, wordInfos, phonemeInfos, voiceStyle) {
print("TTS Success");
script.audio.audioTrack = audioTrackAsset;
script.audio.play(1);
//Set TTS Audio Start to Play State to be true
ttsStart = true;
};
script.api.onTTSCompleteHandler = onTTSCompleteHandler;
var onTTSErrorHandler = function(error,description) {
print("Error: " + error + " Description: "+ description);
};
script.api.onTTSErrorHandler = onTTSErrorHandler;
var options = TextToSpeech.Options.create();
script.api.options = options;
options.voiceName = TextToSpeech.VoiceNames.Sasha;
var text = script.text.text;
script.api.text = text;
script.tts.synthesize(text, options, onTTSCompleteHandler, onTTSErrorHandler);
4. यदि आपने सब कुछ ठीक किया है, तो लेंस को अब ऑडियो में दृश्य का वर्णन करना चाहिए! यदि आप उपयोगकर्ता इंटरैक्शन के लिए अधिक ऑडियो विवरण जोड़ना चाहते हैं, तो निम्न कोड के साथ "अपडेट टेक्स्ट" नामक एक अन्य स्क्रिप्ट बनाएं:
script.api.text = "Yo! Your mouth is as big as a watermelon! Haha! You can hold screen to record this and send to your friends."; // change me!
print('change-text script triggered');
script.tts.synthesize(script.api.text, script.api.options, script.api.onTTSCompleteHandler, script.api.onTTSErrorHandler);
2. स्थानिक ऑडियो का प्रयोग करें
क्या
स्थानिक ऑडियो ध्वनि की मात्रा, दिशा और दूरी को ध्यान में रखते हुए वास्तविकता में ध्वनि को समझने के तरीके को दोहराता है। उदाहरण के लिए, वास्तविक जीवन में, हम किसी कार की ध्वनि की दिशा के आधार पर उसकी स्थिति बता सकते हैं।
क्यों
यदि आपके लेंस में कोई चलती हुई वस्तु शामिल है, तो उपयोगकर्ताओं के अनुभव को बाधित किए बिना केवल ऑडियो विवरण के माध्यम से उनकी स्थिति का वर्णन करना मुश्किल हो सकता है। स्थानिक ऑडियो उपयोगकर्ताओं को वस्तु की स्थिति और गति के बारे में सूक्ष्म संकेत प्रदान करता है, जो दृष्टिहीन और दृष्टिहीन दोनों उपयोगकर्ताओं के लिए गहन अनुभव को भी बढ़ा सकता है।
उदाहरण
कैसे
लेंसस्टूडियो में उनके स्थानिक ऑडियो फीचर के बारे में बात करने वाला एक पैराग्राफ है। विशेष रूप से, यहां बताया गया है कि मैं यह कैसे करता हूं:
- दृश्य वस्तु पर जो चारों ओर घूमती है, मेरे मामले में फीनिक्स, एक ऑडियो घटक जोड़ें, और उस ध्वनि को संलग्न करें जिसे आप बजाना चाहते हैं।
3. अंतिम चरण यह सुनिश्चित करना है कि आपके पास दृश्य वस्तु में एक, और केवल एक, "ऑडियो श्रोता" घटक जोड़ा गया है। मैंने अपना मुख्य कैमरा जोड़ा और यह ठीक काम करता है। इस घटक के बारे में यहाँ और पढ़ें ।
3. स्पीच रिकग्निशन का उपयोग करके वॉयस कमांड को एकीकृत करें
क्या
वॉयस कमांड एक ऐसी सुविधा है जो उपयोगकर्ताओं को अपनी आवाज का उपयोग करके लेंस के साथ इंटरैक्ट करने की अनुमति देती है। उद्योग में एक अधिक लोकप्रिय शब्द वॉयस यूजर इंटरफेस (VUI) है। Amazon का Alexa या Apple का सिरी VUI के अच्छे उदाहरण हैं।
क्यों
वीयूआई नेत्रहीन या नेत्रहीन उपयोगकर्ताओं के लिए विशेष रूप से सहायक हो सकता है, जिन्हें स्नैपचैट के एआर लेंस पर स्पर्श-आधारित नियंत्रणों का उपयोग करने में कठिनाई हो सकती है। जिस तरह से स्नैप फीचर को डिज़ाइन और इंजीनियर किया गया है, उसके कारण स्क्रीन रीडर टच स्क्रीन क्षेत्र पर प्रभावी ढंग से काम नहीं करते हैं। क्या अधिक है, एक अच्छी तरह से डिज़ाइन किया गया वीयूआई एआर अनुभव को दृष्टिगत उपयोगकर्ताओं के लिए अधिक immersive और आकर्षक बनाने के लिए बढ़ा सकता है, जबकि उनके लिए बातचीत करने के लिए एक सहज तरीका भी प्रदान करता है।
उदाहरण
कैसे
लेंसस्टूडियो द्वारा प्रदान किया गया मौजूदा सिस्टम वॉयस कमांड रिसोर्सेज पैकेज हमें जो चाहिए उसके लिए बहुत अच्छा है। उदाहरण के तौर पर, यहां बताया गया है कि मैं इसे अपने लेंस के लिए कैसे संशोधित करता हूं:
- सबसे पहले, मैं संपत्ति पुस्तकालय से पैकेज आयात करता हूं और प्रीफैब को ऑर्थोग्राफिक कैमरे में खींचता हूं।
3. "नृत्य" वस्तु का चयन करें, और "नृत्य" संबंधित कीवर्ड इनपुट करें।
4. अब ट्रिगर्स सेट करें: मेरा लेंस दो व्यवहारों को ट्रिगर करता है, ध्वनि बजाना और एनीमेशन बजाना।
5. उदाहरण के लिए एक एनीमेशन को ट्रिगर करें: अन्य व्यवहार स्क्रिप्ट घटक में जो उसी "नृत्य" ऑब्जेक्ट से जुड़ा हुआ है, मैंने "ट्रिगर" को "कोई नहीं", "प्रतिक्रिया प्रकार" को "एनिमेट मेष" पर सेट किया है, एनीमेशन घटक का चयन करें, और "विकल्प" के तहत मैं दूसरी क्लिप को रोकते हुए लूप पर "नृत्य" नामक एनीमेशन क्लिप चलाने के लिए स्क्रिप्ट बनाता हूं। आप इस वीडियो ट्यूटोरियल से सीख सकते हैं कि लेंसस्टूडियो में एनिमेशन क्लिप कैसे संयोजित करें ।
4. बातचीत में ध्वनि फ़ीडबैक जोड़ें
क्या
ध्वनि प्रतिक्रिया एक विशेषता है जो उपयोगकर्ता को यह पुष्टि करने के लिए एक ऑडियो संकेत प्रदान करती है कि एक घटना शुरू हो गई है, ठीक वैसे ही जैसे वास्तविकता में दरवाजे की घंटी बजती है
क्यों
जबकि एआर इंटरैक्शन में ध्वनि प्रतिक्रिया एक सामान्य विशेषता है, इसे उन वस्तुओं में शामिल करना जो आमतौर पर वास्तविक जीवन में बहुत अधिक शोर नहीं करते हैं, उपयोगकर्ता अनुभव को बढ़ाने का एक अनूठा और प्रभावी तरीका हो सकता है। यह दृश्य संकेतों पर भरोसा किए बिना वर्चुअल ऑब्जेक्ट्स के साथ अधिक इमर्सिव इंटरैक्शन प्रदान करके अंधे या दृष्टिहीन उपयोगकर्ताओं के लिए विशेष रूप से सहायक हो सकता है। रचनात्मक रूप से डिज़ाइन किए गए ध्वनि प्रभाव जोड़ने से दृष्टिहीन उपयोगकर्ता AR अनुभव से अधिक जुड़ाव महसूस कर सकते हैं।
उदाहरण
कैसे
जब उपयोगकर्ता एक स्क्रिप्ट लिखकर अपना सिर हिलाते हैं तो मैंने झुमके की आवाज़ की, जो झुमके की गति के आधार पर विंड चाइम ध्वनि की मात्रा को बढ़ाता है। यहाँ विवरण हैं:
- दृश्य में एक वस्तु बनाएं, जिसे "ध्वनि प्रतिक्रिया नियंत्रक" कहा जाता है, और इसमें ध्वनि प्रभाव और एक स्क्रिप्ट घटक के साथ एक ऑडियो घटक जोड़ें।
//@input Component.AudioComponent aduio
//@input SceneObject earring
//@ui {"widget" : "separator"}
//@ui {"widget":"group_start", "label":"Map Values", "hint":"Same as p5js map() method. Mapping the earring angle to volume"}
//@input float start_1 = 0 {"widget":"slider","min":"0.0","max":"1.0", "step": " 0.1"}
//@input float stop_1 = 0.1 {"widget":"slider","min":"0.0","max":"1.0", "step": " 0.1"}
//@input float start_2 = -0.5 {"widget":"slider","min":"-1.0","max":"1.0", "step": " 0.1"}
//@input float stop_2 = 1 {"widget":"slider","min":"0.0","max":"2.0", "step": " 0.1"}
//@ui {"widget":"group_end"}
script.aduio.fadeInTime = 2;
script.aduio.fadeOutTime = 2;
var theta;
getDeltaTime()
// this function works similar to the map() method in p5.js
function mapVar(n, start1, stop1, start2, stop2) {
return ((n-start1)/(stop1-start1))*(stop2-start2)+start2;
}
function onUpdate() {
theta = Math.abs(script.earring.getTransform().getWorldRotation().z) ;
script.aduio.volume = mapVar(theta, script.start_1, script.stop_1, script.start_2, script.stop_2);
print(script.aduio.volume);
}
script.createEvent("UpdateEvent").bind(onUpdate);
// play audio on loop
script.aduio.play(-1);
4. बस!
निष्कर्ष
सुलभ लेंसों का उबाऊ या सीमित होना आवश्यक नहीं है। जिस तरह उपशीर्षक मूल रूप से श्रवण हानि वाले उपयोगकर्ताओं के लिए विकसित किए गए थे, लेकिन अब कई लोगों द्वारा इसकी सराहना की जाती है, मेरे द्वारा वर्णित सभी सुविधाओं को एआर अनुभव के साथ समेकित रूप से एकीकृत करने और यहां तक कि इसे बढ़ाने के लिए डिज़ाइन किया जा सकता है। आपको यह अंदाजा देने के लिए कि एक सुलभ लेंस कितना सफल हो सकता है, मेरे साउंड-इफेक्ट-एडेड ईयरिंग लेंस को 350k से अधिक बार देखा गया है और स्नैपचैट की "ट्रेंडिंग" सूची में भी दिखाया गया था!
बेशक, न केवल नेत्रहीन उपयोगकर्ताओं के लिए, बल्कि वर्णांधता, श्रवण हानि, मोटर विकलांग, आत्मकेंद्रित और अन्य स्थितियों वाले लोगों के लिए भी इमर्सिव एक्सेसिबल लेंस बनाने के संदर्भ में बहुत कुछ है। नेत्रहीन उपयोगकर्ताओं के लिए इन लेंसों को अधिक प्रभावी बनाने के लिए, यह सहायक होगा यदि स्नैपचैट सभी टेम्प्लेट में ऑडियो विवरण और वॉयस कमांड जैसी एक्सेसिबिलिटी सुविधाओं को शामिल कर सकता है, और क्रिएटर्स को टेक्स्ट विवरण और कमांड कीवर्ड को आसानी से अनुकूलित करने की अनुमति देता है।
क्या आपको ये टिप्स उपयोगी लगते हैं? आपके पास कोई और सुझाव है? मुझे नीचे टिप्पणी में बताये।
यदि आप नेत्रहीन लेंस निर्माता हैं, तो मुझे खुशी है कि आप इस लेख में रुचि रखते हैं! मैंने इस पोस्ट को यथासंभव सुलभ बनाने का प्रयास किया है, लेकिन शायद अभी भी कुछ छूट गया है। यदि इस लेख को पढ़ते समय आपको कोई सुगमता समस्या आती है, तो कृपया मुझे बताने में संकोच न करें ताकि मैं इसे सभी के लिए सुधार सकूं।