अधिकांश लोग अमेरिकियों को विकलांग अधिनियम के साथ शारीरिक, ढांचागत परिवर्तनों के साथ जोड़ते हैं जिन्हें इमारतों या अन्य स्थानों पर करने की आवश्यकता होती है, लेकिन जैसे-जैसे विकलांगता की परिभाषा व्यापक होती जा रही है, लोग यह महसूस कर रहे हैं कि 'सुलभ' वेबसाइटों और आवाज की पहचान जैसी चीजों पर भी लागू होता है।
ऐसे में टेक्नोलॉजी की दिग्गज कंपनी गूगल प्रोजेक्ट यूफोनिया के साथ अपने वॉयस रिकग्निशन सॉफ्टवेयर को बेहतर बनाने का प्रयास कर रही है। प्रोजेक्ट यूफोनिया स्वयंसेवकों से आवाज के नमूने रिकॉर्ड करने और उनका विश्लेषण करने की एक पहल है ताकि एएलएस, तंत्रिका संबंधी विकार और अन्य भाषण कठिनाइयों वाले लोग अपने स्मार्ट उपकरणों का उपयोग एक 'विशिष्ट' व्यक्ति की आसानी से कर सकें।
मैंने स्वेच्छा से क्यों
ब्रेन ट्यूमर के कारण एक लकवाग्रस्त बायीं वोकल कॉर्ड और असममित जीभ के कारण मेरी वाक् रोग डिसरथ्रिया हो गया है। मेरी गंदी बोली और कमजोर आवाज के कारण दोस्तों और परिवार के लिए मुझे समझना या सुनना मुश्किल हो जाता है-खासकर भीड़-भाड़ वाली जगह में। इसने मुझे प्रोजेक्ट यूफ़ोनिया के लिए एक प्रमुख उम्मीदवार बना दिया, इसलिए जैसे ही मैंने इसके बारे में पढ़ा, मैंने स्वेच्छा से काम किया। एक प्राथमिक वेबसाइट पर नमूने रिकॉर्ड करते हुए, मैंने 'मैं माउंटेन व्यू, कैलिफ़ोर्निया कैसे पहुँचूँ?' से लेकर 'कार्डी बी के गाने चलाएँ' तक 4,500 वाक्यांश दोहराए।
प्रोजेक्ट यूफ़ोनिया के मानदंडों को पूरा करने के अलावा, मैंने स्वेच्छा से काम किया क्योंकि मुझे पहली बार 1997 में प्रीमियर वॉयस रिकग्निशन प्रोग्राम ड्रैगन नेचुरली स्पीकिंग से परिचित कराया गया था - और यह शानदार रूप से विफल रहा। इन वर्षों में, मैंने बोस्टन के चिल्ड्रन हॉस्पिटल में सहायक प्रौद्योगिकी लैब में समान कार्यक्रमों के साथ-साथ इसके अद्यतन संस्करणों की कोशिश की है अजगर, और यद्यपि इस सॉफ़्टवेयर ने बहुत प्रगति की है, फिर भी यह मेरी आवाज़ को इंगित करने के लिए संघर्ष करता है।
यह दो कारणों से समस्याग्रस्त है: मैं ठीक मोटर कौशल की कमी वाला लेखक हूं, इसलिए मैं एक हाथ से टाइप करता हूं, या धीरे-धीरे दो से अगर मैं थक गया हूं। कविताओं की तीन स्व-प्रकाशित पुस्तकों, एक संस्मरण, और मेरे नाम से जुड़ी अप्रकाशित कहानियों के संग्रह के साथ, मैं यह सोचकर कांप उठता हूं कि अगर टाइपिंग इतना कठिन काम नहीं होता तो मैं कितना अधिक उत्पादन कर सकता था।
अन्य कारणों से सब-पैरा वॉयस रिकग्निशन मेरे लिए एक बाधा पैदा करता है, क्योंकि घरों और फोन पर वॉयस-सक्षम उत्पादों का प्रसार होता है। बस अपनी कहानी का उपयोग करते हुए, अगर मैं कंप्यूटर और स्मार्ट उपकरणों का उपयोग कर सकता था जिस तरह से उनका उपयोग किया जाना था, तो यह मुझे और अधिक खाली समय देगा, मुझे कार्यों को पूरी तरह से पूरा करने की अनुमति देगा, और संभावित रूप से मेरे जीने के तरीके को बदल देगा।
प्रोजेक्ट यूफोनिया: यह कैसे काम करता है?
तो, यूफोनिया कैसे काम करता है? अपने फ़ोन पर एक वैयक्तिकृत वाक् पहचान मॉडल के साथ एक प्रोटोटाइप ऐप डाउनलोड करने के बाद, मैंने फ़ोन को अपने लैपटॉप के बगल में रखा, और उसमें निर्देशित किया; जब मैंने ऐसा किया, तो मैंने अपने लैपटॉप पर अपने Google डॉक में दिखाई देने वाली हर बात को देखा। मैंने कुछ महीनों के लिए ऐसा किया, मेरे द्वारा लिखे जा रहे उपन्यास के वाक्यांशों को रिकॉर्ड किया, और ऐप का उपयोग करके Google के लिए किसी भी अशुद्धि को ठीक किया।
वाक्यांशों को रिकॉर्ड किए बिना कई महीनों के बाद, मैंने एक उपन्यास का पहला मसौदा - 20,000 शब्द - ऐप का उपयोग करके समाप्त किया। यह कहना नहीं है कि यह निर्दोष है; हर घंटे मैं लिखता हूं, मुझे वापस जाना पड़ता है और मामूली सुधार करने में एक घंटा बिताना पड़ता है। लेकिन मुझे कोई आपत्ति नहीं है क्योंकि यूफोनिया एक बीटा चरण में है और धीमी गति से प्रति दिन 100 शब्द निकालने के बजाय, मैं प्रति दिन 500 शब्द उत्पन्न कर रहा हूं।
फिर तथ्य यह है कि यूफोनिया शब्द-प्रसंस्करण के लिए डिज़ाइन नहीं किया गया था - यह घोषणात्मक आदेशों के लिए अधिक है - और मेरी लेखन शैली वह है जिसे वे 'पैंटर' (आपके पैंट की सीट से उड़ना) कहते हैं, इसलिए मेरे पास बहुत सारे विराम हैं क्योंकि मैं नहीं जानता कि एक वाक्य का अंत कैसे होगा - आप जानते हैं, माइकल स्कॉट की तरह। हालाँकि, जब मुझे पता होता है कि मैं क्या कहना चाहता हूँ, जैसे टेक्स्ट, ईमेल या अपने सहायक को निर्देश देना, तो यह अब तक की सबसे सटीक वाक् पहचान है जिसका मैंने कभी उपयोग किया है।
जब Google जैसी संस्थाएं विकलांगों को भविष्य की वास्तुकला को डिजाइन करने में आवाज देती हैं, तो उन्हें कुछ 'सामान्य' में बदलने की कोशिश करने के बजाय उन्हें स्वयं रहने की अनुमति देती है, इससे मुझे आशा है कि एआई के युग में मानवतावाद प्रबल होगा।
यदि आप प्रोजेक्ट यूफोनिया वेबसाइट पर जाना चाहते हैं, या भाषण हानि है और आवाज के नमूने में योगदान देना चाहते हैं तो आप इस लिंक पर जा सकते हैं: https://sites.research.google/euphonia/about/