अलेक्झांडर – एनडीटीव्हीला काय सांगता येईल यावर हजारो अमेझॅन कर्मचारी ऐकत आहेत – Boisar Marathi News

अलेक्झांडर – एनडीटीव्हीला काय सांगता येईल यावर हजारो अमेझॅन कर्मचारी ऐकत आहेत

लाखो लोक गेम खेळण्यासाठी स्मार्ट स्पीकर आणि त्यांचे व्हॉईस सॉफ्टवेअर वापरतात, संगीत शोधतात किंवा ट्रिव्हियासाठी ट्रेल करतात. लाखो लोक डिव्हाइसेस आणि त्यांच्या शक्तिशाली मायक्रोफोनना त्यांच्या घरांमध्ये निमंत्रण देण्यास अनिच्छा देत आहेत ज्यामुळे कोणीतरी ऐकत असेल.

कधीकधी कोणीतरी आहे.

अझोएक्स इंक. इको स्पीकर्सची लाइन चालवण्याकरिता अॅलेक्सा डिजिटल सहाय्यक सुधारण्यात मदत करण्यासाठी Amazon.com इंक जगभरातील हजारो लोकांना रोजगार प्रदान करते. इको मालकांच्या घरे आणि कार्यालयांमध्ये पकडल्या गेलेल्या आवाज रेकॉर्डिंगची टीम ऐकतो. मानवी भाषणांच्या अलेक्झांडरच्या समजूतदारपणातील त्रुटी दूर करण्यासाठी आणि कमांडस अधिक चांगला प्रतिसाद देण्यात मदत करण्यासाठी या भागाचे रेकॉर्डिंग, भाष्य केले गेले आहे आणि नंतर सॉफ्टवेअरमध्ये परत दिले गेले आहे.

प्रोग्रामवर कार्य करणार्या सात लोकांनी वर्णन केलेल्या अलेक्झॅक व्हॉइस पुनरावलोकन प्रक्रियेत सॉफ्टवेअर अल्गोरिदम प्रशिक्षण देण्यामध्ये बर्याचदा दुर्लक्षित मानवी भूमिका दर्शविते. अमेझॅन म्हणते की अॅलेक्सा म्हणते की “क्लाउडमध्ये राहतात आणि नेहमीच हुशार असतात.” पण अनुभवातून शिकण्यासाठी तयार केलेल्या अनेक सॉफ्टवेअर टूल्सप्रमाणे, मानव काही शिकवत आहेत.

या टीममध्ये कॉन्ट्रॅक्टर्स आणि फुल-टाइम अमेझॅन कर्मचारी आहेत जे बोस्टन ते कोस्टा रिका, भारत आणि रोमानियाच्या चौकटीत कार्यरत आहेत. या कार्यक्रमाबद्दल सार्वजनिकरित्या बोलण्यापासून दूर राहिलेल्या लोकांच्या नक्कल करारावर त्यांनी स्वाक्षरी केली आहे. अॅमेझॉनच्या बुखारेस्ट कार्यालयातील दोन कामगारांच्या मते, प्रत्येक रोव्हरने प्रति ऑडिओ 1,000 ऑडिओ क्लिप पाठवून प्रतिदिन नऊ तास काम केले आणि रोमन कॅपिटलच्या आगामी आणि आगामी काळात ग्लोबलवर्थ बिल्डिंगचे शीर्ष तीन मजले घेऊन पापीरा जिल्हा अमेझॅनच्या अस्तित्वाची जाहिरात करणार्या मूलभूत सुविधेमध्ये आधुनिक सुविधा उपलब्ध आहे.

ऍमेझॉन बुखारेस्ट ब्लूमबर्ग ऍमेझॉन बुखारेस्ट मध्ये अमेझॅन
फोटो क्रेडिटः ब्लूमबर्ग

काम बहुतेक अगणित आहे. बोस्टनमधील एका कार्यकर्त्याने सांगितले की त्याने “टेलर स्विफ्ट” सारख्या विशिष्ट भाषणांसाठी संचयित केलेला आवाज डेटा कमी केला आणि शोधकास वाद्य कलाकाराचा अर्थ दर्शविण्यासाठी त्यांचे भाष्य केले. कधीकधी श्रोत्यांकडून गोष्टी घेतात, इको मालक कदाचित खाजगी राहू शकतात: शॉवरमध्ये बुडणारी कुणी गाणारी स्त्री, किंवा मदतीसाठी चिडलेला मुलगा. जेव्हा काही गोंधळलेल्या शब्दांच्या सहाय्याने मदत आवश्यक असते तेव्हा ते फायली सामायिक करण्यासाठी अंतर्गत चॅट रूम वापरतात – किंवा मनोरंजक रेकॉर्डिंगमध्ये येतात.

कधीकधी ते रेकॉर्डिंग ऐकतात ज्या त्यांना त्रासदायक वाटतात किंवा शक्यतो गुन्हेगारी करतात. दोन कामगारांनी लैंगिक प्राणघातक हल्ला केला असल्याचा त्यांनी विश्वास ठेवला. जेव्हा असे काहीतरी घडते तेव्हा ते तणावमुक्त होण्याचा अनुभव अंतर्गत चॅट रूममध्ये अनुभव सामायिक करू शकतात. अमेझॅन म्हणतात की जेव्हा काही त्रासदायक ऐकतांना श्रमिकांना त्याचे पालन करण्याची प्रक्रिया असते, परंतु रोमानियातील दोन कर्मचा-यांनी सांगितले की, अशा प्रकरणांच्या मार्गदर्शनाची विनंती केल्यानंतर त्यांना अमेझॅनच्या व्यवसायात हस्तक्षेप करण्याची नोकरी नव्हती.

“आम्ही आमच्या ग्राहकांच्या वैयक्तिक माहितीची सुरक्षा आणि गोपनीयता गंभीरतेने घेतो,” अमेझॅन प्रवक्त्याने ईमेल केलेल्या निवेदनात म्हटले आहे. “ग्राहक अनुभवामध्ये सुधारणा करण्यासाठी आम्ही केवळ अॅलेक्सा व्हॉइस रेकॉर्डिंगचा एक अत्यंत लहान नमूना भाष्य करतो. उदाहरणार्थ, ही माहिती आमच्या उच्चार ओळख आणि नैसर्गिक भाषा समजून घेण्याची प्रणाली प्रशिक्षित करण्यात आमची मदत करते, म्हणून अॅलेक्झा आपली विनंत्या अधिक चांगल्या प्रकारे समजून घेऊ शकेल आणि सेवा प्रत्येकासाठी चांगली कार्यप्रणाली सुनिश्चित करेल.

“आमच्याकडे कठोर तांत्रिक आणि कार्यरत सुरक्षा रक्षक आहेत आणि आमच्या सिस्टमच्या गैरवापरासाठी शून्य सहिष्णुता धोरण आहे. कर्मचार्यांना या माहितीचा थेट प्रवेश नाही जो या वर्कफ्लोचा भाग म्हणून व्यक्ती किंवा खात्यास ओळखू शकेल. सर्व माहिती उच्च गोपनीयतेने हाताळली जाते आणि आम्ही त्याचे संरक्षण करण्यासाठी आमच्या नियंत्रण वातावरणावरील प्रवेश, सेवा एनक्रिप्शन आणि ऑडिट प्रतिबंधित करण्यासाठी एकाधिक-घटक प्रमाणीकरण वापरतो. ”

अॅमेझॉन, त्याच्या विपणन आणि गोपनीयता धोरण सामग्रीमध्ये, स्पष्टपणे असे म्हणत नाही की लोक अलेक्झांडाने घेतलेल्या काही संभाषणांचे रेकॉर्डिंग ऐकत आहेत. कंपनीने वारंवार विचारल्या जाणार्या प्रश्नांची यादी दिली आहे, “आमची भाषण ओळख आणि नैसर्गिक भाषा समजून घेण्याची प्रणाली प्रशिक्षित करण्यासाठी आम्ही आपल्या विनंत्या अॅलेक्साचा वापर करतो.”

अॅलेक्साच्या गोपनीयता सेटिंग्जमध्ये, कंपनी नवीन वैशिष्ट्यांच्या विकासासाठी त्यांच्या व्हॉइस रेकॉर्डिंगचा वापर अक्षम करण्याचा पर्याय वापरकर्त्यास देते. ब्लूमबर्गद्वारे पुनरावलोकन केलेले एक स्क्रीनशॉट दर्शवते की अॅलेक्सा ऑडिटरला पाठविलेले रेकॉर्डिंग वापरकर्त्याचे पूर्ण नाव आणि पत्ता प्रदान करीत नाही परंतु खाते क्रमांक तसेच वापरकर्त्याचे प्रथम नाव आणि डिव्हाइसचा सिरीयल नंबरशी संबंधित आहेत.

इंटरसेप्टने या वर्षाच्या सुरुवातीला अहवाल दिला आहे की अमेझॉन मालकीच्या रिंगच्या कर्मचार्यांनी कंपनीच्या दरवाजाच्या कॅमेराद्वारे कॅप्चर केलेल्या व्हिडिओंमधील वाहन आणि लोक ओळखले जातात, हे कार्य करण्यासाठी सॉफ्टवेअरला अधिक चांगले प्रशिक्षित करण्याचा प्रयत्न.

मिशिगन विद्यापीठातील प्राध्यापक फ्लोरियन शॅब यांनी स्मार्ट स्पीकर्सशी निगडित गोपनीयताविषयक समस्यांविषयी संशोधन केले आहे. “आपल्या घराच्या घनिष्ठतेबद्दल आपण आपल्या स्मार्ट स्पीकरला काय म्हणत आहात हे ऐकून आपण दुसर्या माणसाचे ऐकणे आवश्यक नाही.” “मला वाटतं की आम्हाला या [कल्पनेनुसार] कंडिशन देण्यात आले आहे की ही मशीन फक्त जादूची मशीन शिकत आहेत. पण वास्तविकता अद्याप हस्तपुस्तिकेत गुंतलेली आहे. ”

“ते गोपनीयता धोरण असले किंवा नसले तरी त्यावर अमेझॅन आणि इतर कंपन्यांनी कोणत्या प्रकारची माहिती दिली आहे आणि ती माहिती कशी सादर केली आहे यावर अवलंबून आहे यावर अवलंबून आहे.”

जेव्हा इकोने 2014 मध्ये पदार्पण केले तेव्हा अॅमेझॉनच्या बेलनाकार स्मार्ट स्पीकरने त्वरीत घरात व्हॉईस सॉफ्टवेअरचा वापर लोकप्रिय केला. बरेच दिवस आधी, अल्फाबेट इन्क. ने Google होम नावाची स्वतःची आवृत्ती लॉन्च केली, त्यानंतर ऍपल इन्क. च्या होमपॉडने. विविध कंपन्या चीनमध्ये त्यांची स्वतःची साधने देखील विकतात. संशोधक कॅनालिस यांच्या मते, गेल्या वर्षी ग्राहकांनी 78 दशलक्ष स्मार्ट स्पीकर्स विकत घेतले. त्यांच्या स्मार्टफोनवर डिजिटल सहाय्यकांशी संवाद साधण्यासाठी लाखो अधिक व्हॉईस सॉफ्टवेअर वापरतात.

अलेक्झांडवेअर सॉफ्टवेअर सतत ऑडिओचा स्नॅच रेकॉर्ड करण्यासाठी, जागृत शब्द ऐकण्यासाठी डिझाइन केलेले आहे. डीफॉल्टनुसार ते “अॅलेक्सा” आहे परंतु लोक “इको” किंवा “कॉम्प्यूटर” मध्ये बदलू शकतात. जेव्हा वेक शब्द सापडला तेव्हा इकोच्या शीर्षस्थानी हलकी रिंग निळे झाली आहे, हे दर्शविते की डिव्हाइस रेकॉर्डिंग आहे आणि अमेझॅन सर्व्हर्स

अमेझॉन इको शो ब्लूमबर्ग इको स्पॉट अमेझॉन विक्री करणार्या एलेक्सा-सक्षम स्मार्ट स्पीकरपैकी इको स्पॉट हा एक आहे
फोटो क्रेडिटः ब्लूमबर्ग

बहुतेक आधुनिक भाषण-ओळख प्रणाली मानवी मेंदूवर नमूद केलेल्या तंत्रिका नेटवर्कवर अवलंबून असतात. सॉफ्टवेअर मोठ्या प्रमाणावर डेटामध्ये नमुने शोधून त्यानुसार सॉफ्टवेअर शिकते. इको आणि इतर स्मार्ट स्पीकरना सक्षम करणारे अल्गोरिदम शिक्षित अंदाज घेण्यासाठी संभाव्यतेच्या मॉडेलचा वापर करतात. जर कोणी ग्रीक ठिकाण जवळील एखादे एलेक्सा विचारत असेल तर, एल्गोरिदमस माहित आहे की वापरकर्ता कदाचित रेस्टॉरंट शोधत आहे, चर्च किंवा समुदाय केंद्र नाही.

परंतु कधीकधी अलेक्झांडला ते चुकीचे ठरते-विशेषत: जेव्हा नवीन भाषेचा, प्रादेशिक भाषेचा किंवा इंग्लिशव्यतिरिक्त इतर भाषेचा वापर करतात. फ्रेंचमध्ये, एव्हॅक सा, “त्याच्याबरोबर” किंवा “तिच्याबरोबर” हे सॉफ्टवेअर एखाद्याला अॅलेक्झा वेक शब्द वापरत असल्याचा विचार करण्याबद्दल गोंधळात टाकू शकते. हेको, स्पॅनिश किंवा कामांसाठी स्पॅनिश, कधी कधी इको म्हणून misinterpreted आहे. आणि असं. अमेझॅनने अल्गोरिदमद्वारे गमावलेल्या अंतर भरण्यासाठी मानव मदतनीसांची नेमणूक केली आहे.

ऍपलच्या सिरीकडे देखील मानवी मदतनीस आहेत, जे डिजिटल सहाय्यकाने विनंती केलेल्या व्यक्तींच्या विनंतीची व्याख्या कशी करतात याबद्दल मोजण्यासाठी कार्य करते. ऍपल सुरक्षा श्वेत पत्रानुसार, त्यांनी पुनरावलोकन केलेल्या रेकॉर्डिंग वैयक्तिकरित्या ओळखण्यायोग्य माहितीची कमतरता आहेत आणि सहा महिन्यांसाठी यादृच्छिक अभिज्ञापकांशी जोडलेले असतात. त्यानंतर, डेटा त्याच्या यादृच्छिक ओळख माहिती काढून टाकली जाते परंतु सिरीच्या आवाज ओळख सुधारण्यासाठी दीर्घ कालावधीसाठी संग्रहित केली जाऊ शकते.

Google वर, काही पुनरावलोकनकर्ते त्यांच्या प्रशिक्षणासंदर्भात उत्पादनात प्रशिक्षण आणि सुधारण्यात मदत करण्यासाठी काही ऑडिओ स्निपेट्सवर प्रवेश करू शकतात परंतु हे कोणत्याही वैयक्तिकरित्या ओळखण्यायोग्य माहितीशी संबद्ध नाही आणि ऑडिओ विकृत आहे, कंपनी सांगते.

बुखारेस्टमध्ये अॅलेक्सा डेटा सर्व्हिसेससाठी गुणवत्ता आश्वासन व्यवस्थापक शोधण्याच्या अलीकडील अमेझॅन जॉब पोस्टिंगमध्ये मनुष्याच्या भूमिकेचे वर्णन केले आहे: “दररोज ती वेगवेगळ्या विषयांबद्दल आणि वेगवेगळ्या भाषांबद्दल बोलत असलेल्या हजारो लोकांना ऐकते आणि तिला आपल्या ते सर्व समजून घेण्यासाठी मदत करा. “इच्छित जाहिरात पुढे चालू ठेवते:” हा डेटा डेटा हाताळण्यासारखा आहे ज्या आपण कधीही पाहिला नाही. आम्ही दररोज मोठ्या प्रमाणावर भाषण तयार करीत आहोत, लेबल करीत आहोत, वर्गीकरण करतो आणि विश्लेषण करतो. ”

अॅमेझॉनची भाषण डेटाची अचूक प्रक्रिया सुरू होते जेव्हा अॅलेक्स ग्राहक व्हॉइस रेकॉर्डिंगची यादृच्छिक, लहान नमुना आणते आणि ऑडिओ फायली दूरच्या कर्मचार्यांना आणि कंत्राटदारांना पाठवते, प्रोग्रामच्या डिझाइनसह परिचित असलेल्या व्यक्तीनुसार.

काही एलेक्सा समीक्षकांना वापरकर्त्याच्या आज्ञा लिहून काढल्या जातात, रेकॉर्डिंग्ज अलेक्झांडच्या स्वयंचलित प्रतिलिपीशी तुलना करणे, सांगणे किंवा वापरकर्त्यास आणि मशीन दरम्यान परस्परसंवादाची व्याख्या करणे. त्या व्यक्तीने काय विचारले? अॅलेक्सा प्रभावी परिणाम प्रदान करते का?

इतर लोक बोलतात तेव्हाही, संभाषण घेणारी प्रत्येक गोष्ट लक्षात घेते-अगदी पार्श्वभूमी संभाषणांसह. कधीकधी ऐकणार्यांनी वापरकर्त्यांना नावे किंवा बँक तपशीलासारख्या खाजगी तपशीलांची चर्चा करीत असल्याचे ऐकून घेतले; अशा परिस्थितीत, त्यांनी “गंभीर डेटा” दर्शविणारा एक संवाद बॉक्स चेक करणे आवश्यक आहे. नंतर ते पुढील ऑडिओ फाइलवर जातात.

अमेझॉनच्या वेबसाइटनुसार, इको वेक शब्द ओळखत नाही किंवा बटण दाबून सक्रिय केल्याशिवाय ऑडिओ संचयित केलेला नाही. परंतु कधीकधी अलेक्झांडर कोणत्याही प्रॉम्प्टशिवाय रेकॉर्डिंग सुरू करू लागतात आणि ऑडिओ फाइल्स चमकदार दूरदर्शन किंवा अनावश्यक आवाजाने सुरू होतात. सक्रियकरण चुकीचे आहे किंवा नाही, पुनरावलोकनकर्त्यांनी ते लिहून घेणे आवश्यक आहे. लोकांपैकी एकाने म्हटले आहे की लेखापरीक्षक प्रत्येक दिवशी 100 रेकॉर्डिंगचे प्रतिलेखन करतात जेव्हा अॅलेक्सला वेक कमांड मिळत नाही किंवा अपघाताने ट्रिगर केले गेले आहे.

जगभरातील घरे मध्ये, दोनो समीक्षकांच्या मते इको मालक वारंवार ऐकतात की कोणाविषयी ऐकू शकते. ते म्हणाले, “तुम्ही एनएसएसाठी काम करता?” “एलेक्सा, कोणीतरी आम्हाला ऐकत आहे का?”

© 201 9 ब्लूमबर्ग एलपी