- Openai सितंबर में Chatgpt के मानक वॉयस मोड में सेवानिवृत्त हो रहा है
- केवल तेज, अधिक अभिव्यंजक उन्नत वॉयस मोड उपलब्ध होगा
- कई उपयोगकर्ता परिवर्तन के बारे में परेशान हैं, आवाज ओपनईआई की ध्वनि और दृष्टिकोण को प्राथमिकता देना, हटा रहा है
वॉयस लोग चैट के साथ जुड़ने के लिए आए हैं, 9 सितंबर को रिटायर हो रहा है, और हर कोई इसके बारे में खुश नहीं है। CHATGPT की “मानक” आवाज “उन्नत” वॉयस विकल्प के पक्ष में जा रही है, जो पहले पिछले साल CHATGPT उपयोगकर्ताओं के सीमित चयन के लिए जारी की गई थी। केवल “चैट की आवाज” के रूप में रीब्रांडेड, यह केवल एक ही विकल्प होगा जो आगे जा रहा है।
मूल “मानक” वॉयस मोड 2023 में शुरू हुआ, एक साधारण पाइपलाइन पर बनाया गया था: आप बोलेंगे, ओपनईआई के सर्वर आपके इनपुट को ट्रांसक्राइब करेंगे, जीपीटी मॉडल का उपयोग करके एक प्रतिक्रिया उत्पन्न करेंगे, फिर इसे अपेक्षाकृत तटस्थ सिंथेटिक वॉयस का उपयोग करके वापस पढ़ें।
CHATGPT की उन्नत वॉयस मोड को अधिक तेज़ी से जवाब देने के लिए डिज़ाइन किया गया है, अपने स्वर और भाषण के तरीके में अधिक मानवीय होने के लिए, और आम तौर पर अपने पूर्ववर्ती की तुलना में उच्च स्तर पर प्रदर्शन करने के लिए। बहरहाल, बहुत से लोग सोचते हैं कि यह एक गलती है।
एक उपयोगकर्ता ने Openai के मंच पर एक पोस्ट में लिखा है, “मानक आवाज एक गर्मजोशी, गहराई और प्राकृतिक कनेक्शन प्रदान करती है जो उन्नत आवाज बस मेल नहीं खाती है।” उन्नत आवाज रोबोट के रूप में सामने आती है और अलग हो जाती है, जिसमें आत्मीय और समझ में आने वाले स्वर की कमी होती है। “
एक से अधिक लोगों ने नई आवाज को बोलने के लिए कम आकर्षक बताया। ऐसी शिकायतें भी थीं कि नया मॉडल बहुत जल्दी बोलता है, जैसे कि यह बातचीत को प्राप्त करने की कोशिश कर रहा था।
“मानक आवाज विचारशील है और एक आवाज और ताल है जो प्राकृतिक और आरामदायक है। मार्मिक,” एक रेडिट उपयोगकर्ता ने पोस्ट किया। “एडवांस्ड वॉयस में समान विशेषताएं नहीं हैं, विचारशील उत्तर नहीं देते हैं, प्रतिबंधात्मक सामग्री सीमाएं हैं, और हमेशा ऐसा लगता है कि वे एक औसत दर्जे की प्रतिक्रिया के माध्यम से भागने की कोशिश कर रहे हैं।”
उन्नत आवाजें
यहां तक कि अगर आपको कोई आपत्ति नहीं है कि नई आवाज कैसे लगती है, तो कुछ CHATGPT उपयोगकर्ता नाराज हैं क्योंकि उन्होंने पाया है कि यह पहले की आवाज के समान भी नहीं होगा।
उन्नत वॉयस मोड आपकी आवाज, एआई की प्रतिक्रियाओं और एक वास्तविक समय की प्रक्रिया में इसकी मुखर अभिव्यक्ति को एकीकृत करता है। एकीकृत प्रक्रिया का मतलब है कि AI लिखित प्रतिक्रिया शब्दशः उद्धृत नहीं करता है। इसके बजाय, यह विचारों को अधिक संवादात्मक रूप से व्यक्त करता है, कभी -कभी वाक्यांशों को छोड़ देता है, कंडेनसिंग क्लॉस, या संदर्भ के आधार पर टोन को समायोजित करता है। तकनीकी रूप से प्रभावशाली, लेकिन कुछ नहीं चटप्ट उपयोगकर्ता क्या चाहते हैं।
“मानक आवाज शाब्दिक रूप से सटीक प्रतिक्रिया को पढ़ेगी जो कि चटप्ट आपको सामान्य रूप से देगी। यह एक सीधी रेखा थी, आप जानते हैं?” Reddit पर एक उदाहरण पोस्ट पढ़ें। “लेकिन यह नया है? ऐसा लगता है कि यह इसके बजाय इसे पैराफ्रासिंग या समरिंग (sic) कर रहा है। यह छोटे विवरणों पर छोड़ देता है और पूरी बातचीत को अधिक डिस्कनेक्ट करने का तरीका महसूस कराता है।”
यह एआई प्रगति की भव्य योजना में मामूली लग सकता है, लेकिन यह तकनीक में एक व्यापक प्रवृत्ति को प्रतिध्वनित करता है जहां लोग एक बड़ा बदलाव होने पर परेशान होते हैं, भले ही यह एक अपग्रेड हो।
हर कोई निश्चित रूप से नए आवाज विकल्प को नापसंद नहीं करता है। कुछ इसकी यथार्थवाद और गति पसंद करते हैं, और यह अधिक तरल बातचीत के लिए कैसे बनाता है। Openai ने आने वाले अधिक सुधारों का वादा किया है, साथ ही साथ। लेकिन, GPT-4O के हटाने के बारे में शिकायतें यह देखते हुए कि जब GPT-5 ने पुराने मॉडल की वापसी का नेतृत्व किया, तो मुझे मानक वॉयस मोड स्टेज को भी वापसी देखकर आश्चर्य नहीं होगा।