जब से मैंने Google Pixel 10 प्रो फोन की एक जोड़ी के बीच एक कॉल पर Google के रियल टाइम वॉयस ट्रांसलेशन की कोशिश की है, मैं एक ऐसे भविष्य की कल्पना कर रहा हूं जहां मैं अपनी आवाज में किसी भी भाषा में किसी से भी बात कर सकता हूं और हम तुरंत एक -दूसरे को समझ सकते हैं।
मैं अपने विस्मय में अकेला नहीं हूं। जब जिमी फॉलन और YouTuber Karen Polynesia ने 20 अगस्त, 2025 को Google 2025 द्वारा बनाए गए फीचर को लाइव का प्रदर्शन किया, तो देर रात के टीवी होस्ट को गोब्समैक किया गया, जो कि एक अघोषित स्थान पर पिक्सेल 10 प्रो फोन पर किसी को स्पेनिश में अपनी विशिष्ट आवाज के रूप में आश्चर्य में घिनौना था।
मैं उसे दोष नहीं देता। जैसा कि मैंने कहा है, यह सुविधा एआई का उपयोग किसी अन्य भाषा में दोनों कॉलर्स की आवाज़ों को फिर से बनाने के लिए करती है, लगभग बिना किसी अंतराल के, जो कि सबसे करीबी है, हम स्टार ट्रेक के यूनिवर्सल ट्रांसलेटर के लिए आए हैं। लेकिन यह कुछ याद आ रहा है।
आप देखते हैं, Google का रियल टाइम कॉल ट्रांसलेशन केवल तभी काम करता है जब आप किसी को पिक्सेल 10 फोन पर कॉल कर रहे हों। जो मैं वास्तव में चाहता हूं वह एक अधिक परिवेश का अनुभव है।
मुझे विश्वास नहीं हो रहा है कि मैं यह लिख रहा हूं, लेकिन हमें जो कुछ भी चाहिए वह पहनने योग्य हार्डवेयर का एक टुकड़ा है जो हमेशा सुन रहा है और जब यह किसी को आपकी मूल जीभ के अलावा किसी अन्य भाषा में बोलते हुए सुनता है, तो यह मक्खी पर अंतर करना शुरू कर देता है और “बोलने” के लिए आपके मूल लंगुएज में वही शब्द बोलता है, जबकि निश्चित रूप से वक्ताओं की आवाज से मेल खाने वाली आवाज का उपयोग करता है।
स्टार ट्रेक में, गैलेक्सी एक्सप्लोरर बस एलियंस में डिवाइस को इंगित करेंगे, और उनकी अनजाने भाषाएं उनकी आवाज़ों को अंग्रेजी में बदल देंगी। मुझे पता है कि यह संभावना नहीं है; हालाँकि, मेरे पास एक दृष्टि है जो मैं चाहता हूं।
मुझे पता है कि Google के पास लंबे समय से पिक्सेल बड्स (Google अनुवाद और Google सहायक का उपयोग करके) के साथ एक अनुवाद सुविधा है, लेकिन इसने कभी भी इस तरह से काम नहीं किया और अनुवाद के लिए स्पीकर की आवाज के सिमुलैक्रम का उपयोग कभी नहीं किया। जहां तक मेरा सवाल है, सिस्टम तब तक काम नहीं करता है जब तक कि इसमें शामिल नहीं होता।
एक पहनने योग्य अनुवादक
एक आदर्श दुनिया में, सिस्टम घर्षण रहित होगा: दोनों वक्ताओं पर और हमेशा पारदर्शी रूप से इंटरसेप्ट करने, अनुवाद करने और बोलने के लिए तैयार है ताकि हमें कॉल करने, टैप करने, देखने या पढ़ने की जरूरत न हो।
वास्तविक दुनिया में, Google के मोबाइल हार्डवेयर पारिस्थितिकी तंत्र की वर्तमान स्थिति के लिए कुछ रियायतें होंगी।
कुछ विकल्प हैं। यह एक ऐसी प्रणाली हो सकती है जो पिक्सेल वॉच और पिक्सेल बड्स (द वॉच का अनुवाद करती है और बड्स को आवाज भेजती है) पर काम करती है या कलियाँ अनुवाद करती हैं और अपने दम पर आवाज देती हैं। पिक्सेल वॉच 4 और पिक्सेल बड्स (यहां तक कि प्रो मॉडल) में अनुवाद को संभालने के लिए हॉर्सपावर की कमी होती है।
क्या जरूरत है हार्डवेयर का एक और टुकड़ा या पहनने योग्य गैजेट्स का एक संयोजन जो इस कभी-वर्तमान लाइव अनुवाद को जीवन में ला सकता है।
एक हार्डवेयर संभावना
सामान्य तौर पर, मैं समर्पित एआई हार्डवेयर का प्रशंसक नहीं हूं (खरगोश आर 1 और प्लाउड.एआई देखें)। Pixel 10 Pro जैसे स्मार्टफोन में सभी सामान्य AI की आवश्यकता है, और एक माध्यमिक उपकरण सिर्फ उसी AI क्रियाओं में से कई को करने के लिए सबसे अच्छा लगता है।
वास्तविक समय लाइव अनुवाद, हालांकि, मुझे अलग तरह से सोच रहा है। शायद यह एक बढ़ाया पिक्सेल वॉच और कलियों का संयोजन है, लेकिन मैं पसंद करूंगा कि अगर पूरे ऑपरेशन को “पिक्सेल बड्स प्रो एन्हांस्ड” कह सकते हैं।
अंदर एक नया टेंसर चिप होगा जो स्थानीय अनुवाद और आवाज पीढ़ी को करने के लिए पर्याप्त शक्तिशाली ताकत के अंदर फिट होने के लिए काफी छोटा होगा। हम जानते हैं कि सॉफ़्टवेयर काम करता है, इसलिए इसका समर्थन करने के लिए विशेष हार्डवेयर क्यों नहीं बनाया जाता है?
मुझे पता है कि यह एक लंबा आदेश है। टेंसर G5 एक 3NM प्रक्रिया चिप है। क्या यह 2nm हो सकता है? शायद। लक्ष्य दोनों को एआई (अपने तंत्रिका नेटवर्क के साथ) को सिकोड़ने और बिजली की खपत को कम करने के लिए होगा ताकि एक अनुवाद आधे पिक्सेल बड प्रो एन्हांस्ड की बैटरी लाइफ को न खाएं।
यह एक एआई पहनने योग्य विचार है जिसे मैं पीछे ले जा सकता हूं। बस सोचें कि दूसरे देश की यात्रा क्या हो सकती है यदि आप इनमें से किसी एक को पहन रहे थे। मुझे लगता है कि यह संभावना नहीं है कि जिस व्यक्ति से आप बात कर रहे हैं, उसके पास एक जोड़ी भी है, लेकिन अगर वे मिथुन को अपने फोन पर लाइव चला सकते हैं या यदि उनके पास पिक्सेल वॉच है, तो शायद वे सुन सकते हैं कि आप उनकी भाषा में (और आपकी आवाज में) भी क्या कह रहे हैं।
मेरी बात यह है कि यह सुविधा एक स्मार्टफोन के अंदर फंसने के लिए बहुत शक्तिशाली है, और मुझे आशा है कि Google अभी काम कर रहा है ताकि मेरे स्टार ट्रेक यूनिवर्सल ट्रांसलेटर ड्रीम्स को जीवन में लाया जा सके।