इस खबर में क्या है?
Google AI Update : टेक्नोलॉजी की दुनिया में Google ने अपने AI इकोसिस्टम को और आगे बढ़ाते हुए नया टेक्स्ट-टू-स्पीच मॉडल पेश किया है. कंपनी ने Gemini 3.1 Flash TTS नाम का यह एडवांस्ड मॉडल लॉन्च किया है, जो लिखे हुए टेक्स्ट को बेहद प्राकृतिक और मानव जैसी आवाज में बदलने में सक्षम है. इस नए मॉडल की खास बात यह है कि यूजर अब सिर्फ टेक्स्ट के जरिए ही यह नियंत्रित कर सकते हैं कि आवाज किस तरह से सुनाई देगी, जैसे बोलने की गति, टोन और अंदाज. Google का दावा है कि यह अब तक का सबसे ज्यादा नैचुरल और कंट्रोल-फ्रेंडली वॉयस AI सिस्टम है, जो ऑडियो एक्सपीरियंस को पूरी तरह बदल सकता है.
इसे भी पढ़ें-₹15,000 से कम में खरीदना है Smart TV? ये 5 मॉडल बन सकते हैं शानदार विकल्प
टेक्स्ट से आवाज पर मिलेगा पूरा कंट्रोल
Gemini 3.1 Flash TTS को इस तरह डिजाइन किया गया है कि यह केवल शब्दों को पढ़ने तक सीमित नहीं रहता, बल्कि उन्हें भाव और स्टाइल के साथ प्रस्तुत करता है. यूजर्स यह तय कर सकते हैं कि AI आवाज तेज बोले, धीमी बोले या किसी खास भाव के साथ संवाद करे. इससे ऑडियो आउटपुट पहले से ज्यादा रियलिस्टिक और इंटरएक्टिव बन जाता है.
एडवांस ऑडियो टैग्स से बढ़ेगा अनुभव
इस मॉडल में कई एडवांस ऑडियो टैग्स जोड़े गए हैं, जिनकी मदद से आवाज को और सटीक तरीके से नियंत्रित किया जा सकता है. इसमें पॉज यानी रुकने का समय, स्पीड यानी बोलने की रफ्तार और एम्फेसिस यानी किसी शब्द पर जोर देने जैसी सेटिंग शामिल है. इन फीचर्स से कंटेंट क्रिएशन और वॉयस बेस्ड एप्लिकेशन में काफी सुधार आने की उम्मीद है.
मल्टी स्पीकर और बहुभाषी सपोर्ट
Gemini 3.1 Flash TTS में मल्टी-स्पीकर फीचर भी शामिल किया गया है, जिससे एक ही ऑडियो में अलग-अलग आवाजों का इस्तेमाल किया जा सकता है. हर स्पीकर की अपनी अलग पहचान और स्टाइल हो सकती है, जिससे स्टोरीटेलिंग और कस्टमर सपोर्ट जैसे उपयोग और बेहतर हो जाते हैं. इसके अलावा यह मॉडल 70 से अधिक भाषाओं को सपोर्ट करता है, जिससे इसे वैश्विक स्तर पर उपयोग किया जा सकता है.
सुरक्षा के लिए SynthID तकनीक
Google ने इस मॉडल में SynthID नाम की सुरक्षा तकनीक भी जोड़ी है, जो AI द्वारा जनरेट किए गए ऑडियो में एक अदृश्य वॉटरमार्क एम्बेड करती है. इससे यह पहचानना आसान हो जाता है कि कौन सा ऑडियो AI द्वारा बनाया गया है, जिससे पारदर्शिता और सुरक्षा दोनों सुनिश्चित होती हैं.
डेवलपर्स और यूजर्स के लिए उपलब्धता
फिलहाल Gemini 3.1 Flash TTS प्रीव्यू स्टेज में है. डेवलपर्स इसे Gemini API और Google AI Studio के जरिए इस्तेमाल कर सकते हैं. एंटरप्राइज यूजर्स के लिए यह Vertex AI पर उपलब्ध है, जबकि सामान्य यूजर्स को यह Google Vids जैसे टूल्स में देखने को मिल सकता है.
इसे भी पढ़ें-आज लॉन्च होंगे Infinix-Redmi के नए स्मार्टफोन, गेमिंग और बैटरी पर फोकस के साथ बाजार में एंट्री
इसे भी पढ़ें-OnePlus Nord 6 कल देगा दस्तक, 9000mAh बैटरी और दमदार फीचर्स के साथ मिड-रेंज में मचाएगा हलचल

