Google का नया AI वॉयस मॉडल लॉन्च, टेक्स्ट को इंसानों जैसी आवाज में बनाएगा

Google AI Update : Google ने Gemini 3.1 Flash TTS नामक नया AI वॉयस मॉडल लॉन्च किया है, जो टेक्स्ट को प्राकृतिक और इंसानों जैसी आवाज में बदल सकता है. यह मॉडल स्पीच के टोन, स्पीड और स्टाइल को कंट्रोल करने की सुविधा देता है और 70 से अधिक भाषाओं को सपोर्ट करता है. इसमें SynthID तकनीक भी शामिल है, जो AI ऑडियो की पहचान को आसान बनाती है और ट्रांसपेरेंसी बढ़ाती है.

Updated : 17 अप्रैल 2026 12:46 पूर्वाह्न IST

Google AI Update : Google ने Gemini 3.1 Flash TTS नामक नया AI वॉयस मॉडल लॉन्च किया है, जो टेक्स्ट को प्राकृतिक और इंसानों जैसी आवाज में बदल सकता है. यह मॉडल स्पीच के टोन, स्पीड और स्टाइल को कंट्रोल करने की सुविधा देता है और 70 से अधिक भाषाओं को सपोर्ट करता है. इसमें SynthID तकनीक भी शामिल है, जो AI ऑडियो की पहचान को आसान बनाती है और ट्रांसपेरेंसी बढ़ाती है.

इस खबर में क्या है?

Google AI Update : टेक्नोलॉजी की दुनिया में Google ने अपने AI इकोसिस्टम को और आगे बढ़ाते हुए नया टेक्स्ट-टू-स्पीच मॉडल पेश किया है. कंपनी ने Gemini 3.1 Flash TTS नाम का यह एडवांस्ड मॉडल लॉन्च किया है, जो लिखे हुए टेक्स्ट को बेहद प्राकृतिक और मानव जैसी आवाज में बदलने में सक्षम है. इस नए मॉडल की खास बात यह है कि यूजर अब सिर्फ टेक्स्ट के जरिए ही यह नियंत्रित कर सकते हैं कि आवाज किस तरह से सुनाई देगी, जैसे बोलने की गति, टोन और अंदाज. Google का दावा है कि यह अब तक का सबसे ज्यादा नैचुरल और कंट्रोल-फ्रेंडली वॉयस AI सिस्टम है, जो ऑडियो एक्सपीरियंस को पूरी तरह बदल सकता है.

इसे भी पढ़ें-₹15,000 से कम में खरीदना है Smart TV? ये 5 मॉडल बन सकते हैं शानदार विकल्प

टेक्स्ट से आवाज पर मिलेगा पूरा कंट्रोल

Gemini 3.1 Flash TTS को इस तरह डिजाइन किया गया है कि यह केवल शब्दों को पढ़ने तक सीमित नहीं रहता, बल्कि उन्हें भाव और स्टाइल के साथ प्रस्तुत करता है. यूजर्स यह तय कर सकते हैं कि AI आवाज तेज बोले, धीमी बोले या किसी खास भाव के साथ संवाद करे. इससे ऑडियो आउटपुट पहले से ज्यादा रियलिस्टिक और इंटरएक्टिव बन जाता है.

एडवांस ऑडियो टैग्स से बढ़ेगा अनुभव

इस मॉडल में कई एडवांस ऑडियो टैग्स जोड़े गए हैं, जिनकी मदद से आवाज को और सटीक तरीके से नियंत्रित किया जा सकता है. इसमें पॉज यानी रुकने का समय, स्पीड यानी बोलने की रफ्तार और एम्फेसिस यानी किसी शब्द पर जोर देने जैसी सेटिंग शामिल है. इन फीचर्स से कंटेंट क्रिएशन और वॉयस बेस्ड एप्लिकेशन में काफी सुधार आने की उम्मीद है.

मल्टी स्पीकर और बहुभाषी सपोर्ट

Gemini 3.1 Flash TTS में मल्टी-स्पीकर फीचर भी शामिल किया गया है, जिससे एक ही ऑडियो में अलग-अलग आवाजों का इस्तेमाल किया जा सकता है. हर स्पीकर की अपनी अलग पहचान और स्टाइल हो सकती है, जिससे स्टोरीटेलिंग और कस्टमर सपोर्ट जैसे उपयोग और बेहतर हो जाते हैं. इसके अलावा यह मॉडल 70 से अधिक भाषाओं को सपोर्ट करता है, जिससे इसे वैश्विक स्तर पर उपयोग किया जा सकता है.

सुरक्षा के लिए SynthID तकनीक

Google ने इस मॉडल में SynthID नाम की सुरक्षा तकनीक भी जोड़ी है, जो AI द्वारा जनरेट किए गए ऑडियो में एक अदृश्य वॉटरमार्क एम्बेड करती है. इससे यह पहचानना आसान हो जाता है कि कौन सा ऑडियो AI द्वारा बनाया गया है, जिससे पारदर्शिता और सुरक्षा दोनों सुनिश्चित होती हैं.

डेवलपर्स और यूजर्स के लिए उपलब्धता

फिलहाल Gemini 3.1 Flash TTS प्रीव्यू स्टेज में है. डेवलपर्स इसे Gemini API और Google AI Studio के जरिए इस्तेमाल कर सकते हैं. एंटरप्राइज यूजर्स के लिए यह Vertex AI पर उपलब्ध है, जबकि सामान्य यूजर्स को यह Google Vids जैसे टूल्स में देखने को मिल सकता है.

इसे भी पढ़ें-आज लॉन्च होंगे Infinix-Redmi के नए स्मार्टफोन, गेमिंग और बैटरी पर फोकस के साथ बाजार में एंट्री

इसे भी पढ़ें-OnePlus Nord 6 कल देगा दस्तक, 9000mAh बैटरी और दमदार फीचर्स के साथ मिड-रेंज में मचाएगा हलचल

Kolkata: विरासत से भविष्य तक सफाई का संकल्प, पूर्वी रेलवे ने मनाया 173वां स्थापना दिवस

अपना शहर चुनें

कैटेगेरी

अपना शहर चयन करें

कैटेगेरी

वायरल वीडियो

Google का नया AI वॉयस मॉडल लॉन्च, टेक्स्ट को इंसानों जैसी आवाज में बनाएगा

इस खबर में क्या है?

टेक्स्ट से आवाज पर मिलेगा पूरा कंट्रोल

एडवांस ऑडियो टैग्स से बढ़ेगा अनुभव

मल्टी स्पीकर और बहुभाषी सपोर्ट

सुरक्षा के लिए SynthID तकनीक

डेवलपर्स और यूजर्स के लिए उपलब्धता

जरूर पढ़ें

अन्य खबरें

कोई जवाब दें

Category

Categories

Trending Tags

About Us

Connect with us