वायरल वीडियो

Google का नया AI वॉयस मॉडल लॉन्च, टेक्स्ट को इंसानों जैसी आवाज में बनाएगा

Google AI Update : Google ने Gemini 3.1 Flash TTS नामक नया AI वॉयस मॉडल लॉन्च किया है, जो टेक्स्ट को प्राकृतिक और इंसानों जैसी आवाज में बदल सकता है. यह मॉडल स्पीच के टोन, स्पीड और स्टाइल को कंट्रोल करने की सुविधा देता है और 70 से अधिक भाषाओं को सपोर्ट करता है. इसमें SynthID तकनीक भी शामिल है, जो AI ऑडियो की पहचान को आसान बनाती है और ट्रांसपेरेंसी बढ़ाती है.

Google AI Update : टेक्नोलॉजी की दुनिया में Google ने अपने AI इकोसिस्टम को और आगे बढ़ाते हुए नया टेक्स्ट-टू-स्पीच मॉडल पेश किया है. कंपनी ने Gemini 3.1 Flash TTS नाम का यह एडवांस्ड मॉडल लॉन्च किया है, जो लिखे हुए टेक्स्ट को बेहद प्राकृतिक और मानव जैसी आवाज में बदलने में सक्षम है. इस नए मॉडल की खास बात यह है कि यूजर अब सिर्फ टेक्स्ट के जरिए ही यह नियंत्रित कर सकते हैं कि आवाज किस तरह से सुनाई देगी, जैसे बोलने की गति, टोन और अंदाज. Google का दावा है कि यह अब तक का सबसे ज्यादा नैचुरल और कंट्रोल-फ्रेंडली वॉयस AI सिस्टम है, जो ऑडियो एक्सपीरियंस को पूरी तरह बदल सकता है.

इसे भी पढ़ें-₹15,000 से कम में खरीदना है Smart TV? ये 5 मॉडल बन सकते हैं शानदार विकल्प

टेक्स्ट से आवाज पर मिलेगा पूरा कंट्रोल

Gemini 3.1 Flash TTS को इस तरह डिजाइन किया गया है कि यह केवल शब्दों को पढ़ने तक सीमित नहीं रहता, बल्कि उन्हें भाव और स्टाइल के साथ प्रस्तुत करता है. यूजर्स यह तय कर सकते हैं कि AI आवाज तेज बोले, धीमी बोले या किसी खास भाव के साथ संवाद करे. इससे ऑडियो आउटपुट पहले से ज्यादा रियलिस्टिक और इंटरएक्टिव बन जाता है.

एडवांस ऑडियो टैग्स से बढ़ेगा अनुभव

इस मॉडल में कई एडवांस ऑडियो टैग्स जोड़े गए हैं, जिनकी मदद से आवाज को और सटीक तरीके से नियंत्रित किया जा सकता है. इसमें पॉज यानी रुकने का समय, स्पीड यानी बोलने की रफ्तार और एम्फेसिस यानी किसी शब्द पर जोर देने जैसी सेटिंग शामिल है. इन फीचर्स से कंटेंट क्रिएशन और वॉयस बेस्ड एप्लिकेशन में काफी सुधार आने की उम्मीद है.

मल्टी स्पीकर और बहुभाषी सपोर्ट

Gemini 3.1 Flash TTS में मल्टी-स्पीकर फीचर भी शामिल किया गया है, जिससे एक ही ऑडियो में अलग-अलग आवाजों का इस्तेमाल किया जा सकता है. हर स्पीकर की अपनी अलग पहचान और स्टाइल हो सकती है, जिससे स्टोरीटेलिंग और कस्टमर सपोर्ट जैसे उपयोग और बेहतर हो जाते हैं. इसके अलावा यह मॉडल 70 से अधिक भाषाओं को सपोर्ट करता है, जिससे इसे वैश्विक स्तर पर उपयोग किया जा सकता है.

सुरक्षा के लिए SynthID तकनीक

Google ने इस मॉडल में SynthID नाम की सुरक्षा तकनीक भी जोड़ी है, जो AI द्वारा जनरेट किए गए ऑडियो में एक अदृश्य वॉटरमार्क एम्बेड करती है. इससे यह पहचानना आसान हो जाता है कि कौन सा ऑडियो AI द्वारा बनाया गया है, जिससे पारदर्शिता और सुरक्षा दोनों सुनिश्चित होती हैं.

डेवलपर्स और यूजर्स के लिए उपलब्धता

फिलहाल Gemini 3.1 Flash TTS प्रीव्यू स्टेज में है. डेवलपर्स इसे Gemini API और Google AI Studio के जरिए इस्तेमाल कर सकते हैं. एंटरप्राइज यूजर्स के लिए यह Vertex AI पर उपलब्ध है, जबकि सामान्य यूजर्स को यह Google Vids जैसे टूल्स में देखने को मिल सकता है.

इसे भी पढ़ें-आज लॉन्च होंगे Infinix-Redmi के नए स्मार्टफोन, गेमिंग और बैटरी पर फोकस के साथ बाजार में एंट्री

इसे भी पढ़ें-OnePlus Nord 6 कल देगा दस्तक, 9000mAh बैटरी और दमदार फीचर्स के साथ मिड-रेंज में मचाएगा हलचल

- Advertisement -
सोनी कुमारी
सोनी कुमारी
HelloCities24 हिंदी में ब्रेकिंग न्यूज, पॉलिटिक्स, बॉलीवुड, खेल और मनोरंजन से जुड़ी ताजा खबरें लाता है. अपने शहर की बड़ी खबरें सबसे पहले पाएं HelloCities24 पर — भरोसेमंद हिंदी न्यूज प्लेटफॉर्म.
संबंधित खबरें

जरूर पढ़ें

Patna
mist
27 ° C
27 °
27 °
78 %
6.7kmh
20 %
Thu
27 °
Fri
41 °
Sat
44 °
Sun
44 °
Mon
45 °

अन्य खबरें

LEAVE A REPLY

Please enter your comment!
Please enter your name here