ગૂગલની ક્રાંતિકારી ટેકનોલોજી: લોન્ચ કર્યું ‘Gemini 3.5 Live Translate’, હવે 70થી વધુ ભાષાઓમાં રિયલ ટાઈમ અનુવાદ શક્ય

સિલિકોન વેલી: વિવિધ દેશો અને પ્રદેશોના લોકો વચ્ચે સદીઓથી નડતરરૂપ બનતી ભાષાની દીવાલને તોડી પાડવા માટે ટેક જાયન્ટ ગૂગલે (Google) એક ઐતિહાસિક પગલું ભર્યું છે. કંપનીએ તેનું અત્યાધુનિક સ્પીચ-ટુ-સ્પીચ ટ્રાન્સલેશન મોડેલ ‘જેમિની 3.5 લાઈવ ટ્રાન્સલેટ’ વૈશ્વિક સ્તરે રજૂ કરી દીધું છે. આ નવું મોડેલ 70 કરતાં પણ વધુ ભાષાઓને પળવારમાં ઓળખીને રિયલ ટાઈમમાં (સામે વ્યક્તિ બોલે તેની સાથે જ) સચોટ અનુવાદ કરવાની ક્ષમતા ધરાવે છે. આ ટેકનોલોજીની સૌથી મોટી ખાસિયત એ છે કે તે માત્ર શબ્દોનું ભાષાંતર નથી કરતી, પરંતુ વક્તાના અવાજનો ટોન (સ્વર), તેની બોલવાની ગતિ અને હાવભાવને પણ એ જ રીતે જાળવી રાખે છે.

લાંબા વિરામ વગર, ઘોંઘાટ વચ્ચે પણ સચોટ કામગીરી

એક સત્તાવાર બ્લોગ પોસ્ટમાં ગૂગલે જણાવ્યું છે કે, આ પ્રોજેક્ટ બે દાયકા પહેલા શરૂ થયેલા મશીન લર્નિંગના સંશોધનોનું આગામી આધુનિક ચરણ છે. આ મોડેલ ઓડિયો સ્ટ્રીમ થવાની સાથે જ તેને પ્રોસેસ કરે છે. એટલે કે, સામેવાળી વ્યક્તિ જેમ-જેમ બોલતી જશે, તેમ-તેમ બેકગ્રાઉન્ડમાં અનુવાદ તૈયાર થતો જશે અને મુખ્ય સ્પીકરના બોલ્યા પછી માત્ર ગણતરીની સેકન્ડોમાં જ અનુવાદિત ઓડિયો સંભળાશે. અત્યાર સુધીની સિસ્ટમમાં જોવા મળતા લાંબા અને કંટાળાજનક વિરામ (ખચકાટ) આમાં બિલકુલ જોવા નહીં મળે. આ ઉપરાંત, આ સ્માર્ટ મોડેલ ઘોંઘાટવાળા વાતાવરણમાં પણ સામેની ભાષા આપમેળે ઓળખી લે છે. જેથી યુઝરે કોઈ મેન્યુઅલ સેટિંગ્સ કરવાની જરૂર રહેતી નથી.

ગૂગલ મીટ અને સ્માર્ટફોનમાં સીધો જ સંભળાશે અનુવાદિત અવાજ

આ ક્રાંતિકારી ટેકનોલોજીનો મહત્તમ લાભ ગૂગલ મીટ (Google Meet) ના યુઝર્સને મળશે. અગાઉ ગૂગલ મીટમાં માત્ર ૫ ભાષાઓમાં જ અનુવાદની સુવિધા હતી, જે હવે વધારીને ૭૦થી વધુ ભાષાઓની કરી દેવાઈ છે. બહુભાષી બિઝનેસ મીટિંગ્સ, લાઈવ બ્રોડકાસ્ટ્સ, ઓનલાઈન ક્લાસિસ અને ગ્રાહક સપોર્ટ (Customer Support) માટે આ ફીચર ગેમચેન્જર સાબિત થશે.

આ સુવિધા ટૂંક સમયમાં જ iOS, Android અને Google Translate એપમાં ‘લાઈવ ટ્રાન્સલેશન’ તરીકે ઉપલબ્ધ કરાશે. એન્ડ્રોઇડ યુઝર્સ માટે ખાસ ‘લિસનિંગ મોડ’ (Listening Mode) લાવવામાં આવી રહ્યો છે, જેનાથી યુઝર સ્માર્ટફોનના ઇયરપીસ (હેડફોન) ભરાવીને સીધો જ પોતાની ભાષામાં અનુવાદ સાંભળી શકશે. વિદેશી ક્લાયન્ટ્સ સાથે વાતચીત કરવા માટે આ ફીચર વરદાનરૂપ સાબિત થશે.

સુરક્ષા માટે ખાસ કવાયત: ઓડિયોમાં હશે ‘SynthID’ વોટરમાર્ક

આજના સમયમાં AI-જનરેટેડ કન્ટેન્ટ અને ડીપફેક અવાજને લઈને ઉઠતી ચિંતાઓ પર ગૂગલે સ્પષ્ટતા કરી છે. કંપનીએ જણાવ્યું કે, જેમિની ૩.૫ લાઈવ ટ્રાન્સલેટ દ્વારા જનરેટ થનારા તમામ ઓડિયોમાં ગૂગલની પોતાની ખાસ સેફ્ટી ટેકનોલોજી ‘SynthID વોટરમાર્ક’ એમ્બેડેડ (સામેલ) હશે. આ ડિજિટલ વોટરમાર્કના લીધે એ સરળતાથી ઓળખી શકાશે કે આ અવાજ AI દ્વારા તૈયાર કરવામાં આવ્યો છે. હાલમાં ડેવલપર્સ અને ટેક પ્રોફેશનલ્સ માટે Gemini Live API અને Google AI સ્ટુડિયોના જાહેર પૂર્વાવલોકન (Public Preview) માં આ મોડેલ એક્સેસ માટે ખુલ્લું મુકી દેવાયું છે.

Leave a Reply

Your email address will not be published. Required fields are marked *

READ MORE

READ MORE