In context: Google Vertalen is misschien begonnen als een vrij eenvoudige vertaaltool die u alleen gebruikt als het absoluut noodzakelijk is, maar dat heeft een lange weg afgelegd sinds de begintijd. Dankzij de ingebouwde AI-functies van Google Translate is de tool van onschatbare waarde voor het vertalen van alles, van een paar zinnen tot volledige webpagina's; meestal met een hoge mate van nauwkeurigheid en leesbaarheid.

Een nieuw bericht op Google's AI Blog laat zien dat de zoekgigant niet geïnteresseerd is om goed genoeg alleen te zijn. In plaats van zich te concentreren op traditionele spraak-naar-tekst-, tekst-naar-tekst- of tekst-naar-spraakvertaling, spraak-naar-spraak vertaling Het is een systeem dat de unieke vocale kenmerken van een spreker, zoals toon, buiging en cadans, kan behouden.

Google bereikt deze prestatie door middel van "Translatotron", een tool die een "sequence-to-array-netwerk" gebruikt om bronspectrogrammen te transformeren (een visuele weergave van frequenties, zoals Engadget). legt uit) worden omgezet in spectrogrammen die in een specifieke doeltaal zijn vertaald.

Om de toon van een spreker te behouden, zoals eerder vermeld, vertrouwt Google op een optionele "spreker-encoder" -stap die "het karakter van de stem van de bronspreker kan behouden in gesynthetiseerde vertaalde spraak".

De volledige uitleg van hoe Translatotron werkt, is zeer technisch van aard, maar vanuit praktisch oogpunt: "Mijn naam is John, hoe gaat het met je?" Je zou zoiets moeten kunnen zeggen. Engels voor iemand die Engels spreekt en uw bericht sneller en nauwkeuriger dan ooit tevoren naar het voertuig brengt.




U kunt alle details achter de Translatotron-functionaliteit lezen en luisteren naar enkele voor en na audiofragmenten hier. Hoewel de tool interessant klinkt, lijkt de Translatotron helaas nog niet beschikbaar voor het grote publiek en er is geen woord over wanneer hij zou kunnen starten - misschien wordt hij in de toekomst stilletjes aan Google Translate zelf toegevoegd.