Microsoft demonstrira univerzalni prevoditelj s engleskog na kineski koji zadržava vaš glas i naglasak

Univerzalni prevoditelj za Star Trek

Na događaju u Kini, šef Microsoftovog istraživanja Rick Rashid demonstrirao je mehanizam za prevođenje govora u govor s engleskog na mandarinski u stvarnom vremenu. Ne samo da je prijevod vrlo točan, već softver također čuva akcent i intonaciju korisnika. Ovdje ne govorimo samo o digitaliziranom, robotskom prevoditelju - ovo je čvrsto u domenu Liječnik koji je ili Zvjezdane staze univerzalni prijevod.

Najbolji način da cijenite ovu tehnologiju je pogledati video u nastavku. Prvih šest minuta ili nešto više Rick Rashid objašnjava temeljne poteškoće računalnog prevođenja, a zatim posljednjih nekoliko minuta zapravo pokazuje softverski mehanizam za prevođenje govora u govor s engleskog na mandarinski. Nažalost, ne govorim kineski, pa ne mogu potvrditi istinitost prijevoda, ali čini se da je publika - oko 2000 kineskih učenika - impresionirana. Profesionalni prevoditelj za engleski / kineski također mi je primijetio da je računalni prijevod iznenađujuće dobar; nije sasvim na razini ljudskog prevođenja, ali približava se.



Tu je, naravno, puno tehnološkog čarobnjaštva koji se događaju iza kulisa. Za početak je potrebno obučiti softver - i s nekoliko sati maternjeg, govornog kineskog i sat vremena govornog engleskog Ricka Rashida. Od toga, softver u osnovi razbija vaš govor na najmanje komponente (foneme), a zatim ih sabija zajedno s kineskim ekvivalentom, stvarajući veliku mapu zvukova od engleskog do mandarinskog. Zatim, tijekom stvarne prezentacije na pozornici, softver pretvara njegov govor u tekst (kao što vidite na lijevom zaslonu), njegov tekst u mandarinski (desni zaslon), a zatim Rashid / kineska zbrka stvorena tijekom treninga postupak se koristi za pretvaranje tog teksta u izgovorene riječi.

Krajnji rezultat definitivno ima snažan nagovještaj digitaliziranog, robotskog Microsofta Sama, ali iznenađuje koliko je Rashidov naglasak, ton i intonacija sačuvan.

Što se tiče točnosti, Microsoft kaže da cjeloviti sustav ima stopu pogrešaka otprilike jednu od osam riječi - poboljšanje od 30% u odnosu na prethodnu najbolju riječ od pet. Takvo dramatično poboljšanje omogućila je upotreba Duboke neuronske mreže, tehniku ​​strojnog učenja koju je osmislio Geoffrey Hinton sa Sveučilišta u Torontu. Duboka neuronska mreža u osnovi je umjetna neuronska mreža (softver koji modelira tisuće međusobno povezanih 'neurona'), ali s određenim podešavanjima tako da bliže oponaša ponašanje ljudskog mozga.

Krećući se naprijed, veliko je pitanje kada će softver za prijevod govora u govor tvrtke Microsoft Research zapravo pronaći put na tržište - i da, u slučaju da se pitate, softver nije ograničen samo na engleski i kineski; može se koristiti svih 26 jezika podržanih Microsoftovom govornom platformom, uključujući Mandarin-to-English. Najočitiji slučaj upotrebe bio bi na pametnom telefonu sa sustavom Windows Phone 8 (ili 9?) Ili Skypeu: mogli biste nazvati tvrtku u Kini, Njemačkoj ili Brazilu, normalno govoriti na engleskom i oni bi čuli vaš glas na svom lokalnom jeziku . Također biste mogli koristiti svoj pametni telefon kao univerzalni prevoditelj tijekom putovanja. Kao što možete vidjeti u nastavku, Microsoft se igrao prevođenjem telefon-telefon u stvarnom vremenu sve do 2010. godine:

Vjerojatno Microsoft radi na takvim aplikacijama - ali vjerojatno ga koče praktična razmatranja, poput procesorske snage potrebne za prevođenje govora u govor ili pružanje sučelja jednostavnog za korištenje za proces obuke / učenja. Sam proces treninga mogao bi zahtijevati više procesorske snage nego što kućni korisnik može izvodljivo pružiti. Uvijek postoji oblak!

Copyright © Sva Prava Pridržana | 2007es.com