Читај ми!

Tekstove sa portala RTS-a automatski čita glas Dragana Vučelića

Portal RTS-a obnovio je opciju čitanja tekstova objavljenih na portalu koju najviše koriste slepi i slabovidi, ali i oni koji ne mogu da sami čitaju sa ekrana. Softver je postavila novosadska kompanija AlfaNum, specijalizovana za sintetizaciju glasa i pretvaranje glasa u tekst.

Od 8. oktobra 2020. na sajtu RTS-a mogu da se preslušaju vesti uz pomoć AlfaNumovog najnovijeg sintetizatora baziranog na dubokim neuronskim mrežama, za koji je glas dao spiker, radijski i televizijski voditelj Dragan Vučelić dobitnik nagrade Radio-televizije Srbije za lepotu govora.

Ovaj tim koji je potekao sa Fakulteta tehničkih nauka u Novom Sadu, razvio je sintetičke, muške i ženske glasove za srpski, hrvatski i crnogorski jezik.

Korišćenjem tehnologije za konverziju govora od malog uzorka nečijeg glasa AlfaNum za dve nedelje sintetizuje glas koji zvuči veoma slično glasu osobe čiji je snimak uzet kao osnova.
Primer za to je glas kojim govori digitalni asistent Rajfajzen banke REA.

Osvajanjem ove tehnologije korišćenjem veštačke inteligencije stvorena je mogućnosti za razvoj aplikacija koje mogu da pomognu licima sa raznim oblicima invaliditeta, kao i za razvoj velikog broja drugih aplikacija.

Pomenućemo audio-knjige, aplikacije za onlajn nastavu koja je preko potrebna u sistemu obrazovanja, zvučna obaveštenja u kontakt-centrima, u automobilskoj industriji, robotici itd.

Prošle godine portovana je sinteza na Android OS. Sve slepe i slabovide osobe u Srbiji su dobila mogućnost da besplatno koriste ovu aplikaciju koja omogućava jednostavnu upotrebu svih funkcija uređaja koji koriste Android OS na maternjem jeziku.

AlfaNum tim je radio i na unapređenju automatskog prepoznavanja govora, takođe baziranog na dubokim neuronskim mrežama.

Zahvaljujući tome, završen je Sistem za automatsko prepoznavanje govora za diktiranje medicinskih nalaza za potrebe PIO Fonda koji će ubuduće olakšati rad lekara koji neće više gubiti vreme na kucanje dijagnoza.

Ovako unapređene govorne tehnologije danas omogućavaju znatno širu primenu u poslovnom i privatnom okruženju kao i očuvanje srpskog i srodnih jezika u novom domenu govorne komunikacije - između čoveka i mašina.

петак, 22. новембар 2024.
1° C

Коментари

Bravo
Шта је све (не)дозвољено да се једе када имате повишен холестерол
Krusevac
Преминуо новинар Драган Бабић
Omiljeni režiser
Луис Буњуел – редитељ који нам је показао да ово није најбољи од свих могућих светова
Posle toliko vremena..
Репер Диди најбогатији међу славнима, Ђоковић на 68. месту
Zdravlje
Редовно коришћење аспирина узрокује хиљаде смрти годишње