четвртак, 15.10.2020, 06:30 -> 20:54
Извор: АлфаНум
Текстове са портала РТС-а аутоматски чита глас Драгана Вучелића
Портал РТС-а обновио је опцију читања текстова објављених на порталу коју највише користе слепи и слабовиди, али и они који не могу да сами читају са екрана. Софтвер је поставила новосадска компанија АлфаНум, специјализована за синтетизацију гласа и претварање гласа у текст.
Од 8. октобра 2020. на сајту РТС-а могу да се преслушају вести уз помоћ АлфаНумовог најновијег синтетизатора базираног на дубоким неуронским мрежама, за који је глас дао спикер, радијски и телевизијски водитељ Драган Вучелић добитник награде Радио-телевизије Србије за лепоту говора.
Овај тим који је потекао са Факултета техничких наука у Новом Саду, развио је синтетичке, мушке и женске гласове за српски, хрватски и црногорски језик.
Коришћењем технологије за конверзију говора од малог узорка нечијег гласа АлфаНум за две недеље синтетизује глас који звучи веома слично гласу особе чији је снимак узет као основа.
Пример за то је глас којим говори дигитални асистент Рајфајзен банке РЕА.
Освајањем ове технологије коришћењем вештачке интелигенције створена је могућности за развој апликација које могу да помогну лицима са разним облицима инвалидитета, као и за развој великог броја других апликација.
Поменућемо аудио-књиге, апликације за онлајн наставу која је преко потребна у систему образовања, звучна обавештења у контакт-центрима, у аутомобилској индустрији, роботици итд.
Прошле године портована је синтеза на Андроид ОС. Све слепе и слабовиде особе у Србији су добила могућност да бесплатно користе ову апликацију која омогућава једноставну употребу свих функција уређаја који користе Андроид ОС на матерњем језику.
АлфаНум тим је радио и на унапређењу аутоматског препознавања говора, такође базираног на дубоким неуронским мрежама.
Захваљујући томе, завршен је Систем за аутоматско препознавање говора за диктирање медицинских налаза за потребе ПИО Фонда који ће убудуће олакшати рад лекара који неће више губити време на куцање дијагноза.
Овако унапређене говорне технологије данас омогућавају знатно ширу примену у пословном и приватном окружењу као и очување српског и сродних језика у новом домену говорне комуникације - између човека и машина.
Коментари