Razpoznavanje slovenskega govora z metodami globokih nevronskih mrež

Uporabna informatika Pub Date : 2019-09-27 DOI:10.31449/upinf.vol27.num3.53

Matej Ulčar, Simon Dobrišek, Marko Robnik-Šikonja

引用次数: 0

Abstract

V zadnjem času se na področju samodejnega razpoznavanja govora uveljavljajo globoke nevronske mreže, ki nadomeščajo akustično modeliranje z uporabo HMM in GMM modelov ter n-grame za jezikovni model. Za razpoznavanje govorjene slovenščine smo izdelali in preizkusili več arhitektur časovno zakasnjenih nevronskih mrež in nevronskih mrež z dolgim kratkoročnim spominom na akustičnem in jezikovnem modelu v sistemu Kaldi. Razpoznavalnik smo učili na obširnem besednjaku, ki vsebuje približno milijon različnih besed. Najboljše rezultate smo dosegli s časovno zakasnjenimi nevronskimi mrežami, kjer smo dosegli 27,16% napako po kriteriju WER. Preliminarni rezultati kažejo boljšo natančnost v primerjavi z Googlovim speech-to-text modelom, vendar pa je potrebno več dodatnega testiranja za zanesljivo primerjavo.

查看原文本刊更多论文

求助全文

约1分钟内获得全文求助全文

来源期刊

Uporabna informatika

自引率

0.00%

发文量