Adnabod Lleferydd

Mae technolegau adnabod lleferydd yn caniatáu i system gyfrifiadurol adnabod geiriau a leferir gan berson er mwyn trosi’r sain yn destun. Nid yw hyn yn golygu o reidrwydd y bydd y system adnabod lleferydd yn deall ystyr pob gair.

Mae’r adnoddau adnabod lleferydd canlynol ar gael drwy’r Porth Technolegau Iaith:

Mozilla DeepSpeech Cymraeg

Mae DeepSpeech yn darpariaeth adnabod lleferydd gan Mozilla, gwneuthurwyr y porwr Firefox.  Gellir ei hyfforddi a’i gynnwys yn hwylus o fewn unrhyw becyn meddalwedd er mwyn ychwanegu nodweddion adnabod lleferydd. Ewch i https://github.com/mozilla/deepspeech i ddysgu mwy am DeepSpeech.

Mae’r Porth Technolegau Iaith yn darparu’r modelau parod Cymraeg a sgriptiau ar gyfer eu hyfforddi o ddata Mozilla CommonVoice Cymraeg. Ewch i ddudalenau ‘Releases; o fewn dudalennau GitHub i ddarllen rhagor ac ac i lwytho’r modelau eu hunain i lawr

techiaith/docker-deepspeech-cy

Rydym yn defnyddio’r modelau DeepSpeech Cymraeg o fewn dau becyn, hefyd ar gael ar ffurf cod a meddalwedd i’w osod ar eich dyfais neu gyfrifiadur, sef :

 

 


Citiau Adnabod Lleferydd Eraill

 

Kaldi Cymraeg

Mae Kaldi-ASR (http://kaldi-asr.org) wedi dod i’r amlwg yn y blynyddoedd diweddar fel cit wireddu adnabod lleferydd cod agored. Mae’n darparu gwelliannau a gwell hyblygrwydd trwyddedu a masnacheiddio na unrhyw cit arall. Mae hefyd yn darparu hyfforddi modelau acwstig gyda rhwydweithiau niwral. O ganlyniad mae ‘na gynnydd mawr yn ei ddefnydd gan ymchwilwyr, ddatblygwyr a chwmnïau.

Dyma adnodd amgylchedd hyfforddi modelau iaith ac acwstig Cymraeg gyda Kaldi:

techiaith/kaldi-cy

Defnyddir Kaldi Cymraeg o fewn ein project cynorthwyydd Cymraeg ‘Macsen‘ :

HTK Cymraeg

Mae’r HTK (Hidden Markov Model Speech Recognition Toolkit) o Brifysgol Caergrawnt wedi bod yn sail yn y maes ymchwil adnabod lleferydd ers y 90au ac mae  ei ddefnyddio yn llwyddiannus gyda’r Gymraeg gyda’r adnoddau canlynol:

techiaith/seilwaith

 

Julius Cymraeg

Mae Julius yn system weithredu adnabod lleferydd  LVCSR (‘large vocabulary continuous speech recognition’) yn unig. Defnyddir Julius i roi’r modelau acwstig a hyfforddir gan y HTK ar waith:

techiaith/julius-cy

 


Adnoddau Eraill

 

Gwaith Adnabod Lleferydd Uwch (GALLU)

Canlyniadau GALLU

Cofnodion Blog ynghylch Adnabod Lleferydd :

http://techiaith.cymru/category/adnabodlleferydd/