Trawsgrifiwr Cymraeg

Mae’r Trawsgrifiwr yn rhaglen Windows yn unig sydd yn trawsgrifio lleferydd Cymraeg i destun. Dydi’r Trawsgrifiwr ddim eto yn adnabod eich geiriau yn iawn bob amser. Mewn arbrofion syml mae’r fersiwn cychwynnol hwn yn camddeall tua 25% o eiriau mewn brawddeg. Rhoddir y canlyniadau yn y blwch testun ble mae modd i chi eu cywiro a’u copïo i’r clipfwrdd er mwyn eu gludo i unrhyw feddalwedd ar eich PC.

Gwnaed y Trawsgrifiwr Cymraeg yn bosibl diolch i brojectau a chydweithrediad rhwng Mozilla, gwirfoddolwyr, ac Uned Technolegau Iaith, Canolfan Bedwyr, Prifysgol Bangor. Ariannwyd rhan Prifysgol Bangor yn y fenter, gan gynnwys datblygu’r Trawsgrifiwr a’r Ap Macsen (y Cynorthwyydd Personol Cymraeg) gan Lywodraeth Cymru.

Prif sail y Trawsgrifiwr yw DeepSpeech gan Mozilla. Mae DeepSpeech yn beiriant adnabod lleferydd y gellir ei hyfforddi a’i gynnwys yn hwylus o fewn unrhyw becyn meddalwedd. Ewch i https://github.com/mozilla/deepspeech i ddysgu mwy am DeepSpeech. Mae cod y Trawsgrifiwr Cymraeg ar gael o:

techiaith/trawsgrifiwr-windows

Mae hel casgliadau enfawr o recordiadau yn hanfodol i hyfforddi peiriant adnabod lleferydd. Rydym wedi gwneud hynny yn bennaf drwy gyfrwng Common Voice, sef llwyfan Mozilla i gasglu lleisiau pobl yn darllen yn uchel frawddegau penodol. Rydym yn ddiolchgar iawn i Rhoslyn Prys (meddal.com) a ymgymerodd â nifer o ymgyrchoedd torfoli ar sail wirfoddol, i’r Mentrau Iaith, Cyngor Gwynedd, Llyfrgell Genedlaethol Cymru a weithiodd gyda Rhoslyn ar rai o’r ymgyrchoedd hyn, hefyd i Lywodraeth Cymru am eu hymgyrch gyhoeddusrwydd hwy, ac i liaws o gyfranogwyr ar draws Cymru a thu hwnt sydd wedi cyfrannu eu lleisiau i’r Common Voice Cymraeg.

Hoffem ni ddiolch hefyd i Centre Inria de Paris am gorpws agored OSCAR sydd yn cynnwys casgliad mawr o destunau Cymraeg wedi’u crafu o’r we. Rydym wedi defnyddio’r corpws i hyfforddi modelau o eirfa a ieithwedd Cymraeg er mwyn cynorthwyo’r broses adnabod ac i ffurfio canlyniadau cywirach. Ewch i https://traces1.inria.fr/oscar/ am ragor o wybodaeth.