Trawsgrifiwr Cymraeg

Mae’r Trawsgrifiwr yn rhaglen feddalwedd sydd yn trawsgrifio lleferydd Cymraeg yn destun. Mae’n cael ei adolygu a’i diweddaru yn barhaus, ac mae bellach ar gael ar dri llwyfan.

Yn gyntaf, mae’r Trawsgrifiwr Ar-lein ar gael yma. Gallwch naill ai gysylltu gyda gwasanaeth allanol fel YouTube i isdeitlo fideos, clicio neu ollwng i mewn ffeiliau gan ddefnyddio’r rhyngwyneb ar-lein, neu recordio llais yn uniongyrchol o’r microffon.

Yn ail, mae’r Trawsgrifiwr ar gael fel sgìl yn yr ap Cynorthwyydd Personol Cymraeg Macsen.

Yn drydydd, gallwch fynd at y fersiwn Windows o’r dudalen hon  (gw. isod).

Mae’r cod ffynhonnell hefyd ar gael yn GitHub –

Trawsgrifiwr ar gyfer Windows: https://github.com/techiaith/trawsgrifiwr-windows

Trawsgrifiwr Ar-lein: https://github.com/techiaith/trawsgrifiwr-arlein

Dydi’r Trawsgrifiwr ddim eto yn adnabod eich geiriau yn iawn bob amser. Mewn arbrofion syml mae’r fersiwn cychwynnol hwn yn deall tua 85% o eiriau mewn brawddeg mewn Cymraeg safonol. Fe welwch y canlyniadau yn y blwch testun ble mae modd i chi gywiro unrhyw wallau a chopïo’r testun i’r clipfwrdd er mwyn eu gludo i unrhyw feddalwedd ar eich PC. Mae’r Trawsgrifiwr yn gallu delio gydag isdeitlau YouTube hefyd.

Llwythwch i lawr a rhedwch y rhaglen gosod o’r fan hon.

Gwnaed y Trawsgrifiwr Cymraeg yn bosibl diolch i brojectau a chydweithrediad rhwng Mozilla, gwirfoddolwyr, ac Uned Technolegau Iaith, Canolfan Bedwyr, Prifysgol Bangor. Ariannwyd rhan Prifysgol Bangor yn y fenter, gan gynnwys datblygu’r Trawsgrifiwr a’r Ap Macsen (y Cynorthwyydd Personol Cymraeg) gan Lywodraeth Cymru.

Prif sail y Trawsgrifiwr yw DeepSpeech gan Mozilla. Mae DeepSpeech yn beiriant adnabod lleferydd y gellir ei hyfforddi a’i gynnwys yn hwylus o fewn unrhyw becyn meddalwedd. Ewch i https://github.com/mozilla/deepspeech i ddysgu mwy am DeepSpeech. Mae cod y Trawsgrifiwr Cymraeg ar gael o:

techiaith/trawsgrifiwr-windows

Mae hel casgliadau enfawr o recordiadau yn hanfodol i hyfforddi peiriant adnabod lleferydd. Rydym wedi gwneud hynny yn bennaf drwy gyfrwng Common Voice, sef llwyfan Mozilla i gasglu lleisiau pobl yn darllen yn uchel frawddegau penodol. Rydym yn ddiolchgar iawn i Rhoslyn Prys (meddal.com) a ymgymerodd â nifer o ymgyrchoedd torfoli ar sail wirfoddol, i’r Mentrau Iaith, Cyngor Gwynedd, Llyfrgell Genedlaethol Cymru a weithiodd gyda Rhoslyn ar rai o’r ymgyrchoedd hyn, hefyd i Lywodraeth Cymru am eu hymgyrch gyhoeddusrwydd hwy, ac i liaws o gyfranogwyr ar draws Cymru a thu hwnt sydd wedi cyfrannu eu lleisiau i’r Common Voice Cymraeg.

Hoffem ni ddiolch hefyd i Centre Inria de Paris am gorpws agored OSCAR sydd yn cynnwys casgliad mawr o destunau Cymraeg wedi’u crafu o’r we. Rydym wedi defnyddio’r corpws i hyfforddi modelau o eirfa a ieithwedd Cymraeg er mwyn cynorthwyo’r broses adnabod ac i ffurfio canlyniadau cywirach. Ewch i https://traces1.inria.fr/oscar/ am ragor o wybodaeth.