Dyma orfodwr alinio ar gyfer hwyluso creu corpora lleferydd Cymraeg.
Os hoffech chi gael ffordd hwylus o ddefnyddio’r gorfodwr alinio o fewn amgylchedd Docker, yna mae’r adnodd canlynol ar gael hefyd:
Cedwir meta data safonol ynghylch y gorfodwr alinio o fewn ein cronfa adnoddau iaith sy’n rhan o’r rhwydwaith Ewropeaidd META-SHARE:
Llwytho'r adnodd 'Gorfodwr Alinio ar META-SHARE techiaith' i lawr o metashare.techiaith.cymru Download 'Gorfodwr Alinio ar META-SHARE techiaith' resource from metashare.techiaith.cymru |
Cefndir
Mae technolegau lleferydd ar gyfer iaith benodol, megis adnabod lleferydd a testun-i-leferydd, yn ddibynnol ar gorpora lleferydd sy’n llawn enghreifftiau sain siaradwyr wedi’u trawsgrifio a’u hanodi gyda gwybodaeth ffoneteg a phwyslais geiriau.
Mae modd gwneud y gwaith anodi drwy alinio’n fanwl gywir y testun gyda’r sain. Ond gan fod maint rhai corpora lleferydd yn enfawr mae angen dulliau awtomatig i greu corpws o’r fath wedi’i alinio.
Mae gorfodwr alinio yn defnyddio meddalwedd adnabod lleferydd, trawsgrifiadau a geiriaduron ynganu ar gyfer alinio a nodi lleoliad pob gair a ffonem o fewn ffeil sain:
O gyflawni camau i orfodi alinio testun gyda sain corpws lleferydd cyfan, mae modd cael gwell dealltwriaeth o’i ansawdd yn ogystal â chynnig cyfleoedd i wella’r elfennau hyfforddi modelau acwstig.