Gorfodwr Alinio

Dyma orfodwr alinio ar gyfer hwyluso creu corpora lleferydd Cymraeg.

techiaith/Prosodylab-Aligner

Os hoffech chi gael ffordd hwylus o ddefnyddio’r gorfodwr alinio o fewn amgylchedd Docker, yna mae’r adnodd canlynol ar gael hefyd:

techiaith/docker-ProsodylabAligner-cy

Cedwir meta data safonol ynghylch y gorfodwr alinio o fewn ein cronfa adnoddau iaith sy’n rhan o’r rhwydwaith Ewropeaidd META-SHARE:

Llwytho'r adnodd 'Gorfodwr Alinio ar META-SHARE techiaith' i lawr o metashare.techiaith.cymru

Download 'Gorfodwr Alinio ar META-SHARE techiaith' resource from metashare.techiaith.cymru

Cefndir

Mae technolegau lleferydd ar gyfer iaith benodol, megis adnabod lleferydd a testun-i-leferydd, yn ddibynnol ar gorpora lleferydd sy’n llawn enghreifftiau sain siaradwyr wedi’u trawsgrifio a’u hanodi gyda gwybodaeth ffoneteg a phwyslais geiriau.

Mae modd gwneud y gwaith anodi drwy alinio’n fanwl gywir y testun gyda’r sain. Ond gan fod maint rhai corpora lleferydd yn enfawr mae angen dulliau awtomatig i greu corpws o’r fath wedi’i alinio.

Mae gorfodwr alinio yn defnyddio meddalwedd adnabod lleferydd, trawsgrifiadau a geiriaduron ynganu ar gyfer alinio a nodi lleoliad pob gair a ffonem o fewn ffeil sain:

prosodylabaligner

O gyflawni camau i orfodi alinio testun gyda sain corpws lleferydd cyfan, mae modd cael gwell dealltwriaeth o’i ansawdd yn ogystal â chynnig cyfleoedd i wella’r elfennau hyfforddi modelau acwstig.