Mae Moses-SMT yn system cyfieithu peirianyddol cod agored a ddatblygwyd yn bennaf ym Mhrifysgol Caeredin. Mae’r adnodd yma yn caniatáu i chi ddatblygu eich meddalwedd cyfieithu peirianyddol eich hunain o fewn eich projectau cyfieithu drwy ei hyfforddi gyda chorpora cyfochrog sy’n bodoli eisoes.
Rydym ni yn yr Uned Technolegau Iaith wedi defnyddio Moses-SMT er mwyn darparu nodweddion cyfieithu peirianyddol Cymraeg<>Saesneg o fewn ein cynnyrch masnachol: CyfieithuCymru, meddalwedd ar gyfer cynorthwyo a galluogi cyfieithu effeithiol o fewn sefydliadau.
Heddiw rydym yn rhyddhau’r systemau cyfieithu Moses-SMT hyn i chi, yn ogystal â’r data a gafodd ei ddefnyddio i’w hyfforddi.
Rydym yn bwriadu rhyddhau ein peiriannau yn rhydd ac am ddim oherwydd ein bod yn credu bod angen i gyfieithwyr y Gymraeg fod yn feistri ar eu is-adeiledd cyfieithu peirianyddol eu hunain, a meddu ar y ddealltwriaeth ofynnol i allu meistrioli’r technolegau newydd yma i’r eithaf. Darllenwch ein cofnod blog blaenorol i weld mwy am hyn.
Mae’r peiriannau yn hawdd iawn i’w llwytho i lawr, gosod a rhedeg. Rydym wedi datblygu trefn syml iawn sy’n gofyn am ddau orchymyn *yn unig* i’w gweithredu (cyn belled ag y bydd y system weithredu a’r cydrannau priodol wedi eu gosod yn barod)!
Cyn i chi fwrw ymlaen, hoffem bwysleisio unwaith eto bwysigrwydd materion ansawdd – eich cyfrifoldeb chi yw sicrhau y defnyddir y meddalwedd cyfieithu peirianyddol hwn yn y dull priodol, gan gynnwys ôl-gyfieithu priodol ac ystyrlon (gweler Materion Ansawdd).
Docker
Mae Docker yn isadeiledd agored i ddatbygwyr a weinyddwyr systemau ar gyfer adeiladau, dosbarthu a rhedeg meddalwedd cymhleth. Gan ddefnyddio technoleg Docker bydd hi’n hawdd iawn i chi osod a rhedeg peiriannau cyfieithu Moses-SMT heb amharu dim ar weddill eich cyfrifiadur.
Rydym wedi llwytho ein system Moses-SMT i gofrestrfa ganolog docker.com.
Bydd angen fersiwn mwy diweddar na 1.0.1 o Docker ar eich system Linux. Rydym ni yn defnyddio Ubuntu fel arfer. Dyma fideo ar YouTube sy’n esbonio sut mae gosod docker 1.3 ar Ubuntu 14.04 yn hwylus. Os hoffech redeg eich peiriant cyfieithu ar gyfrifiadur Windows neu Mac OS X yna efallai y bydd modd defnyddio Boot2Docker.
O fewn Linux, y ddau orchymyn yw:
Gorchymyn 1 : Gosod Moses-SMT (gyda Docker)
$ docker pull techiaith/moses-smt
Bydd hyn yn llwytho ac yn gosod isadeiledd cyfieithu peirianyddol o fewn eich system Docker.
Ar ôl iddo orffen llwytho i lawr, teipiwch ‘docker images’ i gadarnhau ei fod wedi ei osod:
$ docker images
REPOSITORY TAG IMAGE ID CREATED VIRTUAL SIZE
techiaith/moses-smt latest 3dbad7f9aabf 41 hours ago 3.333 GB
$
Gorchymyn 2 : Cychwyn Peiriant Cyfieithu o’ch Ddewis
Mae’r Uned Technolegau Iaith wedi creu peiriannau cyfieithu ar sail hyfforddi gyda data rydym wedi’i gasglu o ffynonellau agored a chyhoeddus, megis Cofnod y Cynulliad a’r Ddeddfwriaeth ar-lein.
Mae gan y peiriannau enwau a chyfeiriadau cyfieithu penodol. Yr enw ar y peiriant a hyfforddwyd gyda chofnodion y Cynulliad yw ‘CofnodYCynulliad’ a’r enw ar gyfer peiriant y corpws deddfwriaeth yw ‘Deddfwriaeth’.
Dyma’r ail orchymyn, gan ddewis peiriant ‘CofnodYCynulliad’ a’i osod i gyfieithu o’r Saesneg i’r Gymraeg :
$ docker run --name moses-smt-cofnodycynulliad-en-cy -p 8080:8080 -p 8008:8008 techiaith/moses-smt start -e CofnodYCynulliad -s en -t cy
Bydd y system yn llwytho ffeil i lawr (tua 3Gb mewn maint yn achos peiriant CofnodYCynulliad) cyn iddo gadarnhau ei fod yn barod i dderbyn ceisiadau i’w cyfieithu.
Os agorwch chi eich porwr a mynd at http://127.0.0.1:8008 , dylai ffurflen syml ymddangos er mwyn i chi wirio a yw’r peiriant yn gweithio ai peidio :
Data Hyfforddi
Mae’r data a gasglwyd gan yr Uned, ac a ddefnyddiwyd er mwyn hyfforddi ein peiriannau Moses-SMT, ar gael isod: