Creu eich Peiriannau Cyfieithu parth-benodol eich hun

Mae nifer o gyfieithwyr yn credu mai dim ond un peiriant cyfieithu sydd yn bodoli o fewn eu hisadeiledd cyfieithu. Ond mae rhai cyfieithwyr yn defnyddio nifer o beiriannau – peiriannau cyfieithu parth-benodol.

Peiriant sydd wedi’i greu a’i gynllunio er mwyn cyfieithu testunau sy’n deillio o feysydd, arddulliau neu gyweiriau arbennig yw peiriant cyfieithu parth benodol. I nifer o gyfieithwyr mae peiriannau parth-benodol yn cynnig gwell cyfieithiadau na systemau cyfieithu peirianyddol cyffredinol.

Mae peiriannau parth-benodol yn cynnig manteision pendant mewn sefyllfaoedd lle defnyddir cofion cyfieithu arferol eisoes yn llwyddiannus i arbed amser a chostau. Os oes gennych fynediad at gofion cyfieithu parth benodol, gallai defnyddio peiriant cyfieithu parth-benodol, yn unol â threfn ôl-olygu, alluogi i chi fod yn llawer mwy cynhyrchiol ac effeithlon fel cyfieithydd nac y byddech gan ddefnyddio systemau cof cyfieithu arferol yn unig.

Heddiw rydym yn rhyddhau adnoddau yn y Porth Technolegau Iaith ac ar GitHub sydd yn eich caniatáu chi i greu, gan ddefnyddio Moses-SMT, eich peiriannau cyfieithu parth-benodol eich hun.

Rhybudd – bydd angen cyfrifiadur Linux arnoch (e.e. Ubuntu), sy’n meddu ar o leiaf 4Gb o gof RAM a maint sylweddol o destun Cymraeg-Saesneg cyfochrog. Mae ein dulliau yn cynhyrchu peiriannau parth-benodol nad ydynt angen lawer o gof i’w rhedeg, ond sy’n gofyn am lawer o ofod GB ar eich disg caled.

Cyn dechrau, bydd rhaid i chi osod Moses-SMT gan ddilyn y cyfarwyddiadau ar y dudalen canlynol : Gosod Moses-SMT ar Linux. Mae’r sgriptiau gosod yn cynnwys ychwanegiadau gennym ni sy’n hwyluso’r broses o hyfforddi Moses-SMT gyda’ch testun Cymraeg-Saesneg cyfochrog.

Mae’r dudalen Creu Peiriannau Moses-SMT yn cynnig cyfarwyddiadau llawn ar sut mae mynd ati, ond yn syml, dyweder bod gennych destun cyfochrog eisioes yn bodoli o ganlyniad i’ch gwaith cyfieithu ar ddogfenni marchnata, dylech ddilyn y camau canlynol.

I ddechrau, rhowch y testun Cymraeg o fewn ffeil o’r enw ‘Marchnata.cy’ a’r testun Saesneg o fewn ‘Saesneg.en’ ac yna cadwch y ffeiliau o fewn is-ffolder ‘corpus’ o fewn cynllun ffolderi eich peiriant ‘Marchnata’, fel hyn:

moses@ubuntu:~/moses-smt$ cd ~/moses-models/Marchnata/corpus
moses@ubuntu:~/moses-models/Marchnata/corpus$ ls
Marchnata.cy  Marchnata.en

Mae’r data yn nawr yn barod ar gyfer ei hyfforddi. Bydd angen dim ond un gorchymyn arnoch, gan nodi enw’r peiriant a’r cyfeiriad cyfieithu (e.e. Cymraeg i Saesneg, neu Saesneg i Gymraeg). Felly, os hoffwch chi greu peiriant sy’n arbenigo mewn marchnata, ac sy’n cyfieithu o Saesneg i Gymraeg, defnyddiwch y gorchymyn canlynol :

moses@ubuntu:~/moses-smt$ python moses.py train -e Marchnata -s en -t cy

Bydd hyn yn achosi i lwyth o destun ymddangos ar y sgrin. Bydd y gorchymyn, yn dibynnu ar maint eich set ddata gwreiddiol, yn cymryd oriau i’w gwblhau. Does dim angen dilyn adroddiadau cynnydd y broses hyfforddi yn drylwyr ond byddwch angen cadw llygaid allan am unrhyw negeseuon ‘gwall difrifol’ er mwyn gwirio os y bu’r hyfforddi yn llwyddianus.

Os oedd y broses hyfforddi yn llwyddianus, dilynwch unrhyw gais i olygu a newid ffeiliau y peiriant newydd.

Yn olaf, i gychwyn eich peiriant newydd, defnyddiwch y gorchymyn canlynol :

moses@ubuntu:~/moses-smt$ python moses.py start -e Marchnata -s en -t cy