Un o brofiadau cyson bod yn siaradwr Cymraeg ydi’r angen i frwydro i gael defnyddio dy iaith os am ei defnyddio y tu allan i gylch y teulu a’r ffrindiau sy’n ei medru. O orfod gofyn yn benodol am ffurflen Gymraeg yn y deintydd (sydd fel arfer yn llechu mewn cwpwrdd yn y storfa yn y cefn) i ddewis yr opsiwn Gymraeg ar linell ffôn dim ond i gael eich pasio drwodd at siaradwr Saesneg ymddiheurgar.  Ar y cyfrifiadur ac o fewn meddalwedd, yr un yw’r stori yn aml. Fel arfer, rhaid gosod pecyn iaith Cymraeg i gael y rhyngwyneb ac adnoddau eraill yn Gymraeg, a chyn hynny mae angen gwybod am fodolaeth y pecyn iaith a lle i gael ato. 

Un o’r agweddau hynny sy’n gwneud y datblygiadau diweddaraf o fewn maes Deallusrwydd Artiffisial yn rhai cyffrous yw’r ffaith bod y Gymraeg o fewn y modelau iaith mawr o’r cychwyn. Does dim angen gosod nodweddion ychwanegol, neu neidio i mewn i’r gosodiadau. Gallwch deipio Cymraeg i mewn i Claude neu Copilot a chael ateb syndod o rugl. 

Yn ein gwaith ni yma yn yr Uned, mae sicrhau bod ein modelau Adnabod Lleferydd (Speech Recognition) a Thestun i Leferydd (Text-to-Speech) ni hefyd yn fodelau amlieithog sy’n gallu siarad Cymraeg a Saesneg wedi bod yn flaenoriaeth fawr. Er bod hynny’n dechnegol fwy heriol, mae creu un model sy’n medru dwy iaith, ac yn gallu newid rhyngddynt yn ddidrafferth ar ganol brawddeg hyd yn oed yn allweddol. 

Mae hynny oherwydd ein bod ni ar lafar, fel siaradwyr Cymraeg, yn cymysgu Saesneg i mewn i’n Cymraeg. Hyd yn oed wrth gadw at eirfa Gymraeg yn unig, mae angen i fodelau ymdopi gydag enwau pobl, ffilmiau, sefydliadau a chynnyrch lle nad ydi eu sillafiad nhw n cyd-fynd efo ynganiad cyffredin y Gymraeg. Os am drawsgrifio’r modd y mae siaradwyr Cymraeg yn siarad o ddydd i dydd felly, mae’n rhaid i’n modelau ni ymdopi gyda’r cymysgu ieithyddol hwn o fewn y Gymraeg, a’r newid rhwng y Gymraeg o un frawddeg i’r llall.    

Dyna yn union mae ein modelau Adnabod Lleferydd a Thestun i Leferydd ni (sydd ar gael o https://www.techiaith.cymru) yn ceisio’i wneud, ac fe allwch eu gweld ar waith o fewn cynorthwyydd digidol Macsen (https://macsen.techiaith.cymru) a gwefan drawsgrifio ac isdeitlo Trawsgrifiwr (https://trawsgrifiwr.techiaith.cymru). Gallwch hefyd wrando ar y lleisiau synthetig dwyieithog. 

Os ydyn ni am gefnogi’r defnydd o’r Gymraeg fel iaith fyw, fodern, mae angen i ni sicrhau ei bod hi yr un mor hawdd i’w defnyddio yng Nghymru ag y mae’r Saesneg. Diolch i fuddsoddiad gan Lywodraeth Cymru dros y blynyddoedd, mae sicrhau nad ydi’r Gymraeg yn cael ei thrin yn llai ffafriol na’r Saesneg o fewn yr amgylcheddau technegol mwyaf blaengar yn bosib. Os ydych chi’n datblygu ar gyfer y maes hwn, cymrwch olwg ar yr adnoddau sydd ar gael o https://huggingface.co/techiaith a https://github.com/techiaith a chysylltwch gyda ni drwy techiaith@bangor.ac.uk am ragor o fanylion.