Macsen

Mae Macsen yn feddalwedd cynorthwyydd personol Cymraeg cod agored tebyg i Alexa neu’r Google Assistant.
Ystyr cod agored yw y gall unrhyw un weld, addasu a dosbarthu’r cod fel yr hoffen nhw. Mae’n gweithio fel ap ar ffôn neu dabled, ac mae ar gael ar gyfer dyfeisiau iOS ac Android. Mae fersiwn ar-lein o Macsen ar gael hefyd. Mae’n bosib siarad gyda Macsen mewn Cymraeg naturiol er mwyn gofyn iddo gwblhau tasgau neu ofyn am wybodaeth.

Sgiliau Macsen
Erbyn hyn, mae gan Macsen nifer o sgiliau, gan gynnwys y gallu i chwarae cerddoriaeth Cymraeg ar Spotify, rhaglenni ar S4C Clic, rhoi’r golau ymlaen neu i ffwrdd, adrodd y newyddion diweddaraf o benawdau Golwg360 a darparu rhagolygon y tywydd o wefan OpenWeatherMap. Mae Macsen hefyd yn defnyddio ChatGPT, cyfieithu lleferydd Saesneg i destun Cymraeg a thrawsgrifio lleferydd Cymraeg i destun. Felly mae modd teipio yn ogystal â defnyddio’r llais i ofyn cwestiynau a rhoi gorchmynion i Macsen.
Cynorthwyydd
Mae’r datblygiadau diweddaraf ym maes deallusrwydd artiffisial wedi gweddnewid y maes, a pheri i ni ailystyried yr hyn y mae’n bosib i gyfrifiadur ei gyflawni. Erbyn hyn, mae Macsen yn defnyddio Model Iaith ChatGPT-4 i ateb cwestiynau, rhesymu a sgwrsio drwy gyfrwng y Gymraeg.
Cyfieithu
Mae sgil cyfieithu Macsen yn galluogi defnyddwyr i gyfieithu lleferydd Saesneg i destun Cymraeg. Erbyn hyn, mae’r dechnoleg hefyd wedi’i gysylltu â geiriadur Y Termiadur Addysg, sy’n darparu nodwedd defnyddiol er mwyn rhestru termau cysylltiedig i’r hyn a lefarwyd. Mae adnoddau eraill a grëwyd i hwyluso cyfieithu ar gael, megis aliniwr a’n hadnodd ar gyfer rhannu atgofion cyfieithu.
Trawsgrifio
Mae sgil trawsgrifio Macsen yn galluogi defnyddwyr i drawsgrifio unrhyw leferydd Cymraeg yn destun. Ar ôl llefaru eich neges, gallwch gopio’r testun mewn i unrhyw ap, boed yn neges destun, e-bost neu’n restr siopa! Yn ogystal â bod yn sgil yn Macsen, mae Trawsgrifiwr ar gael fel fersiwn ar-lein. Mae fersiwn Windows o Trawsgrifiwr ar gael hefyd.
Lawrlwythwch ap Macsen
Byddwch yn rhan o chwyldro digidol yr iaith Gymraeg a lawrlwythwch ap Macsen ar gyfer dyfeisiadau iOS neu Android heddiw!
Technolegau iaith o fewn Macsen
Mae Macsen yn defnyddio nifer o dechnolegau gwahanol er mwyn gweithio. Defnyddia adnabod lleferydd Mozilla DeepSpeech i drosi’r hyn yr ydych yn ei ddweud i mewn i destun. Yn dilyn hynny, mae technoleg adnabod bwriad yn cael ei ddefnyddio i adnabod a oedd hynny’n gais am newyddion, y tywydd, cerddoriaeth neu un o’r dewisiadau eraill. Pan fydd angen i Macsen ymateb ar lafar, mae’n gwneud hynny drwy ddefnyddio technoleg testun-i-leferydd i lefaru’r ymateb priodol.
Rydym yn dal wrthi yn gwella’r nodweddion lleferydd, ac os hoffech chi, gallwch ein helpu i’w wella yn y dyfodol drwy gyfrannu recordiadau o’ch llais. Gallwch wneud hyn o fewn yr ap drwy glicio ar Hyfforddi yno. Bydd hyn yn eich arwain i ddarllen yn uchel y brawddegau sy’n cael eu hadnabod ar gyfer y sgiliau yn yr ap. Byddwn yn defnyddio’r recordiadau hyn i greu setiau datblygu a setiau profi ar gyfer hyfforddi’r adnabod lleferydd. Os ydych am gyfrannu mwy na hyn, ewch i wefan CommonVoice Mozilla i recordio brawddegau ar gyfer y casgliad mawr o recordiadau. Mae rhagor o wybodaeth am y technolegau hyn a’r Gymraeg ar gael yn y Llawlyfr Technolegau Iaith a gyhoeddwyd gan y Coleg Cymraeg Cenedlaethol.
Ariannwyd Macsen a’r gwaith adnabod lleferydd gan Lywodraeth Cymru, ac rydym yn diolch iddyn nhw ac i’r gwirfoddolwyr sydd wedi bod yn cyfrannu eu lleisiau i wella technoleg lleferydd.
Diolch hefyd i Golwg360 ac i OpenWeatherMap am ganiatâd i ddefnyddio’u gwasanaethau ar-lein.
Adnoddau cod agored i ddatblygwyr
Rydyn ni’n defnyddio’r project hwn i ddangos beth allwn ni greu wrth ddatblygu technoleg lleferydd a deallusrwydd artiffisial Cymraeg ac mae’r holl gydrannau ac adnoddau perthnasol wedi eu rhannu isod dan drwydded cod agored:
techiaith/macsen-flutter
techiaith/macsen-sgwrsfot
Mae dogfennaeth sy’n dangos sut y gellir defnyddio Macsen i ehangu gwasanaeth digidol ar gael o fewn cod yr ap: https://github.com/techiaith/macsen-flutter/blob/master/docs/README.md
Cyhoeddiadau ymchwil Macsen
Macsen: A Voice Assistant for Speakers of a Lesser Resourced Language, Proceedings of the 1st Joint SLTU and CCURL Workshop (SLTU-CCURL 2020), pages 194-201 Language Resources and Evaluation Conference (LREC 2020), Marseille, France Papur
Building Intelligent Assistants for Speakers of a Lesser-Resourced Language,CCURL 2016 2nd Workshop on Collaboration and Computing for Under-Resourced Languages ‘Towards an Alliance for Digital Language Diversity’ (LREC 2016), Portoroz, Slovenia. Papur
Tuag at Gynorthwyydd Personol Deallus Cymraeg, Astudiaeth Fer o APIs ar gyfer Gorchmynion Llafar, Systemau Cwestiwn ac Ateb a Thestun a Lleferydd ar gyfer Llywodraeth Cymru. Adroddiad