Macsen

Mae Macsen yn feddalwedd cynorthwyydd personol digidol Cymraeg cod agored. Rydyn ni’n defnyddio’r project hwn i ddangos beth allwn ni greu wrth ddatblygu technoleg lleferydd a deallusrwydd artiffisial Cymraeg. Rydym yn cyhoeddi’r cydrannau a’r adnoddau perthnasol yn agored ar y Porth Technolegau Iaith, er mwyn i ddatblygwyr eraill hefyd fedru’u defnyddio. Rydyn ni  wrthi yn gwneud ymchwil pellach i’w wella, a’i alluogi mewn sefyllfaoedd eraill. Yn ystod 2018-2019 buom yn datblygu Macsen i weithio fel ap ar ffonau symudol a thabledi Android.

Mae ap Macsen yn defnyddio nifer o dechnolegau gwahanol er mwyn gweithio. Defnyddia adnabod lleferydd i drosi’r hyn yr ydych yn ei ddweud i mewn i destun. Yn dilyn hynny, mae technoleg adnabod bwriad yn cael ei ddefnyddio i adnabod a oedd hynny’n gais am newyddion, y tywydd, cerddoriaeth neu un o’r dewisiadau eraill. Pan fydd angen i Macsen ymateb ar lafar, mae’n gwneud hynny drwy ddefnyddio technoleg testun-i-leferydd i lefaru’r ymateb priodol.

Mae rhagor o wybodaeth am y technolegau hyn a’r Gymraeg ar gael yn y Llawlyfr Technolegau Iaith a gyhoeddwyd gan y Coleg Cymraeg Cenedlaethol.

AP MACSEN AR GYFER ANDROID

 

sgrin_sblash_braslun_fflat

Mae gan ap Macsen, y cynorthwyydd digidol personol Cymraeg 6 sgìl:

– Gosod larwm

– Dweud yr amser

– Rhoi’r dyddiad

– Darllen y newyddion

– Adrodd am y tywydd

– Chwarae cerddoriaeth

Mae’n codi’r newyddion o benawdau Golwg360, a gallwch ofyn iddo am y penawdau, newyddion Cymru, Prydain a’r newyddion rhyngwladol, a’r newyddion busnes, iechyd, chwaraeon.

Daw’r tywydd o wefan OpenWeatherMap.

Daw’r gerddoriaeth o wefan Spotify. Ar hyn o bryd mae’n adnabod 21 band ac unigolyn, sef: Alffa, Anhrefn, Anweledig, Bryn F ôn, Cadi Gwen, Candelas, Cowbois Rhos Botwnnog, Cyrff, Gwibdaith Hen Frân, Gwilym Morus, Lleuwen, Mellt, Melys, Petrobas, Plant Duw, Sibrydion, Sŵnami, Y Bandana, Y Cyrff, Yr Ods, Yws Gwynedd. Os nad oes gennych gyfrif Spotify Premium, bydd weithiau yn chwarae darnau o gerddoriaeth wahanol i’r hyn y gofynsoch amdano – nodwedd o gyfrifon rhad ac am ddim Spotify  yw hynny, nid gwall ar yr adnabod lleferydd.

Mae modd teipio yn ogystal â defnyddio’r llais i ofyn cwestiynau a rhoi gorchmynion i Macsen.

Rydym yn dal wrthi yn gwella’r nodweddion lleferydd, ac os hoffech chi, gallwch ein helpu i’w wella yn y dyfodol drwy gyfrannu recordiadau o’ch llais. Gallwch wneud hyn o fewn yr ap drwy glicio ar Hyfforddi yno. Bydd hyn yn eich arwain i ddarllen yn uchel y brawddegau sy’n cael eu hadnabod ar gyfer y 6 sgìl yn yr ap. Byddwn yn defnyddio’r recordiadau hyn i greu setiau datblygu a setiau profi ar gyfer hyfforddi’r adnabod lleferydd. Os ydych am gyfrannu mwy na hyn, ewch i wefan CommonVoice Mozilla (gw. isod) i recordio brawddegau ar gyfer y casgliad mawr o recordiadau.

Ariannwyd yr ap a’r gwaith adnabod lleferydd gan Lywodraeth Cymru, ac rydym yn diolch iddyn nhw ac i’r gwirfoddolwyr sydd wedi bod yn cyfrannu eu lleisiau i wella technoleg lleferydd. Diolch hefyd i Golwg360 ac i OpenWeatherMap am ganiatâd i ddefnyddio’u gwasanaethau ar-lein.

techiaith/macsen-flutter

Fideos yn esbonio 5 sgil Macsen:-

1)Cyflwyniad i’r Ap Android Newydd Macsen

2)Sgìl Amser Macsen

3)Sgìl Tywydd Macsen

4)Sgìl Newyddion Macsen

5)Sgìl Spotify Macsen

6)Sgìl Larwm Macsen

HELPWCH NI I DDATBLYGU MACSEN AC ADNABOD LLEFERYDD CYMRAEG

CYFRANNWCH EICH LLAIS DRWY EIN AP TORFOLI ‘PALDARUO’ AC YN AWR HEFYD DRWY WEFAN COMMON VOICE MOZILLA

Defnyddir yr ap Paldaruo a gwefan Common Voice Mozilla (https://voice.mozilla.org/cy) i gasglu, neu dorfoli (‘crowdsourcing’) recordiadau gan wahanol unigolion yn siarad Cymraeg.

 

 

 

Apple AppStore

Mae’r recordiadau ap Paldaruo yn cael eu cadw o fewn y corpws lleferydd Paldaruo. Mae’r corpws hyd yn hyn yn cynnwys tua 40 awr o recordiadau gan bron i 570 unigolyn ar gyfer hyfforddi’r systemau adnabod lleferydd Cymraeg oddi fewn Macsen.

Ond rydyn ni angen mwy o recordiadau, gan fwy o unigolion, er mwyn gwella graddfa cywirdeb yr adnabod lleferydd ac ehangu’r mathau o destunau a chwestiynau mae’n adnabod.

Datblygwyd yr ap Paldaruo ddwy flynedd cyn cychwyn project Common Voice Mozilla, ac adeiladwyd ein cydrannau technoleg lleferydd cyntaf ar sail corpws Paldaruo. Rydym yn falch iawn o fedru partneru gyda Mozilla ar broject Common Voice sy’n broject rhyngwladol yn ceisio casglu recordiadau o nifer o ieithoedd gwahanol. Rydym wedi trosglwyddo ein promptiau Paldaruo gwreiddiol i Common Voice, a gallwch ddewis p’un ai a ydi hi’n well gennych gyflwyno’ch llais drwy ap Paldaruo neu drwy Common Voice.

Ceir cyfarwyddiadau pellach ar wefan Common Voice. Dyma fideo o sut i ddefnyddio’r ap Paldaruo isod:

MACSEN AR Y RASPBERRY PI

Roedd fersiwn cyntaf Macsen yn rhedeg ar y Raspberry Pi. Mae fideo yn dangos hyn isod.

Gweler Tudalen Adnabod Lleferydd am ragor o fanylion am gydrannau ac adnoddau adnabod lleferydd Cymraeg Macsen a’r Porth Technolegau Iaith.

Mae’r holl god a’r adnoddau ar gael ar GitHub fel bo unrhyw un yn gallu ehangu a datblygu system ‘Macsen’ ar Raspberry Pi eu hunain ac ymuno â ni yn y gwaith.

techiaith/macsen

Hefyd, mae gennym wefan fach hwylus i bobl sydd eisiau dysgu sut i osod Macsen, recordio eu llais eu hun, a chreu modiwlau newydd ar ei gyfer.

Cysylltwch â ni os oes gennych chi, fel cwmni meddalwedd, clwb codio, ysgol neu fel haciwr cyffredinol unrhyw ddiddordeb yn eu cynnwys o fewn projectau meddalwedd eich hunain.

Cyhoeddiadau Ymchwil Macsen

BUILDING INTELLIGENT ASSISTANTS FOR SPEAKERS OF A LESSER-RESOURCED LANGUAGE, CCURL 2016 2nd Workshop on Collaboration and Computing for Under-Resourced Languages ‘Towards an Alliance for Digital Language Diversity’ LREC 2016, Portoroz, Slovenia. Papur

TUAG AT GYNORTHWYYDD PERSONOL DEALLUS CYMRAEG, Astudiaeth Fer o APIs ar gyfer Gorchmynion Llafar, Systemau Cwestiwn ac Ateb a Thestun a Lleferydd ar gyfer Llywodraeth Cymru. Adroddiad