Macsen

Mae Macsen yn feddalwedd cynorthwyydd personol digidol Cymraeg cod agored. Rydyn ni’n defnyddio’r project hwn i ddangos beth allwn ni greu wrth ddatblygu technoleg lleferydd a deallusrwydd artiffisial Cymraeg. Rydym yn cyhoeddi’r cydrannau a’r adnoddau perthnasol yn agored ar y Porth Technolegau Iaith, er mwyn i ddatblygwyr eraill hefyd fedru’u defnyddio. Rydyn ni  wrthi yn gwneud ymchwil pellach i’w wella, a’i alluogi mewn sefyllfaoedd eraill. Rydym yn datblygu Macsen i weithio fel ap ar ffonau symudol a thabledi Android ac iOS.

Android : https://play.google.com/store/apps/details?id=cymru.techiaith.flutter.macsen

Apple App Store : https://apps.apple.com/gb/app/macsen/id1489915663

sgrin_sblash_braslun_fflat

Mae gan ap Macsen, y cynorthwyydd digidol personol Cymraeg, 7 sgìl:

– Gosod larwm

– Dweud yr amser

– Rhoi’r dyddiad

– Darllen y newyddion

– Adrodd am y tywydd

– Chwarae cerddoriaeth

– Darllen brawddegau cyntaf erthyglau o Wicipedia Cymraeg

Mae’n codi’r newyddion o benawdau Golwg360, a gallwch ofyn iddo am y penawdau, newyddion Cymru, Prydain a’r newyddion rhyngwladol, a’r newyddion busnes, iechyd, chwaraeon.

Daw’r tywydd o wefan OpenWeatherMap.

Daw’r gerddoriaeth o wefan Spotify. Ar hyn o bryd mae’n adnabod 21 band ac unigolyn, sef: Alffa, Anhrefn, Anweledig, Bryn Fôn, Cadi Gwen, Candelas, Cowbois Rhos Botwnnog, Cyrff, Gwibdaith Hen Frân, Gwilym Morus, Lleuwen, Mellt, Melys, Petrobas, Plant Duw, Sibrydion, Sŵnami, Y Bandana, Y Cyrff, Yr Ods, Yws Gwynedd. Os nad oes gennych gyfrif Spotify Premium, bydd weithiau yn chwarae darnau o gerddoriaeth wahanol i’r hyn y gofynsoch amdano – nodwedd o gyfrifon rhad ac am ddim Spotify  yw hynny, nid gwall ar yr adnabod lleferydd.

Mae modd teipio yn ogystal â defnyddio’r llais i ofyn cwestiynau a rhoi gorchmynion i Macsen.

Mae ap Macsen yn defnyddio nifer o dechnolegau gwahanol er mwyn gweithio. Defnyddia adnabod lleferydd Mozilla DeepSpeech i drosi’r hyn yr ydych yn ei ddweud i mewn i destun. Yn dilyn hynny, mae technoleg adnabod bwriad yn cael ei ddefnyddio i adnabod a oedd hynny’n gais am newyddion, y tywydd, cerddoriaeth neu un o’r dewisiadau eraill. Pan fydd angen i Macsen ymateb ar lafar, mae’n gwneud hynny drwy ddefnyddio technoleg testun-i-leferydd i lefaru’r ymateb priodol.

Mae’r cod i’r app ar gael o GitHub yn y gobaith y bydd yn adnodd defnyddiol i ddatblygwyr:

techiaith/macsen-flutter

Yn ogystal, mae’r cod ar gyfer y parsiwr bwriad hefyd ar gael yn GitHub:

techiaith/macsen-sgwrsfot

Rydym yn dal wrthi yn gwella’r nodweddion lleferydd, ac os hoffech chi, gallwch ein helpu i’w wella yn y dyfodol drwy gyfrannu recordiadau o’ch llais. Gallwch wneud hyn o fewn yr ap drwy glicio ar Hyfforddi yno. Bydd hyn yn eich arwain i ddarllen yn uchel y brawddegau sy’n cael eu hadnabod ar gyfer y 7 sgìl yn yr ap. Byddwn yn defnyddio’r recordiadau hyn i greu setiau datblygu a setiau profi ar gyfer hyfforddi’r adnabod lleferydd. Os ydych am gyfrannu mwy na hyn, ewch i wefan CommonVoice Mozilla (gw. isod) i recordio brawddegau ar gyfer y casgliad mawr o recordiadau.

Mae rhagor o wybodaeth am y technolegau hyn a’r Gymraeg ar gael yn y Llawlyfr Technolegau Iaith a gyhoeddwyd gan y Coleg Cymraeg Cenedlaethol.

Ariannwyd yr ap a’r gwaith adnabod lleferydd gan Lywodraeth Cymru, ac rydym yn diolch iddyn nhw ac i’r gwirfoddolwyr sydd wedi bod yn cyfrannu eu lleisiau i wella technoleg lleferydd. Diolch hefyd i Golwg360 ac i OpenWeatherMap am ganiatâd i ddefnyddio’u gwasanaethau ar-lein.

 

Fideos yn esbonio sgiliau Macsen

1)Cyflwyniad i’r Ap Macsen

 

2)Sgìl Amser Macsen

3)Sgìl Dyddiad Macsen

4)Sgìl Tywydd Macsen

5)Sgìl Newyddion Macsen

6)Sgìl Spotify Macsen

7)Sgìl Larwm Macsen

8)Sgìl Wikipedia Macsen

HELPWCH NI I DDATBLYGU MACSEN AC ADNABOD LLEFERYDD CYMRAEG

CYFRANNWCH EICH LLAIS DRWY EIN AP TORFOLI ‘PALDARUO’ AC YN AWR HEFYD DRWY WEFAN COMMON VOICE MOZILLA

Defnyddir yr ap Paldaruo a gwefan Common Voice Mozilla (https://voice.mozilla.org/cy) i gasglu, neu dorfoli (‘crowdsourcing’) recordiadau gan wahanol unigolion yn siarad Cymraeg.

 

 

 

Apple AppStore

Mae’r recordiadau ap Paldaruo yn cael eu cadw o fewn y corpws lleferydd Paldaruo. Mae’r corpws hyd yn hyn yn cynnwys tua 40 awr o recordiadau gan bron i 570 unigolyn ar gyfer hyfforddi’r systemau adnabod lleferydd Cymraeg oddi fewn Macsen.

Ond rydyn ni angen mwy o recordiadau, gan fwy o unigolion, er mwyn gwella graddfa cywirdeb yr adnabod lleferydd ac ehangu’r mathau o destunau a chwestiynau mae’n adnabod.

Datblygwyd yr ap Paldaruo ddwy flynedd cyn cychwyn project Common Voice Mozilla, ac adeiladwyd ein cydrannau technoleg lleferydd cyntaf ar sail corpws Paldaruo. Rydym yn falch iawn o fedru partneru gyda Mozilla ar broject Common Voice sy’n broject rhyngwladol yn ceisio casglu recordiadau o nifer o ieithoedd gwahanol. Rydym wedi trosglwyddo ein promptiau Paldaruo gwreiddiol i Common Voice, a gallwch ddewis p’un ai a ydi hi’n well gennych gyflwyno’ch llais drwy ap Paldaruo neu drwy Common Voice.

Ceir cyfarwyddiadau pellach ar wefan Common Voice. Dyma fideo o sut i ddefnyddio’r ap Paldaruo isod:

MACSEN AR Y RASPBERRY PI

Roedd fersiwn cyntaf Macsen yn rhedeg ar y Raspberry Pi. Mae fideo yn dangos hyn isod.

Gweler Tudalen Adnabod Lleferydd am ragor o fanylion am gydrannau ac adnoddau adnabod lleferydd Cymraeg Macsen a’r Porth Technolegau Iaith.

Mae’r holl god a’r adnoddau ar gael ar GitHub fel bo unrhyw un yn gallu ehangu a datblygu system ‘Macsen’ ar Raspberry Pi eu hunain ac ymuno â ni yn y gwaith.

techiaith/macsen

Hefyd, mae gennym wefan fach hwylus i bobl sydd eisiau dysgu sut i osod Macsen, recordio eu llais eu hun, a chreu modiwlau newydd ar ei gyfer.

Cysylltwch â ni os oes gennych chi, fel cwmni meddalwedd, clwb codio, ysgol neu fel haciwr cyffredinol unrhyw ddiddordeb yn eu cynnwys o fewn projectau meddalwedd eich hunain.

Cyhoeddiadau Ymchwil Macsen

BUILDING INTELLIGENT ASSISTANTS FOR SPEAKERS OF A LESSER-RESOURCED LANGUAGE, CCURL 2016 2nd Workshop on Collaboration and Computing for Under-Resourced Languages ‘Towards an Alliance for Digital Language Diversity’ LREC 2016, Portoroz, Slovenia. Papur

TUAG AT GYNORTHWYYDD PERSONOL DEALLUS CYMRAEG, Astudiaeth Fer o APIs ar gyfer Gorchmynion Llafar, Systemau Cwestiwn ac Ateb a Thestun a Lleferydd ar gyfer Llywodraeth Cymru. Adroddiad