Macsen

Mae Macsen yn feddalwedd cynorthwyydd personol Cymraeg cod agored. Mae’n bosib siarad ar lafar gyda Macsen mewn Cymraeg naturiol er mwyn ofyn iddo gwblhau tasgau neu ofyn am wybodaeth.

Rydyn ni’n defnyddio’r project hwn i ddangos beth allwn ni greu wrth ddatblygu technoleg lleferydd a deallusrwydd artiffisial Cymraeg. Rydym yn cyhoeddi’r cydrannau a’r adnoddau perthnasol yma yn agored ar y Porth Technolegau Iaith, er mwyn i ddatblygwyr eraill hefyd fedru’u defnyddio. Rydyn ni wrthi yn gwneud ymchwil pellach i’w wella, a’i alluogi mewn sefyllfaoedd eraill.

Rydym yn datblygu Macsen i weithio fel ap ar ffonau symudol a thabledi Android ac iOS.

Hyd yn hyn, mae gan ap Macsen 8 sgìl:

– Darllen y newyddion [Fideo]

– Adrodd am y tywydd [Fideo]

– Chwarae cerddoriaeth Cymraeg ar Spotify [Fideo]

– Gosod larwm [Fideo]

– Dweud yr amser [Fideo]

– Rhoi’r dyddiad [Fideo]

– Darllen brawddegau cyntaf erthyglau o Wicipedia Cymraeg [Fideo]

– Dangos rhaglenni teledu drwy gwefan Clic S4C

Get it on Google Play   

 

 

Mae’r cod i’r app ar gael o GitHub yn y gobaith y bydd yn adnodd defnyddiol i ddatblygwyr:

techiaith/macsen-flutter

Yn ogystal, mae’r cod ar gyfer y parsiwr bwriad hefyd ar gael yn GitHub:

techiaith/macsen-sgwrsfot

Mae ddogfennaeth sut gellir defnyddio darpariaeth Macsen ar gyfer ehangu gwasanaeth digidol ar gael o fewn cod yr ap:

https://github.com/techiaith/macsen-flutter/blob/master/docs/README.md

 

Manylion Sgiliau Macsen

Mae Macsen yn codi’r newyddion o benawdau Golwg360, a gallwch ofyn iddo am y prif benawdau, newyddion Cymru, Prydain a’r newyddion rhyngwladol, a’r newyddion busnes, iechyd, chwaraeon.

Daw’r tywydd o wefan OpenWeatherMap.

Daw’r gerddoriaeth o wefan Spotify. Ar hyn o bryd mae’n adnabod 21 band ac unigolyn, sef: Alffa, Anhrefn, Anweledig, Bryn Fôn, Cadi Gwen, Candelas, Cowbois Rhos Botwnnog, Cyrff, Gwibdaith Hen Frân, Gwilym Morus, Lleuwen, Mellt, Melys, Petrobas, Plant Duw, Sibrydion, Sŵnami, Y Bandana, Y Cyrff, Yr Ods, Yws Gwynedd. Os nad oes gennych gyfrif Spotify Premium, bydd weithiau yn chwarae darnau o gerddoriaeth wahanol i’r hyn y gofynsoch amdano – nodwedd o gyfrifon rhad ac am ddim Spotify  yw hynny, nid gwall ar yr adnabod lleferydd.

Mae modd teipio yn ogystal â defnyddio’r llais i ofyn cwestiynau a rhoi gorchmynion i Macsen.

Technolegau Iaith Cymraeg o fewn Macsen

Mae ap Macsen yn defnyddio nifer o dechnolegau gwahanol er mwyn gweithio. Defnyddia adnabod lleferydd Mozilla DeepSpeech i drosi’r hyn yr ydych yn ei ddweud i mewn i destun. Yn dilyn hynny, mae technoleg adnabod bwriad yn cael ei ddefnyddio i adnabod a oedd hynny’n gais am newyddion, y tywydd, cerddoriaeth neu un o’r dewisiadau eraill. Pan fydd angen i Macsen ymateb ar lafar, mae’n gwneud hynny drwy ddefnyddio technoleg testun-i-leferydd i lefaru’r ymateb priodol.

Rydym yn dal wrthi yn gwella’r nodweddion lleferydd, ac os hoffech chi, gallwch ein helpu i’w wella yn y dyfodol drwy gyfrannu recordiadau o’ch llais. Gallwch wneud hyn o fewn yr ap drwy glicio ar Hyfforddi yno. Bydd hyn yn eich arwain i ddarllen yn uchel y brawddegau sy’n cael eu hadnabod ar gyfer y 7 sgìl yn yr ap. Byddwn yn defnyddio’r recordiadau hyn i greu setiau datblygu a setiau profi ar gyfer hyfforddi’r adnabod lleferydd. Os ydych am gyfrannu mwy na hyn, ewch i wefan CommonVoice Mozilla i recordio brawddegau ar gyfer y casgliad mawr o recordiadau.

Mae rhagor o wybodaeth am y technolegau hyn a’r Gymraeg ar gael yn y Llawlyfr Technolegau Iaith a gyhoeddwyd gan y Coleg Cymraeg Cenedlaethol.

Ariannwyd yr ap a’r gwaith adnabod lleferydd gan Lywodraeth Cymru, ac rydym yn diolch iddyn nhw ac i’r gwirfoddolwyr sydd wedi bod yn cyfrannu eu lleisiau i wella technoleg lleferydd. Diolch hefyd i Golwg360 ac i OpenWeatherMap am ganiatâd i ddefnyddio’u gwasanaethau ar-lein.

Fideos o sgiliau Macsen

Cyflwyniad i’r Ap Macsen

Sgil Tywydd Macsen

Sgil Newyddion Macsen

Sgil Spotify Macsen

Sgil Wikipedia Macsen

Sgil Cloc Macsen

Sgil Dyddiad Macsen

Sgil Larwm Macsen

Cyhoeddiadau Ymchwil Macsen

Macsen: A Voice Assistant for Speakers of a Lesser Resourced Language, Proceedings of the 1st Joint SLTU and CCURL Workshop (SLTU-CCURL 2020), pages 194-201 Language Resources and Evaluation Conference (LREC 2020), Marseille, France Papur

BUILDING INTELLIGENT ASSISTANTS FOR SPEAKERS OF A LESSER-RESOURCED LANGUAGE, CCURL 2016 2nd Workshop on Collaboration and Computing for Under-Resourced Languages ‘Towards an Alliance for Digital Language Diversity’ (LREC 2016), Portoroz, Slovenia. Papur

TUAG AT GYNORTHWYYDD PERSONOL DEALLUS CYMRAEG, Astudiaeth Fer o APIs ar gyfer Gorchmynion Llafar, Systemau Cwestiwn ac Ateb a Thestun a Lleferydd ar gyfer Llywodraeth Cymru. Adroddiad