Author Archives: techiaith

RoboLlywydd

Neu’r gallu i greu llais synthetig Cymraeg eich hunan….

Fel rhan o’n gwaith ar broject Macsen, rydyn ni’n creu offer ar gyfer cynhyrchu lleisiau synthetig Cymraeg sy’n swnio’n naturiol.  Mae’r offer yn rhoi dull cyflym a hawdd o baratoi promptiau, a recordio llais unigolyn yn eu darllen, gan ddefnyddio gwybodaeth am seiniau’r Gymraeg, er mwyn adeiladu llais synthetig Cymraeg sy’n swnio’n debyg iawn i lais yr unigolyn a recordiwyd.

Dyma enghreifftiau o leisiau dau aelod o dîm techiaith wedi’u syntheseiddio’r gyda’r offer newydd :

Gwryw:

Benyw:

Cafodd y tîm gyfle i roi hyn ar brawf yn ddiweddar yn nigwyddiad SeneddLab 2017 gan adeiladu llais newydd mewn un awr i roi gwybodaeth lafar am Gynulliad Cenedlaethol Cymru. Fe roeson nhw’r enw ‘RoboLlywydd’ arno. Dipyn bach o hwyl oedd galw’r llais newydd yn ‘RoboLlywydd’, ond mae’n dangos beth sy’n bosib o safbwynt ddefnyddio lleisiau gwahanol unigolion o fewn cynorthwyydd personol digidol eich hunan. Mae’r fideo canlynol yn sôn rhagor am hyn (yn enwedig ar ôl y pumed munud a hanner) :

Rydyn ni wedi defnyddio system oedd eisoes ar gael yn god agored o’r enw MaryTTS ac mae modd i chi ei ddefnyddio ar gyfer y Gymraeg o’r gronfa GitHub ganlynol:

techiaith/docker-marytts

Darlith Cymdeithas Wyddonol Gwynedd

Fe fydd Dewi Bryn Jones o Uned Technolegau Iaith, Canolfan Bedwyr, Prifysgol Bangor yn traddodi ar y pwnc;

Datblygu Adnabod Lleferydd ar gyfer y Gymraeg.

Mae’n gynyddol bosibl i chi siarad gyda dyfeisiadau fel eich ffôn neu gyfrifiadur er mwyn hwyluso defnyddio apiau, gwefannau a hefyd derbyn atebion deallus a pherthnasol i gwestiynau a ofynnwyd mewn iaith naturiol. Apple Siri, Microsoft Cortana, Amazon Alexa a Google Assistant yw rhai o’r cynnyrch a gwasanaethau masnachol poblogaidd sydd yn gyrru’r newid hwn gyda’r iaith Saesneg.

Yn y ddarlith hon bydd Dewi Bryn Jones o Uned Technolegau Iaith, Canolfan Bedwyr, Prifysgol Bangor yn cyflwyno’r gwaith sydd ym Mangor ar ddatblygu adnabod lleferydd ar gyfer cychwyn galluogi’r un ddarpariaeth i ddefnyddwyr Cymraeg. Swyddogaeth adnabod lleferydd yw trosi sain lleferydd unigolyn i destun ac felly bydd Dewi yn esbonio’r dulliau a’r data a ddefnyddir yn ogystal â chyflwyno’r canlyniadau diweddaraf.

Cynhelir y cyfarfod am 7.30 ar nos Lun Tachwedd 14eg yn ystafell 1.07 (llawr cyntaf), Canolfan Bedwyr, Y Ganolfan Reolaeth, Ffordd y Coleg, Bangor.

 

Cyflwyno Macsen

Yn ystod 2015-2016 rydym wedi ceisio datblygu adnoddau newydd ar gyfer siarad Cymraeg gyda chyfrifiaduron. Gweler – Cychwyn ar Siarad i’ch cyfrifiadur , Tuag at ‘Siri’ Cymraeg

Mae’r dechnoleg yma’n dod yn fwyfwy pwysig wrth i’r llais dynol gael ei ddefnyddio mewn systemau holi ac ateb ar ffonau symudol a thabledi, systemau rheoli teclynnau fel setiau teledu a robotiaid, a systemau arddweud. Os na fydd modd defnyddio’r Gymraeg yn y sefyllfaoedd hyn, bydd yr iaith yn cael ei chau allan fwyfwy o’r byd digidol, a siaradwyr Cymraeg yn gorfod troi i’r Saesneg.

Er mwyn paratoi’r ffordd ar gyfer y dechnoleg newydd yn Gymraeg rydyn ni wedi cynhyrchu prototeip o system cwestiwn ac ateb lle mae cynorthwyydd personol o’r enw ‘Macsen’ yn gallu ateb cwestiynau llafar, er enghraifft ‘beth yw’r newyddion?’ neu ‘beth yw’r tywydd?’.

Dyma fideo i gyflwyno ac i arddangos Macsen yn gweithio ar gyfrifiadur bach Raspberry Pi:

Mae’r holl god ac adnoddau ar gael ar GitHub fel bod unrhyw un yn gallu ehangu a datblygu system ‘Macsen’ eu hunain. Prif dudalen ‘Macsen’ ar y we er mwyn gwybod sut i gychwyn arni yw:

http://techiaith.cymru/macsen

Bydd ein gwaith ar adnabod lleferydd ac ar adnoddau agored ar gyfer ‘Macsen’ yn parhau. Cysylltwch â ni os oes gennych chi, fel cwmni meddalwedd, clwb codio, ysgol neu fel haciwr cyffredinol unrhyw ddiddordeb eu cynnwys o fewn projectau meddalwedd eich hunain.

Datblygwyd ‘Macsen’ o fewn y project ‘Seilwaith Cyfathrebu Cymraeg’ a ariannwyd gan Llywodraeth Cymru ac S4C.

Cychwyn ar siarad Cymraeg i’ch cyfrifiadur

Rydyn ni wrthi’n datblygu adnabod lleferydd Cymraeg fel rhan o’n project Seilwaith Cyfathrebu Cymraeg a’i rannu yn agored ac am ddim ar y Porth Technolegau Iaith gyda datblygwyr meddalwedd ac apiau Cymraeg eraill.

Heddiw rydyn ni’n falch o fedru rhannu’r fersiynau cyntaf cychwynnol o’n system adnabod lleferydd Cymraeg.

Julius Cymraeg (julius-cy)

Mae’r ddarpariaeth newydd wedi’i chreu drwy ddatblygu a chynhyrchu ffeiliau arbennig sydd yn addasu meddalwedd adnabod lleferydd cod agored cyffredinol o’r enw Julius i allu adnabod Cymraeg yn lle Saesneg a Japanëeg.

mic_web
http://julius.osdn.jp/en_index.php

Mae’r fersiwn cyntaf i’w ryddhau yn galluogi Julius i adnabod cwestiynau a gorchmynion Cymraeg syml, penodol ynghylch y tywydd, newyddion, amser a cherddoriaeth. E.e:

  • “BETH YDY’R TYWYDD HEDDIW?”
  • “BETH YW TYWYDD YFORY?”
  • “BETH YW’R NEWYDDION?”
  • “FAINT O’R GLOCH YDY HI?”
  • “CHWARAEA GERDDORIAETH CYMRAEG”

Bydd fersiynau o Julius Cymraeg yn y dyfodol yn ceisio cynorthwyo nodweddion arddweud ac adnabod lleferydd mwy rhydd.

github_logo
https://github.com/techiaith/julius-cy

Mae ein haddasiadau ar gyfer Cymreigio Julius, yn ogystal â sgriptiau i hwyluso sefydlu popeth yn hwylus ar eich gyfrifiadur ar gael yn rhydd, yn agored ac am ddim ar GitHub.

Ewch i:

https://github.com/techiaith/julius-cy

 

Mae’n wych! Sut mae julius-cy yn gweithio?

Mae’r dudalen ‘Cefndir’ yn esbonio popeth am y fersiwn cyntaf :

https://github.com/techiaith/julius-cy/blob/master/CEFNDIR.md

Ar ôl darllen hwn bydd modd i chi ychwanegu testunau a chwestiynau eich hunain i Julius-cy!

Hmm. Dydy o ddim yn gweithio’n dda iawn i mi. Sut fedra i helpu?

Fersiynau cynnar yw’r modelau acwstig sydd gennym ni hyd yn hyn, felly mae’n bosib na fydd julius-cy yn adnabod lleisiau rhai unigolion yn llwyddiannus.

Os nad ydych chi eisoes wedi cyfrannu eich llais i’n Corpws Lleferydd Paldaruo, yna defnyddiwch ein ap Paldaruo (http://techiaith.bangor.ac.uk/paldaruo) ar unrhyw ddyfais iOS neu Android er mwyn i ni wella’r modelau acwstig gyda’ch llais chi.

Cyfieithu Peirianyddol Cymraeg yn y Cwmwl

coin-tinyRhan o’n project Seilwaith Cyfarthrebu Cymraeg yw gwella’r adnoddau cyfieithu peirianyddol er mwyn cael y budd mwyaf allan o wasanaethau sydd wedi’u seilio ar y Saesneg.

O ganlyniad, mae adnoddau cyfieithu peirianyddol Moses-SMT Porth Technolegau Iaith Cenedlaethol Cymru wedi eu hychwanegu i’r Ganolfan APIs fel y bydd modd eu defnyddio’n haws  o fewn  eich meddalwedd a phrojectau Cymraeg yn ogystal â systemau cof cyfieithu fel Trados, WordFast a CyfieithuCymru.

api cloudMae Moses-SMT Cymraeg<>Saesneg felly yn ymuno â llu o wasanaethau API technolegau iaith eraill yn y Ganolfan APIs fel Cysill, testun-i-leferydd, tagiwr rhannau ymadrodd, adnabod iaith, lemateiddiwr a Vocab i Gymreigio gwefannau, apiau a meddalwedd.

Yn debyg i’r wasanaethau API eraill byddwch angen derbyn allwedd API o’r Canolfan (http://techiaith.cymru/api/cofrestru/) ac yna defnyddio’r dogfennaeth a chod enghreifftiol rydyn ni wedi paratoi  ar GitHub i’ch helpu chi i gychwyn arni. Gweler: https://github.com/PorthTechnolegauIaith/moses-smt/blob/master/docs/APIArlein.md

Cyn i chi fwrw ymlaen, hoffem bwysleisio unwaith eto bwysigrwydd materion ansawdd – eich cyfrifoldeb chi yw sicrhau y defnyddir y meddalwedd cyfieithu peirianyddol hwn yn y dull priodol, gan gynnwys ôl-gyfieithu priodol ac ystyrlon (gweler Materion Ansawdd).

Demo

Mae gennyn ni ddemo ar-lein hefyd o’r peiriannau er mwyn i chi roi cynnig ar ofyn i’r peiriant gyfieithu ar eich rhan. Gweler: http://techiaith.cymru/cyfieithu/demo

 

Tuag at ‘Siri’ Cymraeg….

Mae’n gynyddol bosibl i chi siarad gyda’ch ffôn neu gyfrifiadur er mwyn gorchymyn a rheoli rhaglenni a dyfeisiau, yn ogystal â derbyn atebion deallus a pherthnasol i gwestiynau a ofynnwyd mewn iaith naturiol.

Mae’r galluoedd hyn yn bosibl o ganlyniad i gynnydd diweddar mewn technolegau iaith megis adnabod lleferydd, cyfieithu peirianyddol a phrosesu a deall iaith naturiol. Hwy felly yw’r prif alluogwyr ar gyfer newid a fydd yn tarfu ar y drefn bresennol ac yn achosi shifft sylfaenol yn y ffordd y bydd defnyddwyr yn ymgysylltu â’u dyfeisiau a’r ffordd y byddant yn defnyddio technoleg yn ehangach.

O edrych ar hyn yn ei gyd-destun hanesyddol ehangach, hwn yw’r cam nesaf naturiol yn natblygiad y rhyngweithio rhwng pobl a chyfrifiaduron; o’r bysellfwrdd i’r llygoden, i dechnoleg cyffwrdd, i lais ac i iaith.

Mae pedwar prif lwyfan masnachol yn gyrru’r newid hwn, sef Siri, OK Google, Microsoft Cortana ac Amazon Alexa, yn ogystal â rhai llwyfannau agored llai adnabyddus.

 

 

Hyd yn hyn mae’r rhain yn darparu eu galluoedd pwerus yn Saesneg a rhai ieithoedd mawr eraill, a phrin yw’r dystiolaeth eu bod yn debygol o ymestyn eu dewis o ieithoedd i gynnwys y ‘gynffon hir’ o ieithoedd llai, gan gynnwys y Gymraeg, yn y dyfodol agos.

Noddwyd yr Uned felly gan Lywodraeth Cymru drwy ei Chronfa Technoleg Gymraeg a’r Cyfryngau Digidol ac S4C i weithredu’r project Seilwaith Cyfarthrebu Cymraeg i sicrhau nad yw defnyddwyr sydd â’r Gymraeg yn ddewis iaith iddynt yn cael eu gadael ar ôl mewn datblygiadau o’r fath.

Bydd yn gosod sylfeini amrediad o dechnolegau Cymraeg i’w defnyddio yn yr amgylcheddau hyn, gan gynnwys gwella’r adnoddau adnabod lleferydd Cymraeg yn ogystal â chyfieithu peirianyddol er mwyn cael y budd mwyaf allan o’r galluoedd a ddarperir drwy dechnolegau wedi’u seilio ar y Saesneg.

Bydd holl allbynnau’r project ar gael yma, o Borth Technolegau Iaith Cenedlaethol Cymru. Bydd y project yn symbylu datblygiad meddalwedd a gwasanaethau Cymraeg newydd a allai gyfrannu at brif-ffrydio’r Gymraeg yn y cam nesaf o ryngweithio rhwng pobl a chyfrifiaduron.

Yn y cyfamser, mae angen eich help! Cyfrannwch eich llais drwy ein ap Paldaruo:

paldaruo

iTunes Google Play

Project Raspberry Pi: Symud braich robot gyda’ch llais

Yn yr Eisteddfodau a digwyddiadau Hacio’r Iaith diweddar, rydym wedi arddangos ein breichiau robot sy’n glwm i Raspberry Pis ac sy’n yn ymateb i gyfarwyddyd yn y Gymraeg.

Dyma fideo o dair braich gyda’i gilydd :

Mae’n system adnabod lleferydd syml iawn a nawr, i’r rhai sy’n teimlo’n anturus, dyma gyfarwyddiadau ar sut y gallwch chithau gosod y demo ar eich Raspberry Pi chi.

Byddwch angen yr offer canlynol:

Os rydych yn defnyddio Raspberry Pi hŷn, gyda ddim ond dau borth USB, yna rydych angen hwb USB, fel http://www.modmypi.com/raspberry-pi/accessories/usb-hubs/pihub-official-4-port-raspberry-pi-usb-hub-eu-plug-5v-3a, er mwyn cysylltu popeth.

Mae’r demo yn defnyddio peiriant adnabod lleferydd cod agored o’r enw ‘Julius’. Mae hefyd yn defnyddio modelau acwstig rydym wedi eu cynhyrchu gyda recordiadau 20 unigolyn yn llefaru promtiau arbennig.

Teipiwch y canlynol o linell gorchymyn ar eich Raspberry Pi er mwyn gosod y system ‘Julius’:

$ sudo apt-get update
$ sudo apt-get install alsa-tools alsa-oss flex zlib1g-dev libc-bin libc-dev-bin python-pexpect libasound2 libasound2-dev cvs
$ cvs -z3 -d:pserver:anonymous@cvs.sourceforge.jp:/cvsroot/julius co julius4
$ export CFLAGS="-O2 -mcpu=arm1176jzf-s -mfpu=vfp -mfloat-abi=hard -pipe -fomit-frame-pointer"
$ ./configure --with-mictype=alsa
$ sudo make
$ sudo make install
$ export ALSADEV="plughw:1,0"
$ julius

Os yw’r llinell olaf yn achosi i’r canlynol ymddangos, yna rydych wedi gosod Julius yn llwyddiannus!

Julius rev.4.3.1 - based on
JuliusLib rev.4.3.1 (fast) built for x86_64-unknown-linux-gnu

Copyright (c) 1991-2013 Kawahara Lab., Kyoto University
Copyright (c) 1997-2000 Information-technology Promotion Agency, Japan
Copyright (c) 2000-2005 Shikano Lab., Nara Institute of Science and Technology
Copyright (c) 2005-2013 Julius project team, Nagoya Institute of Technology

Try '-setting' for built-in engine configuration.
Try '-help' for run time options.

Yn nesaf, rhaid i chi lwytho i lawr ein ffeiliau adnabod lleferydd braich robot o’r Porth Technolegau Iaith ar gyfer eu defnyddio gyda Julius.

$ mkdir robot
$ cd robot
$ wget http://techiaith.cymru/gallu/braichrobot.tar.gz
$ tar -zxvf braichrobot.tar.gz

Ac yna er mwyn cael y Raspberry Pi a’r fraich robot i ymateb i’r gorchmynion ar lafar, teipiwch:

$ cd braichrobot
$ sudo python robotarm_voicectl.py

Dylai’r gair ‘siaradwch’ ymddangos. Dyma beth fyddwch nawr yn gallu dweud wrth y fraich:

ysgwydd i fyny
ysgwydd i lawr
penelin i fyny
penelin i lawr
arddwrn i fyny
arddwrn i lawr
gafael agor
gafael cau
troi i’r chwith
troi i’r dde
golau ymlaen

Gobeithio bydd y project bach yma yn hwyl yn enwedig i ddisgyblion Ysgol Pont y Gof, Botwnnog a enillodd un o’n breichiau robot mewn cystadleuaeth codio yng Ngholeg Meirion Dwyfor ym Mhwllheli yn ystod yr haf:

Yn y cyfamser, diolch i nawdd gan Lywodraeth Cymru ac S4C, rydym yn parhau i ddatblygu adnabod lleferydd Cymraeg ac i’w chynnig yn rhad ac am ddim o fewn y Porth Technolegau Iaith. Ein bwriad yw datblygu systemau mwy soffistigedig a mwy defnyddiol.

Ond mae angen eich help! Cyfrannwch eich llais drwy ein ap Paldaruo:

paldaruo

iTunes Google Play

Mwy o adnoddau testun-i-leferydd Cymraeg ar GitHub

Ers ei lansio ym mis Mawrth, mae rhai codwyr a chwmnïau wedi bod yn defnyddio gwasanaeth yn y cwmwl API ar gyfer llefaru testun Cymraeg.

Yn aml iawn fodd bynnag, mae datblygwyr, mewn cwmnïau yn enwedig, eisiau defnyddio llefaru testun Cymraeg all-lein, a hynny gyda Microsoft Windows. O bryd i’w gilydd byddwn hefyd yn cael e-byst gan ddatblygwyr mewn ieithoedd eraill sydd â llai o adnoddau yn ein holi am help wrth ddefnyddio eu lleisiau eiu hunain gyda Microsoft Windows.

Mae ein llais llefaru testun Cymraeg yn bosib oherwydd System Synthesis Lleferydd Festival, sy’n wych. Serch hynny, nid yw Festival yn dda am gynnal Microsoft Windows o gwbl, fel mae datblygwyr y system eu hunain yn  cyfaddef.

Rydym o’r farn y dylai fod yn bosib cael llais Cymraeg Festival yn Microsoft Windows. Felly, rydym ni wedi cyhoeddi’r data llais sy’n gwneud i Festival siarad Cymraeg ar GitHub yn ogystal â haciad ar yr ochr i greu project datrysiad Visual Studio sy’n galluogi i Festival redeg ar Windows gyda rhyngwyneb COM a .NET sylfaenol iawn.

Gellir dod o hyd i’r data llais yma: https://github.com/PorthTechnolegauIaith/llais_festival

Gallwch ddod o hyd i’n hymgais i gael ein llais llefaru testun Cymraeg yn rhedeg ar Windows ynghyd â’n cyfraniad i wella Festival ar Microsoft Windows yn y fan hon: https://github.com/techiaith/Festival_Windows

Heb yr adnoddau hyn dim ond ychydig o ddewisiadau, os oes yna rai o gwbl, sydd i alluogi defnyddio Cymraeg nac unrhyw lais Festival ar Windows. Y gobaith yw fod y cyfraniadau hyn o gymorth mawr ac y gellir eu gwella gyda chymorth cymunedau ffynonellau agored rhyngwladol.

Gwersi codio robot Cymraeg

Fel rhan o’n hymgais i hybu caffaeliad sgiliau cyfrifiadura ymysg siaradwyr Cymraeg, mae’r Uned Technolegau Iaith wedi bod yn datblygu cyfres o wersi cyfrifiadura wedi eu targedu at blant ysgolion cynradd.

Sylfaen yr adnoddau yma yw gwersi Prawf Turing y sefydliad robotRaspberry Pi. Cynhyrchwyd yr adnoddau hyn yn Saesneg yn wreiddiol ac yna fe’u rhyddhawyd ar wefan y sefydliad dan drwydded agored. Mae’r cwrs, sydd wedi’i strwythuro fel set o dair gwers, yn dysgu plant i godio gan ddefnyddio cyfarpar Raspberry Pi a’r iaith gyfrifiadurol Python. Defnyddia’r gwersi ddamcaniaeth enwog y Prawf Turing fel fframwaith i egluro egwyddorion sylfaenol cyfrifiadura, ac mae digon o weithgareddau ymarferol i gadw pethau’n ddifyr.

Ein cyfraniad ni fu cyfieithu’r cyfan i’r Gymraeg, a’i osod ar GitHub, fel bod modd i’r cyhoedd ei ddefnyddio a’i addasu at eu hamcanion eu hunain. Rydym hefyd wedi creu gwers newydd sbon sydd yn benodol ar gyfer plant Cymraeg eu hiaith. Mae’r wers arbennig hon yn cyflwyno plant at rai o adnoddau’r Porth Technolegau Iaith, gan gynnwys y llais testun-i-leferydd, yr adnodd adnabod iaith, Cysill Ar-lein a’r tagiwr rhannau ymadrodd, mewn ffordd sydd yn hwyl ac yn hawdd i’w ddeall.

tyrbinau 006
Plant Garndolbenmaen yn mwynhau eu gwers codio gyda Dewi Bryn Jones, Patrick Robertson a Rapiro y Robot.

Cafodd y wers hon ei threialu gan Dewi Bryn Jones a Patrick Robertson yn Ysgol Gynradd Garndolbenmaen ym mis Mawrth eleni, a bu’n llwyddiant mawr. Gwelwch y cofnod blaenorol hwn i weld fideo a grëwyd gan y plant, er mwyn dysgu mwy am hwyl a helynt y diwrnod hwnnw.

Mae’r adnoddau i gyd ar gael ar GitHub dan drwydded agored yma. Mae’r rhain yn cynnwys y tair gwers gwreiddiol a gyfieithwyd, y wers arbennig ynglŷn â chymreigio’r robot a hefyd canllawiau paratoi ar gyfer athrawon a myfyrwyr.

 

Gweler strwythur y wers isod:

Gwersi

A gellir cyrraedd y wers Gymraeg arbennig yma:

Diweddariad Moses SMT

Pan gyhoeddwyd ein hadnoddau cyfieithu peirianyddol yn gynharach yn y mis, roeddem yn defnyddio’r fersiwn cyntaf o Moses, sef fersiwn 1.0. Bellach, rydym wedi diweddaru’r sgriptiau hwyluso er mwyn defnyddio’r fersiwn diweddaraf: Moses 3.0.

Mae’r cyfan ar gael un ai o GitHub ar http://github.com/PorthTechnolegauIaith/moses-smt neu o Docker.com https://registry.hub.docker.com/u/techiaith/moses-smt/.

Mae Moses 3.0 yn cynnig nifer o welliannau i gyfieithwyr. Yn ôl y datganiad cyhoeddi (y gellir ei weld yma) mae’r rhain yn cynnwys nodweddion sy’n cyflymu’r broses dadgodio, yn rhyddhau mwy o gof ac yn gwneud Moses yn fwy effeithiol yn y dasg o baru’r brawddegau perthnasol.

Byddwn yn cymryd mantais o’r diweddariad er mwyn gwella peiriant cyfieithu CofnodYCynulliad (sydd wedi ei drafod eisoes yma) gyda data ychwanegol y byddwn yn ei gasglu o’r Cynulliad.

Yn ogystal, rydym yn bwriadu creu peiriant cyfieithu parth benodol ar gyfer cyfieithu meddalwedd, diolch i ddata a gyfrannwyd gan Rhoslyn Prys o meddal.com.

Mae’r rhain yn esiamplau gwych o natur iterus peiriannau cyfieithu, lle mae’n bosib ychwanegu mwy o ddata i’w datblygu a’u gwella’n barhaus. Cadwch eich llygaid allan am fwy o ddatblygiadau gyda hyn.