Hybu dyfodol y Gymraeg

gliniadur

Caiff Porth Technolegau Iaith Cenedlaethol Cymru ei ddarparu gan Uned Technolegau Iaith, Prifysgol Bangor.

Bwriad y Porth yw darparu un man canolog i roi gwybod am adnoddau a chyhoeddiadau academaidd perthnasol, y rhan fwyaf ohonynt yn cael eu hariannu gan Lywodraeth Cymru.

cyfrifiadur

Adnoddau i bawb

Cynnyrch parod wedi’u hanelu at unrhyw un sy’n dymuno defnyddio Technolegau Iaith Cymraeg, gan gynnwys Macsen, Y Trawsgrifiwr ac Ap Geiriaduron.

Hygyrchedd

Adnoddau er mwyn hwyluso ac hybu hygyrchedd gan gynnwys rhaglen darllen sgrin (NVDA), ac lleisiau synthetig dwyieithog.

Adnoddau i ddatblygwyr

Adnoddau wedi’u hanelu at gwmnïau meddalwedd, ymchwilwyr, hacwyr, gwirfoddolwyr brwdfrydig yn ogystal â chlybiau codio Cymraeg.

Cyhoeddiadau academaidd

Ymchwil i bob agwedd o Dechnolegau Iaith, megis adnabodd lleferydd, testun-i-leferydd, deallusrwydd artiffisial a llawer iawn mwy.

Technolegau iaith i bawb

macsen

Mae Technolegau Iaith yn cyfeirio at gyfrifiaduron a dyfeisiau digidol sy’n ceisio gweithio gydag ieithoedd dynol.

Gall hyn gynnwys technoleg adnabod lleferydd, testun-i-leferydd, cyfieithu peirianyddol, prosesu iaith naturiol (NLP) a deallusrwydd artiffisial (AI).

Un adnodd sy’n cwmpasu’r holl elfennau hyn yw’r cynorthwyydd personol digidol Cymraeg, Macsen. Mae’n debyg i Alexa neu Google Assistant ond yn gweithio fel ap… ac mae’n Gymraeg!

mae macsen yn gwrando i'r defnyddiwr ac yn chwarae fiwsig

Adnoddau i ddatblygwyr

logos ar gyfer docker, github ac european language grid
logos ar gyfer docker, github ac european language grid

Mae Porth Technolegau Iaith Cymru yn cynnwys llu o adnoddau wedi’u hanelu at gwmniau meddalwedd, ymchwilwyr, hacwyr, gwirfoddolwyr brwdfrydig yn ogystal â chlybiau codio Cymraeg.

Mae’r holl adnoddau dogfennaeth, enghreifftiau a thiwtorialau sy’n egluro defnydd ein cynnyrch wedi eu lleoli ar GitHub.

Y bwriad, yw darparu’r adnoddau fel ‘blociau adeiladu’, agored ac am ddim, er mwyn galluogi cymorth uwch a llawn o’r Gymraeg o fewn unrhyw gynnyrch gorffenedig digidol.

Cyhoeddiadau academaidd

Mae datblygu adnoddau Technolegau Iaith dan arweiniad ymchwil yn hollbwsig er mwyn hyrwyddo’r Gymraeg fel iaith fyw, fodern sy’n edrych tua’r dyfodol.

Mae’r effaith wedi ymestyn y tu hwnt i Gymru, gan ddylanwadu ar y map ffordd cydraddoldeb ieithoedd digidol yn rhyngwladol a dylanwadu ar ymarfer yn fyd-eang.

Language Report Welsh

Prys, D., Watkins, G. (2023). Language Report Welsh. In: Rehm, G., Way, A. (eds) European Language Equality. Cognitive Technologies. Springer, Cham.

European Language Equality Report on the Welsh Language

Prys, Delyth; Watkins, Gareth; Ghazzali, Stefano. European Language Equality Report on the Welsh Language. ELE Consortium, Adapt Centre, Dulyn.

Evaluation of Three Welsh Language POS Taggers

Prys, Gruffudd & Watkins, Gareth. Evaluation of Three Welsh Language POS Taggers pp 33-39. In Proceedings of the 4th Celtic Language Technology Workshop within LREC eds. Theodorus Fransen, William Lamb & Delyth Prys. ELRA, Marseille.

Development and Evaluation of Speech Resources for the Welsh Language

Jones, Dewi Bryn. Development and Evaluation of Speech Resources for the Welsh Language pp52-59. In Proceedings of the 4th Celtic Language Technology Workshop within LREC eds. Theodorus Fransen, William Lamb & Delyth Prys. ELRA, Marseille.

An Open Source, Bilingual Welsh-to-English Text to Speech Corpus

Russel, Stephen; Jones, Dewi Bryn & Prys, Delyth. An Open Source, Bilingual Welsh-to-English Text to Speech Corpus pp104-109. In Proceedings of the 4th Celtic Language Technology Workshop within LREC eds. Theodorus Fransen, William Lamb & Delyth Prys. Marseille.

The Dawn of the Human-Machine Era

Sayers, Dave; Sousa-Silva, Rui; Höhn, Sviatlana; Ahmedi, Lule; Allkivi-Metsoja, Kais et al. 2021. The Dawn of the Human-Machine Era: A forecast of new and emerging language technologies. University of Jyväskylä.

Modelau Cyfrifiadurol ar gyfer Prosesu Lleferydd Cymraeg

Marshall. I. 2021. Modelau Cyfrifiadurol ar gyfer Prosesu Lleferydd Cymraeg.

Iaith a Thechnoleg yng Nghymru: Cyfrol I

Prys, D (gol.), 2021, Iaith a Thechnoleg yng Nghymru: Cyfrol I. Prifysgol Bangor, Bangor.

Iaith a Thechnoleg yng Nghymru: Cyfrol II

Watkins, G (gol.), 2024, Iaith a Thechnoleg yng Nghymru: Cyfrol II. Prifysgol Bangor, Bangor.

Coherent Planning for Language Technology Developments and Language Revitalization

Prys, D. Jones, D.B. & Prys, G. Coherent Planning for Language Technology Developments and Language Revitalization. In Adda, Giles et al. (eds.) LT4All Proceedings. ELRA, Paris. (tud 367 – 370).

Term formation in Welsh

Prys, D, Andrews, T. & Prys, G. Term formation in Welsh: Problems and solutions. In Brač, Ivana; Ostroški Anić, Ana (eds.). Svijet od riječi. Terminološki i leksikografski ogledi. Institute of Croatian Language and Linguistics. Zagreb (pages 159 – 184).

Macsen

Jones, D.B. Macsen: A Voice Assistant for Speakers of a Lesser Resourced Language Paper in LREC 2020 SLTU-CCURL Workshop (pages 194-201).

Adapting a Welsh Terminology Tool to Develop a Cornish Dictionary

Prys, D.  Adapting a Welsh Terminology Tool to Develop a Cornish Dictionary. Paper in LREC 2020 SLTU-CCURL Workshop (pages 235-239).

Planning for Language Technology Development and Language Revitalization in Wales

Prys, D.; Jones, D.B. & Prys, G. Planning for Language Technology Development and Language Revitalization in Wales. Proceedings of the Language Technologies for All (LT4All) UNESCO Conference, Paris, ELRA 2019 tt 367-370.

Embedding English to Welsh MT in a Private Company

Prys, M. & Jones D. B. Embedding English to Welsh MT in a Private Company Proceedings of the Celtic Language Technology Workshop. European Association for Machine Translation.

Proceedings of the Celtic Language Technology Workshop

Lynn, T; Prys, D; Batchelor, C; Tyers, F. (editors) Proceedings of the Celtic Language Technology Workshop. European Association for Machine Translation.

Crowdsourcing the Paldaruo Speech Corpus of Welsh for Speech Technology

Cooper, S; Jones, D.B & Prys, D. Crowdsourcing the Paldaruo Speech Corpus of Welsh for Speech Technology: in a special edition on Computational Linguistics for Low Resource Languages, Information, 2019. 10, 247.

A roundtable discussion to promote a strategic vision for Celtic Language Technologies.

Prys, D & Williams, I. A roundtable discussion to promote a strategic vision for Celtic Language Technologies. Roundtable discussion at the Celtic Congress at Bangor 2019.

Llawlyfr Technolegau Iaith

Jones, D.B; Pry,s D; Prys, M; Prys, G

Gathering Data for Speech Technology in the Welsh Language

Prys, D. & Jones, D.B. Gathering Data for Speech Technology in the Welsh Language: A Case Study : Paper in LREC 2018 CCURL Workshop (pages 56-61)

National Language Technologies Portals for LRLs

Prys, D. & Jones, D.B. National Language Technologies Portals for LRLs: a Case Study Lecture Notes in Artificial Intelligence. Springer.

Using LT tools in classroom and coding club activities to help LRLs

Prys, D., Jones, D.B & S. Ghazzali Using LT tools in classroom and coding club activities to help LRLs Language Technologies in Support of Less-Resourced Languages, (LRL 2017) 9 November 2017, Poznan, Poland

Facilitating the Multilingual Single Digital Market

Jones, D.B., Prys, D., Ghazzali, S. and Robertson, P. Facilitating the Multilingual Single Digital Market: Case Studies in Software Containerization of Language Technologies. Proceedings of META-FORUM 2016, Lisbon.

Vocab

Jones, D.B., Prys, G. and Prys, D. Vocab: a dictionary plugin for websites. Proceeding of the Second Celtic Language Technology Workshop, TALN 2016. Paris.

Cysill Ar-lein

Delyth Prys and Gruffudd Prys and Dewi Bryn Jones. Cysill Ar-lein: A Corpus of Written Contemporary Welsh Compiled from an On-line Spelling and Grammar Checker. Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016) Portoroz, Slovenia.

Reprinting scholarly works a e-books for less-resourced languages

Prys, D., Roberts, M. and Prys, G. 2016 Reprinting scholarly works a e-books for less-resourced languages. p74-79 Proceedings of the LREC 2016 Workshop “CCURL 2016 – Towards an Alliance for Digital Language Diversity”, Claudia Soria, Laurette Pretorius, Thierry Declerck, Joseph Mariani, Kevin Scannell, Eveline Wandl-Vogt.

Building Intelligent Digitial Assistants for Speakers of a Lesser-Resourced Language

Jones, D.B. and Cooper, S. 2016 Building Intelligent Digitial Assistants for Speakers of a Lesser-Resourced Language. p74-79 Proceedings of the LREC 2016 Workshop “CCURL 2016 – Towards an Alliance for Digital Language Diversity”, Claudia Soria, Laurette Pretorius, Thierry Declerck, Joseph Mariani, Kevin Scannell, Eveline Wandl-Vogt.

Terminology Standardization in Education and the Construction of Resources

Andrews, T. and Prys, G. 2016. Terminology Standardization in Education and the Construction of Resources: The Welsh Experience. Educational Sciences Vol 6, Issue 1. MDPI, Basel.

National Language Technology Portals for LRLs

Prys, D., and Jones D. B. 2016. National Language Technology Portals for LRLs: A Case Study. Language Technologies in Support of Less-Resourced Languages, (LRL 2015) 28 November 2015, Poznan, Poland

Blas o’r adnoddau

Mae Porth Technolegau Iaith Cenedlaethol Cymru yn gasgliad eang o adnoddau technolegol Cymraeg.

Mae’r adnoddau hyn wedi’u hanelu at gwmnïau meddalwedd, ymchwilwyr, hacwyr, gwirfoddolwyr brwdfrydig yn ogystal â chlybiau codio Cymraeg. 

logo macsen

Macsen

Cynorthwyydd digidol personol Cymraeg tebyg i Alexa. Ar gael ar-lein ac fel ap ar ddyfeisiadau iOS ac Android.

logo testun i leferydd

Lleisiau synthetig

Casgliad o leisiau synthetig dwyieithog, Cymraeg a Saesneg.

Adnoddau lleoleiddio

Adnoddau ar gyfer cyfieithu testunau rhyngwynebau meddalwedd, trosi unedau amser, arian ac ati.

Gwasanaethau API

Canolfan gwasanaethau APIs sydd yn darparu amrywiaeth o wasanaethau technoleg iaith ar-lein.

NVDA

Llais synthetig ar gyfer meddalwedd darllenwr sgrîn.

Trawsgrifiwr

Rhaglen feddalwedd sy’n trawsgrifio lleferydd Cymraeg yn destun, defnyddiol ar gyfer creu isdeitlau fideos.

Aliniwr

Rhaglen sy’n caniatáu alinio rhwng testunau Cymraeg a Saesneg.

Cyfieithu peirianyddol

Offer cyfieithu peirianyddol Saesneg > Cymraeg sydd yn defnyddio technoleg fodern niwral i gyfieithu testunau.

logo gwyrdd

Ategion

Adnoddau ar gael ar ffurf ategyn i’w gosod o fewn eich gwefan i gynorthwyo defnydd o’r Gymraeg.

logo gwyrdd

Ap Geiriaduron

Mae’r Ap Geiriaduron yn eiriadur Cymraeg-Saesneg, Saesneg-Cymraeg.

Gadael i'r dechnoleg siarad drosti'i hun...

Cryfach gyda’n gilydd

Map o Gymru gyda delweddau cartwnaidd o bobl arni. Mae'r bobl wedi eu cysylltu â'i gilydd gan ddelweddau sydd yn portreadu gwahanol ffurf o gyfathrebu
Map o Gymru gyda delweddau cartwnaidd o bobl arni. Mae'r bobl wedi eu cysylltu â'i gilydd gan ddelweddau sydd yn portreadu gwahanol ffurf o gyfathrebu

Mae sicrhau cysylltiad agos â byd busnes, diwydiant a gwasanaethau cyhoeddus yn hollbwysig i’n gwelediaeth.

Mae Partneriaethau Trosglwyddo Gwybodaeth (KTP) yn un ffordd o hwyluso’r broses o dosglwyddo gwybodaeth ac arbenigedd academaidd i brojectau byd ‘go iawn’.

Rydym wedi cynnal llu o bartneriaethau tebyg yn y gorffennol gyda chwmniau bach a mawr, o Gymru a thu hwnt ac yn awyddus i barhau i bontio’r bwlch rhwng y byd academaidd a diwydiant.

Barod i gyfrannu?

robot sy'n dweud data data gyda megaphone
Er mwyn parhau i wella ein hadnoddau, mae arnom ni angen llawer iawn o ddata.

Os ydych chi’n dymuno bod yn rhan o’r chwyldro digidol Cymraeg, gallwch rannu eich llais neu ddilysu brawddegau drwy wefan Common Voice. Neu oes gennych recordiadau sain boed yn bodlediadau, rhaglenni teledu neu fideos byddech yn hapus i’w rhannu ac sydd yn rhydd o hawlfraint, cysylltwch â ni!

robot sy'n dweud data data gyda megaphone

Cysylltwch â ni