6. Cydrannau technolegau iaith

Cydrannau ac adnoddau iaith ar gyfery Gymraeg

Lluniwyd y Porth Technolegau Iaith Cenedlaethol fel ‘siop un stop’ i gyhoeddi nifer o’r cydrannau a’r adnoddau a ddatblygwyd ar gyfer prosesu iaith yn Gymraeg ym Mhrifysgol Bangor36. Mae rhai adnoddau eraill ar gael gan ddatblygwyr eraill nad ydynt wedi’u cynnwys yma, ond mae’r isod ar gael yn rhad ac am ddim drwy’r Porth Technolegau Iaith Cenedlaethol ar http://techiaith.cymru.

Mae’r casgliad yn cynnwys setiau data, cod a chyfarwyddiadau defnyddiol i ddatblygwyr eraill, ac wedi’u rhyddhau dan drwyddedau agored caniataol fel bod cwmnïau masnachol mawr a bach yn medru’u cynnwys yn eu cynnyrch eu hunain heb orfod rhyddhau eu cod na’i eiddo deallusol masnachol eu hun yn gyfnewid. Mae hefyd yn cynnwys gwasanaethau API i rai o’r cydrannau fel bod datblygwyr a chodwyr mewn meysydd eraill yn medru’u defnyddio’n hwylus heb wybodaeth arbenigol o dechnoleg iaith. Mae’r adnoddau a’r cydrannau hefyd o ddiddordeb i ymchwilwyr ac academyddion eraill sy’n dymuno gwneud gwaith pellach yn y maes, ac yn wir i hacwyr, hobiwyr a’r cyhoedd yn gyffredinol – unrhyw un mewn gwirionedd sydd am ddefnyddio’r adnoddau a’r cydrannau yn eu gwaith eu hunain.

 

Adnoddau Porth Technolegau Iaith – METASHARE : http://metashare.techiaith.cymru/

Rhif Disgrifiad Trwydded
1 Amgylchedd Docker ar gyfer hyfforddi modelau iaith acwstig a iaith Dim cyfyngiad defnydd
2 Dadgodwyr CP Ystadegol Moses ar sail Docker gyda modelau Saesneg<>Cymraeg wedi’u rhaghyfforddi BSD – style
3 Enwau Cymru: Rhestr o Enwau Lleoedd yng Nghymru yn Gymraeg gyda geo-leoliad a chyfatebion Saesneg CC-BY
4 Julius-cy: Cefnogaeth Gymraeg i’r system LVCSR Julius BSD – style
5 Rhestr o Enwau Lleoedd yng Nghymru yn Gymraeg Apache 2
6 Corpws Lleferydd Paldaruo CC – BY
7 Ffeil cyfatebion Cymreg-Saesneg Apache – 2
8 Gorfodwr Alinio Cymraeg BSD – style
9 Rheolau Llythyren-i-sain Cymraeg BSD – style
10 Lecsicon Ynganu Cymraeg Apache 2
11 Corpws WISPR BSD
12 Alinio

Cod hwyluso alinio gyda hunalign a dogfennaeth ar sut i ddefnyddio LFAligner

GNU LGPL
13 TTS Festival

Dogfennaeth ac enghreifftiau ar sut i ddefnyddio API testun i leferydd Cymraeg trwy Festival

Similar to MIT
14 Dogfennaeth ac enghreifftiau ar sut i ddefnyddio API testun i leferydd Cymraeg trwy MaryTTS | Documentation and examples on how to use the Welsh text-to-speech API based on MaryTTS GNU LGPL

 

Adnoddau Porth Technolegau Iaith – GitHub: https://github.com/PorthTechnolegauIaith, https://github.com/techiaith

Rhif Disgrifiad Trwydded
15 moses-smt

Cyfieithu Peirianyddol hwylus i’r Gymraeg a ieithoedd eraill

MIT
16 postagger

Dogfennaeth, tiwtorialau ac enghreifftiau defnyddio API Tagiwr Rhannau Ymadrodd Cymraeg

MIT
17 turing-test-lessons

Cyflwyniad i raglennu seiliedig ar destun gan ddefnyddio Python ar y Raspberry Pi. Erbyn diwedd yr holl wersi, bydd myfyrwyr wedi creu robot sgwrsio rhyngweithiol ac wedi’u cyflwyno at technolegau iaith Cymraeg yn ogystal a’r cysyniad cyfrifiadurol o ddeallusrwydd artiffisial

CC-BY-SA
18 cymreigio-porwyr

Ategyn gwefannau sy’n tynnu at y ffaith mai Saesneg (UDA) yw dewis iaith cynnwys ddiofyn porwyr a’u helpu i’w newid i Cymraeg (cy)

MIT
19 docker-kaldi-cy

Amgylchedd hwyluso hyfforddi adnabod lleferydd Kaldi Cymraeg

Apache 2
20 docker-kaldi-gstreamer-server

Dockerfile ar gyfer kaldi-gstreamer-server

BSD 2
21 docker-marytts

Creu lleisiau synthetig Cymraeg eich hunain gyda MaryTTS a Docker

Apache 2
22 docker-metashare

Dockerfile a ffeiliau cysylltiedig ar gyfer gosod hwb META-SHARE syml

Apache 2
23 docker-ProsodylabAligner-cy

Defnyddio Prosodylab-Aligner Cymraeg yn hwylus gyda Docker.

Apache 2
24 Festival_MSAPI

Integreiddio testun i leferydd Festival i Windows drwy MSAPI

Hawlfraint Prifysgol Bangor 2005
25 Festival_Windows

Project Visual Studio ar gyfer adeiladu Festival ar gyfer Windows a’i defnyddio drwy COM

BSD
26 julius-cy

Ffeiliau ar gyfer adnabod lleferydd Cymraeg drwy Julius

MIT
27 kaldi-cy

Adnabod lleferydd Cymraeg gyda Kaldi ASR

Apache
28 langdetect

Port of Google’s language-detection library to Python

Apache 2
29 llais_festival

Data llais Cymraeg ddeuffonau er mwyn llwytho i lawr a’u rhedeg o fewn gosodiad lleol o Festival (ar Linux, Raspberry Pi neu Windows)

Hawlfraint Prifysgol Bangor (trwydded rydd ganiataol)
30 macsen

Cod ar gyfer ‘Macsen’ – prototeip o gynorthwyydd digidol Cymraeg

Apache 2
31 macsen-flutter

Ap cynorthwyydd personol digidol

BSD 3
32 marytts

MARY TTS – y system synthesis testun-i-leferydd amlieithog, cod agored wedi’i fforchio ar gyfer datblygu TTS Cymraeg yn benodol

LGPL
33 MMMarkdown

Llyfrgell statig Objective-C er mwyn trosi Markdown i HTML

Hawlfraint Matt Diephouse (trwydded rydd ganiataol)
34 Paldaruo

Cod yr ap Paldaruo i iOS ar gyfer torfoli casglu corpws lleferydd

MIT
35 Prosodylab-Aligner

Rhyngwyneb Python i orfodi alinio awdio gan ddefnyddio HTK a SoX ar gyfer y Gymraeg

Apache 2
36 pyfestival

Amlapiwr Python C ar gyfer hwyluso rhaglennu gyda Festival

BSD
37 pyvona

Lapiwr python ar gyfer  IVONA API Amazon

MIT

 

38 seilwaith

Offer hwyluso creu Adnabod Lleferydd Cymraeg gyda HTK, IRSTLM, Julius a Docker

Apache 2
39 voice-web

Paldaruo: Ein gwefan ar gyfer torfoli corpora lleferydd (ar sail Mozilla Common Voice)

Mozilla Public License 2
40 welsh-lts

Rheolau ynganu Cymraeg

Hawlfraint Prifysgol Bangor (trwydded agored ganiataol)
41 deepspeech

cynhwysydd Deepspeech

MIT
42 moses-smt

Moses-SMT gyda’r Gymraeg

MIT

 

36Prys, D. & Jones, D.B. National Language Technologies Portals for LRLs: a Case StudyLecture Notes in Artificial Intelligence. Springer, 2018.

Cynnwys Nesaf Blaenorol