Cydrannau ac adnoddau iaith ar gyfery Gymraeg
Lluniwyd y Porth Technolegau Iaith Cenedlaethol fel ‘siop un stop’ i gyhoeddi nifer o’r cydrannau a’r adnoddau a ddatblygwyd ar gyfer prosesu iaith yn Gymraeg ym Mhrifysgol Bangor36. Mae rhai adnoddau eraill ar gael gan ddatblygwyr eraill nad ydynt wedi’u cynnwys yma, ond mae’r isod ar gael yn rhad ac am ddim drwy’r Porth Technolegau Iaith Cenedlaethol ar http://techiaith.cymru.
Mae’r casgliad yn cynnwys setiau data, cod a chyfarwyddiadau defnyddiol i ddatblygwyr eraill, ac wedi’u rhyddhau dan drwyddedau agored caniataol fel bod cwmnïau masnachol mawr a bach yn medru’u cynnwys yn eu cynnyrch eu hunain heb orfod rhyddhau eu cod na’i eiddo deallusol masnachol eu hun yn gyfnewid. Mae hefyd yn cynnwys gwasanaethau API i rai o’r cydrannau fel bod datblygwyr a chodwyr mewn meysydd eraill yn medru’u defnyddio’n hwylus heb wybodaeth arbenigol o dechnoleg iaith. Mae’r adnoddau a’r cydrannau hefyd o ddiddordeb i ymchwilwyr ac academyddion eraill sy’n dymuno gwneud gwaith pellach yn y maes, ac yn wir i hacwyr, hobiwyr a’r cyhoedd yn gyffredinol – unrhyw un mewn gwirionedd sydd am ddefnyddio’r adnoddau a’r cydrannau yn eu gwaith eu hunain.
Adnoddau Porth Technolegau Iaith – METASHARE : http://metashare.techiaith.cymru/
Rhif | Disgrifiad | Trwydded |
1 | Amgylchedd Docker ar gyfer hyfforddi modelau iaith acwstig a iaith | Dim cyfyngiad defnydd |
2 | Dadgodwyr CP Ystadegol Moses ar sail Docker gyda modelau Saesneg<>Cymraeg wedi’u rhaghyfforddi | BSD – style |
3 | Enwau Cymru: Rhestr o Enwau Lleoedd yng Nghymru yn Gymraeg gyda geo-leoliad a chyfatebion Saesneg | CC-BY |
4 | Julius-cy: Cefnogaeth Gymraeg i’r system LVCSR Julius | BSD – style |
5 | Rhestr o Enwau Lleoedd yng Nghymru yn Gymraeg | Apache 2 |
6 | Corpws Lleferydd Paldaruo | CC – BY |
7 | Ffeil cyfatebion Cymreg-Saesneg | Apache – 2 |
8 | Gorfodwr Alinio Cymraeg | BSD – style |
9 | Rheolau Llythyren-i-sain Cymraeg | BSD – style |
10 | Lecsicon Ynganu Cymraeg | Apache 2 |
11 | Corpws WISPR | BSD |
12 | Alinio
Cod hwyluso alinio gyda hunalign a dogfennaeth ar sut i ddefnyddio LFAligner |
GNU LGPL |
13 | TTS Festival
Dogfennaeth ac enghreifftiau ar sut i ddefnyddio API testun i leferydd Cymraeg trwy Festival |
Similar to MIT |
14 | Dogfennaeth ac enghreifftiau ar sut i ddefnyddio API testun i leferydd Cymraeg trwy MaryTTS | Documentation and examples on how to use the Welsh text-to-speech API based on MaryTTS | GNU LGPL |
Adnoddau Porth Technolegau Iaith – GitHub: https://github.com/PorthTechnolegauIaith, https://github.com/techiaith
Rhif | Disgrifiad | Trwydded |
15 | moses-smt
Cyfieithu Peirianyddol hwylus i’r Gymraeg a ieithoedd eraill |
MIT |
16 | postagger
Dogfennaeth, tiwtorialau ac enghreifftiau defnyddio API Tagiwr Rhannau Ymadrodd Cymraeg |
MIT |
17 | turing-test-lessons
Cyflwyniad i raglennu seiliedig ar destun gan ddefnyddio Python ar y Raspberry Pi. Erbyn diwedd yr holl wersi, bydd myfyrwyr wedi creu robot sgwrsio rhyngweithiol ac wedi’u cyflwyno at technolegau iaith Cymraeg yn ogystal a’r cysyniad cyfrifiadurol o ddeallusrwydd artiffisial |
CC-BY-SA |
18 | cymreigio-porwyr
Ategyn gwefannau sy’n tynnu at y ffaith mai Saesneg (UDA) yw dewis iaith cynnwys ddiofyn porwyr a’u helpu i’w newid i Cymraeg (cy) |
MIT |
19 | docker-kaldi-cy
Amgylchedd hwyluso hyfforddi adnabod lleferydd Kaldi Cymraeg |
Apache 2 |
20 | docker-kaldi-gstreamer-server
Dockerfile ar gyfer kaldi-gstreamer-server |
BSD 2 |
21 | docker-marytts
Creu lleisiau synthetig Cymraeg eich hunain gyda MaryTTS a Docker |
Apache 2 |
22 | docker-metashare
Dockerfile a ffeiliau cysylltiedig ar gyfer gosod hwb META-SHARE syml |
Apache 2 |
23 | docker-ProsodylabAligner-cy
Defnyddio Prosodylab-Aligner Cymraeg yn hwylus gyda Docker. |
Apache 2 |
24 | Festival_MSAPI
Integreiddio testun i leferydd Festival i Windows drwy MSAPI |
Hawlfraint Prifysgol Bangor 2005 |
25 | Festival_Windows
Project Visual Studio ar gyfer adeiladu Festival ar gyfer Windows a’i defnyddio drwy COM |
BSD |
26 | julius-cy
Ffeiliau ar gyfer adnabod lleferydd Cymraeg drwy Julius |
MIT |
27 | kaldi-cy
Adnabod lleferydd Cymraeg gyda Kaldi ASR |
Apache |
28 | langdetect
Port of Google’s language-detection library to Python |
Apache 2 |
29 | llais_festival
Data llais Cymraeg ddeuffonau er mwyn llwytho i lawr a’u rhedeg o fewn gosodiad lleol o Festival (ar Linux, Raspberry Pi neu Windows) |
Hawlfraint Prifysgol Bangor (trwydded rydd ganiataol) |
30 | macsen
Cod ar gyfer ‘Macsen’ – prototeip o gynorthwyydd digidol Cymraeg |
Apache 2 |
31 | macsen-flutter
Ap cynorthwyydd personol digidol |
BSD 3 |
32 | marytts
MARY TTS – y system synthesis testun-i-leferydd amlieithog, cod agored wedi’i fforchio ar gyfer datblygu TTS Cymraeg yn benodol |
LGPL |
33 | MMMarkdown
Llyfrgell statig Objective-C er mwyn trosi Markdown i HTML |
Hawlfraint Matt Diephouse (trwydded rydd ganiataol) |
34 | Paldaruo
Cod yr ap Paldaruo i iOS ar gyfer torfoli casglu corpws lleferydd |
MIT |
35 | Prosodylab-Aligner
Rhyngwyneb Python i orfodi alinio awdio gan ddefnyddio HTK a SoX ar gyfer y Gymraeg |
Apache 2 |
36 | pyfestival
Amlapiwr Python C ar gyfer hwyluso rhaglennu gyda Festival |
BSD |
37 | pyvona
Lapiwr python ar gyfer IVONA API Amazon |
MIT
|
38 | seilwaith
Offer hwyluso creu Adnabod Lleferydd Cymraeg gyda HTK, IRSTLM, Julius a Docker |
Apache 2 |
39 | voice-web
Paldaruo: Ein gwefan ar gyfer torfoli corpora lleferydd (ar sail Mozilla Common Voice) |
Mozilla Public License 2 |
40 | welsh-lts
Rheolau ynganu Cymraeg |
Hawlfraint Prifysgol Bangor (trwydded agored ganiataol) |
41 | deepspeech
cynhwysydd Deepspeech |
MIT |
42 | moses-smt
Moses-SMT gyda’r Gymraeg |
MIT |
36Prys, D. & Jones, D.B. National Language Technologies Portals for LRLs: a Case StudyLecture Notes in Artificial Intelligence. Springer, 2018.