Corpws Brawddegau CC0 ar gyfer Promptiau Adnabod Lleferydd

Mae hwn yn gasgliad o 14,857 brawddeg sy’n cael eu rhyddhau dan drwydded CC0. Fe’u casglwyd gan aelodau’r Uned Technolegau Iaith yn unswydd i fod yn bromptiau ar gyfer Adnabod Lleferydd Cymraeg. Daw’r brawddegau o wahanol ffynonellau CC0 ac maent yn cynnwys:

* Brawddegau gwreiddiol
* Brawddegau allan o nofelau, ysgrifau a deunydd arall allan o hawlfraint
* Brawddegau o Wicipedia Cymraeg lle rhoddodd yr awduron ganiatâd i ni eu rhyddhau dan drwydded CC0
* Trydariadau, e-byst a deunydd electronig eraill a roddwyd i’r project i’w defnyddio fel promptiau

Mewn nifer o achosion, ystwythwyd yr iaith a golygwyd y brawddegau yn bur drwm i’w gwneud yn addas i’w darllen yn uchel gan wirfoddolwyr.

Cyflwynwyd y corpws hefyd i broject Common Voice Mozilla, a defnyddiwyd y brawddegau hyn felly ar gyfer recordio gwirfoddolwyr.

Dymunwn ddiolch i bawb a’n cynorthwyodd i gasglu’r brawddegau hyn, gan gynnwys y rhai a roddodd eu deunyddiau i ni dan drwyddedau CC0, ac i Mozilla am eu cymorth a’u harweiniad gyda’r project Common Voice.

Llwytho’r adnodd ‘Brawddegau Cymraeg’ i lawr o:

techiaith/brawddegau-adnabod-lleferydd