Corpws Testunau Cymraeg Facebook

Mae’r Corpws Testunau Cymraeg Facebook yn cynnwys data o gyfraniadau defnyddwyr a diweddariadau statws cyfrwng Cymraeg sydd wedi eu casglu oddi ar grwpiau cyhoeddus.

Mae cofnodion Facebook a’u sylwadau cyfatebol wedi’u casglu o amrywiaeth o broffiliau a thudalennau cyhoeddus, a gellir cael mynediad at yr adnodd hwn drwy’r ddolen isod. Ni ddefnyddiwyd unrhyw gyfrifon preifat, ac nid oes unrhyw wybodaeth defnyddwyr yn cael ei rhannu yn y data yma.

Cedwir data ar gyfer sylwadau a chofnodion ar wahân, sy’n golygu nad yw sylwadau wedi’u cysylltu at eu cofnodion gwreiddiol. Gwnaethpwyd hyn am resymau anonymeiddio. Os yw’r wybodaeth hon yn ddefnyddiol i chi, cysylltwch â’r Uned Technolegau Iaith.

Bydd y ddolen isod yn eich tywys at ffolder sy’n cynnwys dwy ffolder wahanol: un ar gyfer sylwadau Facebook ac un ar gyfer negeseuon Facebook. Mae pob ffeil zip o fewn y ffolderi yma yn cynnwys 10,000 o sylwadau a chofnodion (yr un). Bydd y ffeiliau hyn yn aros yn gyson dros amser, ac oherwydd hynny gellir eu defnyddio at ddibenion ymchwil.

Llwytho i Lawr

http://techiaith.org/corpws/Facebook

Cynnwys y Ffeiliau

Ffeiliau Sylwadau

Ffeiliau CSV yn cynnwys:

  • 10,000 sylw yr un
  • Ar gyfer pob sylw:
    • ID y sylw
    • cynnwys y sylw
    • yr amser y cafodd y sylw ei greu
    • nifer y hoffterau

Ffeiliau Cofnodion

Ffeiliau CSV yn cynnwys:

  • 10,000 sylw yr un
  • Ar gyfer pob sylw:
    • ID y cofnod
    • ID y proffil a greodd y cofnod (gallai fod yn ddefnyddiwr Facebook, dudalen neu grŵp)
    • cynnwys y cofnod (testun yn unig)
    • nifer y sylwadau
    • nifer y hoffterau
    • nifer o weithiau y’i rhannwyd

Os ydych chi eisiau unrhyw fanylion arall ar y data Facebook yma, cewch gysylltu â’r Uned Technolegau Iaith yn uniongyrchol.

Cydnabyddiaeth

Dylai unrhyw erthyglau neu feddalwedd a seiliwyd ar ddefnydd y corpws hwn ddyfynnu:

Jones, D. B., Robertson, P., Taborda, A. (2015) Corpws Testunau Cymraeg Facebook [http://techiaith.org/corpora/facebook]