Daeth deallusrwydd artiffisial (artificial intelligence neu AI) yn bwnc ffasiynol unwaith eto yn ddiweddar ar ôl blynyddoedd diffaith pan na wireddwyd yr addewid cynnar yn nyddiau cychwynnol cyfrifiadura o achos diffyg adnoddau uwch-gyfrifiadura digonol.
Erbyn hyn caiff deallusrwydd artiffisial ei ddefnyddio mewn nifer o feysydd cyfrifiadurol, megis roboteg, systemau gwelediad cyfrifiadurol (computer vision), cynllunio awtomeiddiedig (automated planning), a rhesymu gwybodaeth (knowledge reasoning).
Mae’n ddefnyddiol deall egwyddorion sylfaenol deallusrwydd artiffisial a dysgu dwfn gan fod gymaint o’i ddefnydd yng nghyd-destun technolegau iaith.
Prif rinweddau unrhyw system deallusrwydd artiffisial yw:
Awtonomi (Autonomy) – y gallu i gyflawni tasgau cymhleth heb unrhyw lywio na rheolaeth gyson gan fod dynol.
Ymaddasolrwydd(Adaptivity) – y gallu i wella a dod yn fwy effeithlon drwy ddysgu o brofiad.
Dehongladwyedd(Interpretability) –y gallu i gynnig dehongliad o pam y rhoddwyd ateb penodol5
Mae modd sicrhau’r rhinweddau hyn drwy’r mathau addas o hyfforddi ar ddata digonol. Ceir gwahanol fathau o hyfforddi neu ddysgu:
Dysgu dan oruchwyliaeth: (supervised learning). Darperir mewnbwn o enghreifftiau o ddata wedi’u hanodi gyda labeli neu drawsgrifiadau neu fath arall o ateb cywir a disgwylir i’r peiriant eu hail-gynhyrchu fel ateb cywir cyfatebol. Tasg y peiriant yw dysgu i gynhyrchu’r allbwn cywir ar sail y mewnbwn cyfatebol, a chyffredinoli o’r enghreifftiau yn y data hyfforddi i fedru gwneud hynny’n gywir gyda mewnbwn nad yw wedi’i weld o’r blaen. Mae’n ofynnol bod anodi a’r labeli hyfforddi mor gywir â phosibl.
Rhennir data mewn proses dysgu dan oruchwyliaeth yn ddwy: y set hyfforddi (training set) a’r set brofi (test set). Defnyddir y set hyfforddi i ddysgu a chreu modelau tra defnyddir set brofi i fesur gallu’r modelau i ragfynegi’n gywir gyda mewnbynnau gwahanol ac anghyfarwydd. Dyma yw gallu’r model i gyffredinoli (generalize).
Mae dulliau dysgu peirianyddol yn dueddol o ddioddef o ffenomen gorffitio (overfitting), lle mae effeithiolrwydd rhagfynegi modelau yn rhagori’n gynyddol ar enghreifftiau o’r set data hyfforddi ond yn gwaethygu ar enghreifftiau newydd. Mae gorffitio yn aml yn digwydd o ganlyniad i brinder data ac o ddefnyddio’r broses ddysgu yn ormodol. Mae llawer o ymchwil academaidd dysgu peirianyddol yn canolbwyntio ar osgoi gorffitio. Un o sgiliau mwyaf hanfodol gwyddonydd data yw’r gallu i greu modelau nad ydynt yn rhy gyfyngedig, nac yn rhy hyblyg.
Dysgu heb oruchwyliaeth: (unsupervised learning) Ni ddarperir atebion cywir wrth ddysgu heb oruchwyliaeth. Y dasg yw darganfod strwythurau yn y data gan osod elfennau tebyg yn agos at ei gilydd ac elfennau anghyson ymhell oddi wrth ei gilydd. Yr enw ar hyn yw clystyru (clustering). Defnydd diddorol o allu dysgu heb oruchwyliaeth i glystyru yw adnabod geiriau sydd ag ystyron tebyg i’w gilydd. Hynny yw, mae’n adnabod bod ‘bryn’ a ‘mynydd’yn perthyn mewn ystyr i’w gilydd.
Gelwir modelau o ganlyniad i ddysgu heb oruchwyliaeth yn fodelau cynhyrchiol (generative models). Mae ymchwil modelau cynhyrchiol wedi arwain yn ddiweddar ar ddatblygiadau mawr ac at rwydweithiau cynhyrchiol gwrthwynebus (generative adversarial networks / GAN ). Wedi hyfforddi ar un math o ddata, mae rhwydweithiau cynhyrchiol gwrthwynebus yn medru cynhyrchu rhagor o’r un math o ddata.
Dysgu atgyfnerthol: (reinforcement learning) Yn hytrach na dibynnu o reidrwydd ar ddata hyfforddi, mae dysgu atgyfnerthol yn ddull dysgu sy’n ymateb i adborth gan y system ynglŷn â’i benderfyniadau. Mae’r peiriant yn dysgu i wneud pethau lle caiff adborth da, ac yn dysgu i osgoi gwneud pethau lle na chaiff cystal ymateb. Y nod yn y pen-draw yw ei fod yn dysgu ymddygiad cyffredinol sy’n cyd-fynd gyda’r adborth da. Mae’n wahanol felly i ddysgu heb oruchwyliaeth gan fod yn rhaid mynegi pryd i roi adborth da. Mae’n wahanol i ddysgu dan oruchwyliaeth gan nad oes gymaint o ddibyniaeth ar ddata hyfforddi.
Nid oes dull perffaith o hyfforddi modelau fydd yn rhagfynegi atebion cywir bob amser ar gyfer ystod eang o fewnbynnau. Fodd bynnag, yn y rhan fwyaf o achosion, mae rhagfynegiad da ond amherffaith yn ddigonol ac yn well na dim.
Ymhlith y ffactorau eraill sy’n effeithio ar effeithiolrwydd modelau mae:
- Anhawster neu gymhlethdod y dasg sydd angen ei modelu
- Maint y data hyfforddi: mae’n amhosib cynhyrchu modelau sy’n rhagfynegi’n dda o setiau data hyfforddi sy’n annigonol mewn maint
- Ansawdd y data
Y ffactor bwysicaf o blith y rhain yw ansawdd y data. Mae angen i’r data hyfforddi fod yn ddigonol ac yn cynnwys digon o anodiadau cywir sy’n berthnasol i’r broblem wrth law.
Deallusrwydd Artiffisial Cul a Chyffredinol
Gallwn ymhelaethu ar ein dealltwriaeth o ddeallusrwydd artiffisial drwy ddiffinio hefyd deallusrwydd artiffisial cyffredinol (General AI) a deallusrwydd artiffisial cul (Narrow AI).
Mae deallusrwydd artiffisial cyffredinol yn cyfeirio at beiriant sy’n gallu trin unrhyw dasg ddeallusol. Mae nifer helaeth o ymchwilwyr wedi rhoi’r gorau i weithio ar ddeallusrwydd artiffisial cyffredinol oherwydd anhawster y dasg a’r diffyg cynnydd ers dros 50 mlynedd. Cysyniad a therm cysylltiedig yw deallusrwydd artiffisial cryf (strong AI) sydd yn gyfystyr ag ail-greu’r meddwl dynol, rhywbeth a fyddai’n arwain at beiriant hunanymwybodol.
Mae’r rhan fwyaf o ymchwiliwr deallusrwydd artiffisial felly’n canolbwyntio ar deallusrwydd artiffisial cul, sef deallusrwydd artiffisial sy’n benodol ar gyfer trin un dasg. Mae’r holl ddulliau deallusrwydd artiffisial a ddefnyddir heddiw, ac sy’n gweddnewid nifer o ddiwydiannau, yn ddulliau deallusrwydd artiffisial cul. Cysyniad cysylltiedig yw deallusrwydd artiffisial gwan (Weak AI) sef systemau sy’n ymddangos fel petaent yn ddeallus ond sydd yn y bôn yn dal yn “gyfrifiadur”6
5Mae’r rhinwedd yma yn enghreifftio’r angen am ymchwil ar ddefnyddio dulliau ddeallusrwydd artiffisial ar gyfer creu gwirydd sillafu a gramadeg Cymraeg fel Cysill. Mae angen i’r defnyddiwr wybod ba reol gramadeg sydd yn berthnasol i wall dan sylw. Mae’r papur canlynol yn esbonio pensaernïaeth ar sail rheolau Cysill 3.0:
Hicks, W.J. 2004. “Welsh Proofing Tools: Making a Little NLP go a Long Way.” Proceeding of the 1st Workshop on International Proofing Tools and Language Technologies. Greece: Univeristy of Patras.
http://techiaith.bangor.ac.uk/welsh-proofing-tools-making-a-little-nlp-go-a-long-way/
6Dadleuodd Searle drwy’i enghraifft o’r Ystafell Tsieinëeg bod AI cul yn gallu ymddangos fel petai’n ddeallus iawn, ond yn y pen-draw dydy’r deallusrwydd artiffisial ddim yn gweithredu fel person gyda meddwl sydd yn meddu ar wybodaeth ehangach ac sy’n medru deall. Er enghraifft, mae AI cul yn gallu categoreiddio os yw testun yn jôc neu’n ddatganiad o ddifri. Ond nid yw’n gallu penderfynu os yw’r jôc yn ddoniol neu os yw’r datganiad o bwysigrwydd mawr.