Symposiwm Adfer Ieithoedd drwy Dechnolegau Iaith
Bydd tri o aelodau Tîm Technolegau Iaith Canolfan Bedwyr yn teithio i Pécs yn Hwngari ar gyfer Cynhadledd Ieithoedd Lleiafrifol yno 5-6 Gorffennaf eleni.
Byddwn ni’n rhoi symposiwm ar “Adfer Ieithoedd drwy Dechnolegau Iaith”, gyda Dr Briony Williams yn cadeirio, Delyth Prys yn siarad am thema’r symposiwm yn gyffredinol a Gruffudd Prys yn sôn am ddefnyddio gemau iaith ar-lein i ddysgu gramadeg a threigliadau Cymraeg.
Yn ychwanegol at dîm Canolfan Bedwyr, bydd nifer o’u cydweithwyr rhyngwladol sy’n rhannu’r un weledigaeth hefyd yn siarad yn y sesiwn hon. Bydd Christian Monson o Brifysgol Carnegie Mellon yn sôn am eu gwaith ar gyfieithu peirianyddol ar gyfer ieithoedd bach; Dr Ailbhe Ni Chasaide o Trinity College Dulyn yn sôn am brofiad y Wyddeleg wrth ddatblygu technoleg testun i leferydd yn yr iaith honno; Dr Kepa Sarasola o Brifysgol Gwlad y Basg yn sôn am ddefnyddio technolegau iaith i hybu’r Fasgeg, a Dr Steve Krauwer o Brifysgol Utrecht yn yr Iseldiroedd yn sôn am addasu ei git adnoddau iaith BLARK ar gyfer ieithoedd llai.
Mae mwy o fanylion am y gynhadledd ar gael ar http://icml11.law.pte.hu/index.html
ac
Language Reviatlisation through Multimedia Technologies
We’ve finally got our programme together for our Symposium at next week’s Minority Languages Conference at Pécs, Hungary. This is a great opportunity to work again with some of our international collaborators and meet up with old friends, hopefully making some new ones along the way as well.
Full details about the conference can be found at http://icml11.law.pte.hu/ but the details about our own sessions are given below.
Language Revitalisation through Multimedia Technology
Colloquium at the International Conference on Minority Languages
Friday July 5th, 2007, Pécs, Hungary
Chair: Dr Briony Williams, University of Wales, Bangor, UK
14:30 Briony Williams : Welcome and Introduction
14:35 Language Revitalisation through Multimedia Technology
Delyth Prys (University of Wales, Bangor)
If multimedia technologies are to be truly harnessed for the work of revitalising endangered languages, researchers active in the field need to share common strategies and resources. The issue of quality control and evaluation needs also to be addressed, as well as measurements of the success of such initiatives. Current international funding opportunities in the EU provide us with a means of formalising our network of collaboration as we give an overview of current best practice and examine practical proposals for forming long-term partnerships in the field.
15:05 The BLARKette concept: Developing a slimmed-down version of the BLARK matrix for minority languages
Dr Steven Krauwer (University of Utrecht, The Netherlands)
Recently many governments have launched national language and speech technology programmes to strengthen the position of their national languages. The development of these technologies crucially depends on the availability of language resources (e.g. corpora, dictionaries, and annotation tools). Hence the concept of a Basic Language Resources Toolkit (BLARK) has been developed to define the minimum resources needed to carry out language and speech technology research. For languages for which technological research has a short history, we propose an even smaller collection of language resources: the BLARKette. This should be small, cheap, fast to develop, and suitable for bootstrapping initial technology research. It should contain both static material (e.g. corpora and dictionaries) and tools and guidelines for acquiring, creating and processing new resources.
15:35 Bridging the gap: Cutting Edge Technologies working for lesser-resourced languages
Christian Monson (Carnegie Mellon University, USA) presenting for: Lori Levin, Jaime Carbonell, Alon Lavie, Robert Frederking, Ariadna Font Llitjos and Alison Alvarez (Carnegie Mellon University, USA)
Lesser resourced languages lack the large corpora necessary for automatic training of corpus based machine translation systems. However, our project has two ways of obtaining low-cost, corpus-based MT without large corpora. First, we do machine learning from small, highly structured corpora. Second, a machine learning system is guided by interaction with a human user. We are building experimental systems for three Western Hemisphere languages.
16:05 Coffee break
16:30 Technology is an effective tool to promote use of Basque: Strategies to develop HLT for minority languages
Dr Kepa Sarasola (University of the Basque Country, Donostia)
The IXA group at the University of the Basque Country have deployed a long-term strategy for Human Language Technologies for the Basque language, from basic research in the early years to applications development more recently. Beginning many years ago with the core technologies of computational lexicons and text corpora, they then created tools for developers (such as lemmatisers, spell-checkers, and corpus tools). Recently, they have created end-user applications such as a grammar checker, web crawler, and language-learning software. These applications have promoted the use of Basque, and have helped in the ongoing standardisation of Basque.
17:00 Speech Processing Resources for Minority Languages: The Irish Experience
Dr Ailbhe Ní Chasaide (Trinity College, Dublin, Ireland)
The development of speech technology could play an important role in the maintenance and preservation of minority languages. The WISPR project developed spoken corpora along with prerequisites for the synthesis of Irish. There was a need to gear the methodologies used to the particular constraints of Irish, and to maximise the reusability of resources. It is a major consideration to develop resources so that they are independent of any single technical methodology.
17:30 Turning grammar exercises into interactive on-line games: a useful tool to teach Welsh mutations
Gruffudd Prys (University of Wales, Bangor, UK)
We describe the process of turning grammar exercises into interactive on-line games designed to improve the literacy of Welsh speakers who struggle with the language in its standard written form. A recent project demonstrates ways in which complicated grammatical rules can be made entertaining, allowing the engagement of a target audience that is difficult to reach. Technical issues will be discussed, including the question of using language tools (such as corpora, lexicons and spellcheckers) to supply content for language games.
18:00 End of colloquium
Arddangosfa o gynnyrch Canolfan Bedwyr yn yr Urdd
Bydd arddangosfa aml-gyfrwng o gynnyrch Canolfan Bedwyr i’w gweld ym Mhabell y Dysgwyr yn yr Eisteddfod yr Urdd yr wythnos hon. Bydd modd i ymwelwyr ddefnyddio un o’r deg cyfrifadur yn y babell i weld demos o Cysill a Cysgeir ar waith, yn ogystal â chwarae rhai o’r gemau iaith a ddatblygodd y ganolfan ar gyfer gwefan BBC Cymru. Galwch heibio i gael golwg!

Gwefan Enwau Lleoedd y BBC
Yn ddiweddar, rydyn ni wedi bod yn gwneud gwaith i’r BBC drwy ysgrifennu erthyglau cefndir ar gyfer eu project enwau lleoedd newydd. Roedd yn llawer mwy difyr na gweithio ar ein cronfeydd data arferol.
Bellach, mae ffrwyth y gwaith i’w weld ar y safleoedd gwe perthnasol, sef Beth sy’ mewn enw? a What’s in a name?
Mae’r project hwn gan y BBC yn gyffrous iawn, yn llawn o ddeunydd difyr ac amrywiol, ac yn ffordd dda o dreulio ambell i orig ddifyr. Ni wnaeth lunio’r cwis ar gyfer y safle hefyd. Fe lwyddon ni i dwyllo nifer o’n ffrindiau gyda’n hatebion clyfar, tybed beth fydd eich sgôr chi?
Y Gamp Lawn - Gêm Rygbi sy’n dysgu rheolau treiglo

Beth sydd gan rygbi a threiglo yn gyffredin?
Yn y diweddaraf o gemau iaith Canolfan Bedwyr ar gyfer y BBC (gweler gemau Ieithgi a Raw Cymru) mae’r ddwy agwedd honno o’n diwylliant Cymreig ni’n cael eu plethu ynghyd wrth i chi gael y cyfle i arwain tîm cenedlaethol rygbi Cymru wrth iddyn nhw geisio treiglo’u ffordd yn gywir at y Gamp Lawn.
O’r dechrau roeddem ni am gyflwyno’r dasg o ddysgu rheolau gramadeg (gan mai dyna ydi rheolau treiglo yn y bôn) mewn ffordd ddifyr, hwyliog. I’r perwyl hwnnw, fe ddylunion ni’r chwaraewyr fel cymeriadau caricature wedi eu hysbrydoli gan rai o gymeriadau rygbi sydd wedi gwisgo’r crys coch yn ystod y degawdau diwethaf.
Gyda’r sylwebyddion yn amlwg wedi eu seilio ar fersiwn gartŵn o rai o’u cyflwynwyr chwaraeon, roeddem ni wrth ein bodd pan gytunodd llais Cymraeg rygbi, Huw Llywelyn Davies, i leisio llais y sylwebydd yn y gêm, a chael Aled ap Dafydd, hefyd o dîm chwaraeon y BBC, i’ch tywys trwy’r rheolau yn y cyfnod yn arwain at y chwiban gyntaf.
O ganlyniad, mae’n deg dweud bod y rheolau gramadeg (ar dasg o’u dysgu!) yn cael eu cyflwyno mewn modd sy’n dipyn mwy o hwyl na threulio’ch amser yn pori gwerslyfrau gramadeg, er mai’r un yw’r wers. Wedi cyflwyno’r rheolau, mae’r gêm ei hun yn gweithredu fel prawf sy’n profi eich dealltwriaeth o’r hyn a ddysgoch chi - digon tebyg i arholiad, ond ychydig yn fy o hwyl!
Nod y gêm yw pasio’r bêl (sydd ag un o’r rhagenwau fel ‘fy’, ‘dy’ neu ‘eu’ wedi ei hysgrifennu arni) at y chwaraewr gyda’r treiglad cyfatebol wedi ei ysgrifennu ar ei grys. Er enghraifft, os mai ‘fy’ yw’r rhagenw sydd ar y bêl, rhaid pasio at y chwaraewr gyda ‘nghath’ ar ei grys yn hytrach na’r rhai gyda ‘cath’ neu ‘chath’ ar eu crysau. Pasiwch yn gywir ac fe fydd y symudiad yn gorffen gyda chais. Pasiwch (neu treiglwch!) yn anghywir, a bydd y bêl yn cael ei gollwng, ac o ganlyniad bydd y gwrthwynebwyr yn sgorio cais.
Wrth i’r bencampwriaeth fynd yn ei blaen mae mwy o reolau treiglo yn cael eu cyflwyno, gan wneud y gêm yn fwy o sialens - ond peidiwch â phoeni - caiff y rheolau i gyd eu hegluro wrth gael eu cyflwyno.
Eisiau rhoi cynnig ar y gêm? Gallwch chi chwarae’r gêm yn rhad ac am ddim ar wefan Raw Cymru’r BBC: http://www.bbc.co.uk/cymru/raw/gemau/rygbi/index.shtml
Byddwn ni yng Nghanolfan Bedwyr parhau i geisio datblygu cynnyrch sy’n defnyddio’r dechnoleg ddiweddaraf i gyflwyno agweddau ar y Gymraeg mewn modd sy’n cyfuno dysgu ac adloniant, felly cadwch lygad ar y blog, a mwynhewch y gêm!
