Euskaltzaindiaren hitzaldi-aretoa ederki bete zuen bertaratu zen 50 lagunetik gorako taldeak. Hainbat jatorritakoak ziren partehartzaileak: Euskaltzaindikoak, unibertsitateetakoak, ikastetxe pribatuetakoak, EAEko Herri-Erakundeetako hainbat sailetakoak, itzulpen-enpresetakoak, hizkuntza-arloko elkarteetakoak, etab.
Lehenbiziko hitzaldia Vigoko Unibertsitatean Informatika Linguistikoko mintegiaz arduratzen den Xavier Gómez Guinovart irakasleak egin zuen, Testu-corpusak eta plangintza linguistikoa gaitzat hartuta. Oso modu didaktikoan agertu zigun zer diren corpusak, haien sailkapena, zer den hizkuntza-plangintza, honen bi adarretan, hau da corpusaren eta estatusaren plangintzetan, testu-corpusek betetzen dituzten eginkizunak, hiztegigintzan eta gramatikagintzan dituzten aplikazioak; Kataluniako, Euskal Herriko eta Galiziako corpus batzuk alderatu zituen, eta, azkenik, corpusek hizkuntza-teknologiako tresnak garatzeko -zuzentzaile ortografiko eta gramatikalak, itzulpen automatikoko tresnak, informazio-erauzleak, bilatzaileak, etab.- duten garrantzia azaldu zigun. 45 minutuan ezin da sintesi hoberik egin.
Bigarren mintzaldia Miriam Urkia doktoreak egin zuen. Miriam UZEIko Lexikografia Sailaren arduraduna da eta harreman estua du Euskaltzaindiarekin: euskaltzain urgazle eta Hiztegi Batuko lantaldeko kide da, Informazio eta Komunikazioaren Teknologiak batzordearen aholkulari ere bai, eta Lexikoaren Behatokia egitasmorako UZEIk egiten dituen lanen ardura darama.
Aurkeztu zigun gaiaren izenburua Corpusgintzaren garrantzia hizkuntzalaritzan eta euskararen egoera izan zen. Corpusen erabilerak Hizkuntzalaritzan eragin duen planteamendu-aldaketa aipatuz ekin zion hitzaldiari. Gaur egun hizkuntzaren deskribapena erabileratik abiatzen baita, datu enpirikoetatik, eta horrek orain arteko teoria batzuk eta lan egiteko prozedurak aldatu ditu.
Lan egiteko era berri horrek erabiltzen dituen tresnak aipatu zituen ondoren: etiketatzaileak, analizatzaileak/lematizatzaileak, desanbiguatzaileak, ahotsaren transkripziorako tresnak, testu-parekatzaileak, bilatzaileak eta guztion oinarrian dauden datu-base lexikalak, gramatika-formalismoak, ezagutza-baseak, etab.
Horren ostean han eta hemen landu diren corpus garrantzitsuen ezaugarriak errepasatu eta alderatu zituen, eta euskarazko corpusen eta corpusgintzarako tresnen deskribapen xehakatua, benetan orohartzailea, egin zuen, esan zuen corpus orokor baten falta sumatzen duela eta erreferentzia-corpusaren beharra aldarrikatu zuen.
Goiz bete-betea izan zen.