Euskararen Gramatika

43.2. Metodologia: EUDIMA corpusa

Kokapena:

43. Diskurtso markatzaileak (II): birformulatzaileak

43.2. Metodologia: EUDIMA corpusa

43.2a Metodologiari dagokionez, EUDIMA ikerketa proiektuko corpus zabalaz baliatu gara testuak eta datuak aztertzeko, ikerketa hori baita orain arte kontu hauetaz egin den lanik osoen eta sistematikoena. Egungo euskara zaindua islatu nahi du EUDIMA corpusak⁴⁶² (Alberdi 2014b).

Azpicorpusa	Testu-hitz kopurua	Izen laburra
ZIO corpusa	1,0 milioi	ZIO
EHUko eskuliburu itzuliak	5,5 milioi	EHU
Zuzenbidea / lege testuak	4,1 milioi	Zuzen. LT
Zuzenbidea / testu akademikoak	2,5 milioi	Zuzen. TA
Pentsamenduaren Klasikoak	10,7 milioi	PKC
EPD liburuak	10,2 milioi	EPD lib.
EPD prentsa	10,5 milioi	EPD pren.
ZT Corpusa	6,6 milioi	ZTC
ETBko dokumentalak	0,5 milioi	ETB doku.
Goenkale corpusa	11,0 milioi	Goenkale
GUZTIRA	62,6 milioi

EUDIMA corpusaren osaera

Guztira 62,6 milioi testu-hitz ditu corpusak eta halako oreka bat lortu da testu itzulien eta jatorrizkoen artean.

Jatorrizkoak	35,7 milioi testu-hitz
Itzulpenak	26,9 milioi testu-hitz
GUZTIRA	62,6 milioi testu-hitz

43.2b Askotariko testu motak biltzen ditu EUDIMA corpusak: akademikoak, lege testuak, prentsa eta saiakera. Eta, bereziki, ahozko hizkuntzara hurbiltzen diren bi azpicorpus ditu: alde batetik, Goenkale, zeinak hein batean lagunarteko erregistroa imitatzen baitu; eta, bestetik, ETBko dokumentalen corpusa, zeinak, entzunak izateko testuen bidez, erregistro zaindua islatzen baitu. Dena dela, argi dago erregistro jasorantz eta hizkuntza idatzirantz lerratuta dagoela corpusa, baina ez berariaz hautu hori egin dugulako, ezpada eskuragarri genituen testuekin osatuko dugulako.

⁴⁶² URL helbidea: http://www.ehu.es/ehg/eudima/corpusa

<< 43.1. Testuingurua

Aurkibidea

43.3. Birformulatzaileak: aztergaiak >>

Oharra

Euskararen Gramatika Euskaltzaindiaren Gramatika Batzordearen ekarria da. Beraz, lanak ez du eragozten edo baldintzatzen Euskaltzaindiaren Osoko bilkurak etorkizunean ondu edo moldatu ditzakeen alor honetako bestelako lanak, arauemaileak ere aintzat harturik.

Egoitza

B
BIZKAIA
Plaza Barria, 15.
48005 BILBO
+34 944 15 81 55
info@euskaltzaindia.eus

Ikerketa Zentroa

V
LUIS VILLASANTE
Tolare baserria. Almortza bidea, 6.
20018 DONOSTIA
+34 943 42 80 50
donostiaordez@euskaltzaindia.eus

Ordezkaritzak

A
ARABA
Gaztelako atea, 54
01007 GASTEIZ
+34 945 23 36 48
gasteizordez@euskaltzaindia.eus

G
GIPUZKOA
Tolare baserria. Almortza bidea, 6
20018 DONOSTIA
+34 943 42 80 50
donostiaordez@euskaltzaindia.eus

N
NAFARROA
Oliveto Kondea, 2, 2. solairua
31002 IRUÑEA
+34 948 22 34 71
nafarroaordez@euskaltzaindia.eus

Elkartea

I
IPAR EUSKAL HERRIA
Gaztelu Berria. 15, Paul Bert plaza.
64100 BAIONA
+33 (0)559 25 64 26
+33 (0)559 59 45 59
baionaordez@euskaltzaindia.eus

Euskaltzaindia

Hizkuntza baliabideak

Azkue Biblioteka eta argitalpenak

Maximiza tus ganancias en criptomonedas confiando en Bitplex 360, una plataforma diseñada para el éxito.

Euskararen Gramatika

Testu osoko bilaketa

Atalak

Liburua eskuratu

43.2. Metodologia: EUDIMA corpusa

43.2. Metodologia: EUDIMA corpusa

Egoitza

Ikerketa Zentroa

Ordezkaritzak

Elkartea

Harremanetarako

Euskaltzaindia

Hizkuntza baliabideak

Azkue Biblioteka eta argitalpenak

Orokorrak

KOMUNIKAZIOA

ERAKUNDEA

EUSKALTZAINAK

ANTOLAKUNTZA

EGITASMOAK, BATZORDEAK ETA LANTALDEAK

HIZTEGI OROKORRAK

HIZTEGI ESPEZIALIZATUAK

HIZTEGI HISTORIKOAK

ZALANTZEN TXOKOA

ONOMASTIKA

TOKIKO ONOMASTIKA BILDUMAK

ARAUAK

GRAMATIKA

CORPUSAK

DIALEKTOLOGIA

MORFOLOGIA

SUSTAPENA

EUSKARAREN HISTORIA SOZIALA

AZKUE BIBLIOTEKA ETA ARTXIBOA

ERAKUSKETA BIRTUALAK

FUNTS BEREZI BATZUK

BBK-Euskaltzaindia Literatura Ataria

ZER BERRI

KATALOGOA

GAIAK

EUSKERA IKERKETA ALDIZKARIA

EUSKALTZAINDIAREN BULETINA

Euskararen Gramatika

Testu osoko bilaketa

Atalak

Liburua eskuratu

43.2. Metodologia: EUDIMA corpusa

43.2. Metodologia: EUDIMA corpusa

Egoitza

Ikerketa Zentroa

Ordezkaritzak

Elkartea

Harremanetarako

Euskaltzaindia

Hizkuntza baliabideak

Azkue Biblioteka eta argitalpenak

Orokorrak