Euskaltzaindiaren proiektu honen helburua ikerketarako eta kontsultarako testu-corpusa prestatzea da. Hartara, XXI. mendeko euskara eta euskararen bilakaera aztertzeko balioko du testu-corpusak. Azterketa, 2.000 urtetik aurrera sortu diren testuetan oinarritzen da.
EiTBk eta Euskaltzaindiak 2009. urtean sinatu zuten hitzarmen berezi bat Lexikoaren Behatokiaren proiektuan lankide izateko.
Aipatutako 'Yoko' eta 'Aitaren Etxea' saioez gainera, orain arte EiTBk beste gidoi hauek utzi ditu corpuserako: eitb.eus-eko albisteak, ETBren programak ('Sustraia', 'Zu kirolari', 'Eguraldia'...), ETBren serieak ('Goenkale'), ETBren dokumentalak (Ama Lurra...), bikoizketako dokumentalak, eta bikoizketako marrazki bizidunak.
Euskaltzaindiarekin batera, UZEI eta Elhuyar erakundeek eta EHUko Donostiako Informatika Fakultateko IXA Taldeak hartzen dute parte proiektu honetan. Corpusa kudeatzeko ardura, bestalde, UZEIk dauka. Bidalitako testuak corpusean erantsi eta gero, Interneten egin daiteke datu-base osoaren kontsulta.