Co je to korpus?
Jazykový korpus je elektronický soubor autentických textů (psaných nebo mluvených), v němž je možné jednoduše vyhledávat jazykové jevy (zejm. slova a slovní spojení) a zobrazovat je v jejich přirozeném kontextu.
Korpusy ČNK zahrnují vedle psaného současného jazyka (v rozsahu přes 4 mld. slov) i soubory spontánního mluveného jazyka (přes 7 mil. slov), diachronní korpus starších textů a paralelní korpus InterCorp obsahující překlady z nebo do více než 30 jazyků.