AplikaceAplikace
Slovo v kostce

Aplikace KonText představuje základní vyhledávací program pro práci s korpusy projektu ČNK. Umožňuje tvorbu a vyhodnocení jednoduchých i komplexních dotazů, zobrazení formou konkordančních řádků, vypočtení frekvenční distribuce, asociačních měr kolokací a další práci s jazykovými daty. Přehledně jsou všechny funkce KonTextu popsány v manuálu.

Aplikace Slovo v kostce (Word at a Glance, WaG) slouží k vytvoření základního přehledu o tom, jak se používá zadané slovo. Soustředí v sobě informace, které lze získat z různých korpusů ČNK pomocí dostupných nástrojů, a vytváří tak přehledný profil slova z různých perspektiv.

Nástroj SyD je určen pro všestranný průzkum variant jak v současném jazyce, tak v průběhu jeho vývoje. Využívá korpusů ČNK, s jejichž pomocí zjišťuje, jak často se která varianta užívá v současnosti a užívala v průběhu vývoje češtiny. Pro jeho vyzkoušení stačí zadat dvě varianty jednoho jevu, které si vzájemně konkurují, např. téměř × skoro.

Nástroj Morfio slouží pro vyhledávání slovotvorných vztahů mezi jednotkami v korpusech, např. lovit - úlovek. Umožňuje najít všechny dvojice slov tvořené stejným způsobem a vyhodnotit morfologickou produktivitu jejich tvoření.

Aplikace KWords poskytuje základní východisko pro empiricky podloženou interpretaci textů tím, že analyzuje slova v zadaném textu a porovnává jejich frekvenci s referenčním korpusem. Výsledkem takové analýzy je identifikace klíčových slov (tzv. keywords), tj. jednotek vyskytujících se signifikantně častěji v analyzovaném textu než v korpusu, který představuje neutrální jazykový úzus.

Aplikace umožňuje snadné vyhledávání překladových ekvivalentů v oboustranných česko-cizojazyčných slovnícícch vytvořených automaticky na základě dat paralelního korpusu InterCorp.

Korpusová kalkulačka ČNK poskytuje praktický nástroj pro uživatele korpusů, který jim pomáhá řešit běžné statistické úlohy, s nimiž se v rámci svého výzkumu potýkají. Aplikace je rozdělena do 7 modulů reprezentujících různé typy úloh (porovnání frekvence dvou slov, zjištění míry spolehlivosti analýzy vzorku, výpočet lexikální bohatosti atp.).

Aplikace Lists je prohlížeč frekvenčních seznamů vygenerovaných z reprezentativních korpusů psané a mluvené češtiny. Pro každý korpus psané češtiny jsou navíc kromě celkových údajů k dispozici i dílčí frekvenční informace o třech jeho subkorpusech (beletrie, oborová literatura a publicistika). Frekvenční seznamy obsahují pouze jednotky (slovní tvary a lemmata), které se skládají výhradně z alfabetických znaků a z pomlčky a které mají v každém z korpusů SYN2000, SYN2005, SYN2010 a SYN2015 nenulovou frekvenci.

InterText je editor zarovnaných paralelních textů. Byl vyvinut pro projekt InterCorp pro potřeby úprav a správu zarovnání několika paralelních jazykových verzí textů na úrovni vět. Při jeho návrhu byl kladen důraz na flexibilitu, podporuje vlastní XML dokumenty a znakovou sadu Unicode.

Sketch Engine (SkE) je komerční webové rozhraní pro práci s korpusy vyvíjené společností Lexical Computing Ltd. - www.sketchengine.co.uk. Z licenčních důvodů může mít přístup k lokální instalaci SkE v ČNK pouze omezený počet zaměstnanců a studentů Univerzity Karlovy.