Čeština je složitá, automat ji nezkrotí. Ale výrazně pomůže

24. července 2023

Dana Hlaváčková

archiv

Čeština je složitý jazyk. Jediná čárka dokáže kompletně změnit význam věty. Vymyslet automatický nástroj, který by dovedl opravit všechny chyby, kterých se při psaní dopustíme, je tudíž nemožné. Nicméně se můžeme aspoň přiblížit. O což se snaží nový korektor jménem Opravidlo. Najde nejen překlepy, ale i chyby ve shodě podmětu s přísudkem nebo v interpunkci, říká vedoucí projektu Dana Hlaváčková z Masarykovy univerzity v Brně.

Proč bylo důležité vytvořit český korektor? Umí něco víc než ostatní?

V Česku existují různé takzvané korektory, které však s pravopisem nemají nic společného a opravují jen překlepy. Kromě těch je u nás dlouhou dobu k dispozici korektor ve Wordu, nicméně jedná se o placený produkt, a ne každý jej tak může využívat. Navíc se už dlouhou dobu nevyvíjí a jeho opravy nejsou dostatečné. My jsme věděli, že by to šlo lépe, a také jsme věděli, jak to udělat. Naší prioritou bylo, aby v Česku vznikl korektor, který není vázaný na žádný komerční produkt, a je tak pro každého zdarma. Mimochodem, autoři korektoru ve Wordu do tohoto projektu šli s námi.

Co tedy vaše Opravidlo všechno umí?

Samozřejmě opravuje překlepy, ale také pravopisné chyby, například v interpunkci. A potom chyby gramatické, jako například shodu podmětu s přísudkem. Dokáže zachytit i typografické chyby, na které se často nemyslí.

Jaké například?

Typografické chyby souvisí s úpravou textu. Česká státní norma nám říká, jak máme text upravovat, kde mají být mezery, kde naopak být nemají, jak se správně píší interpunkční znaménka, závorky, uvozovky a další textové prvky. To jsou věci, které uživatelé velmi často opomíjí, a je to škoda, protože na textu je to vidět.

V čem jste účinnější než korektor ve Wordu? Je to právě i opravování typografických chyb?

Typografie je ve Wordu opravdu velmi omezená, jsou tam samozřejmě nějaké opravy nadbytečných mezer, například mezera před tečkou a podobně. Ale Opravidlo by mělo zvládnout prakticky vše, co obsahuje česká státní norma. Některé věci se opravují automaticky, takže to vlastně uživatel ani nepostřehne. Může si je však zpětně nechat ukázat. Nicméně se takto opravují jen některé typografické chyby, například se spojují nedělitelné předložky a spojky se slovy, aby v textu fungovaly spolu a nerozdělily se na konci řádku. Drtivou většinu chyb systém v textu jen červeně podtrhne a navrhne alternativu. Uživatel pak musí rozhodnout, jestli opravu přijme, či ne.

Mnohdy záleží na smyslu věty

Jaká je omylnost korektoru? Jak často se stane, že navrhne opravu někde, kde však chyba není?

To nemáme takto procentuálně vyčísleno. Opravidlo se skládá z několika modulů, přičemž každý z nich má jinou úspěšnost. Velmi úspěšný je například modul pro interpunkci, naopak méně úspěšný je modul pro opravu velkých písmen. Tam mnohdy záleží i na smyslu věty a pro automat je těžké to odhadnout. Snažíme se, aby těch falešně hlášených chyb bylo co nejméně, ale samozřejmě se objevují. Pokud se tak stane, mohou nám to uživatelé nahlásit. Program se tak snažíme stále vylepšovat.

Vidíte a já si myslela, že zrovna v případě interpunkce bude chybovost velká. Jak systém pozná, kde je čárka?

Podpořte Reportér sdílením článku