prof. RNDr. Vít Voženílek, CSc.
ProfesorMgr. Radek Barvíř, Ph.D.
Odborný asistentRNDr. Alena Vondráková, Ph.D., LL.M.
Odborný asistentRNDr. Rostislav Nétek, Ph.D.
Odborný asistentCílem projektu je adaptovat existující technologie a vyvinout zcela nové postupy pro využití umělé inteligence při automatickém zpracování přirozeného mluveného jazyka v jeho regionálně rozrůzněné podobě, konkrétně na modelu českých nářečí. Půjde o první projekt svého druhu – automatické rozpoznávání řeči bylo dosud aplikováno výhradně na promluvy s majoritním zastoupením spisovných prvků. Takto jedinečný projekt výrazným způsobem zefektivní práci s autentickým zvukovým materiálem, jehož ruční zpracování je (nejen pro jazykovědce) za současných podmínek časově nesmírně náročné. Zároveň umožní snazší a efektivnější dokumentaci nářečí českého jazyka a interaktivní prezentaci tohoto mizejícího jazykového dědictví. Cíle bude dosaženo (1) tvorbou inovativní Metodiky pro převod strukturovaných znalostí z oboru dialektologie do strojového učení, (2) intenzivní prací na datových sadách, především vybudováním Databáze nářečních promluv pro odbornou veřejnost, jejíž naplnění reprezentativními audiozáznamy zajistí jeden z partnerů projektu, disponující největším interním archivem nahrávek tohoto druhu v ČR, (3) tvorbou několika softwarů, jmenovitě Automatického detektoru dialektu na základě audionahrávky, Rozpoznávače řeči adaptovaného pro generování dialektologické transkripce z audionahrávek a Multilingválního rozpoznávače západoslovanských jazyků pro generování folklorní transkripce z audionahrávek, (4) tvorbou tří specializovaných Map nářečních diferenčních hláskových jevů s interaktivními a multimediálními prvky, a především (5) tvorbou aplikace Jazyková paměť regionů České republiky. Ta bude otevřena široké veřejnosti pro komunitní doplňování, mapové zobrazování a poslech nářečních nahrávek. Publikační stránka projektu bude reprezentována odbornou knihou a řadou časopiseckých a konferenčních publikací.