Jazyková paměť regionů České republiky. Metody strojového učení pro uchování, dokumentaci a prezentaci nářečí českého jazyka

prof. RNDr. Vít Voženílek, CSc.

Profesor

RNDr. Alena Vondráková, Ph.D., LL.M.

Odborný asistent

RNDr. Rostislav Nétek, Ph.D.

Odborný asistent

Doba řešení: 2023 - 2027 | Zdroj financování: Ministerstvo kultury – program NAKI III reg. č. projektu: DH23P03OVV010

Cílem projektu je adaptovat existující technologie a vyvinout zcela nové postupy pro využití umělé inteligence při automatickém zpracování přirozeného mluveného jazyka v jeho regionálně rozrůzněné podobě, konkrétně na modelu českých nářečí. Půjde o první projekt svého druhu – automatické rozpoznávání řeči bylo dosud aplikováno výhradně na promluvy s majoritním zastoupením spisovných prvků. Takto jedinečný projekt výrazným způsobem zefektivní práci s autentickým zvukovým materiálem, jehož ruční zpracování je (nejen pro jazykovědce) za současných podmínek časově nesmírně náročné. Zároveň umožní snazší a efektivnější dokumentaci nářečí českého jazyka a interaktivní prezentaci tohoto mizejícího jazykového dědictví. Cíle bude dosaženo (1) tvorbou inovativní Metodiky pro převod strukturovaných znalostí z oboru dialektologie do strojového učení, (2) intenzivní prací na datových sadách, především vybudováním Databáze nářečních promluv pro odbornou veřejnost, jejíž naplnění reprezentativními audiozáznamy zajistí jeden z partnerů projektu, disponující největším interním archivem nahrávek tohoto druhu v ČR, (3) tvorbou několika softwarů, jmenovitě Automatického detektoru dialektu na základě audionahrávky, Rozpoznávače řeči adaptovaného pro generování dialektologické transkripce z audionahrávek a Multilingválního rozpoznávače západoslovanských jazyků pro generování folklorní transkripce z audionahrávek, (4) tvorbou tří specializovaných Map nářečních diferenčních hláskových jevů s interaktivními a multimediálními prvky, a především (5) tvorbou aplikace Jazyková paměť regionů České republiky. Ta bude otevřena široké veřejnosti pro komunitní doplňování, mapové zobrazování a poslech nářečních nahrávek. Publikační stránka projektu bude reprezentována odbornou knihou a řadou časopiseckých a konferenčních publikací.

Jazyková paměť regionů České republiky. Metody strojového učení pro uchování, dokumentaci a prezentaci nářečí českého jazyka

prof. RNDr. Vít Voženílek, CSc.

Mgr. Radek Barvíř, Ph.D.

RNDr. Alena Vondráková, Ph.D., LL.M.

RNDr. Rostislav Nétek, Ph.D.

Facebook

Instagram

Twitter

Youtube

Rychlé odkazy

Aktuality

Informace

Kontakt