Ustav formalni a aplikovane lingvistiky
Vas srdecne zve na
Seminar formalni lingvistiky
vedeny prof. E. Hajicovou
Seminar se kona v pondeli od 13:30
v budove MFF UK, Malostranske nam. 25,
4. patro, mistnost S1 (c. 428)
20. 4. 2009
Alexandr Rosen (UTKL, FF UK) a Martin Vavrin (UCNK, FF UK)
Projekt InterCorp: Vicejazycny paralelni korpus
Abstrakt:
Mezi casti Ceskeho narodniho korpusu, ktere jsou po registraci verejne
pristupne, patri od roku 2008 paralelni korpus, budovany v ramci projektu
InterCorp na FF UK v Praze. V soucasne dobe obsahuje tento korpus prevazne
rucne zarovnane beletristicke texty v cestine a 20 dalsich jazycich.
Cestina je pritom tzv. pivot, tj. kazdy text ma vzdy jedinou ceskou verzi
(original nebo preklad), ktera je zarovnana s jednou nebo vice verzemi
cizojazycnymi.
Cilem seminare bude predstavit koncepci projektu, postup pripravy textu od
akvizice az po import do korpusoveho manazeru a soucasne i perspektivni
moznosti vyuziti korpusu. Zvlast se zamerime na problematicka mista:
zpracovani textu v mnoha jazycich, navaznost rucnich a automatickych
postupu, spoluprace mnoha pracovist bez informatickeho zazemi,
spolehlivost automatickych metod segmentace a zarovnavani. V zaveru nebude
chybet predstava dalsiho smerovani.
27. 4. 2009
Viktor Bielicky (Ustav Blizkeho vychodu a Afriky, FF UK)
a Otakar Smrz (UFAL, MFF UK)
Tvorba valencniho slovniku arabskych sloves
Abstrakt:
Hlavnim cilem prednasky je predstavit koncepci a soucasny stav projektu
tvorby valencniho slovniku arabskych sloves, jenz je integralni soucasti
elektronickeho lexikonu ElixirFM. Urcita pozornost bude venovana obdobnym
projektum a studiim pro arabstinu, ktere budou zhodnoceny a konfrontovany
s nasim pristupem. Dale se zamerime na charakteristiku nami prijateho
teoretickeho ramce (Funkcní generativni popis), lexikonu ElixirFM,
nastroju a zdroju (Prague Arabic Dependency Treebank, Arabic Gigaword,
VALLEX) pri tvorbe valencnich ramcu. Znacna pozornost bude venovana
charakteristice arabskych sloves z hlediska morfo-semantickeho a
syntaktickeho. Provedeme zhodnoceni dosavadniho stavu projektu a zminime
budouci ukoly.