Facebook Instagram Twitter RSS Feed PodBean Back to top on side

Aktuality

Na foto zľava: Jan Hajič, Ľubomír Falťan, Pavol Žigo, Marta Cimbáková, Tamás Váradi, Georg Rehm

Národný prezentačný deň projektu CESAR

13. 6. 2012 | videné 889-krát

V dňoch 7. a 8. júna 2012 sa v priestore hotela Park Inn Danube v Bratislave uskutočnila medzinárodná konferencia Rozvoj jazykových technológií a zdrojov na Slovensku a vo svete (10 rokov Slovenského národného korpusu), ktorá sa konala pod záštitou predsedu Slovenskej akadémie vied prof. RNDr. Jaromíra Pastoreka, DrSc.

 

Na podujatí sa stretli poprední odborníci z oblasti počítačového spracovania prirodzeného jazyka, korpusovej lingvistiky a súvisiacich oblastí. Ich vystúpenia boli adresované predstaviteľom štátnej i podnikateľskej sféry, ktorí sa na podujatí takisto prezentovali, ako aj ďalším záujemcom z vedeckej a akademickej obce. Cieľom podujatia bolo predstaviť všeobecné národné aj špecializované korpusy, zhrnúť súčasný stav jazykových technológií na Slovensku a ponúknuť informácie o možnostiach rozvoja technológií a nástrojov počítačového spracovania prirodzeného jazyka v jazykovo i kultúrne rozmanitej európskej informačnej spoločnosti.

 

            Medzinárodné podujatie sa uskutočnilo v rámci prezentačných dní členských krajín projektu CESAR, ktorého cieľom je v spolupráci s projektom META-NET vytvárať, modernizovať a sprístupňovať jazykové zdroje a nástroje pre štáty strednej a juhovýchodnej Európy. Slovenský prezentačný deň organizovalo oddelenie Slovenského národného korpusu Jazykovedného ústavu Ľ. Štúra Slovenskej akadémie vied v Bratislave. Toto špecializované pracovisko SNK JÚĽŠ SAV si zároveň pripomenulo 10. výročie svojho založenia.

            Podujatie slávnostne otvorili podpredseda SAV Mgr. Ľubomír Falťan, CSc., generálna riaditeľka sekcie vedy a techniky Ministerstva školstva, vedy, výskumu a športu SR RNDr. Marta Cimbáková a riaditeľ Jazykovedného ústavu Ľ. Štúra SAV prof. PhDr. Pavol Žigo, CSc.

 

            Úvodný príspevok rokovania predniesol G. Rehm z Nemeckého výskumného centra umelej existencie v Berlíne, ktorý stručne predstavil ciele a aktuálne výsledky projektu META-NET. Projekt CESAR a jeho cieľ zmobilizovať národný priemysel a výskum v oblasti jazykových  technológií prezentoval T. Váradi z Maďarskej akadémie vied. Koordinátor projektu je presvedčený, že vďaka moderným jazykových technológiám je možné prekonať jazykové bariéry v kultúrne i jazykovo rôznorodej európskej spoločnosti. M. Šimková a R. Garabík z Jazykovedného ústavu Ľ. Štúra SAV predstavili východiská, ciele a výsledky Slovenského národného korpusu. Dopoludňajšiu sekciu uzavrel M. Tadić príspevkom o chorvátskom národnom korpuse a jeho úlohe pri budovaní jazykových technológií. V rámci každého vystúpenia bol priestor na diskusiu, v tomto bloku bolo najviac otázok k predstaviteľom Slovenského národného korpusu.

            Vstupom do popoludňajšej časti prvého rokovacieho dňa boli prezentácie firiem Seznam.cz a NEWTON technologies a. s. z oblasti jazykových a informačných technológií a občianskeho združenia E@I. Po prezentáciách nasledovala panelová diskusia o postavení slovenského jazyka v digitálnom veku, na ktorej svoje názory a požiadavky formulovali predovšetkým predstavitelia komerčnej sféry, ktorí vytvárajú jazykové technológie. Rečníci v diskusii zdôraznili nevyhnutnosť spolupráce s akademickými a vedeckými inštitúciami prostredníctvom vzájomného poskytovania dát a taktiež poukázali na slabú až žiadnu podporu neakademických projektov v oblasti propagácie slovenského jazyka zo strany domácich inštitúcií.

            Posledný blok prvého dňa uviedol D. Katuščák zo Slovenskej národnej knižnice  príspevkom o možnostiach využitia textového digitálneho obsahu v lingvistických výskumoch. J. Hajič z Matematicko-fyzikálnej fakulty Karlovej univerzity v Prahe prezentoval projekt LINDAT-Clarin, t. j. centrum jazykovej infraštruktúry pre výskum. Prvý deň podujatia uzavreli zástupcovia Ústavu informatiky SAV. L. Hluchý vystúpil s témou počítačových technológií na spracovania reči a textu a M. Rusko demonštroval praktické využitie automatického spracovania reči.

            Druhý deň rokovania otvoril F. Čermák, riaditeľ Ústavu Českého národného korpusu Filozofickej fakulty Karlovej univerzity v Prahe, ktorý prezentoval povahu a možnosti projektu paralelných korpusov InterCorp. Ďalší účastníci z Českej republiky K. Pala a P. Rychlý z Fakulty informatiky Masarykovej univerzity v Brne predniesli svoje skúsenosti a novinky z oblasti budovania veľkých korpusov a nástrojov pre počítačovú lexikografiu. Najnovší vývoj viacjazyčných zdrojov pre bulharčinu prezentovala L. Dimitrova z Bulharskej akadémie vied. Zástupca Ruskej akadémie vied L. Iomdin prišiel na podujatie s prezentáciou o automatizovanom spracovaní textu a o hĺbkovo syntakticky anotovanom korpuse ruských textov.

            V popoludňajšom bloku predstavil P. Žigo, riaditeľ Jazykovedného ústavu Ľ. Štúra SAV,  konkrétnu počítačovú podporu kartografického spracovania nárečí slovanských jazykov a jej výsledky v podobe rozsiahlych atlasov. J. Kravjar z Centra vedecko-technických informácií SR prezentoval atraktívnu tému národného korpusu bakalárskych, diplomových, dizertačných, rigoróznych a habilitačných prác slovenských vysokých škôl a boj proti plagiátorstvu. T. Pintér z Maďarskej akadémie vied orientoval svoje rozprávanie na Maďarský národný korpus II, teda na pokus o veľký gigabajtový korpus. Druhú časť popoludňajšej sekcie otvorili výskumníci J. Staš, D. Hládek a J. Juhár z Technickej univerzity v Košiciach, ktorí predniesli svoje know-how z budovania organizovaného korpusu textov pre rečové technológie v slovenčine. Odborné vystúpenia podujatia uzavrela V. Stojkova z Bulharskej akadémie vied prezentáciou o kolaboratívne vyvinutých lexikálnych zdrojoch pre bulharčinu a ich aplikácii na tvorbu slovníkov a referenčných zdrojov.

            Počas oboch rokovacích dní podujatia sa prezentácie striedali s diskusiami k jednotlivým témam. Súčasťou podujatia bola aj posterová sekcia, v ktorej sa prezentovali firmy a organizácie využívajúce jazykové a internetové technológie, a to Inštitút jazykov a vzdelávania, E@I, NEWTON Technologies a Seznam.cz. M. Medveď z Fakulty informatiky Masarykovej univerzity v Brne prezentoval vlastnú prácu o adaptácii českých syntaktických analyzátorov pre slovenčinu.

            Záverečné slovo patrilo vedúcej oddelenia Slovenského národného korpusu JÚĽŠ SAV M. Šimkovej a riaditeľovi Jazykovedného ústavu Ľ. Štúra SAV P. Žigovi, ktorí vyjadrili svoju vďaku za veľmi príjemnú rokovaciu atmosféru a plodné diskusie 21 prednášateľom a 99 účastníkom. Všetkým popriali šťastný návrat domov a do štandardného pracovného procesu.

 

autorka: Adriána Žáková, foto: Juraj Broš