Facebook Instagram Twitter RSS Feed PodBean Back to top on side

Aktuality

foto.jpg

Postavenie slovenského jazyka v globalizovanom a informatizovanom svete

25. 9. 2012 | videné 2925-krát

Slovenčina sa v rámci rodiny slovenských jazykov radí k najmladším spisovným jazykom s malým počtom nositeľov a používateľov. Jej vedecké opisy z pracoviska Jazykovedného ústavu Ľ. Štúra Slovenskej akadémie vied i univerzitných slovakistických pracovísk sú nevyhnutné pre pozadie vývoja a súčasného stavu slovenského jazykového systému a fungovanie jednotlivých prostriedkov i pre praktické napĺňanie komunikačnej funkcie jazyka všetkými jeho používateľmi.

Gramatické a lexikografické opisy slovenského jazyka, ako aj mnohé ďalšie monografické práce slovenských jazykovedcov dosahujú medzinárodné uznanie rovnako ako ich autori participujúci na rôznych porovnávacích výskumoch na Slovensku i v zahraničí. Začlenením Slovenska do štruktúr EÚ a masívnym rozmachom počítačových technológií sa pre slovenčinu i ďalšie malé jazyky vynára stále naliehavejšia otázka ďalšieho rozvoja, ba aj prežitia.

 

            V oddelení Slovenského národného korpusu JÚĽŠ SAV, ktoré sa od roku 2002 systematicky venuje počítačovému spracovaniu slovenčiny v písanej i hovorenej podobe, sa postupne pripravilo viacero databáz a výstupov umožňujúcich zapojenie Slovenska a slovenčiny do medzinárodných projektov v oblasti tvorby jazykových technológií.  Jedným z nich je sieť excelentnosti META-NET (http://www.meta-net.eu/) a projekt CESAR (http://cesar.nytud.hu/), v rámci ktorých sa podporuje rozvoj multilingválnych technológií v Európe. Riešitelia v rokoch 2011 – 2012 pripravili sériu bielych kníh o stave týchto technológií a nástrojov spracovania prirodzeného jazyka. V slovenskej bielej knihe Slovenský jazyk v digitálnom veku sa opisuje história vzniku slovenčiny a jej špecifiká oproti ostatným jazykom a osobitne v európskej informačnej spoločnosti a porovnáva sa stav podpory pre 30 skúmaných európskych jazykov.

 

            Pri príležitosti Európskeho dňa jazykov, ktorý si už tradične pripomíname 26. septembra, sa celá séria bielych kníh sprístupňuje širokej verejnosti. Informatórium popredných európskych odborníkov v oblasti jazykových technológií varuje pred možným problémom väčšiny európskych jazykov prežiť v digitálnom veku. Hlavní riešitelia zhrnuli výsledky celej série do spoločného vyhlásenia s názvom Minimálne 21 európskym jazykom hrozí digitálne vyhynutie.

 

            Podľa aktuálnych záverov popredných európskych odborníkov na jazykové technológie väčšina európskych jazykov čelí hrozbe digitálneho zániku. Na základe hodnotenia úrovne podpory jazykových technológií pre 30 z približne 80 európskych jazykov vyplynulo, že pre 21 jazykov je podpora slabá alebo žiadna a ich digitalizácia je nedostatočná. Prieskum realizovala sieť excelentnosti META-NET, ktorú tvorí 60 výskumných centier v 34 krajinách.

 

            Informačnú príručku vypracovalo a jej výsledky zdokumentovalo viac než 200 odborníkov v 30 zväzkoch série bielych kníh META-NET-u, ktoré sú dostupné v tlačenej i elektronickej forme. V sérii bielych kníh sa sumarizovala úroveň podpory jazykových nástrojov a technológií pre každý skúmaný jazyk v štyroch rôznych kategóriách: strojový preklad, spracovanie reči,  textová analýza a dostupnosť jazykových zdrojov. 21 jazykov, t. j. 70 % z celkového počtu hodnotených jazykov, má najnižšie hodnotenie „slabá alebo žiadna podpora“ minimálne v jednej kategórii. Jazyky ako islandčina, lotyština, litovčina alebo maltčina majú najnižšie hodnotenie dokonca vo všetkých štyroch kategóriách. Najvyššie hodnotenie, teda „vynikajúca podpora“, nezískal ani jeden zo skúmaných jazykov. Angličtina ako jediná dosiahla hodnotenie „veľmi dobrá podpora“. Za ňou nasledujú jazyky ako holandčina, francúzština, nemčina, taliančina alebo španielčina, ktoré dosiahli hodnotenie „dobrá podpora“. Niektoré jazyky, ako napr. baskičtina, bulharčina, katalánčina, gréčtina, maďarčina a poľština, získali len „čiastočnú podporu“, preto ich možno považovať za veľmi ohrozené jazyky. Do tejto skupiny patrí aj slovenčina.

 

            „Výsledky nášho prieskumu sú znepokojujúce. Väčšina európskych jazykov nedisponuje dostačujúcim počtom jazykových zdrojov alebo dokonca nemá žiadne. Preto je existencia mnohých jazykov ohrozená,“ hovorí prof. Hans Uszkoreit, koordinátor projektu META-NET, vedecký riaditeľ DFKI (Nemecké výskumné centrum pre umelú inteligenciu v Berlíne) a spoluredaktor série bielych kníh. Ďalší spoluredaktor Dr. Georg Rehm (DFKI) dodáva: „V  jednotlivých kategóriách hodnotenia podpory jazykových technológií sú medzi jazykmi markantné rozdiely. Zaostávanie „malých“ jazykov za „veľkými“ sa neustále zväčšuje. Ak sa chceme vyhnúť tomuto zaostávaniu menších jazykov s nižším počtom jazykových zdrojov v oblasti digitalizácie, musíme ich dostatočne technologicky podporovať.”

          

          Jazykovými technológiami sú aj rozmanité softvéry na spracovanie hovorenej i písanej podoby ľudského jazyka. Medzi najznámejšie príklady jazykových technológií patrí napr. kontrola gramatiky, kontrola pravopisu, interaktívny osobný asistent v smartphone (napr. Siri), dialógový systém pracujúci prostredníctvom telefónu, systém automatického prekladu, webové vyhľadávače  alebo syntetický hlasový výstup v navigačných systémoch. Súčasné jazykové technológie využívajú predovšetkým štatistické prístupy, ktoré si vyžadujú obrovské množstvo dát. Z tohto dôvodu je náročné vyvinúť jazykové nástroje pre jazyky s nízkym počtom hovoriacich/nositeľov. Viaceré systémy majú aj zjavné nedostatky v kvalite, napr. online prekladače ponúkajú svojim používateľom často nesprávne, hoci zábavné preklady.

 

            Európe sa viac-menej podarilo odstrániť hranice medzi jednotlivými členskými krajinami. Jednu hranicu sa však ešte nepodarilo prekonať. Je ňou napriek moderným technológiám práve jazyková bariéra. Ak by sa podarilo túto bariéru odstrániť, vytvorí sa jednotný digitálny trh s voľným pohybom tovaru, produktov a služieb. Jazykové technológie majú potenciál odstrániť tieto bariéry, avšak výsledky výskumu META-NET-u jasne ukazujú, že európske jazyky a štáty na to ešte nie sú pripravené. Ich nedostatočné technologické spracovanie je spôsobené sústreďovaním pozornosti na angličtinu, nedostatočnou finančnou a morálnou podporou a nejasnou technologickou a výskumnou víziou pre ostatné jazyky.

 

            Európa sa musí systematicky snažiť vybudovať, príp. doplniť chýbajúce technológie a adaptovať ich na väčšinu jazykov. Nedostatočné financovanie výskumu a vývoja v menších jazykových komunitách, „presun“ technológií medzi jazykmi, nedostatok interoperability zdrojov, nástrojov a služieb a v neposlednom rade aj fakt, že sa jazykové hranice nie vždy prelínajú s politickými hranicami, to všetko zosilňuje nevyhnutnosť zapojiť do procesu budovania jazykových technológií všetky členské štáty Európskej únie, pridružené krajiny a najmä priemysel. Európa sa musí snažiť pripraviť svoje jazyky na plnenie funkcie v digitálnom čase. Jazyk je jednou z najvzácnejších  zložiek kultúrneho dedičstva našich krajín, preto je potrebné vynaložiť všetky sily, aby sme si ho zachovali. 26. septembra si pripomíname Európsky deň jazykov, ktorého myšlienka vznikla v Rade Európy. Cieľom Európskeho dňa jazykov je pripomenúť si význam jazykového vzdelávania a rozvoja  jazykového a kultúrneho dedičstva na európskom kontinente. Aj biele knihy META-NET-u mapujú stav nášho jazykového dedičstva v digitálnej ére.

 

Prehľad jazykových technológií

            Jazykové technológie sú súčasťou nášho každodenného života. Využívame ich napr. pri vyhľadávaní alebo prekladoch webových stránok, pri používaní kontroly gramatiky či pravopisu, pri ovládaní zábavného systému v autách alebo mobilných telefónov hlasovými príkazmi, pri objednávaní tovaru online, pri mobilných navigáciách a pod. V blízkej budúcnosti budeme môcť pravdepodobne sami komunikovať s počítačovými programami a podobnými prístrojmi vrátane dlho očakávaných robotov. Ak potrebujeme získať informáciu, opýtame sa na ňu. Ak odstránime komunikačnú bariéru medzi ľuďmi a technológiami, môžeme zmeniť svet.

 

            Jazykové technológie sa všeobecne považujú za jednu z kľúčových oblastí informačných technológií. Veľké medzinárodné spoločnosti ako Google, Microsoft, IBM a Nuance investovali do ich rozvoja nemalé financie. V Európe existujú stovky malých a stredných podnikov, ktoré sa špecializujú na jazykové aplikácie alebo služby. Jazykové technológie umožňujú ľuďom spolupracovať, učiť sa, obchodovať a vymieňať poznatky napriek jazykových bariéram nezávisle od ich počítačových zručností.

Séria bielych kníh META-NET-u

            Séria bielych kníh META-NET-u s názvom Languages in the European Information Society (Jazyky v európskej informačnej spoločnosti) podáva správu o stave jazykových technológií v 30 európskych jazykoch a opisuje najväčšie riziká a perspektívy. Séria zahŕňa všetky oficiálne jazyky EÚ a niekoľko ďalších jazykov Európy. V danej oblasti už síce existuje viacero rozsiahlych a prínosných štúdií, no ani jedna ešte nepodala celkový súhrn, ktorý by mapoval situáciu v jednotlivých jazykoch a výzvy so zreteľom na technologicky podporovanú multilingválnu Európu. Séria bielych kníh META-NET-u slúži najmä na informovanie o stave jazykových technológií v jednotlivých krajinách. META-NET sumarizuje príčiny, pre ktoré väčšina jazykov čelí vážnym problémom. Sériu bielych kníh pripravilo spolu viac než 200 autorov a spoluautorov.

 

            Biele knihy zahŕňajú nasledujúce jazyky: angličtina, baskičtina, bulharčina, čeština, dánčina, estónčina, fínčina, francúzština, galícijčina, gréčtina, holandčina, chorvátčina, islandčina, írčina, katalánčina, litovčina, lotyština, maďarčina, maltčina, nemčina, nórčina (bokmål a nynorsk), poľština, portugalčina, rumunčina, slovenčina, slovinčina, srbčina, španielčina, švédčina a taliančina. Každá biela kniha je napísaná v jazyku, ktorý hodnotí, a (okrem anglickej) zároveň aj v anglickom preklade.

 

O META-NET-e a META

 

            META-NET je sieť excelentnosti, ktorá združuje 60 výskumných centier z 34 krajín. Jej úlohou je vybudovať technologické základy multilingválnej európskej informačnej spoločnosti. META-NET je spolufinancovaný Európskou komisiou prostredníctvom štyroch rôznych projektov.

 

            Alianciu META (Multilingválna európska technologická aliancia) buduje v súčasnej dobe META-NET. META je tvorená 600 organizáciami z 55 krajín. Združuje výskumné centrá, univerzity, malé a stredné podniky, ako aj niekoľko veľkých spoločností.

 

META-NET:                 http://www.meta-net.eu

Biele knihy:                   http://www.meta-net.eu/whitepapers

Citáty a odporúčania:   http://www.meta-net.eu/whitepapers/all-quotes-and-testimonials

 

Adriána Žáková, Mária Šimková