Projektni sklopi

Cilj projekta je zadovoljiti potrebe po računalniških izdelkih in storitvah s področja jezikovnih tehnologij za slovenski jezik za raziskovalne organizacije, za podjetja in za širšo javnost.

Končni izdelki bodo na uporabniško prijazen način pomagali pri sporazumevanju, sodelovanju, poslovanju, izmenjavi znanja in udeleževanju v družabnih in političnih razpravah, in prispevali k premagovanju jezikovnih meja.

Jezikovni viri

V prvem sklopu bomo nadgradili slovenske besedilne korpuse in leksikon besednih oblik. Prenovili bomo učne množice in postopke za strojno označevanje sodobne slovenščine. Rezultat bodo osveženi in povečani jezikovni viri, ki bodo na voljo tako uporabniški skupnosti kot za strojno rabo. Z razvitimi postopki in orodji bo posodabljanje slovenskih korpusov v prihodnosti hitrejše in preprostejše.

Govorne tehnologije

Predvidena je izdelava govorne baze, ki bo osnova za izdelavo splošnega razpoznavalnika govora, izdelava podpornih orodij in postopka za razvoj robustnega splošnega ter specializiranega razpoznavalnika, razvoj portala s podpornimi orodji in modeli razpoznave ter priprava dolgoročnega načrta nadgradnje splošnega razpoznavalnika z velikim slovarjem besed ter načrta izdelave razpoznavalnika v realnem času za domeno izobraževanja.

Semantični viri in tehnologije

Cilji vključujejo izdelavo osrednje digitalne slovarske baze, ki združuje različne tipe jezikovnih podatkov o slovenščini v odprtem dostopu, avtomatsko izdelavo baze znanja oz. semantične mreže, izdelavo virov in orodij za razdvoumljanje pomenov in prepoznavanje semantičnih premikov ter za za avtomatsko povzemanje in odgovarjanje na vprašanja, izdelavo korpusov za izvajanje semantičnih analiz.

Strojno prevajanje

Cilji zajemajo namestitev referenčnega prevajalnika ter razvoj podpornih orodij in definiranje evalvacijskih metod, testiranje alternativnih ogrodij nevronskega strojnega prevajanja (NMT), izdelavo modelov NMT in njihovo osveževanje glede na rast korpusa prevodov, razvoj dela portala s strojnim prevajalnikom, pripravo dolgoročnega načrta za razvoj strojnega prevajalnika v domeni izobraževanja ter načrta za nadaljnji razvoj splošnega prevajalnika, zbiranje besedil za korpus prevodov.

Terminološki portal

Predvidena je izdelava terminološkega portala z iskalnikom po terminoloških virih in spletnim konkordančnikom za analizo specializiranih korpusov, orodja za luščenje terminoloških kandidatov iz korpusov, spletnega urejevalnika terminoloških virov, smernic in navodil za sestavljanje terminoloških virov z vzorčnimi podatkovnimi zbirkami, vzpostavitev svetovalnice za reševanje terminoloških vprašanj in zagotovitev ažurne objave odgovorov ter priprava načrta razvoja in nadgradnje terminološkega portala po zaključku projekta.

Vzdrževanje infrastrukturnega centra za jezikovne vire in tehnologije

Cilji so zagotoviti obstoječe in nadgrajene storitve infrastrukture CLARIN.SI, poskrbeti za razvoj in vzdrževanje shem XML, za distribucijo jezikovnih virov in orodij ter zagotoviti odkup obstoječih jezikovnih virov ter informirati uporabnike o projektnih rezultatih.

O projektu
Partnerji

O projektu

S projektom Razvoj slovenščine v digitalnem okolju, ki ga financira Ministrstvo za kulturo republike Slovenije, je Slovenija prepoznala pomen razvoja sodobnih jezikovnih tehnologij za slovenski jezik.

© 2020. Vse pravice pridržane