Projektni sklopi
Cilj projekta je zadovoljiti potrebe po računalniških izdelkih in storitvah s področja jezikovnih tehnologij za slovenski jezik za raziskovalne organizacije, za podjetja in za širšo javnost.
Cilj projekta je zadovoljiti potrebe po računalniških izdelkih in storitvah s področja jezikovnih tehnologij za slovenski jezik za raziskovalne organizacije, za podjetja in za širšo javnost.
Končni izdelki bodo na uporabniško prijazen način pomagali pri sporazumevanju, sodelovanju, poslovanju, izmenjavi znanja in udeleževanju v družabnih in političnih razpravah, in prispevali k premagovanju jezikovnih meja.
V prvem sklopu bomo nadgradili slovenske besedilne korpuse in leksikon besednih oblik. Prenovili bomo učne množice in postopke za strojno označevanje sodobne slovenščine. Rezultat bodo osveženi in povečani jezikovni viri, ki bodo na voljo tako uporabniški skupnosti kot za strojno rabo. Z razvitimi postopki in orodji bo posodabljanje slovenskih korpusov v prihodnosti hitrejše in preprostejše.
Predvidena je izdelava govorne baze, ki bo osnova za izdelavo splošnega razpoznavalnika govora, izdelava podpornih orodij in postopka za razvoj robustnega splošnega ter specializiranega razpoznavalnika, razvoj portala s podpornimi orodji in modeli razpoznave ter priprava dolgoročnega načrta nadgradnje splošnega razpoznavalnika z velikim slovarjem besed ter načrta izdelave razpoznavalnika v realnem času za domeno izobraževanja.
Cilji vključujejo izdelavo osrednje digitalne slovarske baze, ki združuje različne tipe jezikovnih podatkov o slovenščini v odprtem dostopu, avtomatsko izdelavo baze znanja oz. semantične mreže, izdelavo virov in orodij za razdvoumljanje pomenov in prepoznavanje semantičnih premikov ter za za avtomatsko povzemanje in odgovarjanje na vprašanja, izdelavo korpusov za izvajanje semantičnih analiz.
Cilji zajemajo namestitev referenčnega prevajalnika ter razvoj podpornih orodij in definiranje evalvacijskih metod, testiranje alternativnih ogrodij nevronskega strojnega prevajanja (NMT), izdelavo modelov NMT in njihovo osveževanje glede na rast korpusa prevodov, razvoj dela portala s strojnim prevajalnikom, pripravo dolgoročnega načrta za razvoj strojnega prevajalnika v domeni izobraževanja ter načrta za nadaljnji razvoj splošnega prevajalnika, zbiranje besedil za korpus prevodov.
Predvidena je izdelava terminološkega portala z iskalnikom po terminoloških virih in spletnim konkordančnikom za analizo specializiranih korpusov, orodja za luščenje terminoloških kandidatov iz korpusov, spletnega urejevalnika terminoloških virov, smernic in navodil za sestavljanje terminoloških virov z vzorčnimi podatkovnimi zbirkami, vzpostavitev svetovalnice za reševanje terminoloških vprašanj in zagotovitev ažurne objave odgovorov ter priprava načrta razvoja in nadgradnje terminološkega portala po zaključku projekta.
Cilji so zagotoviti obstoječe in nadgrajene storitve infrastrukture CLARIN.SI, poskrbeti za razvoj in vzdrževanje shem XML, za distribucijo jezikovnih virov in orodij ter zagotoviti odkup obstoječih jezikovnih virov ter informirati uporabnike o projektnih rezultatih.
S projektom Razvoj slovenščine v digitalnem okolju, ki ga financira Ministrstvo za kulturo republike Slovenije, je Slovenija prepoznala pomen razvoja sodobnih jezikovnih tehnologij za slovenski jezik.
© 2020. Vse pravice pridržane
Zasnova in izvedba: ENKI, d.o.o. Pravno obvestilo Piškotki