Terminološki portal

Delovni sklop 5

V petem sklopu bomo izdelali terminološki portal, ki bo združeval terminološke vire in ponujal odprto dostopno orodje za luščenje terminologije iz specializiranih korpusov, pa tudi strežniško infrastrukturo za izdelavo novih terminoloških virov. Na portalu bo vzpostavljena tudi terminološka svetovalnica za svetovanje ob terminoloških zagatah, na voljo pa bodo tudi smernice z vzorčnimi zbirkami ter kratkimi in jasnimi napotki za samostojno izdelavo terminoloških virov.

Predvideni učinki ali kazalniki

  • Izdelali bomo terminološki portal, ki bo ponujal celovito iskanje po obstoječih in v projektu nastalih terminoloških virih.
  • Razvili bomo orodje za luščenje terminoloških kandidatov iz standardno zapisanih besedil, ki jih bo moč uvoziti v urejevalnik in iz njih izdelati terminološki vir.
  • Izdelali bomo urejevalnik za izdelavo terminoloških virov, ki bo uporabniku omogočal oblikovanje lastnega terminološkega vira, hkrati pa bomo sestavili smernice in navodila, ki bodo uporabniku pri tem v pomoč.
  • Na terminološkem portalu bomo vzpostavili svetovalnico za reševanje terminoloških vprašanj in zagotovili ažurno objavo odgovorov nanje.
  • Pripravili bomo načrt razvoja in nadgradnje terminološkega portala po zaključku projekta.

Terminološki portal

Terminološki portal z vsemi funkcionalnostmi bo izdelan in uporabnikom na voljo kot samostojna, odprto dostopna spletna storitev, v katero bo vključenih čim več terminoloških virov.

Glavni sestavni deli terminološkega portala so iskalnik po vseh integriranih virih, luščilnik terminoloških kandidatov iz specializiranih korpusov, konkordančnik za specializirana besedila, označevalnik terminov v strokovnih besedilih, urejevalnik terminoloških virov, terminološka svetovalnica in pomožni moduli.

Namestitveni paket bo omogočal tudi namestitev lastne instance portala, ki se bo z drugimi lahko povezala v "federacijo" portalov, v okviru katere si bodo portali lahko medsebojno izmenjevali podatke.

Pri oblikovanju in izvedbi terminološkega portala bomo poskušali zagotoviti čim boljšo uporabniško izkušnjo, pri čemer bomo upoštevali potrebe oseb s posebnimi potrebami, npr. oseb s slepoto in slabovidnostjo.

Iskanje terminov

Iskanje informacij po terminoloških virih je osnovna funkcija terminološkega portala, ki jo bo uporabljala večina uporabnikov. Zato je ključna enostavnost in hitrost iskanja ter ustrezen prikaz podatkov o najdenih zadetkih.

Iskanje informacij bo večstopenjsko; iskanje – vpis niza znakov v iskalno polje; prikaz zadetkov z osnovnimi podatki; prikaz celotnega slovarskega sestavka, in sicer: na terminološkem portalu za vse odkupljene in novonastale vire, na izvirnem spletnem mestu, npr. na Terminologišču ali Termanii, za neodkupljene vire.

Luščilnik terminoloških kandidatov

Osnova za izdelavo vsakega slovarja je geslovnik, tj. seznam iztočnic/terminov. S pomočjo specializiranih korpusov, ki so na voljo za vse več strokovnih področij, bo s pomočjo orodja za luščenje mogoče s samodejnimi metodami hitro izluščiti terminološke kandidate in jih dati v nadaljnjo obdelavo terminologom in strokovnjakom. S tem se začetna faza izdelave terminološkega slovarja poenostavi in skrajša.

Luščilnik za svoje delovanje potrebuje temeljne jezikovne tehnologije za slovenščino, in sicer tokenizacijo, lematizacijo in oblikoskladenjsko označevanje, pri statističnem vrednotenju terminološkosti pa se za primerjavo uporabljajo lematizirani frekvenčni seznami (n-grami) referenčnega korpusa – v našem primeru bo to Gigafida 2.0.

Modul luščenja bo vseboval dve osnovni orodji. Prvo bo iz besedil izluščilo terminološke kandidate v obliki seznama, ki ga bo uporabnik lahko obdeloval naprej, drugo pa bo v besedilih označilo termine. Pri uporabi sistema za samodejno luščenje terminologije bo uporabnik lahko vključil javno dostopne zunanje vire nacionalne infrastrukture odprtega dostopa ali pa uporabil le lastna besedila.

Modul za luščenje terminoloških kandidatov bo uporabnik lahko uporabljal v okviru terminološkega portala, samo orodje (luščilnik) pa bo lahko delovalo kot spletna storitev ali pa si bo uporabnik kodo skupaj z navodili naložil lokalno prek GitHuba.

Urejevalnik za izdelavo terminoloških virov

Da bi vsem, ki sestavljajo in urejajo terminologijo, olajšali delo, bomo izdelali spletni urejevalnik za izdelavo terminoloških virov. Osnovno izhodišče je, da bodo imeli vsi slovarji enako strukturo slovarskega sestavka. Da bomo to dosegli, bomo vse obstoječe slovarje, ki jih bomo odkupili, najprej z enkratnim postopkom pretvorili v enotni format zapisa, pri tem pa pazili, da se bo izgubilo čim manj izvornih slovarskih informacij. Za nove slovarje, ki bodo nastali na portalu, bomo imeli več predlog enotnega formata, od preproste z osnovnimi elementi, do kompleksnejše z večjim številom elementov, ki običajno nastopajo v slovarjih in ki jih želimo imeti tudi v naših terminoloških slovarjih.

Pri zasnovi in izdelavi urejevalnika bomo osredotočeni na uporabnike, ki ne bodo profesionalni leksikografi; zato jim bomo ponudili orodje, ki je enostavno za uporabo, a kljub temu ponuja večino funkcij, potrebnih za sestavo in urejanje slovarja.

Terminološke vire bo tudi mogoče vključiti v druga jezikovna orodja in storitve, npr. v strojni prevajalnik, druga orodja za upravljanje terminologije ali razpoznavalnik govora. Omogočeno bo tudi skupinsko delo z različnimi vlogami uporabnikov ter dodajanje večpredstavnih podatkov in povezav na zunanje vire. Aplikacija, ki bo opremljena s podrobno dokumentacijo, bo ustrezala sodobnim terminološkim standardom.

Svetovanje pri terminoloških vprašanjih

Terminološka svetovalnica bo uporabnikom prek spletnega vmesnika omogočala postavljanje s terminologijo povezanih vprašanj, ob tem pa bo vmesnik uporabnika spodbujal k čim bolj natančni formulaciji vprašanja z navedbo vira, sobesedila, morebitnih tujejezičnih ustreznikov in podobnega. Za učinkovito delovanje storitve bomo zagotovili infrastrukturo – spletni vmesnik z arhivom že odgovorjenih vprašanj. Na vprašanja bodo odgovarjali terminologi, ki se bodo po potrebi posvetovali tudi z zunanjimi strokovnjaki. V terminološki portal pa bo smiselno integrirana tudi Terminološka svetovalnica, ki že uspešno deluje na spletišču Terminologišče, spletnem mestu Terminološke sekcije ISJFR ZRC SAZU.

Smernice za izdelavo terminoloških virov in vzorčne zbirke

Smernice s kratkim in razumljivim opisom vseh možnosti, ki jih bo portal ponujal, bodo pomagale uporabnikom terminologije, npr. področnim strokovnjakom, prevajalcem, lektorjem in drugim, ki si želijo izdelati svoj terminološki vir, pri vseh fazah izdelave vira. Pri tem bomo upoštevali tudi uporabnike s posebnimi potrebami. Vsi napotki bodo ponazorjeni tudi z vzorčnimi zbirkami – pripravljeni bodo terminološki slovar s področja davkov, vzorčna zbirka slovarskih sestavkov s področja računalništva in specializirani korpus jezikoslovnih besedil, na voljo pa bodo tudi navodila za uporabo programskih vmesnikov.

Izvedite več o drugih projektnih sklopih

Vzdrževanje infrastrukturnega centra za jezikovne vire in tehnologije

Vzdrževanje infrastrukturnega centra za jezikovne vire in tehnologije

Jezikovni viri

Jezikovni viri

Govorne tehnologije

Govorne tehnologije

© 2020. Vse pravice pridržane