Repozitorij omogoča dolgotrajno in varno hranjenje jezikovnih virov in orodij. Je drugi v Sloveniji , ki je pridobil certifikat Core Trust Seal, certificiran pa je tudi kot CLARIN center tipa B. Trenutno njegov obseg presega 200 vnosov, izmed katerih jih 140 vključuje podatke za slovenski jezik, ki so ključnega pomena za računalniško jezikoslovje.
Delo na repozitoriju obsega vzdrževanje programske in strojne opreme, skrb za nemoteno delovanje sistema in uredniško delo pri novih vnosih. V okviru projekta bo uredniški postopek razširjen na validacijo samih podatkov, katerih zapis bo moral ustrezati izdelanim shemam. Poleg formalne validacije bodo viri tudi kvalitativno ovrednoteni.
Pooblaščeni uredniki bodo skrbeli, da bodo vnosi avtorjev skladni z zahtevami repozitorija, in sicer z vidika popolnosti in konsistentnosti metapodatkov ter upoštevanja odprtih standardov in dobrih praks pri zapisu podatkov. Evalvacija bo podlaga za sprejem vira v repozitorij; v primeru pripomb bo vnos vrnjen avtorjem s podrobnimi smernicami za njegovo izboljšanje ali pa bo tehnične pomanjkljivosti, v dogovoru z avtorji, odpravilo osebje CLARIN.SI.
CLARIN.SI ponuja tudi dva spletna konkordančnika, tj. zmogljivi orodji za analizo korpusov, ki sta koristni predvsem za jezikoslovce. Trenutno nudita dostop do 75 korpusov v 27 jezikih; skupno obsegata prek 15 milijard besed. Vsi javno dostopni korpusi, ki bodo vneseni v repozitorij, bodo dodatno pretvorjeni v t. i. vertikalni format, kar vključuje razvoj pretvorb, ta format pa nato služi kot osnova za postavitev korpusov pod konkordančnike CLARIN.SI, s čimer bodo korpusi postali dostopni tudi jezikoslovcem za opravljanje korpusnih analiz.
Poleg tega bomo tudi ustrezno usposobili nove sodelavce, osebje pa bo uporabnikom na voljo za odgovarjanje na vprašanja, povezana s projektom.