| Regionas | Apskritis | Savivaldybė |
|---|---|---|
| Netaikoma | Vilniaus apskritis, Alytaus apskritis, Kauno apskritis, Klaipėdos apskritis, Marijampolės apskritis, Panevėžio apskritis, Šiaulių apskritis, Tauragės apskritis, Telšių apskritis, Utenos apskritis | Vilniaus m. sav., Jonavos r. sav., Telšių r. sav., Elektrėnų sav., Molėtų r. sav., Palangos m. sav., Kauno m. sav., Prienų r. sav., Klaipėdos m. sav., Kauno r. sav., Vilkaviškio r. sav., Tauragės r. sav., Klaipėdos r. sav., Alytaus m. sav., Ignalinos r. sav., Kretingos r. sav., Anykščių r. sav., Šiaulių r. sav., Panevėžio m. sav., Šiaulių m. sav., Lazdijų r. sav., Druskininkų sav., Utenos r. sav., Panevėžio r. sav., Biržų r. sav., Varėnos r. sav., Joniškio r. sav., Marijampolės sav., Rokiškio r. sav., Šalčininkų r. sav., Akmenės r. sav., Šakių r. sav., Alytaus r. sav., Kazlų Rūdos sav., Vilniaus r. sav., Rietavo sav., Kaišiadorių r. sav., Pakruojo r. sav., Kelmės r. sav., Ukmergės r. sav., Plungės r. sav., Šilutės r. sav., Mažeikių r. sav., Šilalės r. sav., Švenčionių r. sav., Pagėgių sav., Radviliškio r. sav., Kėdainių r. sav., Jurbarko r. sav., Raseinių r. sav., Trakų r. sav., Neringos sav., Kupiškio r. sav., Kalvarijos sav., Zarasų r. sav., Širvintų r. sav., Pasvalio r. sav., Birštono sav., Visagino sav., Skuodo r. sav. |
Kalbos paveldo transformacija ir lietuvių kalbos erdvinių duomenų išteklių sukūrimas Įgyvendinama
Kvietimo numeris
02-109-P
Projekto numeris
02-109-P-0001
Sutarties įsigaliojimo data
2024-12-31 00:00
Projekto vykdytojas
Lietuvių kalbos institutas
Vykdytojo kodas
111955023
Veiklų vykdymo pabaigos data
2026-04-30 00:00
Administruojanti institucija
Centrinė projektų valdymo agentūra
Bendra projekto tinkamų finansuoti išlaidų suma
3 012 983,30 €
Projektu sprendžiamos problemos
Kalbos išteklių skaitmenizavimas yra svarbus procesas, turintis didelę reikšmę kiekvienos šalies mokslui, technologijoms, kultūrai. Šiame kontekste galima būtų išskirti kelias pagrindines svarbos sritis:
-prieiga prie informacijos: skaitmenizavimas leidžia lengviau pasiekti ir dalintis kalbos ištekliais, tokiais kaip žodynai, tekstai, audio ir video įrašai. Tai ypač svarbu mokslininkams, studentams ir plačiajai visuomenei;
-kultūrinis paveldo išsaugojimas: skaitmeninant kalbos išteklius, sukuriamos galimybės išsaugoti kultūrinį paveldą ir tradicijas, kurios gali būti pamirštos ar prarastos. Tai padeda išlaikyti kalbų įvairovę;
-technologijų plėtra: skaitmeniniai kalbos ištekliai yra būtini, kuriant dirbtinio intelekto ir natūralios kalbos apdorojimo sistemas. Tai leidžia kurti pažangias programas, tokias kaip vertimo įrankiai, kalbos atpažinimo sistemos ir kt.;
-mokymosi galimybės: skaitmeniniai ištekliai suteikia galimybę mokytis kalbų nuotoliniu būdu, naudojant įvairias platformas ir programas, kas ypač aktualu šiuolaikiniame pasaulyje.
Visus šiuos aspektus vienija itin sparti pažangių informacinių technologijų (toliau – IT) plėtra. Praktiškai visose gyvenimo, mokslo, ekonomikos, sveikatos ir kt. srityse kuriamos technologijos ir IT įrankiai, skirti duomenų kaupimui, apdorojimui bei siekiama į juos integruoti dirbtinio intelekto elementus, todėl nedvejojant būtų galima teigti, kad pastaraisiais metais žinių visuomenė pereina į kokybiškai naują pažangių informacinių technologijų etapą. Kartu šie pokyčiai kelia ir naujų uždavinių, iš kurių svarbiausi – glaudinti šių sričių sąveiką, užtikrinti kibernetinį saugumą ir apsaugą nuo dezinformacijos sklaidos, plėtoti nuotolinį mokymą, gerinti gyvenimo kokybę, mažinant kalbų barjerus, sprendžiant galėjimo įsidarbinti ir visuomenės senėjimo problemas, mažinant socialinę ir regionų atskirtį. Kalbos technologijos yra svarbi IT dalis ir vienas iš būtinų įrankių šiems uždaviniams spręsti.
Atliepiant šalies strateginiuose dokumentuose įvardintus siekius, būtina ieškoti sprendimų ir galimybių prisidėti prie visaverčio lietuvių kalbos vartojimo skaitmeninėje terpėje užtikrinimo, lietuvių kalbos statuso informacinėje visuomenėje įtvirtinimo ir palaikymo, taip apsaugant lietuvių kalbą nuo vadinamojo skaitmeninio išnykimo, bei sudaryti galimybes kitakalbiams integruotis į Lietuvos visuomenę ir mažinti lietuviškai kalbančios bendruomenės atskirtį globalioje žinių visuomenėje. Be to, kalbos technologijos vaidina svarbų vaidmenį, sprendžiant rinkų susiskaidymo problemą, nes kuria naują erdvę ekonomikos augimui. Todėl svarbu užtikrinti efektyvią sąveiką su lietuvių kalba bei visavertį lietuvių kalbos funkcionavimą elektroninėje terpėje, dirbtinio intelekto (toliau – DI) technologijų pagrindu veikiančių paslaugų prieinamumą visuomenei (rinkoje dominuojantys virtualūs asistentai, kalbos robotai, išmaniųjų namų sistemos ir kt.).
Šiandien lietuvių kalbos plėtros galimybės skaitmeninėje aplinkoje nėra išnaudotos: dar vis yra daugybė nesuskaitmenintų kalbinių duomenų ir duomenų rinkinių, esamos kalbinės infrastruktūros iki galo neišnaudojamos ir neužpildomos skaitmeniniais ištekliais, esami skaitmeniniai kalbos ištekliai nepritaikyti pažangiems technologijų sprendimams, pažangių technologijų galimybės neišnaudojamos lietuvių kalbos gyvybingumui palaikyti ir kalbos paveldui išsaugoti jį transformuojant į modernias skaitmenines kalbinės kultūros raiškos formas, garsynus, vizualizacijas. Esamos mašininio vertimo sistemos reikalauja aukštesnės kokybės, trūksta visuomenei atvertų dvikalbių duomenų, natūralios kalbos supratimui reikalingų duomenų ir natūralios kalbos generavimo sprendinių, atitinkančių globalaus verslo poreikius.
Akivaizdu, kad kalbos išteklių skaitmenizavimo procesas tampa ne poreikiu, bet būtinybe, kuris gali turėti didelį poveikį mokslui, kultūrai, ekonomikai, technologijoms ir galiausiai visai visuomenei. Tačiau norint pasiekti šio proceso privalumus, reikia spręsti iškylančias problemas, tokias kaip kalbų skaitmenizavimo trūkumas, technologinės kliūtys, duomenų privatumo klausimai ir finansavimo stoka.
Pagrindinė projektu sprendžiama problema - nepakankamas el. paslaugų procesų skaitmeninimas ir brandos lygis. Projekto uždaviniai:
-išplėsti kalbinių išteklių poreikiams DI technologijų sprendimus;
-sukurti lietuvių kalbos išsaugojimą ir tęstinumą užtikrinančius skaitmeninius išteklius, modernizuoti ir parengti naujus įrankius jiems kaupti ir analizuoti.
Projektą sudaro dvi dalys, tai Bendrojo lietuvių kalbos paveldo duomenyno kūrimas ir Lietuvių kalbos erdvinių išteklių duomenyno kūrimas. Kadangi pagrindinis Lietuvių kalbos instituto (LKI) mokslinės dalies infrastruktūros tikslas teikti prieigą mokslininkams bei suinteresuotiems asmenims prie LKI kaupiamų lietuvių kalbos išteklių, todėl projekto vykdytojas turi neįkainojamą patirtį kaupiant, kuriant, skaitmeninant ir pristatant visuomenei LKI disponuojamus kalbinius išteklius. Pateikiami ištekliai itin aktualūs ir pravartūs visiems lietuvių kalbą vartojantiems ar norintiems jos išmokti žmonėms, taip pat mokslui ir švietimui, valstybės institucijoms ir verslui.
Projekto metu planuojama sukurti Bendrąjį lietuvių kalbos paveldo duomenyną, pritaikytą DI ir inovatyvioms technologijoms plėtoti, suskaitmeninant, aktualizuojant ir visuomenei, mokslo bei verslo sektoriams atveriant archyvuose saugomus lietuvių kalbos paveldo duomenų rinkinius, turinčius išliekamąją visuomeninę ir mokslinę vertę. Bendrasis lietuvių kalbos paveldo duomenynas užtikrins unikalaus lietuvių kalbos paveldo išsaugojimą, prisidės prie jo gyvybingumo palaikymo suteikdamas atvirąją prieigą plačiajai Lietuvos ir tarptautinei visuomenei, mokslininkams, švietimo institucijoms ir verslo organizacijoms.
Antroji projekto dalis skirta lietuvių kalbos erdvinių išteklių duomenyno sukūrimui. Įgyvendinant šią projekto dalį, numatyta GIS įrankiais ir metodais sukurti lietuvių kalbos erdvinių išteklių duomenyną bei jo funkcionavimą užtikrinančią geoerdvinės informacijos infrastruktūrą, apimančią įrankius, skirtus kalbinio paveldo ir naujiems kalbiniams duomenims kaupti, jų pagrindu erdviniams rinkiniams ir sluoksniams parengti bei atverti Lietuvos bei pasaulio akademinei bendruomenei ir visuomenei. Planuojama kurti kalbos geoerdvinių duomenų infrastruktūra yra unikali Centrinės Europos regione. Lietuva turi galimybę sukurtais geoerdviniais ištekliais susilyginti su geolingvistikos moksle lyderiaujančiomis šalimis (Vokietija, Šveicarija, Ispanija ir kt.). Vertinant pastarojo meto mokslinę literatūrą, galima konstatuoti, kad ateityje kalbos ir vietovės intelekto technologijų bendro naudojimo pridėtinė vertė įvairiose veiklos srityse sparčiai augs, todėl naudojant geoerdvinę kalbos duomenų analizę Lietuvoje bus užtikrinta efektyvesnė kalbos raidos procesų stebėsena laiko ir erdvės dimensijose.
Siekiant įgyvendinti užsibrėžtą projekto tikslą ir uždavinius, suplanuotos dvi projekto veiklos:
-IT įrankių ir technologinių sprendimų sukūrimas.
-Archyvinių duomenų, išteklių surinkimas, skaitmeninimas, duomenynų sukūrimas ir paruošimas įkėlimui į naujo turinio informacinę sistemą (toliau – IS).
Pagrindinis siekiamas paslaugos pokyčio rezultatas – padidintas lietuvių kalbos išteklių prieinamumas elektroninėje erdvėje, kurio rezultatas – pasiekti tiek kokybiniai, tiek ir kiekybiniai rodikliai:
-reikšmingai prisidėta prie šalyje vykdomos el. paslaugų skaitmeninimo strategijos;
-padidintas lietuvių kalbos išteklių prieinamumas elektroninėje erdvėje;
-sukurtas bendrasis lietuvių kalbos paveldo duomenynas, pritaikytas DI ir inovatyvioms technologijoms plėtoti, suskaitmeninant, aktualizuojant ir visuomenei, mokslo bei verslo sektoriams atveriant archyvuose saugomus lietuvių kalbos paveldo duomenų rinkinius, turinčius išliekamąją visuomeninę ir mokslinę vertę;
-GIS įrankiais ir metodais sukurtas lietuvių kalbos erdvinių išteklių duomenynas bei jo funkcionavimą užtikrinanti geoerdvinės informacijos infrastruktūra, apimanti įrankius, skirtus kalbinio paveldo ir naujiems kalbiniams duomenims kaupti, jų pagrindu erdviniams rinkiniams ir sluoksniams parengti bei atverti Lietuvos bei pasaulio akademinei bendruomenei ir visuomenei;
-sudarytos galimybės tikslinėms grupėms naudotis specializuotais žinių ištekliais.
Pagrindiniu projekto rezultatu reikėtų laikyti socialinę naudą, kurią pajus tikslinės grupės besinaudojančios projekto rezultatais. Visa tai ilgalaikiu laikotarpiu prisidėtų prie ekonominės gerovės kūrimo. Projekto įgyvendinimas yra svarbi prielaida siekiant užtikrinti sėkmingą darnaus vystymosi principo įgyvendinimą.
Projektu bus išplėtotos skaitmeninimo viešosios paslaugos, suteiktas naujo konteksto turinys, sustiprinta ir praturtinta naujais funkcionalumais ir nauju turiniu IS, sudarysianti galimybes tikslinėms grupėms naudotis specializuotais žinių ištekliais, šiuolaikiniais įrankiais ir metodais juos kaupti ir analizuoti ir taip prisidėti ne tik prie lietuvių kalbos išteklių prieinamumo elektroninėje erdvėje padidinimo, Lietuvos vietinių kalbos variantų stebėsenos procesų optimizavimo, bet ir prie tautiškumo išsaugojimo. bendrojo lietuvių kalbos paveldo duomenyno apimtis sieks ne mažiau kaip 500 tūkst. vienetų lietuvių kalbos leksikografijos, tarmių, vardyno ir kt. medžiagos objektų, lietuvių kalbos erdvinių išteklių duomenyno apimtis – ne mažiau, kaip 215 erdvinių duomenų rinkinių ir sluoksnių, panaudojant ir kalbos paveldo, ir naujausią kalbinę medžiagą. Iš jų: kalbinių ypatybių pasiskirstymo Lietuvos teritorijoje skaitmeniniai internetiniai žemėlapiai, sudaryti kalbos paveldo duomenų pagrindu, apims ne mažiau kaip 180 erdvinių duomenų rinkinių, šiuolaikinių kalbinių, sociolingvistinių ir mentalinių duomenų skaitmeninių internetinių žemėlapių pagrindą sudarys ne mažiau kaip 35 erdvinių duomenų sluoksniai.
Projektas bus įgyvendinamas pagal Apraše nustatytus privalomus techninius, validavimo, dokumentavimo bei teisinius reikalavimus.
Daugiau
Mažiau
Projekto tikslas
Didinti lietuvių kalbos išteklių prieinamumą elektroninėje erdvėje, taip prisidedant prie valstybės skaitmeninimo procesų brandos lygio kėlimo.
Programos tipas
Naujos kartos Lietuva
Komponentas
Skaitmeninė transformacija ekonomikos augimuiTeritorija, kuriai tenka didžioji dalis projekto lėšų
ES fondas
| Veiklos pavadinimas | Fondas |
|---|---|
| Kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra | Ekonomikos gaivinimo ir atsparumo didinimo priemonė |
Finansavimo šaltiniai
| Finansavimo šaltinio kodas | Finansavimo šaltinio forma | Finansavimo šaltinio suma |
|---|---|---|
| 1. | Projektams skiriamos finansavimo lėšos | 3 012 983,30 € |
| 1.2. | EGADP subsidijos lėšos | 2 698 983,34 € |
| 1.6. | Valstybės biudžeto lėšos, skirtos ES fondų lėšomis netinkamam finansuoti PVM apmokėti | 313 999,96 € |
| 2. | Nuosavas įnašas | 0,00 € |
Projekto veiklos
| Sutarties projekto veiklos numeris ir pavadinimas | Sutarties poveiklės numeris ir pavadinimas |
|---|---|
| 05-002-01-07-08-02 Kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra | 05-002-01-07-08-02-02 Kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra (planavimo būdu) |
Sutarties intervencinių priemonių srities duomenys
- 021a - Parama skaitmeninio turinio kūrimui ir platinimui