Projekts “Viedais bioloģijas speciālās leksikas informācijas sistēmu komplekss lingvistiskās daudzveidības pētniecībai un saglabāšanai”: pirmajos divos īstenošanas gados paveiktais

Pagājuši projekta “Viedais bioloģijas speciālās leksikas informācijas sistēmu komplekss lingvistiskās daudzveidības pētniecībai un saglabāšanai” (IMDS) īstenošanas pirmie divi gadi, un tā ir iespēja atskatīties uz paveikto un informēt sabiedrību. Divos projekta īstenošanas gados ir notikušas 248 projekta partneru (no Dārzkopības Institūta un Ventspils Augstskolas fakultātēm) tiešsaistes sapulces, kurās diskutēts par dažādiem projekta jautājumiem.

Projekta īstenošanas laikā ir pabeigti interaktīvās daudzfunkcionālās informācijas pārvaldības sistēmas datu ievades moduļi. Projektā izstrādātā sistēma ir paredzēta organismu (augu, dzīvnieku un slimību ierosinātāju) nosaukumu uzkrāšanai, saglabāšanai un pētniecībai. Tajā jau ir iespējams ievadīt, rediģēt, dzēst un apskatīt saglabātos datus gan aizmugursistēmā, gan priekšgalsistēmā. Datu ievades moduli veido: organismu nosaukumu apakšmoduļi, kuros latviskie vai citu valodu organismu nosaukumi var būt apkopoti:

sasaistē ar to latīnisko jeb zinātnisko nosaukumu,
sasaistē ar organisma nosaukuma ekvivalentu citā valodā (vārdnīcas tipa apakšmodulī),
sasaistē ar tā definīciju (terminu apakšmodulī) vai
bez šādas sasaistes jeb nesaistīto organismu nosaukumu apakšmodulī.

Visas datubāzē ievadītās organismu nosaukumu vienības tiek sasaistītas ar atbilstošo ievadīto bibliogrāfijas vienību un datu ievadītāja kontu, tādējādi nodrošinot statistikas datu izguvi.

Bibliogrāfijas un lietotāju moduļos ir pabeigta CRUD (Create, Read, Update, Delete) jeb izveidošanas, lasīšanas, atjaunināšanas un dzēšanas funkcionalitāte gan aizmugursistēmā, gan priekšgalsistēmā. Pēdējā pusgada laikā aktīvi strādāts pie sistēmas hierarhiskā moduļa izveides. Šajā sistēmas modulī ievadītie dati (organismu nosaukumi) tiek sasaistīti hierarhiski 33 taksonomiskajos līmeņos. Lai nodrošinātu efektīvu datu izguvi šajā modulī, jau iepriekš programmētā sistēma tika papildināta ar otru datubāzi, kas izstrādāta, izmantojot koka struktūras tipa datubāzes platformu MongoDB.

Noslēdzošajā projekta īstenošanas gadā tiks turpināts darbs pie jaunās sistēmas statistikas moduļa izveides, tiks izstrādāta sistēmas uzstādīšanas un testēšanas dokumentācija, kā arī sagatavota sistēmas lietošanas rokasgrāmata.

Aktīvi turpinās datu ievadīšana sistēmas datubāzē. Līdz šim brīdim sistēmā ievadīti 116 113 dažādu organismu taksonu nosaukumi no 4400 bibliogrāfiskajiem avotiem. Šobrīd pētnieki un programmētāji sadarbojas, lai izstrādātu optiskās rakstzīmju atpazīšanas (OCR) algoritmus, kas spētu apstrādāt no papīra formāta grāmatām digitalizētu tekstu fraktūrā, lai būtu iespējama automatizēta datu ievade no senāku laikmetu grāmatām.

Projekta dalībnieki otrajā projekta īstenošanas gadā ar pētījumiem piedalījušies vairākās starptautiskās zinātniskajās konferencēs, tostarp starptautiskajā starpdisciplinārajā konferencē „Lingvistiskā daudzveidība, terminoloģija un statistika", kas norisinājās tiešsaistē 2022. gada 3.–4. novembrī. Atsevišķi konferencē prezentētie pētījumi zinātnisku publikāciju formā iesniegti publicēšanai žurnālā “Studies about Languages”. Šī žurnāla atsevišķs numurs tiks veltīts tikai konferencē “Lingvistiskā daudzveidība, terminoloģija un statistika” prezentētajiem pētījumiem. Konferences plenārreferente Marije Vahkova (Marie Vachková) uzrakstījusi un iesniegusi ziņojumu par konferenci “Linguistic Diversity, Terminology and Statistics” Čehijas Valodniecības asociācijas žurnālā "Jazykovědné aktuality" (Valodniecības aktualitātes), kas tiks izdots jau šā gada pirmajā ceturksnī.

Pētījuma finansētājs ir Latvijas Zinātnes padomes Fundamentālo un lietišķo pētījumu projekts Nr. lzp-2020/1-0179 "Viedais bioloģijas speciālās leksikas informācijas sistēmu komplekss lingvistiskās daudzveidības pētniecībai un saglabāšanai".

Proj. Nr. lzp-2020/1-0179.

< Vecāka ziņa Jaunāka ziņa >