🌲 Шумарко-ЛМ

Шумарко-ЛМ

Први српски шумарски језички модел

Отворен језички модел fine-tunovan на српском шумарском корпусу, са retrieval-augmented generation слојем над просторно-индексираном базом.

Тренутна фаза: прикупљање корпуса (W1–4)

О пројекту

Шумарко-ЛМ је отворен српски језички модел величине 8–12 милијарди параметара, специјализован за домен шумарства и пољопривреде. Модел се fine-tunuje на стручном корпусу — Закон о шумама и пратећи правилници, научни радови и дисертације (NaRDuS, OpenAlex), Гласник Шумарског факултета, Wikipedia (српска, филтрирана) и сродне отворене базе.

Демо платформа sumarko.ilfe.org ће пружити приступ моделу преко REST API-ja и интерактивног UI-ja, са retrieval-augmented generation (РАГ) над курираном базом просторних података (PostGIS) и текстуалних извора.

Циљ: убрзати истраживање, едукацију и оперативни рад у шумарству Србије и шире балканске регије.

Тренутни статус

Рок MVP: 8–12 недеља · Launch: летo 2026

  1. Phase 0 Setup репоа, GPU и storage-a W1
  2. Phase 1 Прикупљање корпуса и OCR W1–4
  3. Phase 2 Tokenizer audit и припрема dataset-a W4
  4. Phase 3 Тренирање: CT → SFT → DPO (RTX 3090) W5–7
  5. Phase 4 RAG индекс и инференс стек (vLLM) W7
  6. Phase 5 Платформа sumarko.ilfe.org (UI + API) W7–10
  7. Phase 6 Polish, евалуација, public launch W10–12

Партнери и подршка

ILFE

Институт за низијско шумарство и животну средину, Нови Сад — носилац пројекта, ауторски тим, инфраструктура (GPU + storage), демо платформа.

ИИТ КГ

Институт за информационе технологије Универзитета у Крагујевцу — партнер за ML инфраструктуру и евалуацију.

Фонд за науку РС

Програм „Вештачка интелигенција у индустрији" — планирана пријава 2026, Шумарко-ЛМ као технички dokaz koncepta.

Пријави се на waitlist

Биће те међу првима који ће добити приступ sumarko.ilfe.org по launch-у. Без spam-а, без злоупотребе података.

Контакт

др Дејан Стојановић
ILFE — Институт за низијско шумарство и животну средину
Антона Чехова 13, Нови Сад
dejan.b.stojanovic@gmail.com