Žemės ūkis kasmet tampa vis sunkesnis. Pasaulio gyventojų skaičius sparčiai auga, tačiau žemės, tinkamos ūkininkauti, plotas didėja. Tuo pat metu klimato kaita veikia kritulių kiekį, temperatūrą ir dirvožemio sąlygas. Šiuo metu ūkininkai susiduria su daugybe problemų, tokių kaip vandens trūkumas, prasta dirvožemio kokybė, nenuspėjami orai ir didėjančios sąnaudų kainos. Norint patenkinti būsimą maisto poreikį, maisto gamybą reikia ženkliai padidinti. Tyrimai rodo, kad iki 2050 metų pasaulinę maisto gamybą gali tekti padidinti nuo 25 iki 70 procentų. Tai didelis iššūkis, ypač besivystančioms šalims.
Pastaraisiais metais duomenimis pagrįstas žemės ūkis tapo veiksmingu sprendimu šioms problemoms. Šiuolaikiniai ūkiai generuoja didelius kiekius duomenų iš daugelio šaltinių. Tai apima dirvožemio tyrimus, meteorologinius įrašus, palydovinius vaizdus, pasėlių derliaus duomenis ir ekonominius duomenis. Kai šie duomenys tinkamai analizuojami, tai gali padėti ūkininkams priimti geresnius sprendimus. Tai gali padėti jiems pasirinkti tinkamas kultūras, efektyviau naudoti vandenį, sumažinti trąšų atliekas ir pagerinti bendrą produktyvumą.
Tačiau daugelis ūkininkų vis dar pasikliauja tradiciniais ūkininkavimo metodais. Net ir naudojant pažangias technologijas, tokias kaip mašininis mokymasis, rezultatus dažnai sunku suprasti. Dauguma mašininio mokymosi modelių veikia kaip “juodoji dėžė”. Jie pateikia prognozes, bet neaiškiai paaiškina, kodėl tos prognozės daromos. Dėl to ūkininkams ir politikams sunku pasitikėti rezultatais ir jais naudotis.
Kodėl duomenų ir žinių atradimai svarbūs žemės ūkyje
Šiuolaikinė žemdirbystė generuoja didžiulį duomenų kiekį. Šie duomenys patys savaime nėra naudingi, nebent jie tinkamai apdorojami ir analizuojami. Žalų duomenų pavertimo naudinga informacija procesas vadinamas žinių atradimu duomenų bazėse (angl. Knowledge Discovery in Databases), dažnai sutrumpintai KDD. Šis procesas apima kelis etapus, tarp jų duomenų atranką, valymą, transformavimą, analizę ir interpretavimą.
Mašininis mokymasis atlieka labai svarbų vaidmenį žinių atradime. Jis padeda nustatyti modelius, kurių žmonės gali nesunkiai pastebėti. Pavyzdžiui, mašininis mokymasis gali nustatyti ryšius tarp kritulių ir pasėlių derliaus arba tarp dirvožemio tipo ir trąšų poreikio. Šie modeliai gali padėti ūkininkams priimti geresnius sprendimus.
Yra skirtingų tipų mašininio mokymosi metodų. Prižiūrimasis mokymasis naudoja etikuotus duomenis prognozėms daryti. Neprižiūrimasis mokymasis dirba su neetiu s duomenimis ir padeda rasti natūralius grupes ar dėsningumus. Kiekvienas tipas turi savo stipriąsias ir silpnąsias puses. Žemės ūkyje duomenys dažnai yra sudėtingi ir gaunami iš daugybės skirtingų šaltinių. Tai apsunkina vieno metodo tinkamą veikimą vienam.
Kita problema ta, kad žemės ūkio duomenys yra labai įvairūs. Jie apima skaičius, žemėlapius, vaizdus ir teksto duomenis. Tradiciniai mašininio mokymosi modeliai dažnai sunkiai derina visus šiuos duomenų tipus prasmingai. Štai čia tampa svarbi idėja sujungti mašininį mokymąsi su žinių grafais.
Tiriamajame darbe naudoti mašininio mokymosi metodai
Siūloma modelis naudoja du pagrindinius mašininio mokymosi metodus: K-Means klasterizaciją ir Naive Bayes klasifikavimą. Kiekvienas metodas sistemoje atlieka skirtingą paskirtį.
K-Means klasterizavimas yra nekontroliuojamo mokymosi metodas. Jis grupuoja duomenis į klasterius pagal panašumą. Šiame tyrime K-Means naudojamas žemės ūkio regionams suskirstyti į skirtingas agro-klimatines zonas. Šios zonos sukuriamos naudojant tokius duomenis kaip krituliai, dirvožemio drėgmė ir temperatūra. Panašiomis aplinkos sąlygomis pasižymintys regionai yra sujungiami. Tai padeda suprasti, kaip skirtingos sritys veikia žemės ūkio požiūriu.
Tai yra prižiūrėto mokymosi metodas, naudojamas klasifikacijai. Jis prognozuoja kategorijas remdamasis tikimybe. Šiame tyrime Naive Bayes naudojamas pasėlių našumui klasifikuoti į skirtingus lygius, tokius kaip žemas, vidutinis ir aukštas. Naudojami tokie požymiai kaip pasėlių istorija, trąšų naudojimas ir aplinkos sąlygos.
Pagrindinė šios tyrimo idėja yra ta, kad K-Means klasterizavimo rezultatas nenaudojamas atskirai. Vietoj to, klasterio informacija pridedama kaip įvesties ypatybė „Naive Bayes“ klasifikatoriui. Tai sukuria tvirtą ryšį tarp šių dviejų metodų. Dėl to klasifikacija tampa tikslesnė, nes dabar ji atsižvelgia tiek į vietines aplinkos zonas, tiek į pasėliams būdingus duomenis.
Žinių grafų vaidmuo žemės ūkyje
Žinių grafas yra būdas organizuoti informaciją naudojant mazgus ir ryšius. Mazgai atspindi tokius dalykus kaip pasėliai, dirvožemio tipai, klimato zonos ir žemės ūkio reikmenys. Ryšiai parodo, kaip šie dalykai yra susiję. Pavyzdžiui, ryšys gali parodyti, kad tam tikri pasėliai tinka tam tikram dirvožemio tipui arba kad kritulių kiekis turi įtakos pasėlių derliui.
Žemės ūkyje žinių grafai yra labai naudingi, nes žemės ūkio sistemos yra glaudžiai susijusios. Dirvožemis veikia augalus, klimatas veikia dirvožemį, o žemės ūkio praktikos veikia abu. Žinių grafas padeda aiškiai ir struktūruotai pavaizduoti visus šiuos ryšius.
Šiame tyrime mokslininkai naudojo populiarią grafų duomenų bazę „Neo4j“ žinių grafui sukurti. Mašininio mokymosi modelių rezultatai saugomi žinių grafui. Tai leidžia vartotojams užduoti prasmingus klausimus, pavyzdžiui, kokios kultūros labiausiai tinka tam tikrai zonai arba kiek trąšų reikia vienai kultūrai tam tikromis sąlygomis.
Žinių grafas taip pat pagerina aiškinamumą. Vietoj to, kad tiesiog parodytų prognozę, sistema gali parodyti, kaip ta prognozė yra susijusi su dirvožemio, klimato ir pasėlių duomenimis. Tai palengvina ūkininkams ir sprendimų priėmėjams pasitikėti rekomendacijomis ir jomis naudotis.
Duomenų rinkimas ir paruošimas
Tyrime naudota didelė duomenų apimtis, surinkta iš skirtingų patikimų šaltinių. Duomenys apie pasėlių gamybą, trąšų naudojimą, prekybą ir maisto tiekimą buvo gauti iš FAOSTAT. Klimato duomenys, tokie kaip kritulių kiekis, buvo gauti iš CHIRPS, o dirvožemio drėgmės duomenys – iš palydovinių vaizdų.
Duomenys apėmė daugelį metų ir kelis regionus. Tai padėjo užtikrinti, kad modelis galėtų susidoroti su skirtingomis žemės ūkio sąlygomis. Prieš naudodami duomenis, mokslininkai juos kruopščiai išvalė ir apdorojo. Trūkstamos reikšmės buvo užpildytos naudojant patikimus statistinius metodus. Išvengiant klaidų buvo pašalinti kraštutiniai įverčiai. Duomenys taip pat buvo normalizuoti, kad būtų galima teisingai palyginti skirtingus kintamuosius.
Iš žalių duomenų buvo sukurti nauji rodikliai. Į juos įtrauktas kritulių kintamumo indeksas, sausros streso indeksas ir produktyvumo stabilumo indeksas. Šie rodikliai padėjo atskleisti ilgalaikes tendencijas, o ne trumpalaikius pokyčius.
Įtraukti tiek struktūrizuoti duomenys, pavyzdžiui, skaičiai ir lentelės, tiek nestruktūrizuoti duomenys, pavyzdžiui, palydovinės nuotraukos. Dėl to duomenų rinkinys buvo labai turtingas ir realistiškas.
Hibridinio modelio kūrimas
Modelis buvo sudarytas žingsnis po žingsnio. Pirma, aplinkos duomenims buvo pritaikytas K-Means klasterizavimas. Tai leido suskirstyti regionus į tris pagrindines agro-klimatines zonas. Zonų skaičius buvo pasirinktas naudojant standartinį metodą, kuris tikrina, kaip gerai klasteriai yra atskirti.
Toliau buvo taikoma Naive Bayes klasifikacija. Klasifikatorius prognozavo pasėlių produktyvumo lygius. Svarbus skirtumas čia yra tai, kad kaip įvesties požymis buvo įtraukta agroekologinės zonos informacija iš K-Means. Tai leido klasifikatoriui suprasti ne tik pasėlių duomenis, bet ir aplinkos kontekstą.
Hibridinis modelis veikė geriau nei pavieniai modeliai. Klasifikavimo tikslumas siekė 89 procentus. Tai buvo didesnis nei atskirų Naive Bayes ir Random Forest modelių tikslumas. Šis patobulinimas rodo, kad derinant prižiūrimąjį ir neprižiūrimąjį mokymąsi galima pasiekti geresnių rezultatų.
Integracija su žinių grafiku
Kai mašininio mokymosi rezultatai buvo paruošti, jie buvo pridėti prie žinių grafiko. Agro-klimatinės zonos tapo mazgais grafike. Pasėliai, dirvožemio tipai ir tokios priemonės kaip trąšos taip pat buvo pateiktos kaip mazgai. Ryšiai buvo sukurti siekiant parodyti, kaip šie elementai yra susiję.
Pavyzdžiui, viena sąveika galėtų parodyti, kad tam tikra zona su didelė tikimybe tinkama kukurūzams ir duos gerą derlių. Kita sąveika galėtų parodyti, kad žemas dirvožemio pH reikalauja kalkių. Šios sąveikos buvo grindžiamos tiek modelių rezultatais, tiek ekspertų žiniomis.
Kadangi viskas saugoma grafinėje struktūroje, vartotojai gali lengvai tyrinėti informaciją. Jie gali vykdyti užklausas, kad rastų geriausią derlių regionui arba suprastų rizikas, susijusias su klimato ir dirvožemio sąlygomis.
Validavimas ir rezultatai
Mokslininkai modelį išbandė naudodami tiek statistinius matavimus, tiek simuliacijas. Klasterizavimo rezultatai buvo labai stiprūs, rodantys aiškų zonų atskyrimą. Klasifikavimo rezultatai taip pat buvo patikimi, su geromis tikslumo ir pakartojimo reikšmėmis visoms produktyvumo klasėms.
Žinių grafas veikė gerai greičio ir struktūros atžvilgiu. Užklausos buvo atsakytos labai greitai, o dauguma reikalingų ryšių buvo grafike. Tai rodo, kad sistema yra efektyvi ir gerai suprojektuota.
Kadangi didelio masto lauko bandymai yra brangūs ir reikalauja daug laiko, mokslininkai tyrė resursų efektyvumą naudodami modeliavimą. Jie palygino tradicinius ūkininkavimo metodus su ūkininkavimu, vadovaujamu hibridinio modelio.
Rezultatai buvo labai padrąsinantys. Fermos, kurios naudojo modelio rekomendacijas, sunaudojo 22 procentais mažiau vandens. Trąšų atliekos sumažėjo 18 procentų. Šie patobulinimai yra labai svarbūs, nes vanduo ir trąšos yra brangūs ir riboti ištekliai.
Svarba darniajam žemės ūkiui ir apribojimai
Šio tyrimo rezultatai turi didelę reikšmę tvariam žemės ūkiui. Protingiau naudodami duomenis, ūkininkai gali pagaminti daugiau maisto su mažiau išteklių. Tai padeda apsaugoti aplinką ir sumažinti žemės ūkio išlaidas.
Dar viena svarbi nauda yra aiškinamumas. Žinių grafų naudojimas leidžia sistemą lengviau suprasti. Ūkininkai ir politikos formuotojai gali matyti, kodėl pateikiamos tam tikros rekomendacijos. Tai didina pasitikėjimą ir skatina naujų technologijų diegimą.
Sistema taip pat yra plečiama. Nors tyrimas buvo sutelktas į tam tikrus regionus, sistema gali būti pritaikyta kitoms šalims ir kultūroms. Turint daugiau duomenų ir realaus laiko jutiklių, sistema gali tapti dar galingesnė.
Nors rezultatai yra daug žadantys, tyrimas turi keletą apribojimų. Dauguma patvirtinimo buvo atlikta naudojant modeliavimus. Reikalingi realūs lauko bandymai, kad būtų patvirtinti rezultatai, gauti realiomis ūkininkavimo sąlygomis. Sistema taip pat dar neapima duomenų realiuoju laiku iš jutiklių.
B futuras tyrimas galėtų sutelkti dėmesį į realaus laiko oro ir dirvožemio duomenų pridėjimą. Ekonominė analizė taip pat galėtų būti įtraukta, siekiant ištirti ūkininkams naudingas sąnaudas. Sukūrus paprastas mobiliąsias ar internetines programas, ūkininkams būtų lengviau naudotis sistema.
Išvada
Šis tyrimas pristato tvirtą ir praktišką požiūrį į tiksliąją žemdirbystę. Sujungdami K-Means klasterizavimą, Naive Bayes klasifikavimą ir žinių grafus, autoriai sukūrė tikslią, aiškią ir naudingą sistemą. hibridinis modelis pagerina prognozavimo tikslumą ir padeda sumažinti vandens bei trąšų naudojimą.
Svarbiausia, kad žinių grafas leidžia lengvai suprasti ir pritaikyti rezultatus. Tai didelis žingsnis siekiant, kad pažangios agrarinės technologijos taptų prieinamos ūkininkams ir sprendimų priėmėjams. Toliau tobulinant ir praktiškai išbandžius, šis metodas turi didelį potencialą remti tvarią žemdirbystę ir pasaulinį maisto saugumą.
NuorodaNjama-Abang, O., Oladimeji, S., Eteng, I. E., & Emanuel, E. A. (2026). Sinistinė žvalgyba: naujas hibridinis tiksliosios žemdirbystės modelis, naudojantis k-means, naivinį Bajeso ir žinių grafikus. Journal of the Nigerian Society of Physical Sciences, 2929-2929.
Tiksliųjų laukų ūkininkavimo







