Poljoprivreda postaje svake godine sve teža. Svjetsko stanovništvo brzo raste, ali količina zemljišta dostupnog za poljoprivredu ne raste. Istovremeno, klimatske promjene utječu na oborine, temperaturu i uvjete tla. Poljoprivrednici se sada suočavaju s mnogim problemima poput nestašice vode, loše kvalitete tla, nepredvidivog vremena i rastućih troškova ulaganja. Kako bi se zadovoljila buduća potražnja za hranom, proizvodnja hrane mora značajno porasti. Studije sugeriraju da bi se globalna proizvodnja hrane do 2050. godine mogla morati povećati za 25 do 70 posto. Ovo je vrlo velik izazov, posebno za zemlje u razvoju.
Poljoprivreda utemeljena na podacima u posljednjih je nekoliko godina postala snažno rješenje za te probleme. Moderni poljoprivredni sustavi generiraju velike količine podataka iz mnogih izvora. To uključuje analize tla, meteorološke zapise, satelitske snimke, podatke o prinosu usjeva i ekonomske podatke. Kada se ti podaci pravilno analiziraju, mogu pomoći poljoprivrednicima u donošenju boljih odluka. Oni im mogu pomoći u odabiru pravih usjeva, učinkovitijem korištenju vode, smanjenju rasipanja gnojiva i poboljšanju ukupne produktivnosti.
Međutim, mnogi poljoprivrednici se i dalje oslanjaju na tradicionalne metode uzgoja. Čak i kada se koriste napredne tehnologije poput strojnog učenja, rezultate je često teško razumjeti. Većina modela strojnog učenja funkcionira poput “crne kutije”. Daju predviđanja, ali ne objašnjavaju jasno zašto su ta predviđanja napravljena. To poljoprivrednicima i kreatorima politike otežava povjerenje u rezultate i njihovo korištenje.
Zašto su otkrivanje podataka i znanja važni u poljoprivredi
Moderna poljoprivreda proizvodi ogromnu količinu podataka. Sami ti podaci nisu korisni ako nisu pravilno obrađeni i analizirani. Proces pretvaranja sirovih podataka u korisne informacije naziva se Otkrivanje znanja u bazama podataka, često skraćeno kao KDD. Ovaj proces uključuje nekoliko koraka, uključujući odabir podataka, čišćenje, transformaciju, analizu i interpretaciju.
Strojno učenje igra vrlo važnu ulogu u otkrivanju znanja. Pomaže u prepoznavanju obrazaca koje ljudi možda ne vide lako. Na primjer, strojno učenje može pronaći veze između količine oborina i prinosa usjeva ili između tipa tla i potrebe za gnojivom. Ti obrasci mogu pomoći poljoprivrednicima u donošenju boljih odluka.
Postoje različite vrste metoda strojnog učenja. Nadgledano učenje koristi označene podatke za donošenje predviđanja. Nenadzirano učenje radi s neoznačenim podacima i pomaže u pronalaženju prirodnih grupa ili obrazaca. Svaka vrsta ima svoje snage i slabosti. U poljoprivredi su podaci često složeni i dolaze iz mnogo različitih izvora. To otežava dobro funkcioniranje jedne metode sama za sebe.
Drugi izazov je što su poljoprivredni podaci vrlo raznoliki. Uključuju brojeve, karte, slike i tekstualne podatke. Tradicionalni modeli strojnog učenja često se teško nose s kombiniranjem svih tih vrsta podataka na smislen način. Tu postaje važna ideja kombiniranja strojnog učenja s grafovima znanja.
Metode strokovnog učenja korištene u studiji
Predloženi model koristi dvije glavne tehnike strojnog učenja: K-Means klasteriranje i Naive Bayes klasifikaciju. Svaka metoda služi različitoj svrsi u sustavu.
K-Means klasteriranje je metoda nadziranog učenja. Ona grupiše podatke u klastere na osnovu sličnosti. U ovoj studiji, K-Means se koristi za podjelu poljoprivrednih regija na različite agro-klimatske zone. Ove zone se kreiraju koristeći podatke kao što su količina padavina, vlažnost zemljišta i temperatura. Regije sa sličnim uslovima okoline grupišu se zajedno. Ovo pomaže u razumijevanju kako se različita područja ponašaju u smislu poljoprivrede.
Naivni Bayes je metoda nadziranog učenja koja se koristi za klasifikaciju. Predviđa kategorije na temelju vjerojatnosti. U ovoj studiji, Naivni Bayes se koristi za klasifikaciju produktivnosti usjeva u različite razine kao što su niska, srednja i visoka. Koristi značajke poput povijesti usjeva, upotrebe gnojiva i uvjeta okoliša.
Ključna ideja ovog istraživanja je da izlaz K-Means klasteriranja nije korišten zasebno. Umjesto toga, informacije o klasteru dodaju se kao ulazna značajka Naive Bayes klasifikatoru. To stvara snažnu povezanost između ove dvije metode. Kao rezultat toga, klasifikacija postaje točnija jer sada uzima u obzir i lokalne ekološke zone i podatke specifične za usjeve.
Uloga grafova znanja u poljoprivredi
Graf znanja je način organiziranja informacija pomoću čvorova i veza. Čvorovi predstavljaju stvari poput usjeva, tipova tla, klimatskih zona i poljoprivrednih inputa. Veze pokazuju kako su te stvari povezane. Na primjer, veza može pokazati da je određeni usjev pogodan za određeni tip tla ili da oborine utječu na prinos usjeva.
U poljoprivredi, grafovi znanja su vrlo korisni jer su poljoprivredni sustavi jako međusobno povezani. Tlo utječe na usjeve, klima utječe na tlo, a poljoprivredne prakse utječu na oboje. Graf znanja pomaže prikazati sve te veze na jasan i strukturiran način.
U ovoj studiji, istraživači su koristili Neo4j, popularnu grafičku bazu podataka, za izgradnju grafova znanja. Rezultati iz modela strojevog učenja pohranjeni su u grafu znanja. To omogućuje korisnicima postavljanje smislenih pitanja, kao što su koje su kulture najbolje za određenu zonu ili koliko gnojiva je potrebno za usjev pod određenim uvjetima.
Baza znanja također poboljšava interpretativnost. Umjesto da samo pokaže predviđanje, sustav može pokazati kako je to predviđanje povezano s podacima o tlu, klimi i usjevima. To olakšava poljoprivrednicima i donositeljima odluka da vjeruju i koriste preporuke.
Prikupljanje i priprema podataka
U studiji je korištena velika količina podataka prikupljenih iz različitih pouzdanih izvora. Podaci o proizvodnji usjeva, podaci o korištenju gnojiva, podaci o trgovini i podaci o opskrbi hranom dobiveni su iz FAOSTAT-a. Podaci o klimi, kao što su obrasci oborina, potječu iz CHIRPS-a, dok su podaci o vlažnosti tla dobiveni iz satelitskih snimaka.
Podaci su obuhvatili mnogo godina i više regija. Ovo je pomoglo osigurati da model može podnijeti različite poljoprivredne uvjete. Prije korištenja podataka, istraživači su ih pažljivo očistili i obradili. Nedostajuće vrijednosti popunjene su pouzdanim statističkim metodama. Izvanredne vrijednosti uklonjene su kako bi se izbjegle pogreške. Podaci su također normalizirani kako bi se različite varijable mogle pošteno usporediti.
Iz sirovih podataka stvoreni su neki novi pokazatelji. To su uključivali indeks varijabilnosti oborina, indeks stresa od suše i indeks stabilnosti produktivnosti. Ovi pokazatelji pomogli su u hvatanju dugoročnih trendova, a ne kratkoročnih promjena.
Uključeni su i strukturirani podaci, poput brojeva i tablica, i nestrukturirani podaci, poput satelitskih snimaka. To je podatke učinilo vrlo bogatima i realističnima.
Razvoj hibridnog modela
Hibridni model je izgrađen korak po korak. Prvo je K-Means klasterizacija primijenjena na ekološke podatke. Time su regije podijeljene u tri glavne agro-klimatske zone. Broj zona odabran je standardnom metodom koja provjerava koliko su klasteri dobro odvojeni.
Zatim je primijenjena Naive Bayes klasifikacija. Klasifikator je predvidio razine produktivnosti usjeva. Važna razlika ovdje je što su podaci o agro-klimatskim zonama iz K-Means uključeni kao ulazna značajka. To je klasifikatoru omogućilo da razumije ne samo podatke o usjevima, već i ekološki kontekst.
Hibridni model pokazao se boljim od pojedinačnih modela. Točnost klasifikacije dosegla je 89 posto. To je bilo više od točnosti samostalnih modela Naive Bayes i Random Forest. Ovo poboljšanje pokazuje da kombiniranje nadziranog i nenadziranog učenja može dovesti do boljih rezultata.
Integracija s bazom znanja
Nakon što su rezultati strojnog učenja bili spremni, dodani su grafu znanja. Agro-klimatske zone postale su čvorovi u grafu. Usjevi, tipovi tla i inputi poput gnojiva također su predstavljeni kao čvorovi. Stvorene su veze kako bi se prikazalo kako su ti elementi povezani.
Na primjer, odnos bi mogao pokazati da je određena zona prikladna za kukuruz s velikom vjerojatnošću dobrog uroda. Drugi odnos mogao bi pokazati da nizak pH tla zahtijeva dodavanje vapna. Ti su odnosi bili utemeljeni na izlazima modela i stručnom znanju.
Budući da je sve pohranjeno u grafičkoj strukturi, korisnici lako mogu istraživati informacije. Mogu pokretati upite kako bi pronašli najbolju kulturu za određenu regiju ili razumjeli rizike povezane s klimatskim i tlenim uvjetima.
Validacija i rezultati
Istraživači su testirali model koristeći statistička mjerenja i simulacije. Rezultati klasteriranja bili su vrlo snažni, pokazujući jasnu separaciju između zona. Rezultati klasifikacije također su bili pouzdani, s dobrim vrijednostima preciznosti i odziva za sve klase produktivnosti.
Graf znanja je dobro funkcionirao u pogledu brzine i strukture. Upiti su odgovoreni vrlo brzo, a većina potrebnih odnosa bila je prisutna u grafu. Ovo pokazuje da je sustav učinkovit i dobro dizajniran.
Budući da su veliki terenski eksperimenti skupi i dugotrajni, istraživači su koristili simulacije za testiranje učinkovitosti resursa. Usporedili su tradicionalne poljoprivredne metode s poljoprivredom vođenom hibridnim modelom.
Rezultati su bili vrlo ohrabrujući. Farme koje su slijedile preporuke modela koristile su 22 posto manje vode. Otpad gnojiva smanjen je za 18 posto. Ova poboljšanja su vrlo važna jer su voda i gnojiva skupi i ograničeni resursi.
Važnost za održivu poljoprivredu i ograničenja
Nalazi ovog istraživanja imaju snažne implikacije za održivu poljoprivredu. Pametnijim korištenjem podataka, poljoprivrednici mogu proizvesti više hrane uz manje resursa. Ovo pomaže u zaštiti okoliša i smanjuje troškove poljoprivrede.
Druga važna prednost je interpretativnost. Korištenje grafova znanja olakšava razumijevanje sustava. Poljoprivrednici i kreatori politika mogu vidjeti zašto se donose određene preporuke. Time se povećava povjerenje i potiče usvajanje novih tehnologija.
Sustav je također skalabilan. Iako se studija fokusirala na određene regije, okvir se može primijeniti na druge zemlje i usjeve. S više podataka i senzora u stvarnom vremenu, sustav može postati još snažniji.
Iako su rezultati obećavajući, studija ima neka ograničenja. Većina validacija je napravljena pomoću simulacija. Potrebna su stvarna terenska ispitivanja kako bi se rezultati potvrdili u stvarnim poljoprivrednim uvjetima. Sustav također još ne uključuje podatke u stvarnom vremenu sa senzora.
Buduća istraživanja mogu se usredotočiti na dodavanje podataka o vremenu i tlu u stvarnom vremenu. Ekonomska analiza također se može uključiti kako bi se proučile koristi za poljoprivrednike u smislu troškova. Razvoj jednostavnih mobilnih ili web aplikacija može pomoći poljoprivrednicima da lako koriste sustav.
Zaključak
Ovo istraživanje predstavlja snažan i praktičan pristup preciznoj poljoprivredi. Kombinirajući K-Means klasteriranje, Naive Bayes klasifikaciju i grafove znanja, autori su stvorili sustav koji je točan, interpretativan i koristan. Hibridni model poboljšava točnost predviđanja i pomaže smanjiti upotrebu vode i gnojiva.
Najvažnije, graf znanja čini rezultate lakim za razumijevanje i primjenu. Ovo je veliki korak prema tome da napredne poljoprivredne tehnologije postanu dostupne poljoprivrednicima i donositeljima odluka. Daljnjim razvojem i testiranjem u stvarnim uvjetima, ovaj pristup ima veliki potencijal za podršku održivoj poljoprivredi i globalnoj sigurnosti hrane.
ReferencaNjama-Abang, O., Oladimeji, S., Eteng, I. E., & Emanuel, E. A. (2026). Sinergijska inteligencija: novi hibridni model za preciznu poljoprivredu korištenjem k-means, naivnog Bayesa i grafova znanja. Journal of the Nigerian Society of Physical Sciences, 2929-2929.
Precizna poljoprivreda







