Agricultura devine din ce în ce mai dificilă în fiecare an. Populația mondială crește rapid, dar suprafața de teren disponibilă pentru agricultură nu crește. În același timp, schimbările climatice afectează precipitațiile, temperatura și condițiile solului. Fermierii se confruntă acum cu multe probleme, cum ar fi deficitul de apă, calitatea slabă a solului, vremea imprevizibilă și costurile în creștere ale inputurilor. Pentru a satisface cererea viitoare de alimente, producția de alimente trebuie să crească într-o mare măsură. Studiile sugerează că producția mondială de alimente ar putea trebui să crească cu 25% până la 70% până în anul 2050. Aceasta este o provocare foarte mare, în special pentru țările în curs de dezvoltare.
În ultimii ani, agricultura bazată pe date a apărut ca o soluție puternică la aceste probleme. Fermele moderne generează cantități mari de date din numeroase surse. Acestea includ analize de sol, înregistrări meteorologice, imagini din satelit, date privind recolta și date economice. Când aceste date sunt analizate corespunzător, ele pot ajuta fermierii să ia decizii mai bune. Îi pot ajuta să aleagă culturile potrivite, să folosească apa mai eficient, să reducă risipa de îngrășăminte și să îmbunătățească productivitatea generală.
Totuși, mulți fermieri se bazează în continuare pe metode tradiționale de agricultură. Chiar și atunci când sunt utilizate tehnologii avansate, cum ar fi învățarea automată, rezultatele sunt adesea greu de înțeles. Majoritatea modelelor de învățare automată funcționează ca o “cutie neagră”. Ele oferă predicții, dar nu explică clar de ce sunt făcute acele predicții. Acest lucru face dificil pentru fermieri și factorii de decizie politică să aibă încredere și să utilizeze rezultatele.
De ce datele și descoperirea cunoștințelor contează în agricultură
Agricultura modernă produce o cantitate uriașă de date. Aceste date singure nu sunt utile decât dacă sunt procesate și analizate corespunzător. Procesul de transformare a datelor brute în informații utile se numește Descoperirea Cunoștințelor în Baze de Date, adesea prescurtat KDD. Acest proces implică mai multe etape, inclusiv selecția datelor, curățarea, transformarea, analiza și interpretarea.
Învățarea automată joacă un rol foarte important în descoperirea cunoștințelor. Ajută la identificarea tiparelor pe care oamenii s-ar putea să nu le vadă ușor. De exemplu, învățarea automată poate găsi relații între precipitații și recolta culturilor sau între tipul de sol și necesarul de îngrășăminte. Aceste tipare pot ajuta fermierii să ia decizii mai bune.
Există diferite tipuri de metode de învățare automată. Învățarea supervizată folosește date etichetate pentru a face predicții. Învățarea nesupervizată lucrează cu date neetichetate și ajută la găsirea grupurilor sau tiparelor naturale. Fiecare tip are punctele sale forte și slăbiciunile sale. În agricultură, datele sunt adesea complexe și provin din multe surse diferite. Acest lucru face dificilă funcționarea eficientă a unei singure metode pe cont propriu.
O altă provocare este că datele agricole sunt foarte diverse. Acestea includ numere, hărți, imagini și date textuale. Modelele tradiționale de machine learning se luptă adesea să combine toate aceste tipuri de date într-un mod semnificativ. Aici devine importantă ideea de a combina machine learning-ul cu grafuri de cunoștințe.
Metode de învățare automată utilizate în studiu
Modelul propus utilizează două tehnici principale de învățare automată: clusterizarea K-Means și clasificarea Naive Bayes. Fiecare metodă servește un scop diferit în sistem.
Clusteringul K-Means este o metodă de învățare nesupervizată. Grupează datele în clustere pe baza similarității. În acest studiu, K-Means este utilizat pentru a împărți regiunile agricole în diferite zone agro-climatice. Aceste zone sunt create folosind date precum precipitațiile, umiditatea solului și temperatura. Regiunile cu condiții de mediu similare sunt grupate împreună. Acest lucru ajută la înțelegerea modului în care se comportă diferite zone din punct de vedere agricol.
Naive Bayes este o metodă de învățare supervizată utilizată pentru clasificare. Prezice categorii pe baza probabilităților. În acest studiu, Naive Bayes este utilizat pentru a clasifica productivitatea culturilor în diferite niveluri precum scăzut, mediu și ridicat. Utilizează caracteristici precum istoricul culturilor, utilizarea fertilizatorilor și condițiile de mediu.
Ideea principală în această cercetare este că rezultatul grupării K-Means nu este utilizat separat. În schimb, informația despre cluster este adăugată ca o caracteristică de intrare la clasificatorul Naive Bayes. Acest lucru creează o legătură puternică între cele două metode. Ca rezultat, clasificarea devine mai precisă, deoarece ia în considerare atât zonele de mediu locale, cât și datele specifice culturilor.
Rolul grafurilor de cunoștințe în agricultură
Un graf de cunoștințe este o modalitate de organizare a informațiilor folosind noduri și relații. Nodurile reprezintă lucruri precum culturi, tipuri de sol, zone climatice și inputuri agricole. Relațiile arată cum sunt conectate aceste lucruri. De exemplu, o relație poate arăta că o anumită cultură este potrivită pentru un anumit tip de sol sau că precipitațiile afectează randamentul culturilor.
În agricultură, grafurile de cunoștințe sunt foarte utile, deoarece sistemele de fermă sunt puternic interconectate. Solul afectează culturile, climatul afectează solul, iar practicile agricole afectează ambele. Un graf de cunoștințe ajută la reprezentarea tuturor acestor conexiuni într-un mod clar și structurat.
În acest studiu, cercetătorii au utilizat Neo4j, o bază de date graf populară, pentru a construi graful de cunoștințe. Rezultatele modelelor de învățare automată sunt stocate în graful de cunoștințe. Acest lucru permite utilizatorilor să pună întrebări semnificative, cum ar fi care sunt cele mai potrivite culturi pentru o anumită zonă sau cât îngrășământ este necesar pentru o cultură în anumite condiții.
Graful de cunoștințe îmbunătățește, de asemenea, interpretabilitatea. În loc să prezinte doar o predicție, sistemul poate arăta cum este conectată acea predicție la datele despre sol, climă și culturi. Acest lucru face mai ușor pentru fermieri și factorii de decizie să aibă încredere și să utilizeze recomandările.
Colectarea și pregătirea datelor
Studiul a utilizat o cantitate mare de date colectate din diferite surse fiabile. Datele privind producția agricolă, consumul de îngrășăminte, comerțul și oferta de alimente au fost obținute de la FAOSTAT. Datele climatice, cum ar fi tiparele de precipitații, au provenit de la CHIRPS, în timp ce datele privind umiditatea solului au fost obținute din imagini satelitare.
Datele au acoperit mulți ani și mai multe regiuni, ajutând la asigurarea faptului că modelul putea gestiona diferite condiții agricole. Înainte de a utiliza datele, cercetătorii le-au curățat și prelucrat cu atenție. Valorile lipsă au fost completate folosind metode statistice fiabile. Valorile aberante au fost eliminate pentru a evita erorile. Datele au fost, de asemenea, normalizate astfel încât diferite variabile să poată fi comparate în mod echitabil.
Au fost create noi indicatori din datele brute. Aceștia au inclus indexul de variabilitate a precipitațiilor, indexul de stres cauzat de secetă și indexul de stabilitate a productivității. Acești indicatori au ajutat la surprinderea tendințelor pe termen lung, mai degrabă decât a schimbărilor pe termen scurt.
Au fost incluse atât date structurate, cum ar fi numere și tabele, cât și date nestructurate, cum ar fi imagini satelitare. Acest lucru a făcut setul de date foarte bogat și realist.
Dezvoltarea modelului hibrid
Modelul hibrid a fost construit pas cu pas. Mai întâi, a fost aplicat clusteringul K-Means pe datele de mediu. Acesta a împărțit regiunile în trei zone agro-climatice principale. Numărul de zone a fost selectat folosind o metodă standard care verifică cât de bine sunt separate clusterele.
Ulterior, a fost aplicată clasificarea Naive Bayes. Clasificatorul a prezis nivelurile de productivitate a culturilor. Diferența importantă aici este că informațiile despre zona agroclimatică obținute prin K-Means au fost incluse ca o caracteristică de intrare. Acest lucru a permis clasificatorului să înțeleagă nu numai datele despre culturi, ci și contextul de mediu.
Modelul hibrid a performat mai bine decât modelele individuale. Acuratețea clasificării a atins 89 la sută. Aceasta a fost mai mare decât acuratețea modelelor standalone Naive Bayes și Random Forest. Această îmbunătățire arată că combinarea învățării nesupervizate și supervizate poate duce la rezultate mai bune.
Integrare cu Graficul de Cunoștințe
Odată ce rezultatele învățării automate au fost pregătite, acestea au fost adăugate în graful de cunoștințe. Zonele agro-climatice au devenit noduri în grafic. Culturile, tipurile de sol și inputurile, cum ar fi fertilizatorii, au fost, de asemenea, reprezentate ca noduri. Au fost create relații pentru a arăta cum sunt conectate aceste elemente.
De exemplu, o relație ar putea arăta că o anumită zonă este potrivită pentru porumb cu o probabilitate mare de randament bun. O altă relație ar putea arăta că pH-ul scăzut al solului necesită aplicarea de var. Aceste relații s-au bazat atât pe rezultatele modelului, cât și pe cunoștințe de specialitate.
Deoarece totul este stocat într-o structură graf, utilizatorii pot explora cu ușurință informațiile. Aceștia pot rula interogări pentru a găsi cea mai bună cultură pentru o regiune sau pentru a înțelege riscurile legate de condițiile climatice și de sol.
Validare și Rezultate
Cercetătorii au testat modelul folosind atât măsuri statistice, cât și simulări. Rezultatele clusterizării au fost foarte puternice, arătând o separare clară între zone. Rezultatele clasificării au fost, de asemenea, fiabile, cu valori bune de precizie și recall pentru toate clasele de productivitate.
Graful de cunoștințe a performat bine din punct de vedere al vitezei și structurii. Interogările au fost răspuns foarte rapid, iar majoritatea relațiilor necesare erau prezente în graf. Acest lucru arată că sistemul este eficient și bine conceput.
Deoarece experimentele extinse pe teren sunt costisitoare și consumatoare de timp, cercetătorii au folosit simulări pentru a testa eficiența resurselor. Ei au comparat metodele tradiționale de agricultură cu cele ghidate de modelul hibrid.
Rezultatele au fost foarte încurajatoare. Fermele care au folosit recomandările modelului au utilizat cu 22% mai puțină apă. Deșeurile de îngrășăminte au fost reduse cu 18%. Aceste îmbunătățiri sunt foarte importante, deoarece apa și îngrășămintele sunt resurse costisitoare și limitate.
Importanța pentru agricultura durabilă și limitările
Constatările acestui studiu au implicații puternice pentru agricultura durabilă. Folosind datele mai inteligent, fermierii pot produce mai multă hrană folosind mai puține resurse. Acest lucru ajută la protejarea mediului și reduce costurile de exploatare agricolă.
Un alt beneficiu important este interpretabilitatea. Utilizarea unui graf de cunoștințe face sistemul mai ușor de înțeles. Fermierii și factorii de decizie pot vedea de ce sunt făcute anumite recomandări. Acest lucru crește încrederea și încurajează adoptarea noilor tehnologii.
Sistemul este, de asemenea, scalabil. Deși studiul s-a concentrat pe anumite regiuni, cadrul poate fi aplicat în alte țări și culturi. Cu mai multe date și senzori în timp real, sistemul poate deveni și mai puternic.
Deși rezultatele sunt promițătoare, studiul prezintă unele limitări. Majoritatea validării a fost realizată prin simulări. Sunt necesare teste reale pe teren pentru a confirma rezultatele în condiții agricole reale. Sistemul nu include încă date în timp real de la senzori.
Cercetările viitoare se pot concentra pe adăugarea datelor meteorologice și de sol în timp real. De asemenea, poate fi inclusă o analiză economică pentru a studia beneficiile de cost pentru fermieri. Dezvoltarea unor aplicații simple pentru mobil sau web poate ajuta fermierii să utilizeze sistemul cu ușurință.
Concluzie
Această cercetare prezintă o abordare puternică și practică pentru agricultura de precizie. Prin combinarea clusterizării K-Means, clasificării Naive Bayes și a grafurilor de cunoștințe, autorii au creat un sistem precis, interpretabil și util. Modelul hibrid îmbunătățește acuratețea predicțiilor și ajută la reducerea consumului de apă și îngrășăminte.
Cel mai important, graful de cunoștințe face rezultatele ușor de înțeles și de aplicat. Acesta este un pas important spre a face tehnologiile agricole avansate accesibile fermierilor și factorilor de decizie. Cu dezvoltare ulterioară și testare în lumea reală, această abordare are un potențial mare de a sprijini agricultura durabilă și securitatea alimentară globală.
ReferințăNjama-Abang, O., Oladimeji, S., Eteng, I. E., & Emanuel, E. A. (2026). Inteligență sinergică: un model hibrid nou pentru agricultura de precizie utilizând k-means, naive Bayes și grafuri de cunoștințe. Journal of the Nigerian Society of Physical Sciences, 2929-2929.
Agricultură de precizie







