Orzul de munte, o cultură cerealieră rezilientă cultivată în regiunile înalte ale Platoului Qinghai-Tibet din China, joacă un rol esențial în securitatea alimentară și stabilitatea economică locală. Cunoscut științific ca Hordeum vulgare L., această cultură prosperă în condiții extreme – aer rarefiat, niveluri scăzute de oxigen și o temperatură medie anuală de 6,3°C – făcând-o indispensabilă pentru comunitățile din medii vitrege.
Cu peste 270.000 de hectare dedicate cultivării sale în China, în principal în Regiunea Autonomă Xizang, orzul de altitudine reprezintă peste jumătate din suprafața cultivată a regiunii și peste 70% din producția totală de cereale. Monitorizarea precisă a densității orzului – numărul de plante sau spiculețe pe unitate de suprafață – este esențială pentru optimizarea practicilor agricole, cum ar fi irigarea și fertilizarea, și pentru predicția recoltelor.
Cu toate acestea, metodele tradiționale precum eșantionarea manuală sau imaginile din satelit s-au dovedit ineficiente, intensive din punct de vedere al forței de muncă sau insuficient de detaliate. Pentru a aborda aceste provocări, cercetători de la Universitatea de Agricultură și Silvicultură din Fujian și de la Universitatea de Tehnologie din Chengdu au dezvoltat un model inovator de inteligență artificială bazat pe YOLOv5, un algoritm de detectare a obiectelor de ultimă generație.
Lucrarea lor, publicată în Metode de plantare (2025), a obținut rezultate remarcabile, inclusiv o precizie medie medie (mAP) de 93,1% — o metrică ce măsoară acuratețea generală a detecției — și o reducere a costurilor computaționale de 75,6%, făcându-l potrivit pentru implementări de drone în timp real.
Provocări și Inovații în Monitorizarea Culturilor
Importanța orzului de altitudine depășește rolul său ca sursă de hrană. Numai în 2022, orașul Rikaze, o regiune importantă producătoare de orz, a recoltat 408.900 de tone de orz pe 60.000 de hectare, contribuind cu aproape jumătate din producția totală de cereale a Tibetului.
În ciuda importanței sale culturale și economice, estimarea producției de orz a fost mult timp o provocare. Metodele tradiționale, precum numărătoarea manuală sau imaginile din satelit, sunt fie prea intensive în muncă, fie nu au rezoluția necesară pentru a detecta spiculetele individuale de orz – partea plantei care poartă bobul, având adesea doar 2-3 centimetri lățime.
Eșantionarea manuală necesită ca fermierii să inspecteze fizic secțiuni ale unui teren – un proces lent, subiectiv și nepracticabil pentru ferme la scară largă. Imaginile din satelit, deși utile pentru observații generale, se confruntă cu o rezoluție scăzută (adesea 10–30 metri pe pixel) și întreruperi frecvente cauzate de condițiile meteorologice, cum ar fi acoperirea cu nori în regiuni muntoase precum Tibet.
Pentru a depăși aceste limitări, cercetătorii s-au orientat către vehicule aeriene fără pilot (UAV-uri), sau drone, echipate cu camere de 20 de megapixeli. Aceste drone au capturat 501 imagini de înaltă rezoluție ale culturilor de orz din orașul Rikaze, în două etape critice de creștere: etapa de creștere din august 2022, caracterizată prin spice verzi, în dezvoltare, și etapa de maturare din august 2023, marcată prin spice galben-aurii, gata de recoltare.
Totuși, analizarea acestor imagini a prezentat provocări, inclusiv margini încețoșate cauzate de mișcarea dronei, dimensiunea mică a spicelor de orz în vederi aeriene și spicele suprapuse în culturile dense.
Pentru a aborda aceste probleme, cercetătorii au preprocesat imaginile prin împărțirea fiecărei imagini de înaltă rezoluție în 35 de sub-imagini mai mici și prin filtrarea marginilor neclare, rezultând 2.970 de sub-imagini de înaltă calitate pentru antrenare. Acest pas de preprocesare a asigurat că modelul s-a concentrat pe date clare și acționabile, evitând distragerile din regiunile de calitate slabă.
Progrese tehnice în detecția obiectelor
Central acestei cercetări este algoritmul YOLOv5 (You Only Look Once versiunea 5), un model de detecție de obiecte pe o singură etapă, cunoscut pentru viteza și designul său modular. Spre deosebire de modelele mai vechi pe două etape, precum Faster R-CNN, care identifică mai întâi regiunile de interes și apoi clasifică obiectele, YOLOv5 efectuează detecția într-o singură trecere, făcându-l semnificativ mai rapid.
Modelul de bază YOLOv5n, cu 1,76 milioane de parametri (componente configurabile ale modelului AI) și 4,1 miliarde de FLOP-uri (operațiuni în virgulă mobilă, o măsură a complexității computaționale), era deja eficient. Cu toate acestea, detectarea spicelelor de orz minuscule și suprapuse a necesitat optimizări suplimentare.
Echipa de cercetare a introdus trei îmbunătățiri cheie ale modelului: convoluția separabilă în profunzime (DSConv), convoluția Ghost (GhostConv) și un modul de atenție de bloc convoluțional (CBAM).
Convoluția separată pe profunzime (DSConv) reduce costurile de calcul prin împărțirea procesului standard de convoluție – o operație matematică ce extrage caracteristici din imagini – în doi pași. Mai întâi, convoluția pe profunzime aplică filtre pe canale individuale de culoare (de exemplu, roșu, verde, albastru), analizând fiecare canal separat.
Aceasta este urmată de convoluția punctuală, care combină rezultatele pe canale folosind nuclee de 1×1. Această abordare reduce numărul de parametri cu până la 75%.
De exemplu, o convoluție tradițională 3×3 cu 64 de canale de intrare și 128 de canale de ieșire necesită 73.728 de parametri, în timp ce DSConv reduce acest număr la doar 8.768 - o reducere de 88%. Această eficiență este esențială pentru implementarea modelelor pe drone sau dispozitive mobile cu putere de procesare limitată.
Convoluția fantomă (GhostConv) alungește și mai mult modelul prin generarea de hărți de caracteristici suplimentare – reprezentări simplificate ale tiparelor de imagine – prin operațiuni liniare simple, cum ar fi rotația sau scalarea, în loc de convoluții intensive din punct de vedere al resurselor.
Straturile tradiționale de convoluție produc caracteristici redundante, irosind resursele de calcul. GhostConv abordează acest lucru prin crearea unor caracteristici “fantoma” din cele existente, reducând efectiv la jumătate parametrii în anumite straturi.
De exemplu, un strat cu 64 de canale de intrare și 128 de canale de ieșire ar necesita în mod tradițional 73.728 parametri, dar GhostConv reduce acest lucru la 36,864 păstrând acuratețea. Această tehnică este deosebit de utilă pentru detectarea obiectelor mici, cum ar fi spicele de orz, unde eficiența computațională este esențială.
Modulul de atenție convoluțională (CBAM) a fost integrat pentru a ajuta modelul să se concentreze pe caracteristicile critice, chiar și în medii aglomerate. Mecanismele de atenție, inspirate de sistemele vizuale umane, permit modelelor AI să prioritizeze părțile importante ale unei imagini.
CBAM utilizează două tipuri de atenție: atenție pe canale, care identifică canalele de culoare importante (de exemplu, verde pentru spicele în creștere), și atenție spațială, care evidențiază regiunile cheie dintr-o imagine (de exemplu, grupuri de spice). Înlocuind modulele standard cu DSConv și GhostConv și încorporând CBAM, cercetătorii au creat un model mai suplu și mai precis, adaptat pentru detectarea orzului.
Implementare și Rezultate
Pentru a antrena modelul, cercetătorii au etichetat manual 135 de imagini originale folosind casete de încadrare — rame rectangulare care marchează locația spiculețelor de orz — clasificând spiculeții în etape de creștere și maturare. Tehnici de augmentare a datelor — incluzând rotația, injectarea de zgomot, ocluziunea și ascuțirea — au extins setul de date la 2.970 de imagini, îmbunătățind capacitatea modelului de a generaliza în condiții variate de pe teren.
De exemplu, rotirea imaginilor cu 90°, 180° sau 270° a ajutat modelul să recunoască țepii din diferite unghiuri, în timp ce adăugarea de zgomot a simulat imperfecțiuni din lumea reală, cum ar fi praful sau umbrele. Setul de date a fost împărțit într-un set de antrenament (80%) și un set de validare (20%), asigurând o evaluare robustă.
Antrenamentul a avut loc pe un sistem performant cu un procesor AMD Ryzen 7, placă grafică NVIDIA RTX 4060 și 64GB RAM, utilizând framework-ul PyTorch – un instrument popular pentru deep learning. Pe parcursul a peste 300 de epoci de antrenament (treceri complete prin setul de date), precizia modelului (acuratețea detecțiilor corecte), recall-ul (capacitatea de a găsi toți spike-urile relevante) și pierderea (rata de eroare) au fost monitorizate meticulos.
Rezultatele au fost uimitoare. Modelul YOLOv5 îmbunătățit a obținut o precizie de 92,2%(în creștere față de 89,1%în baseline) și un recall de 86,2%(în creștere față de 83,1%), depășind baseline-ul YOLOv5n cu 3,1%la ambele metrici. Precizia medie medie (mAP) - o metrică cuprinzătoare care face media acurateței detecției pe toate categoriile - a atins 93,1%, cu scoruri individuale de 92,7% pentru spike-urile în stadiul de creștere și 93,5% pentru spike-urile în stadiul de maturare.
La fel de impresionantă a fost eficiența sa computațională: parametrii modelului au scăzut cu 70,6%la 1,2 milioane, iar FLOPs au scăzut cu 75,6%la 3,1 miliarde. Analizele comparative cu modele de top precum Faster R-CNN și YOLOv8n au evidențiat superioritatea sa.
În timp ce YOLOv8n a obținut un mAP ușor mai mare (93,8%), parametrii săi (3,0 milioane) și FLOPs (8,1 miliarde) au fost de 2,5x și respectiv 2,6x mai mari, făcând modelul propus mult mai eficient pentru aplicații în timp real.
Comparațiile vizuale au subliniat aceste progrese. În imaginile din stadiul de creștere, modelul îmbunătățit a detectat 41 de vârfuri, comparativ cu cele 28 ale modelului de bază. În timpul maturării, a identificat 3 vârfuri față de cele 2 ale modelului de bază, cu mai puține detecții ratate (marcate cu săgeți portocalii) și false pozitive (marcate cu săgeți mov).
Aceste îmbunătățiri sunt vitale pentru fermierii care se bazează pe date precise pentru a prognoza recoltele și a optimiza resursele. De exemplu, numărarea precisă a spiculețelor permite estimări mai bune ale producției de cereale, informând deciziile privind momentul recoltării, depozitarea și planificarea pieței.
Direcții viitoare și implicații practice
În ciuda succesului său, studiul a recunoscut limitări. Performanța a scăzut în condiții extreme de iluminare, cum ar fi lumina puternică de la amiază sau umbrele dense, care pot ascunde detaliile vârfurilor. În plus, casetele de delimitare dreptunghiulare nu au reușit uneori să se potrivească vârfurilor de formă neregulată, introducând mici inexactități.
Modelul a exclus, de asemenea, marginile neclare din imaginile UAV, necesitând preprocesare manuală – un pas care adaugă timp și complexitate.
Lucrările viitoare își propun să abordeze aceste probleme prin extinderea setului de date pentru a include imagini surprinse la răsărit, amiază și apus, experimentând cu adnotări de formă poligoală (forme flexibile care se potrivesc mai bine obiectelor neregulate) și dezvoltând algoritmi pentru a gestiona mai bine regiunile neclare fără intervenție manuală.
Implicațiile acestei cercetări sunt profunde. Pentru fermierii din regiuni precum Tibet, modelul oferă estimări în timp real ale recoltei, înlocuind numărătorile manuale intensive cu automatizarea bazată pe drone. Distingerea între stadiile de creștere permite planificarea precisă a recoltei, reducând pierderile cauzate de recoltarea prematură sau întârziată.
Date detaliate privind densitatea spicului – cum ar fi identificarea zonelor subpopulate sau supraaglomerate – pot informa strategiile de irigare și fertilizare, reducând risipa de apă și substanțe chimice. Pe lângă orz, arhitectura ușoară oferă promisiuni pentru alte culturi, precum grâul, orezul sau fructele, deschizând calea pentru aplicații mai largi în agricultura de precizie.
Concluzie
În concluzie, acest studiu exemplifică potențialul transformator al AI în abordarea provocărilor agricole. Prin rafinarea YOLOv5 cu tehnici inovatoare și ușoare, cercetătorii au creat un instrument care echilibrează precizia și eficiența – critice pentru implementarea în lumea reală în medii cu resurse limitate.
Termeni precum mAP, FLOPs și mecanisme de atenție pot părea tehnici, dar impactul lor este profund practic: permit fermierilor să ia decizii bazate pe date, să conserve resursele și să maximizeze recoltele. Pe măsură ce schimbările climatice și creșterea populației intensifică presiunea asupra sistemelor alimentare globale, astfel de progrese vor fi indispensabile.
Pentru fermierii din Tibet și nu numai, această tehnologie reprezintă nu doar un salt în eficiența agricolă, ci un far de speranță pentru securitatea alimentară durabilă într-un viitor incert.
Referință: Cai, M., Deng, H., Cai, J. et al. Detecția ușoară a orzului din zone montane pe baza YOLOv5 îmbunătățit. Plant Methods 21, 42 (2025). https://doi.org/10.1186/s13007-025-01353-0






























Here is how drone mapping works: a drone is mounted with sensors such as cameras and laser scanners that fly over an area capturing images or scanning it with lasers at various altitudes and angles. The collected data is then processed into 3D maps which can be viewed on a computer or smartphone screen.
2. Prescription maps for fertilizers, herbicides, and pesticides with drone survey
Just one strategy is out of date, as it not only wastes resources, but it can also affect the health and vitality of crops. Too much water, for example, can kill an otherwise healthy crop by preventing its roots from absorbing oxygen, so even watering isn’t the best approach to growing flawless crops.
The same is true for fertilizers; using the correct amount is critical for growth, as using too many causes burnt roots, which can destroy otherwise healthy plants.
Drone mapping allows sprays to be splattered only where the problem exists, reducing waste of resources and the risk of harming healthy crops that do not require the same treatment. While humans would be unable to recognize the unique requirements of each plant in their crop, drone survey technology can do it in minutes.
3. Crop assessment
At the touch of a button, scouting missions are launched; the drone departs the weatherproof charging station, collects data, and uploads it. The findings of the drone, as well as a study of its plant stress detection and the efficacy of any current treatments or amendments, can be used to adapt automated irrigation systems. With on-site scouting drones, constant health checks are possible.
4. Plant population count
With the drone’s powerful AI technology, any variety of plants may be identified. This allows the entire production and total loss to be determined at the start and conclusion of each season, increasing precision and awareness of the growing season’s success.
5. Automatic classifications with drone imaging
The drone imaging can tell what type of agricultural land it’s flying over, whether it’s arable, pastoral, or mixed. Drones may count the number of crops and livestock, as shown above, to verify that records are current and that any losses are noted.
6. Tracking crops
Crop health isn’t predetermined because environmental factors might influence development. Temperature, humidity, nutritional and trace mineral content, insect and disease presence, water availability, and amounts of sun exposure are all elements to consider.
All of these may be tracked using the drones’ different payloads, and many of these intangible variables can be handled by applying water or sprays directly to the needed regions.
The healthier the crop’s surroundings, the stronger its immune system gets, and thus the healthier it becomes — with a far greater ability to ward off pests and diseases.





