Tinklaraštis / Tiksliųjų laukų ūkininkavimo / Javų auginimas sustiprėja su lengvuoju YOLOv5 aptikimu

Javų auginimas sustiprėja su lengvuoju YOLOv5 aptikimu

Javų auginimas sustiprėja su lengvuoju YOLOv5 aptikimu
1 min skaityti |
Dalintis

Daugiametės miežiai, atsparus javų augalas, auginamas Kinijos Činghai-Tibeto plynaukštės aukštikalnių regionuose, atlieka svarbų vaidmenį vietos maisto saugumui ir ekonominiam stabilumui užtikrinti. Moksliškai žinomas kaip Hordeum vulgare L., šis augalas klesti ekstremaliomis sąlygomis – retame ore, žemo deguonies kiekyje ir vidutiniškai 6,3°C metinėje temperatūroje, todėl jis nepakeičiamas atšiauriose aplinkose gyvenančioms bendruomenėms.

Kinijoje, daugiausia Tibeto autonominiame regione, auginamas kalninis miežis užima daugiau nei 270 000 hektarų, sudaro daugiau nei pusę regiono pasėlių ploto ir viršija 70% viso jo grūdų derliaus. Tikslus miežių tankumo – augalų ar varpų skaičiaus vienam ploto vienetui – stebėjimas yra būtinas optimizuojant žemės ūkio praktiką, tokią kaip drėkinimas ir tręšimas, bei prognozuojant derlių.

Tačiau tradiciniai metodai, tokie kaip rankinis mėginių ėmimas ar palydovinės nuotraukos, pasirodė esą neefektyvūs, reikalaujantys daug darbo arba nepakankamai detalūs. Siekdami išspręsti šiuos uždavinius, Fudžiano žemės ūkio ir miškininkystės universiteto bei Čengdu technologijos universiteto mokslininkai sukūrė novatorišką dirbtinio intelekto modelį, paremtą YOLOv5 – pažangiu objektų aptikimo algoritmu.

Jų darbas, paskelbtas Augalų metodai (2025 m.), pasiekė stulbinančių rezultatų, įskaitant 93,1% vidutinį vidutinį tikslumą (mAP) – metriką, matuojančią bendrą aptikimo tikslumą – ir 75,6% sumažintus skaičiavimo kaštus, todėl jis tinkamas realaus laiko dronų naudojimui.

Iššūkiai ir naujovės augalų stebėjimo srityje

Sėjamųjų miežių svarba neapsiriboja vien maisto šaltiniu. Vien 2022 m. Rikažės mieste, pagrindinėje miežių auginimo regione, buvo surinkta 408 900 tonų miežių 60 000 hektarų plote, o tai sudaro beveik pusę viso Tibeto grūdų derliaus.

Nepaisant jo kultūrinės ir ekonominės reikšmės, miežių derliaus įvertinimas ilgą laiką buvo sudėtingas. Tradiciniai metodai, tokie kaip rankinis skaičiavimas ar palydovinės nuotraukos, yra arba per daug daug darbo reikalaujantys, arba neturi pakankamai raiškos, kad būtų galima aptikti atskirus varpas – augalo grūdus nešančią dalį, kurių plotis dažnai tesiekia 2–3 centimetrus.

Rankinis mėginių ėmimas reikalauja, kad ūkininkai fiziškai apžiūrėtų lauko dalis – tai lėtas, subjektyvus ir dideliems ūkiams nepraktiškas procesas. Palydovinė vaizdoteka, nors ir naudinga bendroms apžvalgoms, susiduria su maža skiriamąja geba (dažnai 10–30 metrų vienam pikseliui) ir dažnais oro sąlygų sutrikimais, pvz., debesimis kalnuotuose regionuose, tokiuose kaip Tibetas.

Siekiant įveikti šiuos apribojimus, mokslininkai pasitelkė nepilotuojamus orlaivius (UAV), arba dronus, aprūpintus 20 megapikselių kameromis. Šiais dronais darytos 501 didelės raiškos miežių laukų Rikažės mieste nuotraukos, apimančios du kritinius augimo etapus: rugpjūčio 2022 m. vykusį augimo etapą, kuriam būdingi žali, besivystantys varpos, ir rugpjūčio 2023 m. vykusį brandinimo etapą, kuriam būdingos aukso geltonumo, derliui tinkamos varpos.

Susiję:  Kaip naudoti žemės ūkio dronus tiksliojoje žemdirbystėje?

Dronais atliekama miežių laukų stebėsena Rikazės mieste

Tačiau analizuojant šiuos vaizdus kilo iššūkių, įskaitant neryškius kraštus dėl drono judėjimo, mažą miežių varpų dydį iš oro perspektyvos ir persidengiančius varpus tankiai pasėtuose laukuose.

Sprendžiant šias problemas, tyrėjai parengė vaizdus, padalindami kiekvieną didelės raiškos vaizdą į 35 mažesnius potraukinius vaizdus ir pašalindami neryškius kraštus, todėl mokymui buvo gauti 2 970 aukštos kokybės potraukiniai vaizdai. Šis parengimo žingsnis užtikrino, kad modelis sutelktų dėmesį į aiškius, tinkamus veikti duomenis, vengdamas neaiškių regionų trukdžių.

Technologinės pažangos objektų aptikime

Pagrindinis šio tyrimo elementas yra „YOLOv5“ (You Only Look Once, 5 versija) algoritmas – vienpakopės objektų aptikimo modelis, žinomas dėl savo greičio ir modulinės konstrukcijos. Skirtingai nuo senesnių dvipakopių modelių, tokių kaip „Faster R-CNN“, kurie pirmiausia nustato dominančias sritis, o vėliau klasifikuoja objektus, „YOLOv5“ atlieka aptikimą vienu metu, todėl yra žymiai greitesnis.

Didesnis YOLOv5n modelis, turintis 1,76 mln. parametrų (konfigūruojami DI modelio komponentai) ir 4,1 mlrd. FLOPs (slankiojo kablelio operacijos, skaičiavimo sudėtingumo matas), jau buvo efektyvus. Tačiau aptinkant smulkius, besidengiančius miežių varpelius reikėjo tolesnės optimizacijos.

Mokslininkų komanda modelyje pristatė tris pagrindinius patobulinimus: gylių atskiriamoji konvoliucinė (DSConv), vaiduoklinė konvoliucinė (GhostConv) ir konvoliucinis blokinis atidumą valdantis modulis (CBAM).

„Depthwise separable“ konvoliuciniai (DSConv) tinklai sumažina skaičiavimo sąnaudas, standartinę konvoliucinę operaciją, skirtą vaizdų požymiams išskirti, suskaidydami į du etapus. Pirma, „depthwise“ konvoliucinis tinklas taiko filtrus atskiriems spalvų kanalams (pvz., raudonam, žaliam, mėlynam), analizuodamas kiekvieną kanalą atskirai.

Po to seka taškinė konvoliucija, kuri sujungia rezultatus tarp kanalų naudojant 1×1 branduolius. Šis metodas sumažina parametrų skaičių iki 75%.

Parametrų mažinimas gyliniu atskiriamuoju konvoliuvimu

Pavyzdžiui, tradicinis 3×3 konvoliucinis sluoksnis su 64 įvesties ir 128 išvesties kanalais reikalauja 73 728 parametrų, o DSConv sumažina šį skaičių iki 8 768 – tai yra 88% sumažinimas. Šis efektyvumas yra labai svarbus diegiant modelius dronuose ar mobiliuosiuose įrenginiuose su ribota apdorojimo galia.

„Ghost convolution“ (GhostConv) dar labiau palengvina modelį, generuodamas papildomus vaizdo schemų supaprastintus atvaizdavimus turinčius požymių žemėlapius per paprastas linijines operacijas, tokias kaip rotavimas ar mastelio keitimas, o ne daug išteklių reikalaujančias konvoliucijas.

Tradiciniai konvoliuciniai sluoksniai sukuria perteklines savybes, švaistant skaičiavimo išteklius. “GhostConv” sprendžia šią problemą kurdamas „vaiduoklines“ savybes iš esamų, taip efektyviai perpus sumažindamas tam tikrų sluoksnių parametrus.

Pavyzdžiui, sluoksnis su 64 įvesties ir 128 išvesties kanalais tradiciškai reikalautų 73 728 parametrų, bet „GhostConv“ sumažina šį iki 36,864 išsaugant tikslumą. Ši technika ypač naudinga aptinkant smulkius objektus, tokius kaip miežių varpos, kai skaičiavimo efektyvumas yra svarbiausias.

Konvoliucinis blokinio dėmesio modulis (CBAM) buvo integruotas, kad padėtų modeliui sutelkti dėmesį į svarbiausius bruožus net ir chaotiškoje aplinkoje. Dėmesio mechanizmai, įkvėpti žmogaus regėjimo sistemos, leidžia dirbtinio intelekto modeliams teikti pirmenybę svarbioms vaizdo dalims.

Susiję:  Valdymo zonos tiksliame ūkininkavime derliui optimizuoti

CBAM naudoja dviejų tipų dėmesį: kanalų dėmesį, kuris atpažįsta svarbius spalvų kanalus (pvz., žalią, rodantį augančius grūdus), ir erdvinį dėmesį, kuris paryškina svarbias vaizdo sritis (pvz., grūdų sankaupas). Pakeisdami standartinius modulius DSConv ir GhostConv bei įtraukdami CBAM, mokslininkai sukūrė lengvesnį, tikslesnį modelį, pritaikytą miežių aptikimui.

Įgyvendinimas ir rezultatai

Norint apmokyti modelį, mokslininkai rankiniu būdu pažymėjo 135 originalius vaizdus naudodami ribojančius rėmus – stačiakampius, žyminčius miežių varpų vietą – ir suskirstydami varpas į augimo bei nokimo stadijas. Duomenų didinimo metodai, įskaitant sukimą, triukšmo įterpimą, uždengimą ir ryškinimą, padidino duomenų rinkinį iki 2 970 vaizdų, pagerindami modelio gebėjimą generalizuoti įvairiomis lauko sąlygomis.

Pavyzdžiui, vaizdų sukimai 90°, 180° ar 270° padėjo modeliui atpažinti smailes iš skirtingų kampų, o triukšmo pridėjimas imitavo realaus pasaulio netobulumus, tokius kaip dulkės ar šešėliai. Duomenų rinkinys buvo padalintas į mokymo rinkinį (80%) ir validacijos rinkinį (20%), užtikrinant patikimą vertinimą.

Mokymas vyko aukštos klasės sistemoje su AMD Ryzen 7 CPU, NVIDIA RTX 4060 GPU ir 64GB RAM, naudojant PyTorch karkasą – populiarų įrankį giluminiam mokymui. Per daugiau nei 300 mokymų epochų (pilni duomenų rinkinio perėjimai) kruopščiai buvo stebimos modelio precizija (tikslių aptikimų tikslumas), atšaukimas (gebėjimas rasti visus svarbius smailius) ir nuostoliai (klaidos rodiklis).

Rezultatai buvo stulbinantys. Patobulintas YOLOv5 modelis pasiekė 92,2%tikslumą (padidėjo nuo 89,1ziniame modelyje) ir 86,2%atšaukimą (padidėjo nuo 83,1%), abiem metrikoms pranokdamas bazinį YOLOv5n modelį 3,1%. Jo vidutinis vidutinis tikslumas (mAP) – išsami metrika, apskaičiuojanti aptikimo tikslumą visose kategorijose – pasiekė 93,1% , su atskirais rezultatais: 92,7% augimo stadijos smailiukams ir 93,5% brandinimo stadijos smailiukams.

YOLOv5 modelio mokymo rezultatai

Lygiai taip pat įspūdingas buvo jo skaičiavimo efektyvumas: modelio parametrų sumažėjo 70,6%iki 1,2 milijono, o FLOPs sumažėjo 75,6%iki 3,1 milijardo. Lyginamosios analizės su pirmaujančiais modeliais, tokiais kaip Faster R-CNN ir YOLOv8n, pabrėžė jo pranašumą.

Nors YOLOv8n pasiekė šiek tiek didesnį mAP (93,8%), jo parametrai (3,0 mln.) ir FLOPs (8,1 mlrd.) buvo atitinkamai 2,5x ir 2,6x didesni, todėl siūlomas modelis yra daug efektyvesnis realaus laiko programoms.

Vizualiniai palyginimai pabrėžė šiuos patobulinimus. Augimo stadijos vaizduose patobulintas modelis aptiko 41 smaigą, palyginti su bazinio modelio 28. Brędimo metu jis nustatė 3 smaigus, palyginti su bazinio modelio 2, su mažiau praleistų aptikimų (pažymėtų oranžiniais rodykliais) ir klaidingų teigiamų rezultatų (pažymėtų violetiniais rodykliais).

Šie patobulinimai yra gyvybiškai svarbūs ūkininkams, kuriems reikalingi tikslūs duomenys prognozuojant derlių ir optimizuojant išteklius. Pavyzdžiui, tikslus varpų skaičius leidžia geriau įvertinti grūdų gamybą, informuojant apie derliaus nuėmimo laiką, saugojimą ir rinkos planavimą.

Susiję:  Libano „Cedar Crest“ yra tarp 11 FFA skyrių, kurie gaus tiksliosios žemdirbystės vairavimo simuliatorių

Ateities kryptys ir praktinės pasekmės

Nepaisant sėkmės, tyrime pripažintos ribotos galimybės. Veiklos rezultatai pablogėjo ekstremaliomis apšvietimo sąlygomis, tokiomis kaip ryškus vidurdienio akinimas ar stiprūs šešėliai, kurie gali paslėpti smailių detales. Be to, stačiakampiai ribojantys stačiakampiai kartais netiko netaisyklingos formos smailėms, sukeldami nedidelius netikslumus.

Modelis taip pat neįtraukė neryškių kraštų iš UAV vaizdų, todėl reikėjo rankinio išankstinio apdorojimo – tai užtruko ir apsunkino procesą.

Tolimesni darbai sieks išspręsti šias problemas, plečiant duomenų rinkinį, įtraukiant nuotraukas, darytas per aušrą, per vidurdienį ir per sutemą, eksperimentuojant su daugiakampio formos anotacijomis (lanksčiomis formomis, kurios geriau tinka netaisyklingiems objektams) ir kuriant algoritmus, geriau neautomatiniu būdu tvarkantiems neryškias sritis.

Šio tyrimo pasekmės yra didžiulės. Tibetui panašiems regionams, kur dirba ūkininkai, modelis siūlo realaus laiko derliaus įvertinimą, pakeisdamas daug darbo reikalaujantį rankinį skaičiavimą automatizuotu, atliekamu su dronais. Augimo fazių atskyrimas leidžia tiksliai planuoti derliaus nuėmimą, sumažinant nuostolius dėl per ankstyvo ar per vėlyvo derliaus nuėmimo.

Išsami duomenų apie dyglių tankį – pavyzdžiui, nustatant nepakankamai ar per tankiai apgyvendintas sritis – analizė gali padėti formuoti drėkinimo ir tręšimo strategijas, sumažinant vandens ir cheminių medžiagų eikvojimą. Be miežių, lengva architektūra suteikia vilčių ir kitoms kultūroms, tokioms kaip kviečiai, ryžiai ar vaisiai, atveriant kelią platesniam taikymui tiksliojoje žemdirbystėje.

Išvada

Apibendrinant, šis tyrimas parodo dirbtinio intelekto transformacinį potencialą sprendžiant žemės ūkio iššūkius. Tobulindami YOLOv5 novatoriškais lengvaisiais metodais, mokslininkai sukūrė įrankį, derinantį tikslumą ir efektyvumą – tai itin svarbu praktiniam pritaikymui aplinkoje, kurioje trūksta išteklių.

Tokios sąvokos kaip mAP, FLOPs ir dėmesio mechanizmai gali atrodyti techniškos, tačiau jų poveikis yra labai praktiškas: jos leidžia ūkininkams priimti sprendimus vadovaujantis duomenimis, taupyti išteklius ir didinti derlių. Klimato kaitai ir gyventojų skaičiaus augimui didinant spaudimą pasaulinėms maisto sistemoms, tokie patobulinimai taps nepakeičiami.

Tibeto ir kitų šalių ūkininkams ši technologija atstovauja ne tik žemės ūkio efektyvumo šuoliui, bet ir vilties švyturiui siekiant tvaraus apsirūpinimo maistu neapibrėžtoje ateityje.

Nuoroda: Cai, M., Deng, H., Cai, J. ir kt. Lengvas kalninių miežių aptikimas, paremtas patobulintu YOLOv5. Plant Methods 21, 42 (2025). https://doi.org/10.1186/s13007-025-01353-0

Tiksliųjų laukų ūkininkavimo
Gaukite naujausias naujienas
iš GeoPard

Prenumeruokite mūsų naujienlaiškį!

Prenumeruoti

GeoPard teikia skaitmeninius produktus, kad atskleistų visą jūsų laukų potencialą, pagerintų ir automatizuotų jūsų agronominius pasiekimus taikydama duomenimis pagrįstus tiksliosios agrokultūros metodus.

Prisijunkite prie mūsų „AppStore“ ir „Google Play“

Programėlių parduotuvė Google parduotuvė
Telefonai
Gauk naujausias naujienas iš „GeoPard“

Prenumeruokite mūsų naujienlaiškį!

Prenumeruoti

Susiję įrašai

wpChatIcon
wpChatIcon

Atraskite daugiau GeoPard - Precision agriculture Mapping software

Prenumeruokite prenumeratą ir gaukite prieigą prie viso archyvo.

Toliau skaityti

    Prašyti nemokamos „GeoPard“ demonstracijos / konsultacijos








    Spustelėdami mygtuką sutinkate su mūsų Privatumo Politika. Mums to reikia, kad galėtume atsakyti į jūsų užklausą.

      Prenumeruoti


      Spustelėdami mygtuką sutinkate su mūsų Privatumo Politika

        Atsiųskite mums informaciją


        Spustelėdami mygtuką sutinkate su mūsų Privatumo Politika