Höglandskorn, en motståndskraftig spannmålsgröda som odlas i de högt belägna områdena på Kinas Qinghai-Tibet-platå, spelar en avgörande roll för lokal livsmedelssäkerhet och ekonomisk stabilitet. Vetenskapligt känt som Hordeum vulgare L., denna gröda trivs under extrema förhållanden – tunn luft, låga syrenivåer och en genomsnittlig årstemperatur på 6,3 °C – vilket gör den oumbärlig för samhällen i hårda miljöer.
Med över 270 000 hektar odlingsareal i Kina, främst i den autonoma regionen Xizang, står höglandskorn för mer än hälften av regionens odlade areal och över 70% av den totala spannmålsproduktionen. Noggrann övervakning av korndensiteten – antalet plantor eller axlar per ytenhet – är avgörande för att optimera jordbruksmetoder, såsom bevattning och gödsling, och för att förutsäga avkastning.
Traditionella metoder som manuell provtagning eller satellitbilder har dock visat sig vara ineffektiva, arbetsintensiva eller otillräckligt detaljerade. För att hantera dessa utmaningar har forskare från Fujian Agriculture and Forestry University och Chengdu University of Technology utvecklat en innovativ AI-modell baserad på YOLOv5, en banbrytande algoritm för objektdetektering.
Deras arbete, publicerat i Växtmetoder (2025) uppnådde anmärkningsvärda resultat, inklusive en genomsnittlig precision (mAP) på 93,1% – ett mått som mäter den totala detektionsnoggrannheten – och en minskning av beräkningskostnaderna med 75,6%, vilket gör den lämplig för drönarutplaceringar i realtid.
Utmaningar och innovationer inom grödövervakning
Höglandskornets betydelse sträcker sig bortom dess roll som livsmedelskälla. Bara under 2022 skördade Rikaze City, en stor kornproducerande region, 408 900 ton korn på 60 000 hektar, vilket bidrog med nästan hälften av Tibets totala spannmålsproduktion.
Trots dess kulturella och ekonomiska betydelse har det länge varit utmanande att uppskatta kornskörden. Traditionella metoder, såsom manuell räkning eller satellitbilder, är antingen för arbetsintensiva eller saknar den upplösning som krävs för att upptäcka enskilda kornspiror – den kornbärande delen av växten, som ofta bara är 2–3 centimeter breda.
Manuell provtagning kräver att jordbrukare fysiskt inspekterar delar av ett fält – en process som är långsam, subjektiv och opraktisk för storskaliga gårdar. Satellitbilder, även om de är användbara för breda observationer, kämpar med låg upplösning (ofta 10–30 meter per pixel) och frekventa väderstörningar, såsom molntäcke i bergsområden som Tibet.
För att övervinna dessa begränsningar vände sig forskare till obemannade flygfarkoster (UAV), eller drönare, utrustade med 20-megapixelkameror. Dessa drönare tog 501 högupplösta bilder av kornfält i Rikaze City under två kritiska tillväxtstadier: tillväxtstadiet i augusti 2022, som kännetecknas av gröna, växande axlar, och mognadsstadiet i augusti 2023, som kännetecknas av gyllengula, skördeklara axlar.
Att analysera dessa bilder innebar dock utmaningar, inklusive suddiga kanter orsakade av drönarrörelser, den lilla storleken på kornspik i flygbilder och överlappande spikar i tätt planterade fält.
För att åtgärda dessa problem förbehandlade forskarna bilderna genom att dela upp varje högupplöst bild i 35 mindre delbilder och filtrera bort suddiga kanter, vilket resulterade i 2 970 högkvalitativa delbilder för träning. Detta förbehandlingssteg säkerställde att modellen fokuserade på tydliga, handlingsbara data, och undvek distraktioner från lågkvalitativa områden.
Tekniska framsteg inom objektdetektering
Centralt för denna forskning är YOLOv5-algoritmen (You Only Look Once version 5), en enstegsmodell för objektdetektering känd för sin hastighet och modulära design. Till skillnad från äldre tvåstegsmodeller som Faster R-CNN, som först identifierar intressanta regioner och sedan klassificerar objekt, utför YOLOv5 detektering i ett enda steg, vilket gör den betydligt snabbare.
Basmodellen YOLOv5n, med 1,76 miljoner parametrar (konfigurerbara komponenter i AI-modellen) och 4,1 miljarder FLOP:er (flyttalsoperationer, ett mått på beräkningskomplexitet), var redan effektiv. Att upptäcka små, överlappande korntoppar krävde dock ytterligare optimering.
Forskargruppen introducerade tre viktiga förbättringar av modellen: djupgående separerbar faltning (DSConv), spökfaltning (GhostConv) och en faltningsblockuppmärksamhetmodul (CBAM).
Djupseparerbar faltning (DSConv) minskar beräkningskostnaderna genom att dela upp standardfaltningsprocessen – en matematisk operation som extraherar funktioner från bilder – i två steg. Först tillämpar djupseparerbar faltning filter på enskilda färgkanaler (t.ex. röd, grön, blå) och analyserar varje kanal separat.
Detta följs av punktvis konvolution, som kombinerar resultat över kanaler med hjälp av 1×1-kärnor. Denna metod minskar parameterantalet med upp till 75%.
Till exempel kräver en traditionell 3×3-faltning med 64 ingångs- och 128 utgångskanaler 73 728 parametrar, medan DSConv reducerar detta till bara 8 768 – en minskning jämfört med 88%. Denna effektivitet är avgörande för att distribuera modeller på drönare eller mobila enheter med begränsad processorkraft.
Spökfaltning (GhostConv) förenklar modellen ytterligare genom att generera ytterligare funktionskartor – förenklade representationer av bildmönster – genom enkla linjära operationer, såsom rotation eller skalning, istället för resurskrävande faltningar.
Traditionella faltningslager producerar redundanta funktioner, vilket slösar bort beräkningsresurser. GhostConv åtgärdar detta genom att skapa "spökfunktioner" från befintliga, vilket effektivt halverar parametrarna i vissa lager.
Till exempel skulle ett lager med 64 ingångs- och 128 utgångskanaler traditionellt kräva 73 728 parametrar, men GhostConv reducerar detta till 36,864 samtidigt som noggrannheten bibehålls. Denna teknik är särskilt användbar för att detektera små objekt som kornspiror, där beräkningseffektivitet är av största vikt.
Den konvolutionella blockuppmärksamhetmodulen (CBAM) integrerades för att hjälpa modellen att fokusera på kritiska funktioner, även i röriga miljöer. Uppmärksamhetmekanismer, inspirerade av mänskliga visuella system, gör det möjligt för AI-modeller att prioritera viktiga delar av en bild.
CBAM använder två typer av uppmärksamhet: kanaluppmärksamhet, som identifierar viktiga färgkanaler (t.ex. grönt för växande spikar), och spatial uppmärksamhet, som markerar viktiga regioner i en bild (t.ex. kluster av spikar). Genom att ersätta standardmoduler med DSConv och GhostConv och införliva CBAM skapade forskarna en smidigare och mer exakt modell skräddarsydd för korndetektering.
Implementering och resultat
För att träna modellen märkte forskarna manuellt 135 originalbilder med hjälp av avgränsande rutor – rektangulära ramar som markerar platsen för kornspetsarna – och kategoriserade spetsarna i tillväxt- och mognadsstadier. Dataförstärkningstekniker – inklusive rotation, brusinjektion, ocklusion och skärpa – utökade datamängden till 2 970 bilder, vilket förbättrade modellens förmåga att generalisera över olika fältförhållanden.
Till exempel hjälpte rotering av bilder med 90°, 180° eller 270° modellen att känna igen spikar från olika vinklar, samtidigt som brussimulerade verkliga defekter som damm eller skuggor lades till. Datasetet delades upp i en träningsuppsättning (80%) och en valideringsuppsättning (20%), vilket säkerställde en robust utvärdering.
Träningen ägde rum på ett högpresterande system med en AMD Ryzen 7-processor, NVIDIA RTX 4060 GPU och 64 GB RAM, med hjälp av PyTorch-ramverket – ett populärt verktyg för djupinlärning. Över 300 träningsepoker (kompletta genomgångar av datasetet), modellens precision (noggrannhet i korrekta detektioner), recall (förmåga att hitta alla relevanta toppar) och förlust (felfrekvens) spårades noggrant.
Resultaten var slående. Den förbättrade YOLOv5-modellen uppnådde en precision på 92,2% (upp från 89,1% vid baslinjen) och en återkallelse på 86,2% (upp från 83,1%), vilket överträffade baslinjen YOLOv5n med 3,1% i båda måtten. Dess genomsnittliga precision (mAP) – en omfattande metrisk medelvärdesdetekteringsnoggrannhet över alla kategorier – nådde 93,1%, med individuella poäng på 92,7% för tillväxtstadietoppar och 93,5% för mognadsstadietoppar.
Lika imponerande var dess beräkningseffektivitet: modellens parametrar sjönk med 70,6% till 1,2 miljoner, och FLOP minskade med 75,6% till 3,1 miljarder. Jämförande analyser med ledande modeller som Faster R-CNN och YOLOv8n framhävde dess överlägsenhet.
Medan YOLOv8n uppnådde en något högre mAP (93,8%), var dess parametrar (3,0 miljoner) och FLOP:er (8,1 miljarder) 2,5x respektive 2,6x högre, vilket gjorde den föreslagna modellen betydligt effektivare för realtidsapplikationer.
Visuella jämförelser underströk dessa framsteg. I bilder från tillväxtstadiet detekterade den förbättrade modellen 41 toppar jämfört med baslinjens 28. Under mognaden identifierade den 3 toppar jämfört med baslinjens 2, med färre missade detektioner (markerade med orange pilar) och falskt positiva resultat (markerade med lila pilar).
Dessa förbättringar är avgörande för jordbrukare som förlitar sig på korrekta data för att förutsäga avkastning och optimera resurser. Till exempel möjliggör exakta toppräkningar bättre uppskattningar av spannmålsproduktionen, vilket informerar beslut om skördetidpunkt, lagring och marknadsplanering.
Framtida riktningar och praktiska konsekvenser
Trots studiens framgång erkände den sina begränsningar. Prestandan försämrades under extrema ljusförhållanden, såsom starkt ljussken mitt på dagen eller kraftiga skuggor, vilket kan skymma detaljerna i spikarna. Dessutom passade rektangulära avgränsningsramar ibland inte oregelbundet formade spikar, vilket ledde till mindre felaktigheter.
Modellen exkluderade också suddiga kanter från UAV-bilder, vilket krävde manuell förbehandling – ett steg som ökar tid och komplexitet.
Framtida arbete syftar till att åtgärda dessa problem genom att utöka datamängden till att omfatta bilder tagna vid gryning, middag och skymning, experimentera med polygonformade annoteringar (flexibla former som bättre passar oregelbundna objekt) och utveckla algoritmer för att bättre hantera suddiga områden utan manuell ingripande.
Implikationerna av denna forskning är djupgående. För jordbrukare i regioner som Tibet erbjuder modellen uppskattning av avkastning i realtid, vilket ersätter arbetsintensiva manuella räkningar med drönarbaserad automatisering. Att skilja mellan tillväxtstadier möjliggör exakt skördeplanering, vilket minskar förluster från för tidig eller försenad skörd.
Detaljerade data om spricktäthet – såsom att identifiera underbefolkade eller trångbefolkade områden – kan ligga till grund för bevattnings- och gödslingsstrategier, vilket minskar vatten- och kemikalieavfall. Utöver korn har den lätta arkitekturen lovande effekter för andra grödor, såsom vete, ris eller frukt, vilket banar väg för bredare tillämpningar inom precisionsjordbruk.
Slutsats
Sammanfattningsvis exemplifierar denna studie den transformativa potentialen hos AI för att hantera jordbruksutmaningar. Genom att förfina YOLOv5 med innovativa lättviktstekniker har forskarna skapat ett verktyg som balanserar noggrannhet och effektivitet – avgörande för verklig implementering i resursbegränsade miljöer.
Termer som mAP, FLOP och uppmärksamhetsmekanismer kan verka tekniska, men deras inverkan är djupt praktisk: de gör det möjligt för jordbrukare att fatta datadrivna beslut, spara resurser och maximera avkastningen. I takt med att klimatförändringar och befolkningstillväxt ökar trycket på de globala livsmedelssystemen kommer sådana framsteg att vara oumbärliga.
För bönderna i Tibet och övriga världen representerar denna teknik inte bara ett språng i jordbrukseffektivitet, utan ett hoppfullt hopp för hållbar livsmedelssäkerhet i en osäker framtid.
Hänvisning: Cai, M., Deng, H., Cai, J. et al. Detektion av lättviktigt höglandskorn baserat på förbättrad YOLOv5. Plant Methods 21, 42 (2025). https://doi.org/10.1186/s13007-025-01353-0






























Så här fungerar drönarkartläggning: en drönare är monterad med sensorer som kameror och laserskannrar som flyger över ett område och tar bilder eller skannar det med lasrar på olika höjder och i olika vinklar. Den insamlade datan bearbetas sedan till 3D-kartor som kan visas på en dator- eller smartphoneskärm.
2. Förskrivningskartor för gödningsmedel, herbicider och bekämpningsmedel med drönarmätning
Bara en strategi är föråldrad, eftersom den inte bara slösar resurser, utan också kan påverka grödornas hälsa och vitalitet. För mycket vatten kan till exempel döda en annars frisk gröda genom att hindra dess rötter från att absorbera syre, så inte ens vattning är det bästa sättet att odla felfria grödor. Detsamma gäller för gödningsmedel; att använda rätt mängd är avgörande för tillväxt, eftersom för mycket vatten orsakar brända rötter, vilket kan förstöra annars friska växter. Drönarkartläggning gör att sprayning endast kan sprutas där problemet finns, vilket minskar resursslöseri och risken att skada friska grödor som inte kräver samma behandling. Även om människor inte skulle kunna känna igen de unika behoven hos varje växt i sin gröda, kan drönarkartläggningsteknik göra det på några minuter.
3. Växtbedömning
Med en knapptryckning startas spaningsuppdrag; drönaren lämnar den väderbeständiga laddningsstationen, samlar in data och laddar upp den. Drönarens resultat, såväl som en studie av dess stressdetektering av växter och effektiviteten av eventuella nuvarande behandlingar eller ändringar, kan användas för att anpassa automatiserade bevattningssystem. Med spaningsdrönare på plats är ständiga hälsokontroller möjliga.
4. Antal växter
Med drönarens kraftfulla AI-teknik kan alla typer av växter identifieras. Detta gör att hela produktionen och det totala svinnet kan fastställas i början och slutet av varje säsong, vilket ökar precisionen och medvetenheten om växtsäsongens framgång.
5. Automatiska klassificeringar med drönaravbildning
Drönarbilderna kan avgöra vilken typ av jordbruksmark den flyger över, om den är åkermark, betesmark eller blandad mark. Drönare kan räkna antalet grödor och boskap, som visas ovan, för att verifiera att uppgifterna är aktuella och att eventuella förluster noteras.
6. Spårning av grödor
Grödans hälsa är inte förutbestämd eftersom miljöfaktorer kan påverka utvecklingen. Temperatur, luftfuktighet, närings- och spårmineralinnehåll, förekomst av insekter och sjukdomar, vattentillgång och mängden solexponering är alla faktorer att beakta. Alla dessa kan spåras med hjälp av drönarnas olika nyttolaster, och många av dessa immateriella variabler kan hanteras genom att applicera vatten eller spray direkt på de områden som behövs. Ju friskare grödans omgivningar är, desto starkare blir dess immunförsvar, och därmed desto friskare blir den – med en mycket större förmåga att avvärja skadedjur och sjukdomar.





