Didelio tikslumo dirbtinio intelekto modeliai klasifikuoja topografinius žemėlapius greičiau nei tradiciniai

Indonezija, daugiau nei 17 000 salų, užimančių 1,9 milijono kvadratinių kilometrų plotą, turinti tautą, susiduria su dideliu iššūkiu kurdama išsamius žemėlapius, kurie padėtų įgyvendinti jos vystymosi tikslus.

Kadangi didelio mastelio topografiniai žemėlapiai (1:5000 masteliu) apima tik 3% šalies teritorijos, tradiciniai metodai, tokie kaip rankinis stereografinis braižymas ir lauko tyrimai, yra per lėti, kad patenkintų skubius miestų planavimo, nelaimių valdymo ir aplinkos apsaugos poreikius.

Novatoriškas tyrimas, paskelbtas m. Nuotoliniai tyrimai 2025 m. siūlo sprendimą: gilaus mokymosi sistemą, kuri automatizuoja žemės dangos klasifikavimą naudojant labai didelės skiriamosios gebos palydovinius vaizdus.

Indonezijos žemėlapių sudarymo iššūkis Topografija

Dėl Indonezijos dydžio ir sudėtingumo kartografavimas yra milžiniška užduotis. Už nacionalinį kartografavimą atsakinga Geografinės informacijos agentūra (BIG) šiuo metu kasmet parengia 13 000 kvadratinių kilometrų topografinių žemėlapių.

Tokiu tempu visos šalies kartografavimas užtruktų daugiau nei šimtmetį. Net jei neįtrauktume miškų, kurie užima beveik pusę Indonezijos teritorijos, likusios teritorijos sudarymas vis tiek užtruktų 60 metų.

Ši lėta pažanga prieštarauja nacionaliniams prioritetams, pvz. Vieno žemėlapio politika, pristatyta 2016 m., siekiant standartizuoti žemėlapius skirtinguose sektoriuose ir išvengti konfliktų dėl žemės naudojimo. Šios politikos mastelio keitimas iki 1:5000 žemėlapių yra būtinas, tačiau gerokai atsilieka nuo grafiko.

Topografiniai žemėlapiai yra išsamūs natūralių ir žmogaus sukurtų Žemės paviršiaus darinių, įskaitant aukštį (kalvas, slėnius), vandens telkinius, kelius, pastatus ir augmeniją, vaizdai.

Jie yra pagrindinės infrastruktūros planavimo, reagavimo į nelaimes ir aplinkos stebėsenos priemonės. Indonezijoje šių žemėlapių kūrimas masteliu 1:5000 (kai 1 cm žemėlapyje atitinka 50 metrų ant žemės) yra labai svarbus tikslumui tokiuose projektuose kaip kelių tiesimas ar potvynių modeliavimas.

Žemės dangos duomenys, topografinių žemėlapių pogrupis, reiškia fizinę medžiagą Žemės paviršiuje, pavyzdžiui, miškus, miesto teritorijas ar vandenį. Kitaip nei žemės naudojimas (kuris apibūdina, kaip žmonės naudoja žemę, pvz., gyvenamosios ar pramoninės zonos), žemė sutelkia dėmesį į stebimus objektus.

Tikslūs žemės dangos žemėlapiai padeda vyriausybėms stebėti miškų naikinimą, miestų plėtrą arba įvertinti žemės ūkio produktyvumą. Tradiciškai analitikai šiuos objektus žymi rankiniu būdu pikseliu po pikselio, naudodami aerofotonuotraukas arba palydovinius vaizdus – tai procesas, kuris užima daug laiko ir yra linkęs į žmogiškąsias klaidas.

Pavyzdžiui, kelių ar mažų pastatų identifikavimas tankiai apgyvendintose miesto teritorijose gali užtrukti kruopštaus darbo kelias dienas. 2025 m. atliktas tyrimas šią kliūtį sprendžia rankinį darbą pakeisdamas dirbtiniu intelektu, konkrečiai – giliuoju mokymusi, siekiant automatizuoti žemės dangos klasifikavimą.

Dirbtinio intelekto valdoma palydovinių vaizdų analizė

Tyrimas buvo sutelktas į Mataramo miestą – nedidelį, bet įvairiapusį miesto rajoną Lomboko saloje, kaip bandomąjį atvejį. Komanda naudojo Plejadų palydoviniai vaizdai nuo 2015 m., įskaitant didelės skiriamosios gebos panchromatinių (0,5 metro) ir multispektrinių (2 metrų) duomenų.

Panchromatiniai vaizdai fiksuoja smulkias erdvines detales pilkos spalvos tonu, o daugiaspektriniai vaizdai teikia spalvų ir infraraudonųjų spindulių informaciją konkrečiuose bangos ilgių diapazonuose (pvz., raudona, žalia, mėlyna, artimoji infraraudonoji spinduliuotė).

Susiję: (GIS) geoinformatikos taikymas žemės ūkyje

Siekdami sujungti šiuos privalumus, tyrėjai pritaikė techniką, vadinamą panoraminiu paryškinimu, kuri sujungia didelės skiriamosios gebos pilkos spalvos duomenis su mažesnės skiriamosios gebos spalvotais vaizdais. Šis procesas leido gauti ryškius, detalius vaizdus, kurių skiriamoji geba yra 0,5 metro, idealiai tinkančius mažiems objektams, tokiems kaip keliai ar atskiri pastatai, aptikti.

Panaršinimas yra labai svarbus, nes jis išsaugo išsamią daugiaspektrinių duomenų spektrinę informaciją, kartu padidindamas erdvinį aiškumą ir užtikrindamas, kad spalvos tiksliai atitiktų fizines savybes.

Toliau komanda iš vaizdų ištraukė papildomos informacijos, kad pagerintų klasifikavimo tikslumą. Jie apskaičiavo normalizuotą skirtuminį augalijos indeksą (NDVI) – augalų sveikatos matą, gautą iš artimojo infraraudonojo spektro (NIR) ir raudonos šviesos atspindžių.

Sveika augmenija atspindi daugiau artimojo infraraudonojo spinduliavimo ir sugeria daugiau raudonos šviesos dėl chlorofilo aktyvumo. Formulė $NDVI = (artimasis infraraudonųjų spindulių - Raudona) / (artimasis infraraudonųjų spindulių + Raudona)$ gaunamos vertės nuo -1 iki 1, kur didesnės vertės rodo tankesnę, sveikesnę augmeniją.

NDVI yra neįkainojamas norint atskirti miškus, dirbamą žemę ir miesto žaliąsias erdves. Pavyzdžiui, šiame tyrime NDVI padėjo atskirti vešlius plantacijas nuo plikos dirvos.

Tekstūros analizė buvo dar vienas svarbus žingsnis. Naudodami statistinį metodą, vadinamą pilkojo lygio bendro pasireiškimo matrica (GLCM), tyrėjai kiekybiškai įvertino vaizduose matomus modelius, tokius kaip žemės ūkio laukų šiurkštumas, palyginti su asfaltuotų kelių lygumu.

GLCM veikia analizuodamas, kaip dažnai paveikslėlyje pasitaiko pikselių poros su konkrečiomis reikšmėmis ir erdviniais ryšiais (pvz., horizontaliai gretimi). Iš šios matricos galima gauti tokius rodiklius kaip homogeniškumas (pikselių verčių vienodumas), kontrastas (vietiniai intensyvumo svyravimai) ir entropija (pikselių pasiskirstymo atsitiktinumas) yra apskaičiuojami.

Šie tekstūros rodikliai padėjo dirbtinio intelekto modeliui atskirti panašiai atrodančius žemės dangos tipus, pavyzdžiui, asfaltuotus kelius nuo tamsių dirvožemio plotų.

Siekdama supaprastinti duomenis, komanda pritaikė Pagrindinių komponentų analizė (PCA), technika, kuri identifikuoja reikšmingiausius duomenų rinkinio modelius. PCA sumažina perteklių, transformuodama koreliuotus kintamuosius (pvz., kelias tekstūros juostas) į mažesnį nekoreliuotų komponentų rinkinį.

Šiame tyrime PCA sujungė penkias tekstūros juostas į du pagrindinius komponentus, išlaikydama 95% pradinės informacijos. Tai supaprastino gilaus mokymosi modelio įvestį, pagerindama tiek tikslumą, tiek skaičiavimo efektyvumą.

„U-Net“ giluminis mokymasis žemės dangos srityje Topografija

Tyrimo esmė buvo gilaus mokymosi modelis, pagrįstas „U-Net“ architektūra – konvoliucinio neuroninio tinklo (CNN) tipu, plačiai naudojamu vaizdų segmentavimo užduotims.

Pavadintas dėl U formos dizaino, U-Net sudaro dvi pagrindinės dalys: kodavimo įrenginys, kuris analizuoja vaizdą, kad išskirtų hierarchines ypatybes (pvz., kraštus, tekstūras), ir dekodavimo įrenginys, kuris rekonstruoja vaizdą su pikselių žymėmis.

Kodavimo įrenginys naudoja konvoliucinius sluoksnius ir telkimą, kad sumažintų vaizdo diskretizavimą, užfiksuodamas plačius modelius, o dekodavimo įrenginys padidina duomenų diskretizavimą, kad atkurtų erdvinę skiriamąją gebą. Praleidžiant jungtis tarp kodavimo ir dekodavimo sluoksnių, išsaugomos smulkios detalės, leidžiant tiksliai aptikti ribas – tai labai svarbi funkcija, sudarant siaurų gatvių ar netaisyklingos formos pastatų žemėlapius.

Susiję: „GeoPard“ automatizuotas lauko ribų aptikimo modelis tiksliajai žemdirbystei

Modelyje buvo naudojamas “ResNet34” magistralė – iš anksto apmokytas tinklas, žinomas dėl savo gylio ir efektyvumo. „ResNet34“ priklauso likutinių tinklų šeimai, kuri įdiegia „trumpuosius ryšius“, kad apeitų sluoksnius ir sumažintų nykstančio gradiento problemą (kai giliems tinklams sunku mokytis dėl mažėjančių atnaujinimų mokymo metu).

Pasinaudojant ’ResNet34“ gebėjimu atpažinti sudėtingus modelius iš „ImageNet“ (didžiulės vaizdų duomenų bazės), modeliui reikėjo mažiau mokymo duomenų ir laiko prisitaikyti prie palydovinių vaizdų.

Modelio apmokymui reikėjo 1440 vaizdo plytelių, kurių kiekviena buvo 512 × 512 pikselių, apimančių šešias žemės dangos klases: pastatus, kelius, žemės ūkio paskirties žemę, pliką žemę, plantacijas ir vandens telkinius.

Duomenų rinkinyje buvo būdingų disbalansų; keliai ir vandens telkiniai sudarė atitinkamai tik 3,7% ir 4,2% imčių, o pastatai ir žemės ūkio paskirties žemė – daugiau nei 25%. Nepaisant šio iššūkio, modelis buvo apmokytas per 200 epochų – tikslumo ir skaičiavimo sąnaudų pusiausvyra – naudojant 2 partijų dydį dėl atminties apribojimų.

An epocha reiškia vieną visišką mokymo duomenų perdavimą per modelį, tuo tarpu partijos dydis nustato, kiek pavyzdžių apdorojama prieš atnaujinant modelio parametrus. Mažesni paketų dydžiai sumažina atminties naudojimą, bet gali sulėtinti mokymą.

Žemėlapių tobulinimas morfologiniu apdorojimu

Net ir geriausi dirbtinio intelekto modeliai sukuria klaidų, pavyzdžiui, neteisingai klasifikuoja izoliuotus pikselius arba sukuria nelygius kraštus aplink elementus. Norėdami tai išspręsti, tyrėjai pritaikė morfologinį apdorojimą – techniką, kuri išlygina trūkumus, naudodama tokias operacijas kaip erozija ir išplėtimas.

Erozija pašalina plonus pikselių sluoksnius nuo objektų ribų, panaikindama mažyčius neteisingai klasifikuotus plotus, o išplėtimas prideda pikselių, kad išplėstų objektų ribas ir užpildytų tarpus linijiniuose elementuose, tokiuose kaip keliai.

Šios operacijos remiasi struktūrizuojančiu elementu (maža matrica), kuris slenka per vaizdą ir keičia pikselių vertes. Optimalus branduolio dydis šioms operacijoms (5 × 5 pikseliai) buvo nustatytas naudojant pusiau dispersinę analizę – geostatistinį metodą, kuris kiekybiškai įvertino erdvinius vaizduose matomus modelius.

Pusdispersija matuoja, kiek pikselių vertės skiriasi skirtingais atstumais, ir padeda nustatyti mastelį, kuriame tekstūros elementai (pvz., pastatų sankaupos) yra ryškiausi.

Dirbtinis intelektas padidina žemėlapių sudarymo greitį ir tikslumą

Modelis pasiekė pradinį 84% tikslumą (kappa balas = 0,79), kuris po papildomo apdorojimo padidėjo iki 86% (kappa = 0,81). kappa balas (Koeno kapa) matuoja numatytos ir faktinės klasifikacijos atitikimą, pakoreguojant pagal atsitiktinumą.

0,81 balo rodiklis rodo “beveik visišką” atitikimą, viršijantį 0,61–0,80 diapazoną, kuris laikomas “dideliu”. Vandens telkiniai ir plantacijos buvo klasifikuoti beveik idealiu tikslumu (atitinkamai 97% ir 96%), o keliai, kuriems kėlė problemų dėl plonos, linijinės formos ir šešėlių, pasiekė 85%.

Pastatai ir žemės ūkio paskirties žemė taip pat pasirodė gerai – jų F1 balai buvo 88% ir 83%. F1 balas, harmoninis tikslumo ir atkūrimo vidurkis, subalansuoja klaidingai teigiamus ir klaidingai neigiamus rezultatus, todėl idealiai tinka nesubalansuotų duomenų rinkinių vertinimui.

Susiję: Trimačių kontūrinių žemėlapių įvaldymo paslaptys

Efektyvumo padidėjimas buvo dar ryškesnis. Tradicinis stereografinis braižymas, kai elementai trimačiuose aerofotonuotraukose žymimi rankiniu būdu, pastatams ir augmenijai sužymėti trunka devynias dienas vienam žemėlapio lapui (5,29 km²).

Dirbtiniu intelektu pagrįstas metodas sumažino šį laiką iki 43 minučių vienam lapui – 250 kartų geresnis. Iš pradžių modelio apmokymas užtruko 17 valandų, tačiau apmokytas jis galėtų klasifikuoti didžiulius plotus su minimaliu žmogaus įsikišimu. Šios sistemos mastas leistų Indonezijai kasmet sudaryti 9000 km² žemėlapį, sutrumpinant numatomą užbaigimo laiką nuo daugiau nei šimtmečio iki vos 15 metų.

Dirbtinio intelekto žemėlapių sudarymas skatina pasaulinį tvarumą

Pasekmės apima daug daugiau nei Indoneziją. Automatizuotas žemės dangos klasifikavimas padeda siekti pasaulinių pastangų, tokių kaip JT darnaus vystymosi tikslai (DVT). Pavyzdžiui, miškų naikinimo (DVT 15) arba miestų plėtros (DVT 11) stebėjimas tampa greitesnis ir tikslesnis.

Nelaimių paveiktuose regionuose, pavyzdžiui, potvynių paveiktose teritorijose, atnaujinami žemėlapiai gali padėti nustatyti pažeidžiamas bendruomenes ir suplanuoti evakuacijos maršrutus.

Ūkininkai taip pat gauna naudos; tikslūs žemės dangos duomenys leidžia taikyti tiksliąją žemdirbystę, optimizuoti vandens naudojimą ir pasėlių derlių, stebint dirvožemio sveikatą ir augmenijos stresą naudojant NDVI.

Tačiau iššūkių vis dar išlieka. Modelio veikimas nepakankamai atstovaujamose klasėse, tokiose kaip keliai, pabrėžia subalansuotų mokymo duomenų poreikį. Būsimuose darbuose būtų galima įtraukti perkėlimo mokymąsi – techniką, kai modelis, iš anksto apmokytas vienai užduočiai (pvz., bendram vaizdų atpažinimui), yra tiksliai pritaikomas konkrečiai programai (pvz., kelių aptikimui palydoviniuose vaizduose).

Tai sumažina didelių, brangiai kainuojančių, paženklintų duomenų rinkinių poreikį. Tikslumą būtų galima dar labiau padidinti testuojant pažangias architektūras, tokias kaip „U-Net3+“, kuri pagerina objektų agregavimą įvairiais masteliais, arba transformatoriais pagrįstus modelius (kurie puikiai fiksuoja tolimojo nuotolio priklausomybes vaizduose).

Tačiau Lidaro (šviesos aptikimo ir diapazono matavimo) arba radaro duomenų integravimas taip pat galėtų pagerinti rezultatus, ypač debesuotuose regionuose, kur optiniai palydovai sunkiai veikia.

Išvada: nauja geoprinių mokslų era

Šis tyrimas žymi lūžio tašką topografinio kartografavimo srityje. Automatizuodamos žemės dangos klasifikavimą, šalys gali greičiau ir pigiau nei bet kada anksčiau parengti tikslius žemėlapius. Indonezijai ši technologija yra ne tik patogumas – tai būtinybė norint valdyti sparčią urbanizaciją, apsaugoti miškus ir pasiruošti su klimatu susijusioms nelaimėms.

Tobulėjant dirbtiniam intelektui ir palydovinėms technologijoms, didelės skiriamosios gebos realaus laiko žemėlapių sudarymo vizija tampa ranka pasiekiama, suteikiant vyriausybėms ir bendruomenėms galių kurti tvaresnę ateitį.

NuorodaHakim, YF; Tsai, F. Giliuoju mokymusi pagrįstas žemės dangos išskyrimas iš labai didelės skiriamosios gebos palydovinių vaizdų, siekiant palengvinti didelio masto topografinių žemėlapių kūrimą. Remote Sens. 2025, 17, 473. https://doi.org/10.3390/rs17030473