Горный ячмень, устойчивая зерновая культура, выращиваемая в высокогорных районах китайского плато Цинхай-Тибет, играет важнейшую роль в обеспечении продовольственной безопасности и экономической стабильности региона. Известный в науке как Hordeum vulgare L., эта культура процветает в экстремальных условиях - разреженный воздух, низкий уровень кислорода и среднегодовая температура 6,3°C, что делает ее незаменимой для сообществ в суровых климатических условиях.
В Китае под его выращивание отведено более 270 000 гектаров, в основном в автономном районе Сицзан, на долю высокогорного ячменя приходится более половины посевных площадей региона и более 70% общего объема производства зерна. Точный мониторинг плотности ячменя - количества растений или колосьев на единицу площади - необходим для оптимизации сельскохозяйственных методов, таких как орошение и удобрение, и прогнозирования урожайности.
Однако традиционные методы, такие как ручной отбор проб или спутниковая съемка, оказались неэффективными, трудоемкими или недостаточно подробными. Чтобы решить эти проблемы, исследователи из Фуцзяньского университета сельского и лесного хозяйства и Технологического университета Чэнду разработали инновационную модель искусственного интеллекта на основе YOLOv5, передового алгоритма обнаружения объектов.
Их работа, опубликованная в журнале Растительные методы (2025), достигла замечательных результатов, включая среднюю точность (mAP) - показатель общей точности обнаружения - 93,1% и снижение вычислительных затрат на 75,6%, что делает ее пригодной для развертывания беспилотников в режиме реального времени.
Проблемы и инновации в области мониторинга сельскохозяйственных культур
Значение высокогорного ячменя выходит за рамки его роли как источника пищи. Только в 2022 году в городе Риказе, крупном регионе, производящем ячмень, было собрано 408 900 тонн ячменя с 60 000 гектаров, что составило почти половину общего объема производства зерна в Тибете.
Несмотря на свою культурную и экономическую значимость, оценка урожайности ячменя долгое время оставалась сложной задачей. Традиционные методы, такие как ручной подсчет или спутниковые снимки, либо слишком трудоемки, либо не обладают достаточным разрешением для обнаружения отдельных колосьев ячменя - зерноносной части растения, ширина которых зачастую составляет всего 2-3 сантиметра.
Ручной отбор проб требует от фермеров физического осмотра участков поля - процесс медленный, субъективный и непрактичный для крупных хозяйств. Спутниковые снимки, хотя и полезны для широкого круга наблюдений, сталкиваются с проблемой низкого разрешения (часто 10-30 метров на пиксель) и частых погодных сбоев, таких как облачность в горных регионах, например в Тибете.
Чтобы преодолеть эти ограничения, исследователи обратились к беспилотным летательным аппаратам (БПЛА), или дронам, оснащенным 20-мегапиксельными камерами. Эти беспилотники сделали 501 снимок высокого разрешения ячменных полей в городе Рикадзе на двух критических стадиях роста: на стадии роста в августе 2022 года, характеризующейся зелеными, развивающимися колосьями, и на стадии созревания в августе 2023 года, отмеченной золотисто-желтыми, готовыми к уборке колосьями.
Однако при анализе этих изображений возникли сложности, включая размытые края, вызванные движением дрона, малый размер колосьев ячменя на снимках с воздуха и перекрывающиеся колосья на густо засеянных полях.
Чтобы решить эти проблемы, исследователи провели предварительную обработку изображений, разбив каждое изображение высокого разрешения на 35 более мелких суб-изображений и отфильтровав размытые края, в результате чего для обучения было получено 2 970 высококачественных суб-изображений. Эта предварительная обработка позволила модели сфокусироваться на четких, пригодных к действию данных, избегая отвлекающих факторов в виде низкокачественных областей.
Технические достижения в области обнаружения объектов
Центральное место в этом исследовании занимает алгоритм YOLOv5 (You Only Look Once version 5) - одноэтапная модель обнаружения объектов, известная своей скоростью и модульной конструкцией. В отличие от старых двухэтапных моделей, таких как Faster R-CNN, которые сначала определяют области интереса, а затем классифицируют объекты, YOLOv5 выполняет обнаружение за один проход, что делает его значительно быстрее.
Базовая модель YOLOv5n с 1,76 млн параметров (настраиваемых компонентов модели искусственного интеллекта) и 4,1 млрд FLOP (операций с плавающей запятой, показатель сложности вычислений) уже была эффективной. Однако обнаружение крошечных, перекрывающих друг друга колосьев ячменя требовало дальнейшей оптимизации.
Исследовательская группа внесла в модель три ключевых усовершенствования: свертку с разделением по глубине (DSConv), свертку с призраками (GhostConv) и модуль сверточного блочного внимания (CBAM).
Свертка с разделением по глубине (DSConv) позволяет сократить вычислительные затраты за счет разделения стандартного процесса свертки - математической операции, позволяющей извлекать особенности из изображений - на два этапа. Сначала свертка по глубине применяет фильтры к отдельным цветовым каналам (например, красному, зеленому, синему), анализируя каждый канал отдельно.
Затем следует точечная свертка, которая объединяет результаты по каналам с помощью ядер 1×1. Такой подход позволяет сократить количество параметров до 75%.
Например, традиционная свертка 3×3 с 64 входными и 128 выходными каналами требует 73 728 параметров, а DSConv сокращает их до 8 768 - на 88% меньше. Такая эффективность очень важна для развертывания моделей на беспилотниках или мобильных устройствах с ограниченной вычислительной мощностью.
Свертка Ghost (GhostConv) еще больше облегчает модель, генерируя дополнительные карты признаков - упрощенные представления паттернов изображения - с помощью простых линейных операций, таких как поворот или масштабирование, вместо ресурсоемких сверток.
Традиционные слои свертки создают избыточные признаки, расходуя вычислительные ресурсы. GhostConv решает эту проблему путем создания “призрачных” функций из существующих, эффективно уменьшая вдвое параметры некоторых слоев.
Например, для слоя с 64 входными и 128 выходными каналами традиционно требуется 73 728 параметров, но GhostConv сводит это к 36,864 при сохранении точности. Эта техника особенно полезна для обнаружения мелких объектов, таких как ячменные колосья, где эффективность вычислений имеет первостепенное значение.
Модуль внимания на основе конволюционных блоков (CBAM) был интегрирован, чтобы помочь модели сфокусироваться на важных особенностях даже в загроможденном окружении. Механизмы внимания, вдохновленные зрительными системами человека, позволяют моделям ИИ определять приоритетность важных частей изображения.
CBAM использует два типа внимания: канальное внимание, которое определяет важные цветовые каналы (например, зеленый для растущих колосьев), и пространственное внимание, которое выделяет ключевые области в изображении (например, скопления колосьев). Заменив стандартные модули на DSConv и GhostConv и внедрив CBAM, исследователи создали более компактную и точную модель, предназначенную для обнаружения ячменя.
Реализация и результаты
Для обучения модели исследователи вручную маркировали 135 исходных изображений, используя ограничительные рамки - прямоугольные рамки, обозначающие местоположение колосьев ячменя, и классифицируя колосья по стадиям роста и созревания. Методы дополнения данных, включая поворот, наложение шума, окклюзию и повышение резкости, расширили набор данных до 2 970 изображений, улучшив способность модели обобщать данные в различных полевых условиях.
Например, поворот изображений на 90°, 180° или 270° помог модели распознать шипы под разными углами, а добавление шума имитировало недостатки реального мира, такие как пыль или тени. Набор данных был разделен на обучающий (80%) и проверочный (20%), что обеспечило надежную оценку.
Обучение проводилось на высокопроизводительной системе с процессором AMD Ryzen 7, графическим процессором NVIDIA RTX 4060 и 64 ГБ оперативной памяти с использованием фреймворка PyTorch - популярного инструмента для глубокого обучения. В течение 300 тренировочных эпох (полных проходов по набору данных) тщательно отслеживались точность модели (точность правильных обнаружений), запоминание (способность находить все релевантные шипы) и потери (частота ошибок).
Результаты оказались поразительными. Улучшенная модель YOLOv5 достигла точности 92,2% (по сравнению с 89,1% в базовой версии) и recall 86,2% (по сравнению с 83,1%), превзойдя базовую модель YOLOv5n на 3,1% по обеим метрикам. Средняя точность (mAP) - комплексная метрика, усредняющая точность обнаружения по всем категориям, - достигла 93,1%, а отдельные показатели составили 92,7% для шипов на стадии роста и 93,5% для шипов на стадии созревания.
Не менее впечатляющей оказалась и вычислительная эффективность: параметры модели снизились на 70,6% до 1,2 миллиона, а количество FLOP уменьшилось на 75,6% до 3,1 миллиарда. Сравнительный анализ с такими ведущими моделями, как Faster R-CNN и YOLOv8n, подчеркнул ее превосходство.
Хотя YOLOv8n достигла немного более высокой mAP (93,8%), ее параметры (3,0 млн) и FLOPs (8,1 млрд) были в 2,5 раза и 2,6 раза выше, соответственно, что делает предложенную модель гораздо более эффективной для приложений реального времени.
Визуальное сравнение показало эти достижения. На изображениях, полученных на стадии роста, улучшенная модель обнаружила 41 шип по сравнению с 28 базовыми. Во время созревания она определила 3 шипа против 2, при этом было меньше пропущенных обнаружений (отмечены оранжевыми стрелками) и ложноположительных результатов (отмечены фиолетовыми стрелками).
Эти усовершенствования жизненно важны для фермеров, полагающихся на точные данные для прогнозирования урожайности и оптимизации ресурсов. Например, точный подсчет колосков позволяет лучше оценить производство зерна, что дает возможность принимать решения о сроках сбора урожая, хранении и планировании рынка.
Будущие направления и практические последствия
Несмотря на успех, исследование признало и недостатки. Производительность снижалась при экстремальных условиях освещения, таких как яркие полуденные блики или сильные тени, которые могут скрыть детали колосьев. Кроме того, прямоугольные ограничительные рамки иногда не подходили к шипам неправильной формы, что вносило небольшие погрешности.
Модель также исключает размытые края из изображений с БПЛА, требующих ручной предварительной обработки, что увеличивает время и сложность.
Будущая работа направлена на решение этих проблем путем расширения набора данных за счет включения в него изображений, полученных на рассвете, в полдень и в сумерках, экспериментов с аннотациями в форме многоугольников (гибкие формы, которые лучше подходят для нестандартных объектов) и разработки алгоритмов для лучшей обработки размытых областей без ручного вмешательства.
Последствия этого исследования очень глубоки. Для фермеров в таких регионах, как Тибет, модель позволяет оценивать урожайность в режиме реального времени, заменяя трудоемкие ручные подсчеты автоматизацией с помощью дронов. Различение стадий роста позволяет точно планировать сбор урожая, сокращая потери от преждевременной или несвоевременной уборки.
Подробные данные о плотности колоса - например, выявление недостаточно заселенных или переполненных участков - могут служить основой для разработки стратегий орошения и внесения удобрений, что позволит сократить расход воды и химикатов. Помимо ячменя, облегченная архитектура перспективна и для других культур, таких как пшеница, рис или фрукты, что открывает путь для более широкого применения в точном земледелии.
Заключение
В заключение следует отметить, что данное исследование демонстрирует преобразующий потенциал ИИ в решении сельскохозяйственных задач. Доработав YOLOv5 с помощью инновационных облегченных методов, исследователи создали инструмент, в котором сбалансированы точность и эффективность, что крайне важно для реального применения в условиях ограниченных ресурсов.
Такие термины, как mAP, FLOPs и механизмы внимания, могут показаться техническими, но их влияние глубоко практично: они позволяют фермерам принимать решения на основе данных, сохранять ресурсы и максимизировать урожайность. Поскольку изменение климата и рост населения усиливают давление на глобальные продовольственные системы, такие достижения будут незаменимы.
Для фермеров Тибета и других регионов эта технология представляет собой не просто скачок в эффективности сельского хозяйства, но и маяк надежды на устойчивую продовольственную безопасность в неопределенном будущем.
Ссылка: Cai, M., Deng, H., Cai, J. et al. Обнаружение легкого высокогорного ячменя на основе улучшенного YOLOv5. Plant Methods 21, 42 (2025). https://doi.org/10.1186/s13007-025-01353-0






























Вот как работает картографирование с помощью дронов: на дрон устанавливаются датчики, такие как камеры и лазерные сканеры, которые летают над определенной местностью, делая снимки или сканируя ее лазерами на разных высотах и под разными углами. Собранные данные затем обрабатываются и преобразуются в 3D-карты, которые можно просматривать на экране компьютера или смартфона.
2. Карты распределения удобрений, гербицидов и пестицидов с использованием данных аэрофотосъемки с дронов.
Только одна стратегия устарела, поскольку она не только тратит ресурсы, но и может негативно повлиять на здоровье и жизнеспособность урожая. Например, избыток воды может погубить даже здоровый урожай, препятствуя усвоению кислорода корнями, поэтому даже полив не является лучшим способом выращивания безупречных культур. То же самое относится и к удобрениям; использование правильного количества имеет решающее значение для роста, поскольку избыток вызывает ожоги корней, что может погубить даже здоровые растения. Картографирование с помощью дронов позволяет распылять удобрения только там, где существует проблема, сокращая потери ресурсов и риск повреждения здоровых культур, которые не нуждаются в таком же уходе. В то время как человек не может распознать уникальные потребности каждого растения в его урожае, технология обследования с помощью дронов может сделать это за считанные минуты.
3. Оценка урожая
Одним нажатием кнопки запускаются разведывательные миссии; дрон покидает защищенную от непогоды зарядную станцию, собирает данные и загружает их. Полученные данные, а также результаты исследования способности дрона выявлять стресс у растений и эффективности применяемых методов обработки или добавок, могут быть использованы для адаптации автоматизированных систем орошения. Благодаря наличию дронов для разведки на месте, становится возможен постоянный контроль состояния растений.
4. Количество растений на единицу площади
Благодаря мощной технологии искусственного интеллекта, используемой в дроне, можно идентифицировать любые виды растений. Это позволяет определять весь урожай и общие потери в начале и конце каждого сезона, повышая точность и осведомленность об успехе вегетационного периода.
5. Автоматическая классификация с использованием изображений, полученных с помощью дронов.
Благодаря возможности съемки с дрона, можно определить тип сельскохозяйственных угодий, над которыми он пролетает: пахотные, пастбищные или смешанные. Дроны также могут подсчитывать количество урожая и скота, как показано выше, чтобы убедиться в актуальности данных и зафиксировать любые потери.
6. Отслеживание урожая
Состояние здоровья урожая не предопределено, поскольку на его развитие могут влиять факторы окружающей среды. Температура, влажность, содержание питательных веществ и микроэлементов, наличие насекомых и болезней, доступность воды и количество солнечного света — все это необходимо учитывать. Все эти факторы можно отслеживать с помощью различных полезных нагрузок дронов, и многие из этих неосязаемых переменных можно контролировать, полив водой или опрыскиванием непосредственно необходимых участков. Чем здоровее окружающая среда, тем сильнее становится иммунная система культуры, и, следовательно, тем здоровее она становится — с гораздо большей способностью противостоять вредителям и болезням.





