Заказчик:
Лаборатория Арктической океанологии Московского физико-технического института (МФТИ). Лаборатория проводит исследования по широкому спектру тем, в рамках физической океанологии вод Арктики, с фокусом на изучение прибрежных и шельфовых зон российского сектора Северного Ледовитого океана.

Задача:
Океанические вихри, имеющие размер от нескольких до сотен километров в диаметре, являются важной составляющей динамики морских вод.  Вихри способны захватывать большие объемы воды, тепла, соли и биогенов. Одиночный вихрь может перемещать триллионы тон воды и десятки тераджоулей тепла из места его генерации до места диссипации. Таким образом, вихри играют ключевую роль в вертикальном перемешивании океана, а также оказывают существенное влияние на региональные и глобальные климатические процессы и на биопродуктивность океана. Детальные исследования океанических вихрей необходимы для лучшего понимания динамических, климатических и биологических процессов в океане, а также помогают совершенствовать климатические модели и прогнозы.
Российские ученые решили задачу разработку методики автоматического обнаружения и анализа океанических вихрей по данным радарных наблюдений (РСА - радар с синтезированной апертурой) с помощью интеллектуальных моделей компьютерного зрения.
Большинство современных подходов к автоматической идентификации вихрей применялись в зонах, свободных ото льда, что оставляет пробел в применении этих методик для прикромочной зоны Арктики, где существует потребность в более надёжной и автоматизированной методике идентификации вихрей по данным РСА. Для проведения исследования и отработки методики был выбран регион пролива Фрама.
Решение: Проведение численных экспериментов с использованием графических ускорителей (GPU) в облачной среде Yandex DataSphere
Для разработки методики автоматизированной идентификации вихрей использовалась модель обнаружения объектов в реальном времени YOLOv8 (You Only Look Once). В ходе исследования было протестировано пять различных архитектур YOLOv8 – от малой (small) до сверхбольшой (xlarge) на имеющемся наборе данных, чтобы определить наиболее подходящую из них для задачи обнаружения вихрей. Основной для проведения исследования послужили данные спутника Sentinel-1 с пространственным разрешением 40 м, который позволяет визуально распознавать огромное количество вихрей различного масштаба. Для выбранной модели (medium) был проведен тонкий гиперпараметрический тюнинг с использованием современных методов оптимизации, что позволило достичь максимальной производительности модели и точности детекции.
Решение задачи потребовало доступа к значительным вычислительным ресурсам, которыми авторы исследования не располагали. Чтобы обеспечить требуемые вычислительные мощности и при этом не выйти за рамки бюджета, было принято решение использовать облачные ресурсы YandexCloud. Партнер Yandex Cloud, компания Аплана Диджитал, предложила применить для проведения численных экспериментов высокопроизводительную облачную архитектуру с использованием графических ускорители (GPU).
Все вычислительные задачи выполнялись в облачной среде Yandex DataSphere Запуски моделей выполнялись на двух аппаратных конфигурациях.
  • Для моделей nano, small и medium архитектуры использовались графические процессоры NVIDIA T4.
  • Карты NVIDIA Tesla V100 с объемом оперативной памяти от 48 до 96 ГБ использовалась для запуска более крупных и ресурсоемких large и xlarge моделей.
Решение: Проведение численных экспериментов с использованием графических ускорителей (GPU) в облачной среде Yandex DataSphere

Для разработки методики автоматизированной идентификации вихрей использовалась модель обнаружения объектов в реальном времени YOLOv8 (You Only Look Once). В ходе исследования было протестировано пять различных архитектур YOLOv8 – от малой (small) до сверхбольшой (xlarge) на имеющемся наборе данных, чтобы определить наиболее подходящую из них для задачи обнаружения вихрей. Основной для проведения исследования послужили данные спутника Sentinel-1 с пространственным разрешением 40 м, который позволяет визуально распознавать огромное количество вихрей различного масштаба. Для выбранной модели (medium) был проведен тонкий гиперпараметрический тюнинг с использованием современных методов оптимизации, что позволило достичь максимальной производительности модели и точности детекции.

Решение задачи потребовало доступа к значительным вычислительным ресурсам, которыми авторы исследования не располагали. Чтобы обеспечить требуемые вычислительные мощности и при этом не выйти за рамки бюджета, было принято решение использовать облачные ресурсы YandexCloud. Партнер Yandex Cloud, компания Аплана Диджитал, предложила применить для проведения численных экспериментов высокопроизводительную облачную архитектуру с использованием графических ускорители (GPU).

Все вычислительные задачи выполнялись в облачной среде Yandex DataSphere Запуски моделей выполнялись на двух аппаратных конфигурациях.

  • Для моделей nano, small и medium архитектуры использовались графические процессоры NVIDIA T4.
  • Карты NVIDIA Tesla V100 с объемом оперативной памяти от 48 до 96 ГБ использовалась для запуска более крупных и ресурсоемких large и xlarge моделей
Результаты
По словам руководителя исследования, к.г.н. Сандалюка Никиты: «Использование высокопроизводительной вычислительной инфраструктуры Yandex Cloud позволило существенно сократить время обработки спутниковых изображений, ускорив расчёты в несколько раз. Кроме того, ML-сервисы платформы Datasphere обеспечили удобную и доступную среду для быстрой разработки, обучения и тестирования моделей автоматического обнаружения вихрей в океане по данным РСА».
Ключевым результатам проведенных исследований стала разработка метода ML-исследований данных радарных наблюдений, обеспечивающего:
  • Повышение качества и оперативности обнаружения океанских вихрей в Арктической зоне
  • Выделение вихрей по их полярности на циклонические и антициклонические, различающиеся по своим физическим свойствам и роли в процессах перемешивания океанских вод
  • Извлечение географической информации о местоположении и размере каждого обнаруженного вихря, что позволяет более полно понять их динамику
Полученные результаты помогут российским ученым в дальнейшем изучении особенностей океанических и климатических процессов в Арктике, будут способствовать освоению этого важнейшего для нашей страны региона.
Полные результаты исследования опубликованы в научной статье: Nikita Sandalyuk, Eduard Khachatrian «Automatic eddy detection in the MIZ based on YOLO algorithm and SAR images», Science of Remote Sensing, 11(2025)
Использованные в проекте технологии:
  • Yandex Compute Cloud
  • Yandex Object Storage
  • Yandex DataSpherе