Пакетная обработка данных с автоскейлингом вычислительных ресурсов

Пакетная обработка данных с автоскейлингом вычислительных ресурсов

Реализовали в платформе обработку файлов пакетами с автоматическим масштабированием вычислительных ресурсов под нагрузку.

2023
Разработка сервиса
IT
Наука

Задача и проблема

В компаниях, где регулярно обрабатывают большие объемы данных — например, изображения, видео, сканы, результаты расчетов или модели — задачи часто запускают по одной. Это замедляет работу, когда нужно обработать сразу десятки или сотни файлов.

При массовом запуске появляется другая проблема: нагрузка резко растет, и текущих вычислительных мощностей не хватает. Задачи выстраиваются в очередь, увеличивается время обработки. При этом держать инфраструктуру с запасом под пиковые нагрузки невыгодно — ресурсы простаивают.

В результате компании сталкиваются с выбором: либо медленная обработка данных, либо избыточные затраты на инфраструктуру.

Задача — настроить автоматизацию вычислений, упростить запуск задач для больших массивов данных и обеспечить гибкое управление нагрузкой.

Решение — пакетная обработка задач с автоскейлингом

Сделали пакетную обработку файлов с автоматическим управлением вычислительными ресурсами.

Мы реализовали механизм массового запуска задач: пользователь выбирает файлы из хранилища и отправляет их в обработку одним действием. Это упрощает работу с большими объемами и ускоряет получение результата

Обработка проходит на вычислительном кластере: система распределяет задачи между узлами и выполняет их параллельно. За счет этого сокращается общее время обработки и снижается нагрузка на локальную инфраструктуру.

Оптимизация вычислительных ресурсов

Ключевая часть решения — динамическое распределение ресурсов. При появлении задач система автоматически поднимает дополнительные вычислительные мощности, а после завершения обработки — отключает их.

Такой подход реализует автоскейлинг ресурсов и позволяет оптимизировать затраты: инфраструктура используется по фактической нагрузке, без избыточных мощностей.

Для тяжеловесных файлов вы предусмотрели загрузку через S3-хранилище, чтобы не загружать их через веб-интерфейс. Это решение упрощает передачу данных и позволяет обрабатывать большие объемы без ограничений.

Кому актуально это решение

Решение подходит компаниям, которые обрабатывают большие объемы данных и запускают ресурсоемкие вычисления:

  • компаниям в области анализа данных и ML;
  • инженерным и расчетным подразделениям;
  • научным и исследовательским организациям;
  • компаниям с задачами пакетной обработки файлов.

Запишитесь на консультацию

Обсудим, как сможем решить вашу задачу




Спасибо за заявку!
Мы скоро с вами свяжемся.
Благодарим вас за вашу заявку! Наши специалисты уже работают над ней, и мы обязательно свяжемся с вами в ближайшее время.
Произошла ошибка при отправке
К сожалению, произошла ошибка при отправке вашего сообщения. Пожалуйста, проверьте ваше подключение к интернету и попробуйте отправить сообщение еще раз
Результат работы команды Riverstart
Автоматизировали обработку данных с динамическим масштабированием ресурсов

Обсудить проект

Расскажите о проекте в форме или свяжитесь с нами напрямую

hi@riverstart.ru

Написать нам на почту

@hi_riverstart

Написать нашему аккаунт-директору в Telegram

Нижегородский офис

ул. Рождественская, 26

+7 499 647 48 28

Московский офис

Новая площадь, 6