AI-модель распознавания данных с фото для бизнеса в ритейле

AI-модель распознавания данных с фото для бизнеса в ритейле

Riverstart создали AI-модель, которая автоматически распознает текст и числовые данные с фото ценников и маркировок и передает их в систему учета. Решение обеспечивает до 95% точности распознавания и экономит время сотрудников.

2025
ML/AI
Ритейл

Задача — более точная модель распознавания ценников с помощью AI

Клиент — крупная региональная ритейл-компания (NDA). Каждый день продавцы делают до 20 000 фотографий ценников в магазинах конкурентов, чтобы заносить данные в систему учета.

Для ускорения работы компания использовала собственное AI-решение для автоматизированного распознавания данных с фото. Ее точность составляла около 36%. Нашей задачей стало улучшение этого решения до 75%.

Мы изучили исходную модель и выяснили, что разработка новой будет экономически эффективнее. Команда применила свой опыт в AI  и использовала в качестве решения визуально-языковую модель, точность которой в итоге составила 95%. Готовая модель позволила уменьшить количество ошибок при распознавании цен и наименований товаров — аналитики получили возможность снизить трудозатраты по анализу цен у конкурентов в разы.

2секунды
на обработку фотографии
95%
точность распознавания

Решение — AI-сервис распознавания данных с фото для бизнеса

Riverstart разработала и развернула для клиента AI-модель, которая обрабатывает до 200 000 фото в месяц, затрачивая до 2 секунд на одно изображение. Она автоматически распознает текст и данные с фото ценников, обрабатывает их в облаке или защищенном контуре компании и передает напрямую в базу учета.

Первичное тестирование на 917 реальных фотографиях показало точность распознавания 93,5% — более чем в два раза выше, чем у предыдущей модели клиента. После доработок точность выросла до 95%.

Для высокой точности распознавания мы используем пайплайн предобработки изображений: переводим цветные фото в чёрно-белые, усиливаем резкость, корректируем контрастность и освещенность. Это позволяет модели стабильно работать в сложных реальных условиях съемки — при плохом освещении, наклоне камеры, бликах и искажениях перспективы.

От фото до базы учета данных: процесс работы модели

Система Riverstart распознает данные на фотографиях ценников и маркировок и передает их в систему учета и аналитики:

  • Сотрудник фотографирует ценник или маркировку на смартфон.
  • Отправляет на обработку через мобильное приложение или загружает в систему вручную.
  • AI-модель анализирует изображение, распознает текст и числовые значения и преобразует их в структурированные данные: наименование товара, цену, акционную цену и другие параметры. 
  • Проверенные данные передаются в ERP или внутреннюю базу клиента, исключая ручной ввод и связанные с ним ошибки.
  • Бизнес получает актуальные и структурированные данные для отчетности, контроля цен и принятия оперативных управленческих решений.

Внедрение системы занимает от 1,5 до 5 месяцев — с учетом настройки под специфику данных, обучения модели и интеграции с учётной системой. Уже после запуска сотрудники работают быстрее, а бизнес получает доступ к актуальной информации в режиме близком к реальному времени.

Система может выполнять обработку в облаке или в защищенном контуре компании, если требуется особое внимание к конфиденциальности данных.

Результат — 95% точности распознавания данных с фото и передача в систему учета

Внедрение AI-сервиса Riverstart для распознавания данных с фото ценников позволило повысить точность обработки изображений до 95%.

Автоматизация распознавания информации на фотографиях снизила нагрузку на сотрудников, сократила финансовые потери из-за ошибок и ускорило принятие управленческих решений.

Результаты в цифрах:

  • 95% точности распознавания данных с фотографии
  • до 200 000 фотографий в месяц способна обработать модель
  • до 2 секунд уходит на распознавание данных на одном фото

Внедрение аналогичного AI-сервиса занимает от 1,5 до 5 месяцев. Использование собственной AI-модели для распознавания фото для бизнеса снижает стоимость обработки изображений и создает основу для масштабирования и коммерциализации решения.

Результат работы команды Riverstart
Автоматизация учета в ритейле с помощью AI-модели распознавания данных по фотографии
Результат работы команды Riverstart

AI-модель на основе Computer Vision для распознавания данных по фото

Стек
Python
Python
Docker/Docker-swarm
Docker/Docker-swarm
FastAPI
FastAPI
LLaVA
LLaVA
Redis
Redis
Celery
Celery

Обсудить проект

Расскажите о проекте в форме или свяжитесь с нами напрямую

hi@riverstart.ru

Написать нам на почту

@hi_riverstart

Написать нашему аккаунт-директору в Telegram

Нижегородский офис

ул. Рождественская, 26

+7 499 647 48 28

Московский офис

Новая площадь, 6