MForum.ru
12.08.2025,
MWS Cloud (входит в МТС Web Services) запустило платформу Inference Valve, позволяющую внедрять и эксплуатировать модели AI. В частности, можно выводить в продакшн любые обученные ML-модели, большие языковые модели (LLM), модели компьютерного зрения (CV).
Развернув модели можно их подключать к IT-системам компании через стандартные API, масштабировать, обновлять и мониторить. Платформа должна обеспечить сокращение времени внедрения моделей в бизнес-процессы, существенно снизить операционную нагрузку на команды за счет автоматизации рутины - от упаковки модели до ее сопровождения.
С этим запуском MWS Cloud вышла на рынок платформ для инференса AI моделей, размер этого рынка оценивают более, чем в 15 млрд рублей.
С помощью платформы CV-модели могут автоматически анализировать видео, находя определенные объекты, сцены и действия или классифицировать медицинские изображения. ML- и LLM-модели смогут генерировать и структурировать тексты, анализировать данные, создавать их описание, прогнозировать показатели маркетинга и продаж, отвечать на часто задаваемые вопросы в HR-порталах. Также на платформе можно разворачивать голосовые модели для синтеза и анализа речи, а также внедрения их в колл-центры.
Компании могут развернуть как собственные обученные AI-модели, так и воспользоваться готовыми к работе опенсорсными моделями. Кроме того, Inference Valve интегрируется с ML-платформой и инструментами непрерывной разработки (CI/CD), что позволяет выстроить бесшовный процесс от обучения ИИ до его внедрения в бизнес-процессы и непрерывного обновления.
Платформа доступна в частном облаке на инфраструктуре MWS Cloud, on-prem на серверах заказчика, а также в составе программно-аппаратных комплексов (ПАК) в закрытом контуре, включая режимы с ограниченным доступом к внешним сетям.
После запуска кластера специалисты заказчика загружают артефакты модели (например, ONNX, TorchScript) в платформу, после чего она автоматически формирует контейнер сервиса и публикует эндпоинт. Платформа поддерживает одновременную работу сразу с несколькими моделями с выделением квот вычислительных ресурсов, управление версиями, маршрутизацию трафика между версиями и масштабирование под нагрузку как на GPU, так и на CPU.
Inference Valve также предоставляет метрики задержек и пропускной способности, мониторинг доступности, алёрты и дашборды; доступна телеметрия качества, включая отслеживание дрейфа данных и моделей, контроль целевых метрик и уведомления при деградации. Интеграция с системами наблюдаемости (Prometheus/Grafana) и журналированием запросов упрощает аудит и разбор инцидентов.
«Без активного внедрения искусственного интеллекта практически невозможно рассчитывать на лидерство на рынке. Только в MWS Cloud спрос на инфраструктуру для ИИ за год вырос в два раза. При этом недостаточно просто обучить AI-модель. Её ещё нужно интегрировать в бизнес-процессы компании, наладить её бесперебойную работу, отслеживать успешность её работы. Inference Valve позволяет сделать это из коробки с помощью нескольких простых команд. С её помощью LLM и CV-модели в десятки раз быстрее интегрируются с ИТ-системами компании, операционная нагрузка на ML-команды при эксплуатации моделей снижается на 70%, степень автоматизации CI/CD повышается более чем на треть, а затраты на GPU снижаются более чем на 15%», — отметил CEO MWS Cloud, исполнительный директор МТС Web Services Игорь Зарубинский.
--
За новостями телекома и IT удобно следить в телеграм-канале abloud62. Региональные новости и анонсы пресс-релизов вы найдете в канале abloudRealTime, также подключайтесь к каналу Бойко про телеком ВКонтакте
теги: искусственный интеллект цифровые платформы облачные услуги MWS МТС
--
Публикации по теме:
14.01. [Новости компаний] Искусственный интеллект: B2B: МТС Web Services запустила сервис для безопасной работы ИИ с персональными данными / MForum.ru
06.12. [Новости компаний] ЦОД: МТС Web Services сообщает о начале работ по расширению мощностей ЦОД GreenBuschDC / MForum.ru
28.08. [Новости компаний] Искусственный интеллект: МТС запустила еще 2 кластера на базе GPU для облачного ИИ / MForum.ru
09.08. [Новости компаний] Искусственный интеллект: МТС Web Services запустил в Санкт-Петербурге GPU-облако для обучения ИИ / MForum.ru
27.06. [Новости компаний] Облачные услуги. IT: Билайн Big Data & AI и Сеченовский институт создали ИИ-модель для оценки прогноза рецидива рака почки / MForum.ru
15.08. [Новинки] Анонсы: Представлен Tecno Spark Go 5G c камерой на 50 МП и АКБ 6000 мАч / MForum.ru
15.08. [Новинки] Анонсы: Умные очки HTC Vive Eagle AI представлены официально / MForum.ru
14.08. [Новинки] Слухи: Samsung Galaxy S26 Edge на базе Snapdragon 8 Elite 2 замечен в базе Geekbench / MForum.ru
13.08. [Новинки] Слухи: Появились новые данные о чипсете iPhone 17 Air / MForum.ru
13.08. [Новинки] Анонсы: Poco M7 Plus 5G официально представлен в Индии / MForum.ru
13.08. [Новинки] Анонсы: Infinix Hot 60i 5G появится в Индии с 16 августа / MForum.ru
12.08. [Новинки] Слухи: Tecno MegaPad с 12-дюймовым экраном и AI-кнопкой готовится к анонсу / MForum.ru
12.08. [Новинки] Слухи: Появились новые подробности об iPhone 17 Pro / MForum.ru
11.08. [Новинки] Анонсы: HTC Wildfire E4 Plus представлен официально / MForum.ru
11.08. [ПО] Анонсы: Realme изменила подход к выпуску обновлений ПО / MForum.ru
08.08. [Новинки] Слухи: Подтверждены основные характеристики Infinix Hot 60i 5G / MForum.ru
08.08. [Новинки] Анонсы: Redmi 15 5G с АКБ 7000 мАч представлен официально / MForum.ru
08.08. [Новинки] Анонсы: Honor 400 Smart с АКБ 6500 мАч появился в Европе / MForum.ru
07.08. [Новинки] Слухи: Exynos 1680 замечен в листинге Geekbench 6 / MForum.ru
07.08. [Новинки] Слухи: Появились подробности о Moto G06 / MForum.ru
06.08. [Новинки] Слухи: Раскрыты подробности о спецификациях Nubia Z80 Ultra / MForum.ru
05.08. [Новинки] Анонсы: Vivo Y400 5G с чипсетом чипсет Snapdragon 4 Gen 2 представлен официально / MForum.ru
05.08. [Новинки] Анонсы: Honor Play 70 Plus получил Snapdragon 6s Gen 3 и АКБ 7000 мАч / MForum.ru
04.08. [Новинки] Анонсы: Бюджетный смартфон Vivo Y04s представлен официально / MForum.ru
04.08. [Новинки] Слухи: Oukitel WP210 готовится к анонсу / MForum.ru