Искусственный интеллект: MTS AI перенесла в облако процесс обучения и инференса моделей ИИ

MForum.ru

Искусственный интеллект: MTS AI перенесла в облако процесс обучения и инференса моделей ИИ

14.05.2025, MForum.ru


Компания утверждает, что это позволило ускорить запуск продуктов и сэкономить более 1 млрд рублей инвестиций в собственную инфраструктуру.

MTS AI - один из центров компетенций в области ИИ в России. Компания разрабатывает продукты и решения на базе генеративного ИИ, технологии обработки естественного языка и компьютерного зрения. Среди сервисов компании: AI-сервис речевой аналитики — WordPluse, платформа синтеза и распознавания речи на базе нейронных сетей и методов машинного обучения — Audiogram, сервис генерации и автодополнения кода для оптимизации процесса разработки — Kodify, а также голосовые и текстовые ассистенты для автоматизации коммуникации бизнеса с клиентами.

В основе практически всех сервисов компании лежат ML-модели. Они обучаются на данных, объемы которых могут достигать тысяч ТБ. Для ускорения обучения моделей компания применяет GPU. Закупка соответствующего оборудования требует серьезных инвестиций в инфраструктуру. MTS AI предпочла перенести обучение в облако. Теперь ML-платформа для обучения ключевых моделей компании развернута на виртуальной инфраструктуре. Уже обученные модели продолжают инференс в облаке, это, кстати, упрощает их обслуживание.

Для решения сложных задач, клиенты MTS AI могут использовать услуги компании, основанные на использовании LLM (больших языковых моделей). Это LLM для работы с текстами, а также поиска и анализа информации - Cotype и ее облегченная версия - Cotype Nano, on-premise сервис генерации и автодополнения кода для оптимизации процесса разработки - Kodify.

Обучение LLM еще более затратная и сложная задача, чем работа с ML-моделями. Если обучать и дообучать LLM на GPU потребительского уровня - на это уйдет много времени (и энергии). Для ускорения этого процесса в несколько десятков раз MTS AI использует суперкомпьютер МТС GROM.

Работу с моделями ИИ в облаке можно разделить на 3 этапа:

  • На первом этапе - деплой и предобучение;
  • На втором - глубокое обучение на суперкомпьютере (некоторые нейросети проходят дообучение на VI с GPU. Не совсем понял, что здесь имеется в виду под VI -Variational Inference? - в этом случае, конечно, без GPU не обойтись. Или речь о Virtual Infrastructure?);
  • На третьем этапе - модели переходят на инференс, который происходит в облаке MWS

 

«Для работы с моделями искусственного интеллекта требуется большое количество различного оборудования. Чем больше моделей вы внедряете, тем оно разнообразнее. Для более простых моделей нужны более слабые карты, для более мощных — более производительные, для обучения LLM — суперкомпьютер, для инференса может применяться ещё один вид GPU. При работе с моделями on-prem все эти мощности пришлось бы закупать самостоятельно либо работать со всеми моделями на одном виде GPU, что привело бы к значительному увеличению инвестиционных затрат или нерациональному использованию инфраструктуры. Переезд в облако позволяет нам использовать ровно тот объём вычислительных ресурсов, который необходим и не тратить огромные суммы на закупку серверов. Лишь для того, чтобы закупить оборудование для обучения LLM, нам пришлось бы проинвестировать в инфраструктуру более миллиарда рублей. А благодаря использованию мощностей MWS мы можем перераспределить инвестиции на новые проекты. Кроме того, облачная модель потребления позволяет нам ускорять запуск новых продуктов, так как отпадает необходимость ждать поставки оборудования», — отметил директор по LLM-продуктам MTS AI Сергей Пономаренко.

--

За новостями телекома и IT удобно следить в телеграм-канале abloud62. Региональные новости и анонсы пресс-релизов вы найдете в канале abloudRealTime, также подключайтесь к каналу Бойко про телеком ВКонтакте

теги: МТС MWS искусственный интеллект

-- 

© Алексей Бойко, MForum.ru


Публикации по теме:

06.05. [Новости компаний] ЦОД: MWS сообщает об аттестации ЦОД Авантаж в Лыткарино по высшему уровню защиты персональных данных / MForum.ru

06.05. [Новости компаний] Искусственный интеллект: В Билайн готовят решения для инференса ИИ-моделей / MForum.ru

14.04. [Новинки] Анонсы: Oppo Watch X2 Mini и Enco Free4 представлены официально / MForum.ru

24.03. [Новости компаний] ИИ: Билайн и red_mad_robot будут совместно разрабатывать инструменты ИИ / MForum.ru

20.03. [Новости компаний] ИИ: Билайн adtech представил ИИ-помощника для создания текстов таргетированных SMS-рассылок / MForum.ru

Обсуждение (открыть в отдельном окне)

В форуме нет сообщений.

Новое сообщение:
Complete in 2 ms, lookup=0 ms, find=2 ms

Последние сообщения в форумах

Ничего не найдено.

Все форумы »



Поиск по сайту:

Подписка:

Подписаться
Отписаться


Новости

30.05. [Новинки] Анонсы: Vivo S30 и S30 Pro mini представлены официально / MForum.ru

30.05. [Новинки] Анонсы: Realme Neo7 Turbo получил огромную батарею и быструю зарядку 100 Вт / MForum.ru

29.05. [ПО] Анонсы: OnePlus анонсирует новые функции AI, которые дебютируют вместе с OnePlus 13s / MForum.ru

29.05. [Новинки] Анонсы: Представлен Huawei nova Y73 со знакомым внешним видом и характеристиками / MForum.ru

28.05. [Новинки] Анонсы: Motorola анонсировала Edge 2025 с новым AI Key / MForum.ru

27.05. [Новинки] Слухи: Moto G96 замечен на рендерах / MForurm.ru

27.05. [Новинки] Слухи: Samsung Galaxy A57 будет базироваться на SoC Exynos 1680 / MForum.ru

27.05. [Новинки] Анонсы: iQOO Neo 10 появился в Индии / MForum.ru

26.05. [Новинки] Слухи: Vivo T4 Ultra может быть представлен уже в июне / MForum.ru

26.05. [Новинки] Анонсы: Honor 400 и Honor 400 Pro с 200 Мп камерой представлены официально / MForum.ru

23.05. [Новинки] Анонсы: Новая версия Xiaomi Watch S4 использует специальный чипсет Xring T1 / MForum.ru

23.05. [Новинки] Анонсы: Представлен Xiaomi Pad 7 Ultra с 14-дюймовым OLED-дисплеем и чипсетом Xring O1 / MForum.ru

23.05. [Новинки] Анонсы: Samsung Galaxy A25 и Galaxy Tab S6 Lite (2024) обновят до Android 15 с One UI 7 / MForum.ru

22.05. [Новинки] Анонсы: Представлен игровой планшет Infinix Xpad GT с 13-дюймовым дисплеем 144 Гц и Snapdragon 888 / MForum.ru

22.05. [Новинки] Анонсы: Представлен Infinix GT 30 Pro с Dimensity 8350 Ultimate, экраном 144 Гц и триггерами GT / MForum.ru

21.05. [Новинки] Слухи: Infinix GT 30 Pro замечен на «живых» фото / MForum.ru

21.05. [Новинки] Слухи: Использование Snapdragon 8 Elite 2 в Xiaomi 16 подтверждено официально / MForum.ru

20.05. [Новинки] Анонсы: Huawei представила Nova 14 Ultra со спутниковой связью и HarmonyOS 5 / MForum.ru

20.05. [Новинки] Анонсы: Huawei Nova 14 и Nova 14 Pro представлены официально / MForum.ru

19.05. [Новинки] Слухи: 22 мая Xiaomi представит собственный мобильный чипсет Xring 01 / MForum.ru