Senior MLOps/Devops инженер (LLM) - вакансии и работа Москва
Срочно приглашается на работу Senior MLOps/Devops инженер (LLM) Москва Москва МО с зарплатой от 0, Полный рабочий день
Для удобства добавьте данную страницу к себе в закладки.
Основная информация |
|
|---|---|
Организация |
Ростелеком |
Адрес организации |
г Москва, Кутузовский проспект 32к3 |
Вакансия |
Senior MLOps/Devops инженер (LLM) |
Зарплата |
от 0 |
Адрес работы |
|
|---|---|
Регион, область: |
Москва МО |
Уточнения по адресу: |
г Москва, Кутузовский проспект 32к3 |
Уточнения |
|
|---|---|
Специальность: |
Senior MLOps/Devops инженер (LLM) |
Направление деятельности: |
Информационные технологии, телекоммуникации, связь |
Режим работы: |
|
Характер работы: |
Полный рабочий день |
Должностные обязанности: |
Мы строим платформу для инференса и SFT opensource LLM. Используем продвинутые cutting edge движки для инференса, много экспериментируем и боремся за каждую дополнительную единицу в Token thoughput. Cейчас мы находимся в поиске MLOps-инженера, который вместе с нами продолжит настраивать и улучшать инфраструктуру инференса LLM-моделей и осуществлять вывод решений в прод контур. Первый этап отбора на эту вакансию - общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача - уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным! Вам предстоит: разрабатывать и оптимизировать инфраструктуру инференса LLM-моделей для минимальной задержки и высокой пропускной способности внутренних приложений и сервисов обеспечивать масштабируемость и надежность LLM-serving инфраструктуры; выбирать и настраивать инструменты для инференса (sglang, vLLM, llama.cpp) разрабатывать механизмы разграничения доступов к API-сервисам моделей строить систему observability и мониторинга LLM-инференса собирать модели в сервисы и интерфейсы (FastAPI, Flask, Tornado, Streamlit, Chainlit и т.д.) Мы ожидаем: опыт в аналогичной роли от 5 лет оппыт с Linux (сеть, storage, роли/пользователи, менеджмент процессов) уверенное владение Kubernetes (используем Istio Service Mesh) опыт построения высокопроизводительных LLM-сервисов (sglang, vLLM) опыт настройки высоконагруженных прокси-серверов (nginx, Envoy, HAProxy): load balancing, rate limiting, SSL termination, health checks владение языками: Bash, Python, Groovy (Jenkins scripted) продвинутые навыки в CI/CD и оркестрации моделей. Будет преимуществом: понимание распределенных систем и GPU-коммуникации (NCCL, MPI, RDMA, InfiniBand) знание служебных компонентов LLM-пайплайна: токенизаторы, KV-cache, контекстное окно понимание внутренней архитектуры GPU (CUDA, cuDNN, Tensor Cores) опыт работы с векторными БД (Opensearch, Qdrant, FAISS, pgvector) для RAG и других задач. Мы предлагаем: гибридный формат работы (2-3 дня в офисе) годовой бонус и ежегодный пересмотр расширенный ДМС с первого дня + стоматологию и льготное страхование для семьи корпоративный университет Сбера, внутреннюю образовательную платформу, участие в IT-конференциях офис на Кутузовской с зонами отдыха и спортзалом льготную ипотеку в Сбере, корпоративную пенсионную программу, подписку СберПрайм+, скидки от партнеров и сервисов группы компаний. |
Источник информации: |
Вакансия интернет ресурса |
Требования к соискателю |
|
|---|---|
Образование: |
Не указано |
Контакты, адрес работодателя |
|
|---|---|
Регион: |
Москва МО |
Адрес: |
г Москва, Кутузовский проспект 32к3 |
ОГРН: |
1067761906805 |
ИНН: |
7718620740 |
Дополнительная информация о работе |
|
|---|---|
Дата: |
2026-03-27 |
Возможность трудоустройства с зарплатой от 0, с режимом работы Полный рабочий день,
по адресу г Москва, Кутузовский проспект 32к3.
Оформить бесплатную рассылку новых рабочих мест от Ростелеком можно через специальную форму.
Новые вакантные должности предоставлены отделом кадров работодателя Ростелеком 22 апреля 2026 г.