Главная
Москва МО
LLM Platform Engineer (ML Engineer)

LLM Platform Engineer (ML Engineer) - вакансии и работа

Срочно приглашается на работу LLM Platform Engineer (ML Engineer) Москва МО с зарплатой от 0, Полный рабочий день

Для удобства добавьте данную страницу к себе в закладки.

Для женщин Для мужчин Без опыта На дому Подработка

Основная информация
Организация	ФГБОУ ВО Санкт-Петербургский государственный университет
Адрес организации	г Москва
Вакансия	LLM Platform Engineer (ML Engineer)
Зарплата	от 0

Адрес работы
Регион, область:	Москва МО
Уточнения по адресу:	г Москва

Уточнения
Специальность:	LLM Platform Engineer (ML Engineer)
Направление деятельности:	Информационные технологии, телекоммуникации, связь
Режим работы:
Характер работы:	Полный рабочий день
Должностные обязанности:	Наша задача - создать систему (ASC AI Fabrique), которая создает ИИ-агентов для оптимизации различных бизнес-процессов клиентских менеджеров. Система представляет собой рой специализированных ИИ-агентов, задача которых - выполнять полный SDLC (жизненный цикл разработки программного обеспечения) для создания других ИИ-агентов. ASC AI Fabrique — это мета-генеративная фабрика цифровых сотрудников (ИИ-агентов), построенная на парадигме Agentic Swarm Coding. Система способна автономно проектировать, кодировать, тестировать и разворачивать ИИ-агентов по текстовому бизнес-описанию. Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным! Обязанности развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism организация MLOps-процессов и системная оценка качества моделей обеспечение production latency 2s и uptime 95% для инфраструктуры inference профилирование и оптимизация использования VRAM (CUDA OOM prevention) мониторинг GPU-производительности. Требования Python (asyncio, multiprocessing, typing) Advanced уровня Bash/Shell scripting Advanced уровня для автоматизации развертывания практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM знание оптимизаций Flash Attention и Paged Attention навыки работы с PyTorch, JAX, ONNX для универсального развертывания опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA). Условия комфортный современный офис рядом с м. Кутузовская гибридный формат работы ежегодный пересмотр зарплаты и годовая премия корпоративный спортзал и зоны отдыха гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ более 400 образовательных программ СберУниверситета для профессионального и карьерного развития программа адаптации и помощь руководителя на старте расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.
Источник информации:	Вакансия интернет ресурса

Требования к соискателю
Образование:	Не указано

Контакты, адрес работодателя
Регион:	Москва МО
Адрес:	г Москва
ОГРН:	1067761906805
ИНН:	7718620740

Дополнительная информация о работе
Дата:	2026-03-20

Возможность трудоустройства с зарплатой от 0, с режимом работы Полный рабочий день, по адресу г Москва. Оформить бесплатную рассылку новых рабочих мест от ФГБОУ ВО Санкт-Петербургский государственный университет можно через специальную форму. Новые вакантные должности предоставлены отделом кадров работодателя ФГБОУ ВО Санкт-Петербургский государственный университет 24 апреля 2026 г.