LLM Platform Engineer (ML Engineer) - вакансии и работа
Срочно приглашается на работу LLM Platform Engineer (ML Engineer) Москва МО с зарплатой от 0, Полный рабочий день
Для удобства добавьте данную страницу к себе в закладки.
Основная информация |
|
|---|---|
Организация |
ФГБОУ ВО Санкт-Петербургский государственный университет |
Адрес организации |
г Москва |
Вакансия |
LLM Platform Engineer (ML Engineer) |
Зарплата |
от 0 |
Адрес работы |
|
|---|---|
Регион, область: |
Москва МО |
Уточнения по адресу: |
г Москва |
Уточнения |
|
|---|---|
Специальность: |
LLM Platform Engineer (ML Engineer) |
Направление деятельности: |
Информационные технологии, телекоммуникации, связь |
Режим работы: |
|
Характер работы: |
Полный рабочий день |
Должностные обязанности: |
Наша задача - создать систему (ASC AI Fabrique), которая создает ИИ-агентов для оптимизации различных бизнес-процессов клиентских менеджеров. Система представляет собой рой специализированных ИИ-агентов, задача которых - выполнять полный SDLC (жизненный цикл разработки программного обеспечения) для создания других ИИ-агентов. ASC AI Fabrique — это мета-генеративная фабрика цифровых сотрудников (ИИ-агентов), построенная на парадигме Agentic Swarm Coding. Система способна автономно проектировать, кодировать, тестировать и разворачивать ИИ-агентов по текстовому бизнес-описанию. Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным! Обязанности развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism организация MLOps-процессов и системная оценка качества моделей обеспечение production latency 2s и uptime 95% для инфраструктуры inference профилирование и оптимизация использования VRAM (CUDA OOM prevention) мониторинг GPU-производительности. Требования Python (asyncio, multiprocessing, typing) Advanced уровня Bash/Shell scripting Advanced уровня для автоматизации развертывания практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM знание оптимизаций Flash Attention и Paged Attention навыки работы с PyTorch, JAX, ONNX для универсального развертывания опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA). Условия комфортный современный офис рядом с м. Кутузовская гибридный формат работы ежегодный пересмотр зарплаты и годовая премия корпоративный спортзал и зоны отдыха гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ более 400 образовательных программ СберУниверситета для профессионального и карьерного развития программа адаптации и помощь руководителя на старте расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров. |
Источник информации: |
Вакансия интернет ресурса |
Требования к соискателю |
|
|---|---|
Образование: |
Не указано |
Контакты, адрес работодателя |
|
|---|---|
Регион: |
Москва МО |
Адрес: |
г Москва |
ОГРН: |
1067761906805 |
ИНН: |
7718620740 |
Дополнительная информация о работе |
|
|---|---|
Дата: |
2026-03-20 |
Возможность трудоустройства с зарплатой от 0, с режимом работы Полный рабочий день,
по адресу г Москва.
Оформить бесплатную рассылку новых рабочих мест от ФГБОУ ВО Санкт-Петербургский государственный университет можно через специальную форму.
Новые вакантные должности предоставлены отделом кадров работодателя ФГБОУ ВО Санкт-Петербургский государственный университет 24 апреля 2026 г.