Мэтч & Сопровод
Для мэтча с этой вакансией нужен Plus
Описание вакансии
Текст:
TL;DR
LLM Inference Engineer (AI): Optimizing large language model (LLM) serving infrastructure with an accent on inference optimization techniques and distributed serving architectures. Focus on designing multi-node systems, applying quantization techniques, and improving performance across various deployment scenarios.
Location: Onsite in Palo Alto, CA
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →