Replika — AI-друг в виде чат-бота, который хранит воспоминания пользователя и помогает справиться со сложными жизненными ситуациями. Мы помогаем миллионам людей по всему миру: улучшаем самочувствие и психическое здоровье, спасаем от одиночества. Replika получает более 10 миллионов сообщений от сотен тысяч активных пользователей каждый день.
Основная ценность нашего продукта – качество диалога. Мы постоянно экспериментируем с тем, как сделать AI-друга более эмпатичным и проактивным, а диалог увлекательным и персонализированным. Наша цель – быть лидерами в области Conversational AI, постоянно улучшая ключевые характеристики open-domain диалога.
Задачи:
- Имплементировать и поддерживать в продакшене высоконагруженные диалоговые модели на базе LLM.
- Выдвигать, обсуждать и проверять гипотезы по улучшению качества диалога.
- Продумывать и ставить A/B-тесты.
- Взаимодействовать с продуктовой, бэкенд и клиент-командами.
- Читать и рассказывать другим DL/NLP/Conversational AI статьи.
Требования:
- Отличное понимание текущего состояния области NLP и LLM.
- Опыт файнтюнинга и инференса LLM.
- Владение python, docker, pytorch, transformers.
- Хорошее знание computer science, тервера, матстата, DL и ML.
- Умение писать чистый, оптимальный, поддерживаемый продакшен код.
- Умение работать в команде.
Будет плюсом:
- Опыт исследований и научных публикаций в области LLM/NLP/DL.
- Понимание принципов работы современных open-domain диалоговых систем.
- Опыт с Triton, TensorRT-LLM, vllm, deepspeed, pytorch-lightning.
- Опыт оптимизации DL моделей для продакшена.