RLLama
Усиливает LLM с помощью обучения с подкреплением, дополненного памятью.
Перечислено в категориях:
Искусственный интеллектИнструменты разработчикаGitHub


Описание
RLlama — это улучшенная версия LlamaGym, которая наделяет его возможностями обучения с использованием памяти и дополнительными алгоритмами обучения с подкреплением (RL). Она вводит эпизодическую память и рабочую память, позволяя агентам учиться на прошлых опытах и поддерживать контекст для текущего принятия решений, что делает его мощным инструментом для разработки интеллектуальных агентов в различных средах.
Как использовать RLLama?
Чтобы начать работу с RLlama, просто установите его с помощью pip, используя команду 'pip install rllama'. Затем вы можете создавать агентов для различных сред, таких как Блэкджек или текстовые игры, импортируя класс RLlamaAgent и определяя необходимые методы для поведения вашего агента.
Основные функции RLLama:
1️⃣
Обучение с использованием памяти с эпизодической и рабочей памятью
2️⃣
Несколько алгоритмов RL (PPO, DQN, A2C, SAC, REINFORCE, GRPO)
3️⃣
Поддержка онлайн-обучения
4️⃣
Бесшовная интеграция с Gymnasium
5️⃣
Поддержка мультимодальности (скоро)
Почему использовать RLLama?
# | Сценарий использования | Статус | |
---|---|---|---|
# 1 | Разработка интеллектуальных агентов для карточных игр, таких как Блэкджек | ✅ | |
# 2 | Создание агентов для текстовых приключенческих игр | ✅ | |
# 3 | Реализация обучения с использованием памяти в различных средах RL | ✅ |
Разработано RLLama?
RLlama разработан Ch33nchan, который внес вклад в область обучения с подкреплением и обучения с использованием памяти, улучшая возможности LlamaGym для создания более мощной платформы для построения интеллектуальных агентов.