Moonlight
Moonlight - это легкая модель, обученная с помощью оптимизатора Muon, которая обеспечивает лучшую производительность при меньших затратах на обучение.
Перечислено в категориях:
Открытый исходный кодИскусственный интеллектGitHub


Описание
Лунный свет - это современная модель Mixture-of-Expert (MoE) с параметрами 3B-16B, обученная на 57 триллионах токенов с использованием оптимизатора Muon. Она разработана для повышения производительности при меньших затратах FLOP на обучение по сравнению с предыдущими моделями, что делает ее высокоэффективной для обучения языковых моделей в крупном масштабе. Архитектура Лунного света позволяет легко развертывать и интегрировать с популярными движками вывода, улучшая ее удобство в различных приложениях.
Как использовать Moonlight?
Чтобы использовать модель Лунного света, вы можете импортировать ее с помощью библиотеки Hugging Face Transformers. Загрузите модель и токенизатор, подготовьте свои входные подсказки и генерируйте ответы, используя возможности вывода модели. Рекомендуемая среда включает Python 3.10, PyTorch 2.1.0 и Transformers 4.48.2.
Основные функции Moonlight:
1️⃣
Архитектура Mixture-of-Expert (MoE)
2️⃣
Эффективная распределенная реализация
3️⃣
Оптимальная память и эффективная связь
4️⃣
Предобученные контрольные точки с настройкой инструкций
5️⃣
Поддержка обучения в крупном масштабе без настройки гиперпараметров
Почему использовать Moonlight?
# | Сценарий использования | Статус | |
---|---|---|---|
# 1 | Эффективное обучение языковых моделей в крупном масштабе | ✅ | |
# 2 | Интеграция с популярными движками вывода для развертывания | ✅ | |
# 3 | Проведение исследований в области масштабируемого обучения языковых моделей | ✅ |
Разработано Moonlight?
MoonshotAI - это организация, ориентированная на исследования, посвященная продвижению области искусственного интеллекта через инновационную разработку моделей и вклад в открытый исходный код. Их работа подчеркивает масштабируемость и эффективность в обучении крупных языковых моделей, делая передовые технологии доступными для исследований и практических приложений.