Subscribe to get weekly email with the most promising tools 🚀

Moonlight - это легкая модель, обученная с помощью оптимизатора Muon, которая обеспечивает лучшую производительность при меньших затратах на обучение.

Перечислено в категориях:

Открытый исходный кодИскусственный интеллектGitHub
Moonlight-image-0
Moonlight-image-1
Moonlight-image-2

Описание

Лунный свет - это современная модель Mixture-of-Expert (MoE) с параметрами 3B-16B, обученная на 57 триллионах токенов с использованием оптимизатора Muon. Она разработана для повышения производительности при меньших затратах FLOP на обучение по сравнению с предыдущими моделями, что делает ее высокоэффективной для обучения языковых моделей в крупном масштабе. Архитектура Лунного света позволяет легко развертывать и интегрировать с популярными движками вывода, улучшая ее удобство в различных приложениях.

Как использовать Moonlight?

Чтобы использовать модель Лунного света, вы можете импортировать ее с помощью библиотеки Hugging Face Transformers. Загрузите модель и токенизатор, подготовьте свои входные подсказки и генерируйте ответы, используя возможности вывода модели. Рекомендуемая среда включает Python 3.10, PyTorch 2.1.0 и Transformers 4.48.2.

Основные функции Moonlight:

1️⃣

Архитектура Mixture-of-Expert (MoE)

2️⃣

Эффективная распределенная реализация

3️⃣

Оптимальная память и эффективная связь

4️⃣

Предобученные контрольные точки с настройкой инструкций

5️⃣

Поддержка обучения в крупном масштабе без настройки гиперпараметров

Почему использовать Moonlight?

#Сценарий использованияСтатус
# 1Эффективное обучение языковых моделей в крупном масштабе
# 2Интеграция с популярными движками вывода для развертывания
# 3Проведение исследований в области масштабируемого обучения языковых моделей

Разработано Moonlight?

MoonshotAI - это организация, ориентированная на исследования, посвященная продвижению области искусственного интеллекта через инновационную разработку моделей и вклад в открытый исходный код. Их работа подчеркивает масштабируемость и эффективность в обучении крупных языковых моделей, делая передовые технологии доступными для исследований и практических приложений.

Часто задаваемые вопросы Moonlight