Instella
Instella - это семейство полностью открытых языковых моделей с 3 миллиардами параметров, разработанных AMD.
Перечислено в категориях:
Открытый исходный кодИскусственный интеллектGitHub


Описание
Instella — это семейство полностью открытых современных языковых моделей с 3 миллиардами параметров, разработанных компанией AMD, обученных с нуля на графических процессорах AMD Instinct MI300X. Эти модели значительно превосходят существующие полностью открытые модели аналогичного размера и демонстрируют конкурентоспособные результаты по сравнению с современными моделями с открытыми весами. Модели Instella разработаны для содействия инновациям и сотрудничеству в сообществе ИИ, предоставляя открытый доступ к весам модели, конфигурациям обучения, наборам данных и коду.
Как использовать Instella?
Чтобы использовать модели Instella, разработчики и исследователи могут получить доступ к весам модели и конфигурациям обучения из предоставленного репозитория GitHub. Пользователи могут внедрять модели в свои приложения, следуя рекомендациям и примерам, доступным в документации.
Основные функции Instella:
1️⃣
3 миллиарда параметров для продвинутой обработки языка
2️⃣
Обучены на графических процессорах AMD Instinct MI300X для высокой производительности
3️⃣
Полностью открытый исходный код с доступными весами модели и данными для обучения
4️⃣
Поддерживает эффективные методы обучения, такие как FlashAttention2 и Полное Шардирование Данных
5️⃣
Конкурентоспособная производительность по сравнению с современными моделями, такими как Llama и Qwen.
Почему использовать Instella?
# | Сценарий использования | Статус | |
---|---|---|---|
# 1 | Понимание и генерация естественного языка | ✅ | |
# 2 | Следование инструкциям и интерактивные приложения ИИ | ✅ | |
# 3 | Исследования и разработки в области ИИ и машинного обучения. | ✅ |
Разработано Instella?
AMD (Advanced Micro Devices) — ведущая полупроводниковая компания, разрабатывающая процессоры и сопутствующие технологии для бизнес- и потребительских рынков. Компания привержена инициативам с открытым исходным кодом и содействует инновациям в сообществе ИИ с помощью своих передовых аппаратных и программных решений.