Instella
Instella é uma família de modelos de linguagem totalmente abertos e de última geração, com 3 bilhões de parâmetros, desenvolvidos pela AMD.
Listado em categorias:
Código abertoInteligência artificialGitHub


Descrição
Instella é uma família de modelos de linguagem de última geração com 3 bilhões de parâmetros, totalmente abertos, desenvolvidos pela AMD, treinados do zero em GPUs AMD Instinct MI300X. Esses modelos superam significativamente os modelos totalmente abertos existentes de tamanhos semelhantes e alcançam desempenho competitivo em comparação com modelos de peso aberto de última geração. Os modelos Instella são projetados para promover a inovação e a colaboração dentro da comunidade de IA, fornecendo acesso de código aberto aos pesos do modelo, configurações de treinamento, conjuntos de dados e código.
Como usar Instella?
Para usar os modelos Instella, desenvolvedores e pesquisadores podem acessar os pesos do modelo e as configurações de treinamento no repositório do GitHub fornecido. Os usuários podem implementar os modelos em suas aplicações seguindo as diretrizes e exemplos disponíveis na documentação.
Recursos principais de Instella:
1️⃣
3 bilhões de parâmetros para processamento avançado de linguagem
2️⃣
Treinado em GPUs AMD Instinct MI300X para alto desempenho
3️⃣
Totalmente de código aberto com pesos de modelo e dados de treinamento acessíveis
4️⃣
Suporta técnicas de treinamento eficientes como FlashAttention2 e Paralelismo de Dados Totalmente Fragmentado
5️⃣
Desempenho competitivo em relação a modelos de última geração como Llama e Qwen.
Por que usar Instella?
# | Caso de uso | Status | |
---|---|---|---|
# 1 | Compreensão e geração de linguagem natural | ✅ | |
# 2 | Seguir instruções e aplicações interativas de IA | ✅ | |
# 3 | Pesquisa e desenvolvimento em IA e aprendizado de máquina. | ✅ |
Desenvolvido por Instella?
A AMD (Advanced Micro Devices) é uma empresa líder em semicondutores que desenvolve processadores de computador e tecnologias relacionadas para mercados empresariais e de consumo. A empresa está comprometida com iniciativas de código aberto e com a promoção da inovação na comunidade de IA por meio de suas soluções avançadas de hardware e software.