Subscribe to get weekly email with the most promising tools 🚀

Instella-image-0
Instella-image-1
Instella-image-2

Descrição

Instella é uma família de modelos de linguagem de última geração com 3 bilhões de parâmetros, totalmente abertos, desenvolvidos pela AMD, treinados do zero em GPUs AMD Instinct MI300X. Esses modelos superam significativamente os modelos totalmente abertos existentes de tamanhos semelhantes e alcançam desempenho competitivo em comparação com modelos de peso aberto de última geração. Os modelos Instella são projetados para promover a inovação e a colaboração dentro da comunidade de IA, fornecendo acesso de código aberto aos pesos do modelo, configurações de treinamento, conjuntos de dados e código.

Como usar Instella?

Para usar os modelos Instella, desenvolvedores e pesquisadores podem acessar os pesos do modelo e as configurações de treinamento no repositório do GitHub fornecido. Os usuários podem implementar os modelos em suas aplicações seguindo as diretrizes e exemplos disponíveis na documentação.

Recursos principais de Instella:

1️⃣

3 bilhões de parâmetros para processamento avançado de linguagem

2️⃣

Treinado em GPUs AMD Instinct MI300X para alto desempenho

3️⃣

Totalmente de código aberto com pesos de modelo e dados de treinamento acessíveis

4️⃣

Suporta técnicas de treinamento eficientes como FlashAttention2 e Paralelismo de Dados Totalmente Fragmentado

5️⃣

Desempenho competitivo em relação a modelos de última geração como Llama e Qwen.

Por que usar Instella?

#Caso de usoStatus
# 1Compreensão e geração de linguagem natural
# 2Seguir instruções e aplicações interativas de IA
# 3Pesquisa e desenvolvimento em IA e aprendizado de máquina.

Desenvolvido por Instella?

A AMD (Advanced Micro Devices) é uma empresa líder em semicondutores que desenvolve processadores de computador e tecnologias relacionadas para mercados empresariais e de consumo. A empresa está comprometida com iniciativas de código aberto e com a promoção da inovação na comunidade de IA por meio de suas soluções avançadas de hardware e software.

FAQ de Instella