Subscribe to get weekly email with the most promising tools 🚀

Instella-image-0
Instella-image-1
Instella-image-2

Descripción

Instella es una familia de modelos de lenguaje de última generación con 3 mil millones de parámetros, desarrollados por AMD, entrenados desde cero en GPUs AMD Instinct MI300X. Estos modelos superan significativamente a los modelos completamente abiertos existentes de tamaños similares y logran un rendimiento competitivo en comparación con los modelos de peso abierto de última generación. Los modelos Instella están diseñados para fomentar la innovación y la colaboración dentro de la comunidad de IA al proporcionar acceso de código abierto a los pesos del modelo, configuraciones de entrenamiento, conjuntos de datos y código.

Cómo usar Instella?

Para usar los modelos Instella, los desarrolladores e investigadores pueden acceder a los pesos del modelo y las configuraciones de entrenamiento desde el repositorio de GitHub proporcionado. Los usuarios pueden implementar los modelos en sus aplicaciones siguiendo las pautas y ejemplos disponibles en la documentación.

Características principales de Instella:

1️⃣

3 mil millones de parámetros para procesamiento avanzado del lenguaje

2️⃣

Entrenados en GPUs AMD Instinct MI300X para un alto rendimiento

3️⃣

Totalmente de código abierto con pesos de modelo y datos de entrenamiento accesibles

4️⃣

Soporta técnicas de entrenamiento eficientes como FlashAttention2 y Paralelismo de Datos Totalmente Fragmentado

5️⃣

Rendimiento competitivo contra modelos de última generación como Llama y Qwen.

Por qué podría ser usado Instella?

#Caso de UsoEstado
# 1Comprensión y generación de lenguaje natural
# 2Seguimiento de instrucciones y aplicaciones interactivas de IA
# 3Investigación y desarrollo en IA y aprendizaje automático.

Desarrollado por Instella?

AMD (Advanced Micro Devices) es una empresa líder en semiconductores que desarrolla procesadores de computadora y tecnologías relacionadas para mercados empresariales y de consumo. La empresa está comprometida con iniciativas de código abierto y con fomentar la innovación en la comunidad de IA a través de sus soluciones avanzadas de hardware y software.

Preguntas frecuentes de Instella