Subscribe to get weekly email with the most promising tools 🚀

Instella-image-0
Instella-image-1
Instella-image-2

Deskripsi

Instella adalah keluarga model bahasa dengan 3 miliar parameter yang sepenuhnya terbuka dan canggih yang dikembangkan oleh AMD, dilatih dari awal pada GPU AMD Instinct MI300X. Model-model ini secara signifikan mengungguli model-model terbuka yang ada dengan ukuran serupa dan mencapai kinerja yang kompetitif dibandingkan dengan model-model dengan bobot terbuka yang canggih. Model-model Instella dirancang untuk mendorong inovasi dan kolaborasi dalam komunitas AI dengan menyediakan akses sumber terbuka ke bobot model, konfigurasi pelatihan, dataset, dan kode.

Cara menggunakan Instella?

Untuk menggunakan model Instella, pengembang dan peneliti dapat mengakses bobot model dan konfigurasi pelatihan dari repositori GitHub yang disediakan. Pengguna dapat menerapkan model dalam aplikasi mereka dengan mengikuti pedoman dan contoh yang tersedia dalam dokumentasi.

Fitur inti dari Instella:

1️⃣

3 miliar parameter untuk pemrosesan bahasa yang canggih

2️⃣

Dilatih pada GPU AMD Instinct MI300X untuk kinerja tinggi

3️⃣

Sepenuhnya sumber terbuka dengan bobot model dan data pelatihan yang dapat diakses

4️⃣

Mendukung teknik pelatihan efisien seperti FlashAttention2 dan Fully Sharded Data Parallelism

5️⃣

Kinerja kompetitif dibandingkan dengan model-model canggih seperti Llama dan Qwen.

Mengapa bisa digunakan Instella?

#Kasus PenggunaanStatus
# 1Pemahaman dan generasi bahasa alami
# 2Mengikuti instruksi dan aplikasi AI interaktif
# 3Penelitian dan pengembangan dalam AI dan pembelajaran mesin.

Dikembangkan oleh Instella?

AMD (Advanced Micro Devices) adalah perusahaan semikonduktor terkemuka yang mengembangkan prosesor komputer dan teknologi terkait untuk pasar bisnis dan konsumen. Perusahaan ini berkomitmen pada inisiatif sumber terbuka dan mendorong inovasi dalam komunitas AI melalui solusi perangkat keras dan perangkat lunak canggihnya.

FAQ dari Instella