Instella
Instella adalah keluarga model bahasa sepenuhnya terbuka dan mutakhir dengan 3 miliar parameter yang dikembangkan oleh AMD.
Terdaftar dalam kategori:
Sumber TerbukaKecerdasan buatanGitHub


Deskripsi
Instella adalah keluarga model bahasa dengan 3 miliar parameter yang sepenuhnya terbuka dan canggih yang dikembangkan oleh AMD, dilatih dari awal pada GPU AMD Instinct MI300X. Model-model ini secara signifikan mengungguli model-model terbuka yang ada dengan ukuran serupa dan mencapai kinerja yang kompetitif dibandingkan dengan model-model dengan bobot terbuka yang canggih. Model-model Instella dirancang untuk mendorong inovasi dan kolaborasi dalam komunitas AI dengan menyediakan akses sumber terbuka ke bobot model, konfigurasi pelatihan, dataset, dan kode.
Cara menggunakan Instella?
Untuk menggunakan model Instella, pengembang dan peneliti dapat mengakses bobot model dan konfigurasi pelatihan dari repositori GitHub yang disediakan. Pengguna dapat menerapkan model dalam aplikasi mereka dengan mengikuti pedoman dan contoh yang tersedia dalam dokumentasi.
Fitur inti dari Instella:
1️⃣
3 miliar parameter untuk pemrosesan bahasa yang canggih
2️⃣
Dilatih pada GPU AMD Instinct MI300X untuk kinerja tinggi
3️⃣
Sepenuhnya sumber terbuka dengan bobot model dan data pelatihan yang dapat diakses
4️⃣
Mendukung teknik pelatihan efisien seperti FlashAttention2 dan Fully Sharded Data Parallelism
5️⃣
Kinerja kompetitif dibandingkan dengan model-model canggih seperti Llama dan Qwen.
Mengapa bisa digunakan Instella?
# | Kasus Penggunaan | Status | |
---|---|---|---|
# 1 | Pemahaman dan generasi bahasa alami | ✅ | |
# 2 | Mengikuti instruksi dan aplikasi AI interaktif | ✅ | |
# 3 | Penelitian dan pengembangan dalam AI dan pembelajaran mesin. | ✅ |
Dikembangkan oleh Instella?
AMD (Advanced Micro Devices) adalah perusahaan semikonduktor terkemuka yang mengembangkan prosesor komputer dan teknologi terkait untuk pasar bisnis dan konsumen. Perusahaan ini berkomitmen pada inisiatif sumber terbuka dan mendorong inovasi dalam komunitas AI melalui solusi perangkat keras dan perangkat lunak canggihnya.