Mistral Large
Mistral 7B adalah model bahasa yang kuat dengan 73B parameter yang mengungguli model lain dalam berbagai benchmark. Dapat dengan mudah disesuaikan untuk berbagai tugas dan tersedia di bawah lisensi Apache 2.0.
Terdaftar dalam kategori:
Alat PengembangSumber TerbukaKecerdasan buatanDeskripsi
Mistral 7B adalah model bahasa terkuat dengan parameter 73B yang telah dirilis oleh tim Mistral AI. Model ini memiliki performa yang superior dibandingkan dengan model Llama 2 13B dan Llama 1 34B pada berbagai benchmark. Mistral 7B menggunakan Groupedquery attention (GQA) untuk inferensi yang lebih cepat dan Sliding Window Attention (SWA) untuk menangani urutan yang lebih panjang dengan biaya yang lebih rendah.
Cara menggunakan Mistral Large?
Unduh Mistral 7B dan gunakan di mana saja, termasuk secara lokal dengan implementasi referensi kami. Deploy di cloud mana pun (AWS, GCP, Azure) menggunakan server inferensi vLLM dan skypilot. Gunakan pada HuggingFace. Mudah untuk disesuaikan dengan tugas apa pun.
Fitur inti dari Mistral Large:
1️⃣
Outperforms Llama 2 13B on all benchmarks
2️⃣
Outperforms Llama 1 34B on many benchmarks
3️⃣
Approaches CodeLlama 7B performance on code while remaining good at English tasks
4️⃣
Uses Groupedquery attention (GQA) for faster inference
5️⃣
Uses Sliding Window Attention (SWA) to handle longer sequences at smaller cost
Mengapa bisa digunakan Mistral Large?
# | Kasus Penggunaan | Status | |
---|---|---|---|
# 1 | Finetuning untuk tugas chat | ✅ | |
# 2 | Penggunaan pada berbagai benchmark | ✅ |
Dikembangkan oleh Mistral Large?
Tim Mistral AI dengan bangga merilis Mistral 7B, model bahasa paling kuat untuk ukurannya hingga saat ini.