Mistral Large
Mistral 7B 是一个强大的语言模型,具有73B参数,在各种基准测试中表现优异。它可以轻松进行微调以适应不同任务,并在Apache 2.0许可下提供。
列在类别中:
开发工具开源人工智能描述
Mistral 7B是迄今为止规模最大的73B参数模型,它在所有基准测试中均优于Llama 2 13B,在许多基准测试中也优于Llama 1 34B。它在处理代码时接近CodeLlama 7B的性能,同时在英语任务上表现良好。Mistral 7B使用Groupedquery attention (GQA)进行更快的推理,使用Sliding Window Attention (SWA)处理更长的序列,成本更低。
如何使用 Mistral Large?
您可以在任何地方下载Mistral 7B并使用它,包括在本地使用我们的参考实现,也可以在任何云平台(如AWS、GCP、Azure)上部署使用vLLM推理服务器和skypilot。Mistral 7B易于在任何任务上进行微调,我们还提供了一个微调用于聊天的模型作为演示,该模型优于Llama 2 13B的聊天性能。
核心功能 Mistral Large:
1️⃣
73B参数模型
2️⃣
优于Llama 2 13B和Llama 1 34B
3️⃣
逼近CodeLlama 7B性能
4️⃣
使用Groupedquery attention (GQA)
5️⃣
使用Sliding Window Attention (SWA)
为什么要使用 Mistral Large?
# | 使用案例 | 状态 | |
---|---|---|---|
# 1 | 用于代码处理 | ✅ | |
# 2 | 用于英语任务 | ✅ | |
# 3 | 用于快速推理 | ✅ |
开发者 Mistral Large?
Mistral AI团队自豪地发布了Mistral 7B,这是迄今为止规模最大的语言模型,具有强大的性能。