Subscribe to get weekly email with the most promising tools 🚀

Mistral Large

Mistral 7B 是一个强大的语言模型,具有73B参数,在各种基准测试中表现优异。它可以轻松进行微调以适应不同任务,并在Apache 2.0许可下提供。

列在类别中:

开发工具开源人工智能
Mistral Large-image-0
Mistral Large-image-1
Mistral Large-image-2

描述

Mistral 7B是迄今为止规模最大的73B参数模型,它在所有基准测试中均优于Llama 2 13B,在许多基准测试中也优于Llama 1 34B。它在处理代码时接近CodeLlama 7B的性能,同时在英语任务上表现良好。Mistral 7B使用Groupedquery attention (GQA)进行更快的推理,使用Sliding Window Attention (SWA)处理更长的序列,成本更低。

如何使用 Mistral Large?

您可以在任何地方下载Mistral 7B并使用它,包括在本地使用我们的参考实现,也可以在任何云平台(如AWS、GCP、Azure)上部署使用vLLM推理服务器和skypilot。Mistral 7B易于在任何任务上进行微调,我们还提供了一个微调用于聊天的模型作为演示,该模型优于Llama 2 13B的聊天性能。

核心功能 Mistral Large:

1️⃣

73B参数模型

2️⃣

优于Llama 2 13B和Llama 1 34B

3️⃣

逼近CodeLlama 7B性能

4️⃣

使用Groupedquery attention (GQA)

5️⃣

使用Sliding Window Attention (SWA)

为什么要使用 Mistral Large?

#使用案例状态
# 1用于代码处理
# 2用于英语任务
# 3用于快速推理

开发者 Mistral Large?

Mistral AI团队自豪地发布了Mistral 7B,这是迄今为止规模最大的语言模型,具有强大的性能。

常见问题 Mistral Large