Instella
Instellaは、AMDによって開発された、完全にオープンで最先端の30億パラメータの言語モデルのファミリーです.
カテゴリーにリストされています:
オープンソース人工知能GitHub


説明
Instellaは、AMDによって開発された、最先端の30億パラメータの言語モデルのファミリーであり、AMD Instinct MI300X GPU上でゼロからトレーニングされています。これらのモデルは、同様のサイズの既存の完全オープンモデルを大幅に上回り、最先端のオープンウェイトモデルと競争力のあるパフォーマンスを達成します。Instellaモデルは、モデルの重み、トレーニング構成、データセット、コードへのオープンソースアクセスを提供することで、AIコミュニティ内のイノベーションとコラボレーションを促進するように設計されています。
使い方 Instella?
Instellaモデルを使用するには、開発者や研究者は提供されたGitHubリポジトリからモデルの重みとトレーニング構成にアクセスできます。ユーザーは、ドキュメントに記載されたガイドラインや例に従って、アプリケーションにモデルを実装できます。
の主な機能 Instella:
1️⃣
高度な言語処理のための30億パラメータ
2️⃣
高性能のためにAMD Instinct MI300X GPUでトレーニング
3️⃣
アクセス可能なモデルの重みとトレーニングデータを持つ完全オープンソース
4️⃣
FlashAttention2やFully Sharded Data Parallelismなどの効率的なトレーニング技術をサポート
5️⃣
LlamaやQwenなどの最先端モデルに対して競争力のあるパフォーマンス。
なぜ使用するのか Instella?
# | ユースケース | ステータス | |
---|---|---|---|
# 1 | 自然言語の理解と生成 | ✅ | |
# 2 | 指示に従うインタラクティブなAIアプリケーション | ✅ | |
# 3 | AIと機械学習における研究開発。 | ✅ |
開発者 Instella?
AMD(Advanced Micro Devices)は、ビジネスおよび消費者市場向けにコンピュータプロセッサおよび関連技術を開発するリーディング半導体企業です。同社はオープンソースの取り組みと、先進的なハードウェアおよびソフトウェアソリューションを通じてAIコミュニティのイノベーションを促進することにコミットしています。