Instella
Instella là một gia đình các mô hình ngôn ngữ hoàn toàn mở và tiên tiến với 3 tỷ tham số, được phát triển bởi AMD.
Liệt kê trong các danh mục:
Mã nguồn mởTrí tuệ nhân tạoGitHub


Mô tả
Instella là một gia đình các mô hình ngôn ngữ với 3 tỷ tham số hoàn toàn mở, được phát triển bởi AMD, được đào tạo từ đầu trên các GPU AMD Instinct MI300X. Những mô hình này vượt trội hơn đáng kể so với các mô hình hoàn toàn mở hiện có có kích thước tương tự và đạt được hiệu suất cạnh tranh so với các mô hình trọng số mở tiên tiến. Các mô hình Instella được thiết kế để thúc đẩy đổi mới và hợp tác trong cộng đồng AI bằng cách cung cấp quyền truy cập mã nguồn mở vào trọng số mô hình, cấu hình đào tạo, tập dữ liệu và mã nguồn.
Cách sử dụng Instella?
Để sử dụng các mô hình Instella, các nhà phát triển và nhà nghiên cứu có thể truy cập trọng số mô hình và cấu hình đào tạo từ kho GitHub được cung cấp. Người dùng có thể triển khai các mô hình trong ứng dụng của họ bằng cách làm theo các hướng dẫn và ví dụ có sẵn trong tài liệu.
Tính năng chính của Instella:
1️⃣
3 tỷ tham số cho xử lý ngôn ngữ tiên tiến
2️⃣
Được đào tạo trên các GPU AMD Instinct MI300X để có hiệu suất cao
3️⃣
Hoàn toàn mã nguồn mở với trọng số mô hình và dữ liệu đào tạo có thể truy cập
4️⃣
Hỗ trợ các kỹ thuật đào tạo hiệu quả như FlashAttention2 và Fully Sharded Data Parallelism
5️⃣
Hiệu suất cạnh tranh so với các mô hình tiên tiến như Llama và Qwen.
Tại sao nên sử dụng Instella?
# | Trường hợp sử dụng | Trạng thái | |
---|---|---|---|
# 1 | Hiểu và sinh ngôn ngữ tự nhiên | ✅ | |
# 2 | Theo dõi hướng dẫn và ứng dụng AI tương tác | ✅ | |
# 3 | Nghiên cứu và phát triển trong AI và học máy. | ✅ |
Do ai phát triển Instella?
AMD (Advanced Micro Devices) là một công ty bán dẫn hàng đầu phát triển các bộ xử lý máy tính và các công nghệ liên quan cho thị trường doanh nghiệp và tiêu dùng. Công ty cam kết với các sáng kiến mã nguồn mở và thúc đẩy đổi mới trong cộng đồng AI thông qua các giải pháp phần cứng và phần mềm tiên tiến của mình.