MARS5 TTS
MARS5 là một mô hình nói mới cho cú pháp điên rồ.
Liệt kê trong các danh mục:
GitHubKỹ thuật phần mềmTrí tuệ nhân tạoMô tả
MARS5 là một mô hình TTS tiếng Anh mới lạ từ CAMBAI. Nó tuân theo một đường ống AR-NAR hai giai đoạn với một thành phần NAR độc đáo, cho phép nó tạo ra giọng nói cho các tình huống về ngữ điệu khó khăn và đa dạng như bình luận thể thao và anime. Mô hình có thể được điều khiển bằng dấu câu và viết hoa để hướng dẫn ngữ điệu của đầu ra. Định danh người nói có thể được chỉ định bằng cách sử dụng tệp âm thanh tham chiếu, nâng cao chất lượng đầu ra.
Cách sử dụng MARS5 TTS?
Để sử dụng MARS5, tải các mô hình AR và NAR từ torch hub, chọn một tệp âm thanh tham chiếu và tùy chọn là văn bản của nó, chọn giữa sao chép nông hoặc sâu để suy luận, và thực hiện tổng hợp để tạo ra đầu ra giọng nói. Tinh chỉnh cài đặt suy luận để có kết quả tối ưu.
Tính năng chính của MARS5 TTS:
1️⃣
Đường ống AR-NAR hai giai đoạn
2️⃣
Hướng dẫn ngữ điệu với dấu câu và viết hoa
3️⃣
Chỉ định định danh người nói
4️⃣
Sao chép sâu để cải thiện chất lượng
5️⃣
Tinh chỉnh cài đặt suy luận
Tại sao nên sử dụng MARS5 TTS?
# | Trường hợp sử dụng | Trạng thái | |
---|---|---|---|
# 1 | Bình luận thể thao | ✅ | |
# 2 | Lồng tiếng anime | ✅ | |
# 3 | Sao chép giọng | ✅ |
Do ai phát triển MARS5 TTS?
CAMBAI là một nhóm nghiên cứu của các kỹ sư trước đây của Carnegie Mellon đã công bố tại Interspeech, tận tâm với việc làm cho giọng nói của mọi người trở nên quan trọng. Họ chào đón sự đóng góp tích cực và sẵn lòng hợp tác.