Subscribe to get weekly email with the most promising tools 🚀

MARS5 TTS-image-0
MARS5 TTS-image-1

Mô tả

MARS5 là một mô hình TTS tiếng Anh mới lạ từ CAMBAI. Nó tuân theo một đường ống AR-NAR hai giai đoạn với một thành phần NAR độc đáo, cho phép nó tạo ra giọng nói cho các tình huống về ngữ điệu khó khăn và đa dạng như bình luận thể thao và anime. Mô hình có thể được điều khiển bằng dấu câu và viết hoa để hướng dẫn ngữ điệu của đầu ra. Định danh người nói có thể được chỉ định bằng cách sử dụng tệp âm thanh tham chiếu, nâng cao chất lượng đầu ra.

Cách sử dụng MARS5 TTS?

Để sử dụng MARS5, tải các mô hình AR và NAR từ torch hub, chọn một tệp âm thanh tham chiếu và tùy chọn là văn bản của nó, chọn giữa sao chép nông hoặc sâu để suy luận, và thực hiện tổng hợp để tạo ra đầu ra giọng nói. Tinh chỉnh cài đặt suy luận để có kết quả tối ưu.

Tính năng chính của MARS5 TTS:

1️⃣

Đường ống AR-NAR hai giai đoạn

2️⃣

Hướng dẫn ngữ điệu với dấu câu và viết hoa

3️⃣

Chỉ định định danh người nói

4️⃣

Sao chép sâu để cải thiện chất lượng

5️⃣

Tinh chỉnh cài đặt suy luận

Tại sao nên sử dụng MARS5 TTS?

#Trường hợp sử dụngTrạng thái
# 1Bình luận thể thao
# 2Lồng tiếng anime
# 3Sao chép giọng

Do ai phát triển MARS5 TTS?

CAMBAI là một nhóm nghiên cứu của các kỹ sư trước đây của Carnegie Mellon đã công bố tại Interspeech, tận tâm với việc làm cho giọng nói của mọi người trở nên quan trọng. Họ chào đón sự đóng góp tích cực và sẵn lòng hợp tác.

Câu hỏi thường gặp MARS5 TTS