MY Blog
友情链接
往期整理
  •   历史归档
  •   文章分类
  •   文章标签
关于我
ZZB
Article
213
Category
4
Tags
580
友情链接
往期整理
历史归档
文章分类
文章标签
关于我
extract
🚀MaskGCT: 新一代文本转语音开源模型
Post on: 2024-11-11
Last edited: 2024-11-11
Views
人工智能
语音合成
开源
文本转语音
声音克隆
type
status
date
slug
summary
tags
category
icon
password
🔖标签✨概述📄摘要🔗原文链接

🔖标签

人工智能、语音合成、开源、文本转语音、声音克隆

✨概述

港中大(深圳)与趣丸科技联合推出的MaskGCT模型,通过非自回归架构实现高质量、可编辑的语音合成。

📄摘要

MaskGCT是由港中大(深圳)与趣丸科技联合开发的新一代文本转语音(TTS)开源模型。该模型通过非自回归(NAR)架构,解决了传统自回归(AR)和非自回归TTS系统的不足,生成的语音更加自然连贯。MaskGCT支持多种语音特征的控制,包括语音长度、语速、停顿和预期,并能进行语音内容编辑和声音克隆。其两阶段架构首先预测语义tokens,然后生成声学tokens,无需对齐监督即可合成高质量语音。MaskGCT还支持零样本语音内容编辑和语音转换,能够根据参考音频转换语音音色,同时保持语义内容不变。相关资源包括GitHub项目、项目主页、论文和Demo展示。

🔗原文链接

https://mp.weixin.qq.com/s/m2hiJsL7fjCvJ3MB8Bn4WA
  • Author:ZZB
  • URL:https://project-servers.com/article/13be5c82-ebbd-8136-9fba-c7cfa1a19319
  • Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!
Relate Posts
🚀FlowiseAI:快速构建自定义LLM应用的低代码工具
🚀LANDrop:跨平台、安全、高效的局域网文件传输工具
🚀OmniParse - 非结构化数据解析与转换平台
🚀ESP-SparkBot: 基于ESP32-S3的AI桌面机器人
🚀Fish Speech 1.5: 新一代语音合成工具的突破与创新
🚀LobeChat:开源AI工具的多功能集成平台
🚀GitHub 热门开源项目盘点:项目管理、智能家居与API管理🚀Python构建个性化星座运势查询程序
Loading...
ZZB
ZZB
A Coder 🤖
Article
213
Category
4
Tags
580
Latest posts
✨Github热门榜: 2025-12-12
✨Github热门榜: 2025-12-12
2025-12-12
✨Github热门榜: 2025-12-11
✨Github热门榜: 2025-12-11
2025-12-11
✨Github热门榜: 2025-12-10
✨Github热门榜: 2025-12-10
2025-12-10
✨Github热门榜: 2025-12-09
✨Github热门榜: 2025-12-09
2025-12-9
✨Github热门榜: 2025-12-08
✨Github热门榜: 2025-12-08
2025-12-8
✨Github热门榜: 2025-12-07
✨Github热门榜: 2025-12-07
2025-12-7
Announcement
🎉欢迎来到我的博客🎉
-- 感谢您的支持 ---
👏Welcome to my blog👏
联系我们
 
2024-2025 ZZB.
赣ICP备2024046115号

MY Blog | A Coder 🤖