Kitten TTS：25MB 大小、纯 CPU 运行的开源语音合成模型

5天前更新

03515

语音合成（TTS）工具这两年越来越多，但大多数要么需要 GPU，要么模型体积大得吓人。最近在 Hacker News 上看到一个叫 Kitten TTS 的开源项目，只有 25MB 大小，纯 CPU 就能跑，效果据说还不错。对于想在自己项目里加语音功能的站长来说，这个值得一试。

项目介绍

Kitten TTS 是一个轻量级的开源文本转语音模型，主打”小而能用”。整个模型只有 25MB 左右，不需要 GPU，普通 CPU 就能实时生成语音。

项目地址：https://github.com/KittenML/KittenTTS

功能亮点

超小体积：模型只有 25MB，下载秒完，部署不占空间
纯 CPU 推理：不需要 GPU，普通服务器、甚至树莓派都能跑
多种声音：内置多种预设声音，男女声都有
支持流式输出：可以边生成边播放，不用等全部生成完
Python SDK：提供 pip 安装的 Python 包，几行代码就能用
MIT 许可：商用也没问题

安装和使用

安装

用 pip 直接安装：

pip install kitten-tts

基本用法

最简单的用法就是三行代码：

from kitten_tts import KittenTTS

model = KittenTTS()
audio = model.generate("你好，这是一段测试语音。")
model.save(audio, "output.wav")

运行后会在当前目录生成一个 output.wav 文件，直接就能播放。

选择不同声音

模型内置了多种声音风格，可以按需选择：

# 查看可用声音
print(model.list_voices())

# 指定声音生成
audio = model.generate("Hello world", voice="female_01")

流式生成

如果文本比较长，可以用流式模式边生成边处理：

for chunk in model.stream("这是一段很长的文本..."):
    # 每个 chunk 是一小段音频数据
    process_audio_chunk(chunk)

部署到服务器

如果你想在自己的网站上提供 TTS 服务，可以这样部署：

用 FastAPI 包装成 HTTP 接口

from fastapi import FastAPI
from fastapi.responses import Response
from kitten_tts import KittenTTS

app = FastAPI()
model = KittenTTS()

@app.get("/tts")
async def text_to_speech(text: str):
    audio = model.generate(text)
    return Response(content=audio, media_type="audio/wav")

这样部署后，前端只需要请求 /tts?text=你好 就能拿到语音文件。

Docker 部署

FROM python:3.11-slim
WORKDIR /app
RUN pip install kitten-tts fastapi uvicorn
COPY main.py .
CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8000"]

适合什么场景

网站语音播报：给文章加上”听全文”功能
聊天机器人：让 AI 客服能开口说话
无障碍功能：为视障用户提供语音导航
嵌入式设备：树莓派、NAS 等低算力设备上的语音交互
本地 AI 助手：配合 Ollama 等本地模型，做一个能说话的助手

限制和注意事项

作为轻量模型，语音自然度比不上 ElevenLabs、Azure TTS 这类商业服务
中文支持情况需要实际测试，目前主要优化的是英文
25MB 模型的质量和几千兆的大模型肯定有差距，但”够用”场景下性价比很高
长时间运行的生产环境建议用 GPU 加速，纯 CPU 在高并发下会比较慢

简评

Kitten TTS 的定位很清晰：不追求最好，追求”小而能用”。25MB 的体积和纯 CPU 推理这两个特点，让它特别适合资源有限但又想加语音功能的场景。如果你之前因为 TTS 方案太重而放弃，可以试试这个。MIT 许可也很友好，商用没问题。

来源：
GitHub – KittenML/KittenTTS
Hacker News 讨论

文章版权声明 1、本网站名称：枫选
2、本站永久网址：https://feng.cx
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6、本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END

开源项目

喜欢就支持一下吧

架构设计

TradingAgents的设计借鉴了真实金融交易团队的分工模式，将不同职责分配给不同的Agent：

分析师Agent：负责分析市场数据、财报、新闻等信息，产出分析报告。
研究员Agent：深入研究特定行业或公司，提供基本面分析。
交易员Agent：根据分析结果制定交易策略和执行计划。
风控Agent：评估交易风险，设置止损和仓位控制。
决策Agent：综合各方意见，做出最终交易决策。

这种多Agent协作的模式，模拟了真实对冲基金的决策流程。每个Agent可以使用不同的LLM模型，甚至可以使用同一模型的不同温度参数来产生多样化的观点。

使用场景

学术研究

TradingAgents是研究多Agent系统在金融领域应用的优秀平台。研究人员可以修改Agent的提示词、调整协作机制、测试不同的决策算法。

策略回测

框架支持接入历史市场数据，可以用来回测AI交易策略的表现。这对于量化交易团队评估AI辅助决策的价值很有帮助。

学习和教育

对于想了解AI在金融领域应用的开发者，TradingAgents是一个很好的学习项目。代码结构清晰，文档完善，适合上手研究。

安装和运行

# 克隆项目
git clone https://github.com/TauricResearch/TradingAgents.git
cd TradingAgents

# 安装依赖
pip install -r requirements.txt

# 配置API密钥
cp .env.example .env
# 编辑 .env 文件，填入 OpenAI API key

重要风险提示

⚠️ 以下几点需要特别注意：

不要用真金白银：TradingAgents是一个研究和实验框架，不是成熟的交易系统。绝对不要用它来做实盘交易。
AI不是万能的：金融市场受到无数因素影响，AI模型无法预测黑天鹅事件、政策变化、市场情绪等非理性因素。
回测不等于实盘：在历史数据上表现好的策略，在真实交易中可能完全失败（过拟合问题）。
合规风险：在某些司法管辖区，使用AI进行自动化交易可能受到监管限制。

项目简介

TradingAgents是一个开源的多Agent金融交易分析框架，核心思路是让多个AI Agent各司其职，协同完成金融市场的分析和交易决策。项目地址：GitHub – TauricResearch/TradingAgents

架构设计

TradingAgents的设计借鉴了真实金融交易团队的分工模式，将不同职责分配给不同的Agent：

分析师Agent：负责分析市场数据、财报、新闻等信息，产出分析报告。
研究员Agent：深入研究特定行业或公司，提供基本面分析。
交易员Agent：根据分析结果制定交易策略和执行计划。
风控Agent：评估交易风险，设置止损和仓位控制。
决策Agent：综合各方意见，做出最终交易决策。

使用场景

学术研究

TradingAgents是研究多Agent系统在金融领域应用的优秀平台。研究人员可以修改Agent的提示词、调整协作机制、测试不同的决策算法。

策略回测

框架支持接入历史市场数据，可以用来回测AI交易策略的表现。这对于量化交易团队评估AI辅助决策的价值很有帮助。

学习和教育

对于想了解AI在金融领域应用的开发者，TradingAgents是一个很好的学习项目。代码结构清晰，文档完善，适合上手研究。

安装和运行

# 克隆项目
git clone https://github.com/TauricResearch/TradingAgents.git
cd TradingAgents

# 安装依赖
pip install -r requirements.txt

# 配置API密钥
cp .env.example .env
# 编辑 .env 文件，填入 OpenAI API key

重要风险提示

⚠️ 以下几点需要特别注意：

不要用真金白银：TradingAgents是一个研究和实验框架，不是成熟的交易系统。绝对不要用它来做实盘交易。
AI不是万能的：金融市场受到无数因素影响，AI模型无法预测黑天鹅事件、政策变化、市场情绪等非理性因素。
回测不等于实盘：在历史数据上表现好的策略，在真实交易中可能完全失败（过拟合问题）。
合规风险：在某些司法管辖区，使用AI进行自动化交易可能受到监管限制。

核心功能

文档模板：上传PDF文档，通过拖拽方式添加签名框、日期框、文本框等表单字段。
多方签署：支持多个签署人按顺序或并行签署同一文档。
邮件通知：自动发送签署邀请和完成通知邮件。
API接口：提供REST API，可以集成到现有应用中。
Webhook：签署完成后通过Webhook通知你的系统。
审计日志：记录完整的签署过程，包括IP地址、时间戳等。
多语言：支持中文在内的多种语言界面。

Docker部署教程

DocuSeal推荐使用Docker部署，步骤如下：

1. 创建docker-compose.yml

version: "3"
services:
  docuseal:
    image: docuseal/docuseal:latest
    ports:
      - "3000:3000"
    volumes:
      - docuseal-data:/data
    environment:
      - DATABASE_URL=sqlite3:/data/docuseal.sqlite3
      - RAILS_ENV=production
      - SECRET_KEY_BASE=your-random-secret-key-here

volumes:
  docuseal-data:

2. 启动服务

docker-compose up -d

3. 访问初始化

打开浏览器访问 http://your-server:3000，按照向导创建管理员账户。

4. 配置邮件（可选）

在环境变量中添加SMTP配置：

SMTP_ADDRESS=smtp.example.com
SMTP_PORT=587
SMTP_USERNAME=your-email@example.com
SMTP_PASSWORD=your-password
SMTP_DOMAIN=example.com

与DocuSign对比

特性	DocuSeal（自部署）	DocuSign（SaaS）
价格	免费开源	$10-60/月/用户
数据控制	完全在自己服务器	存储在DocuSign云端
自定义	可完全自定义	受限于平台功能
法律效力	取决于当地法律	全球认可
合规认证	需要自行确保	SOC 2、ISO 27001等
维护成本	需要自行运维	平台托管

适合谁使用

中小团队：需要内部合同签署，但不想为每个用户付费。
数据敏感行业：不想将签署文档存储在第三方云端。
定制化需求：需要将签署功能集成到自己的业务系统中。
学习和研究：想了解电子签名系统的技术实现。

注意事项

电子签名的法律效力因国家和地区而异，重要合同建议咨询法律专业人士。
自部署需要自行负责服务器安全、数据备份和SSL证书配置。
对于需要全球法律认可的签署场景，DocuSign等成熟SaaS仍然是更稳妥的选择。

来源：

GitHub – docusealco/docuseal

-枫选">

DocuSign是全球最知名的电子签名服务，但其定价对中小站长和创业团队来说并不友好。DocuSeal是一个开源免费的电子签名平台，GitHub上已获得16000+星标，支持自部署，可以作为DocuSign的替代方案。

项目简介

DocuSeal是一个功能完整的电子签名解决方案，支持创建、发送和签署PDF文档。项目使用Ruby on Rails开发，提供直观的Web界面，适合需要在自己的服务器上部署电子签名服务的团队。

项目地址：GitHub – docusealco/docuseal

核心功能

文档模板：上传PDF文档，通过拖拽方式添加签名框、日期框、文本框等表单字段。
多方签署：支持多个签署人按顺序或并行签署同一文档。
邮件通知：自动发送签署邀请和完成通知邮件。
API接口：提供REST API，可以集成到现有应用中。
Webhook：签署完成后通过Webhook通知你的系统。
审计日志：记录完整的签署过程，包括IP地址、时间戳等。
多语言：支持中文在内的多种语言界面。

Docker部署教程

DocuSeal推荐使用Docker部署，步骤如下：

1. 创建docker-compose.yml

version: "3"
services:
  docuseal:
    image: docuseal/docuseal:latest
    ports:
      - "3000:3000"
    volumes:
      - docuseal-data:/data
    environment:
      - DATABASE_URL=sqlite3:/data/docuseal.sqlite3
      - RAILS_ENV=production
      - SECRET_KEY_BASE=your-random-secret-key-here

volumes:
  docuseal-data:

2. 启动服务

docker-compose up -d

3. 访问初始化

打开浏览器访问 http://your-server:3000，按照向导创建管理员账户。

4. 配置邮件（可选）

在环境变量中添加SMTP配置：

SMTP_ADDRESS=smtp.example.com
SMTP_PORT=587
SMTP_USERNAME=your-email@example.com
SMTP_PASSWORD=your-password
SMTP_DOMAIN=example.com

与DocuSign对比

特性	DocuSeal（自部署）	DocuSign（SaaS）
价格	免费开源	$10-60/月/用户
数据控制	完全在自己服务器	存储在DocuSign云端
自定义	可完全自定义	受限于平台功能
法律效力	取决于当地法律	全球认可
合规认证	需要自行确保	SOC 2、ISO 27001等
维护成本	需要自行运维	平台托管

适合谁使用

中小团队：需要内部合同签署，但不想为每个用户付费。
数据敏感行业：不想将签署文档存储在第三方云端。
定制化需求：需要将签署功能集成到自己的业务系统中。
学习和研究：想了解电子签名系统的技术实现。

注意事项

电子签名的法律效力因国家和地区而异，重要合同建议咨询法律专业人士。
自部署需要自行负责服务器安全、数据备份和SSL证书配置。
对于需要全球法律认可的签署场景，DocuSign等成熟SaaS仍然是更稳妥的选择。

来源：

GitHub – docusealco/docuseal

DocuSign是全球最知名的电子签名服务，但其定价对中小站长和创业团队来说并不友好。DocuSeal...

3天前 49

评论抢沙发

请登录后发表评论

登录注册

暂无评论内容

Kitten TTS：25MB 大小、纯 CPU 运行的开源语音合成模型

项目介绍

功能亮点

安装和使用

安装

基本用法

选择不同声音

流式生成

部署到服务器

用 FastAPI 包装成 HTTP 接口

Docker 部署

适合什么场景

限制和注意事项

简评

架构设计

使用场景

学术研究

策略回测

学习和教育

安装和运行

重要风险提示

同类项目参考

项目简介

架构设计

使用场景

学术研究

策略回测

学习和教育

安装和运行

重要风险提示

同类项目参考

核心功能

Docker部署教程

1. 创建docker-compose.yml

2. 启动服务

3. 访问初始化

4. 配置邮件（可选）

与DocuSign对比

适合谁使用

注意事项

项目简介

核心功能

Docker部署教程

1. 创建docker-compose.yml

2. 启动服务

3. 访问初始化

4. 配置邮件（可选）

与DocuSign对比

适合谁使用

注意事项

请登录后发表评论