Cloudflare Workers AI为开发者提供了慷慨的免费额度:每天10000次Neurons推理调用。对于想要低成本接入AI能力的站长来说,这可能是目前最划算的方案之一。本文实测了Workers AI的使用体验和限制。
免费额度详情
Cloudflare Workers AI的免费额度包括:
- 每天10000次Neurons:Neurons是Cloudflare的推理计量单位,不同模型消耗不同
- 支持多种模型:包括Llama 3、Mistral、Phi、Gemma等开源模型
- 全球边缘网络:推理在Cloudflare的全球边缘节点执行,延迟低
- 无需GPU服务器:不需要自己购买和管理GPU资源
支持的模型
Workers AI支持多种开源模型,以下是常用的几个:
- @cf/meta/llama-3-8b-instruct:Meta的Llama 3 8B模型,通用对话
- @cf/mistralai/mistral-7b-instruct-v0.1:Mistral 7B模型,速度快
- @cf/microsoft/phi-2:微软Phi-2模型,轻量级
- @cf/google/gemma-2b-it:Google Gemma 2B模型,超轻量
- @cf/qwen/qwen1.5-14b-chat-awq:通义千问14B,中文表现好
快速接入教程
接入Cloudflare Workers AI非常简单:
第一步:创建Worker
# 安装Wrangler CLI
npm install -g wrangler
# 创建项目
npm create cloudflare@latest my-ai-worker
cd my-ai-worker
第二步:编写Worker代码
export default {
async fetch(request, env) {
const response = await env.AI.run(
"@cf/meta/llama-3-8b-instruct",
{
messages: [
{ role: "system", content: "你是一个有用的助手" },
{ role: "user", content: "用一句话介绍Cloudflare Workers AI" }
]
}
);
return new Response(JSON.stringify(response));
}
};
第三步:配置和部署
在wrangler.toml中添加AI绑定:
name = "my-ai-worker"
main = "src/index.js"
compatibility_date = "2024-01-01"
[ai]
binding = "AI"
然后部署:
npx wrangler deploy
实际使用场景
Workers AI适合以下站长场景:
- 智能客服:为网站添加AI客服机器人,每天10000次调用足够中小站点使用
- 内容审核:自动审核用户评论和投稿内容
- 文本摘要:为长文章自动生成摘要
- 翻译服务:提供多语言翻译能力
- 代码助手:为技术博客添加代码解释功能
注意事项
- Neurons消耗:不同模型消耗的Neurons不同,大模型消耗更多。8B模型每次调用约消耗30-50 Neurons,每天10000次约可调用200-300次
- 输出长度限制:单次调用的输出token数有上限
- 模型可用性:部分模型可能在某些区域不可用
- 不适合训练:Workers AI只提供推理服务,不支持模型训练和微调
- 超出免费额度:超出后按Neurons数量计费,价格约为每百万Neurons 0.011美元
与其他免费AI服务对比
- vs Google Colab:Colab需要运行Jupyter Notebook,Workers AI是API调用,更灵活
- vs Hugging Face:Hugging Face的免费推理有冷启动延迟,Workers AI在边缘执行,延迟更低
- vs Groq:Groq速度更快但免费额度有限,Workers AI额度更慷慨
本文参考来源:Cloudflare Workers AI官方文档
© 版权声明
THE END













暂无评论内容