想给自己的网站加AI功能但不想花钱?Cloudflare Workers AI的免费套餐可能是目前最适合站长的方案——每天1万次免费推理请求,支持Llama、Mistral等主流开源模型,冷启动时间低于5毫秒。
什么是Cloudflare Workers AI
Workers AI是Cloudflare的边缘AI推理平台。它把开源大模型部署在Cloudflare全球300+个数据中心的GPU上,你的请求会在离用户最近的节点执行。简单说就是:全球CDN + GPU推理 + 按请求计费。
与直接调用OpenAI或Anthropic的API相比,Workers AI的优势在于:
- 低延迟:请求在边缘节点处理,不用绕到美国西海岸
- 免费额度大方:每天1万次免费推理,小站长基本够用
- 无冷启动:V8 Isolates技术,启动时间<5ms,比传统容器快100倍
- 无需管理GPU:不用自己租服务器、装驱动、配CUDA
支持的模型
Workers AI目前支持的模型包括:
- @cf/meta/llama-3.3-70b-instruct:Meta的Llama 3.3 70B,适合通用对话和文本生成
- @cf/mistralai/mistral-7b-instruct-v0.1:Mistral 7B,轻量快速
- @cf/qwen/qwen2.5-coder-32b-instruct:通义千问Coder,代码生成
- @cf/google/gemma-2-9b-it:Google Gemma 2 9B
- 以及更多文本嵌入、图像、语音模型
5分钟接入教程
第一步:注册Cloudflare账号
访问 dash.cloudflare.com 注册,不需要绑信用卡。
第二步:创建Worker
# 安装Wrangler CLI
npm install -g wrangler
# 登录
wrangler login
# 创建项目
wrangler create my-ai-worker
cd my-ai-worker
第三步:编写AI调用代码
// src/index.js
export default {
async fetch(request, env) {
const response = await env.AI.run(
'@cf/meta/llama-3.3-70b-instruct',
{
messages: [
{ role: 'system', content: '你是一个有用的助手' },
{ role: 'user', content: '用一句话解释什么是CDN' }
],
max_tokens: 256
}
);
return new Response(JSON.stringify(response), {
headers: { 'Content-Type': 'application/json' }
});
}
}
第四步:配置wrangler.toml
name = "my-ai-worker"
main = "src/index.js"
compatibility_date = "2024-01-01"
[ai]
binding = "AI"
第五步:部署
wrangler deploy
部署完成后,你的AI API就上线了。Cloudflare会给你一个 https://my-ai-worker.your-subdomain.workers.dev 的URL。
实际使用场景
场景1:网站智能客服——把常见问题和回答作为system prompt,用Workers AI处理用户提问。每天1万次免费额度足够中小站长使用。
场景2:内容摘要——给文章自动生成摘要,展示在列表页。用Llama 3.3处理长文本,延迟在200-500ms。
场景3:代码高亮解释——技术博客中嵌入代码块的AI解释功能,用Qwen Coder模型处理。
免费额度够用吗
每天1万次推理请求,换算一下:
- 如果每个用户访问触发1次AI调用,可以服务1万UV/天
- 如果做内容摘要,可以处理约500篇文章(每次调用约20次推理)
- 如果做智能客服,按平均每个会话5轮对话算,可以服务2000个会话/天
对大多数个人站长和小型项目来说,免费额度绰绰有余。超出部分按token计费,价格也比主流API便宜不少。
本文参考来源:Cloudflare Workers AI 官方文档
















暂无评论内容