原文链接:https://www.chenweiliang.com/cwl-34244.html
文章目录
前两天我在折腾一个个人项目,想搭个AI助手,就需要调用大模型。一问价格,好家伙,GPT-4o一次调用几毛钱,要是我们这项目真跑起来,一个月光API费就得大几千。
我们就寻思,有没有什么便宜的路子。
然后我们就翻到了Cloudflare Workers AI。其实之前就知道Cloudflare搞了AI推理,但一直没当回事,觉得大厂的东西肯定得收费吧。结果一看,好家伙,每天白送10000 Neurons。
10000 Neurons什么概念?差不多几百次对话或几百次图像生成,一天。个人玩完全够了。
当时我就来劲了,立马去研究了一波。
Cloudflare Workers AI 是什么?

Cloudflare Workers AI这玩意,怎么说呢,我觉得它的定位挺有意思的。它不是一个单纯的模型提供商,它是一个跑在Cloudflare全球边缘网络上的AI推理平台。300多个城市的边缘节点,离用户贼近。
你想想看,你用OpenAI的API,请求先跑去美国,处理完再回来,一趟三四百毫秒。Cloudflare这个,因为它本身就是做CDN的,全球到处都有节点,你人在哪,它就在离你最近的节点上跑模型。
典型响应不到100毫秒。这个差距,体感上很明显。
而且它有个很骚的地方,就是冷启动是毫秒级的,自动扩缩容。流量突然爆了也不会卡,不像有些平台凌晨三点没人用的时候响应快得要死,白天一高峰直接炸了。
50+ 模型,覆盖全场景
支持的模型也很多,2026年6月这个时间点,已经有50多个了。
文本对话这块,Llama 3、Llama 4、Mistral、GLM、Qwen、Gemma、deepseek-r1都有。图像生成有Stable Diffusion、FLUX、Pixverse。语音方面有Whisper语音转文字,也有TTS文字转语音,甚至还有视频生成。
而且它的API设计得很干净。不管用什么模型,都是统一的一个接口,改一下模型名就行。
env.AI.run(“模型名”, …)
一行代码换模型,太舒服了。
价格极便宜,免费额度友好
价格这块我也算了一下。免费额度每天10000 Neurons,个人折腾完全够了。如果要付费,0.011美元1000 Neurons,比OpenAI便宜60%到90%。而且它是按Neuron计费的,不是按token,小对话更划算。
这个计费方式,说实话我觉得挺良心的。你简简单单聊两句和一个超长上下文,花的Neurons不一样,但差别不会像token计费那么离谱。
说到这你可能想问,那到底怎么用?
我亲自走了一遍流程,给你说说。
注册与创建 API 令牌
第一步,先注册Cloudflare账号。有账号的直接登录就行,没有的话注册一个也不麻烦,填个邮箱设个密码就完事了。
登录之后,点左边菜单的AI,再点Workers AI。

进去之后会看到一个创建API令牌的按钮,点一下就能生成令牌。

这里有个细节要注意一下,生成的令牌只有创建的时候能看到一次,一定要保存好。页面同时还会给你一个账户ID,这两个东西后面都要用。

保存好之后,页面下面会有调用示例,就是curl命令。把账户ID和APIKEY替换进去就行。命令长这样:
curl \
https://api.cloudflare.com/client/v4/accounts/账户ID/ai/run/@cf/模型ID \
-H "Authorization: Bearer 刚才生成的APIKEY" \
-d '"messages":["role":"system","content":"You are a friendly assistant that helps write stories","role":"user","content":"Write a short story about a llama that goes on a journey to find an orange cloud"]'
查看可用模型列表
然后问题来了,模型ID去哪看?
在Workers AI页面右边有个文档按钮。

点进去找到Models这个分类,那里是所有模型的列表。

选一个你想用的,点进去就能看到模型ID。

测试调用 kimi2.6 模型
我选择用kimi2.6来测试一下。把模型ID复制出来,替换到curl命令里,从@cf开始替换。
请求发出去,很快就返回了结果。

响应速度确实很快,比我想象中要流畅。
说实话,我就是想看看这个免费额度到底能干什么,结果发现还挺能打的。日常聊天、内容生成、翻译、写代码,这些场景完全够用。
而且你想想,这玩意跑在边缘节点上,你部署一个AI应用,用户遍布全国甚至全球,响应速度都能保持一致,不用考虑区域部署的问题。对于个人开发者和小团队来说,这个吸引力太大了。
以前你要跑模型,要么自己买GPU搭建,贵得要死,要么用云厂商的GPU实例,配置起来麻烦。Cloudflare这个,直接给你封装好了,你写代码调用就行,后面那些乱七八糟的事都帮你处理了。
我觉得这个思路是对的。AI能力会越来越像水电一样的基础设施,你不需要知道电是怎么发的,插上就能用。Cloudflare Workers AI就是把这个「插上就能用」做得更极致了一点。
当然它也不是没有缺点。免费额度只有10000 Neurons,真要上生产环境,流量大的话还是要付费的。而且模型虽然有50多个,但跟OpenAI那种啥都有的生态比起来,还是有些小众模型或者最新的模型不支持。
但对于个人项目、小工具、或者只是好奇心驱动的尝试,我觉得已经完全够用了。
以上就是我的真实体验。既然看到这里了,如果觉得不错,随手点赞、转发吧,如果想第一时间收到推送,也可以给我个关注⭐~
谢谢你看我的文章,我们,下次再见。
欢迎转载《Cloudflare Workers AI免费调用API全流程:注册、配置、上线一步到位》
欢迎分享本文链接:https://www.chenweiliang.com/cwl-34244.html
网站地址:https://www.chenweiliang.com/
欲获取更多资讯内幕和秘技,欢迎进入Telegram频道:https://www.chenweiliang.com/go/tgchannel


