// Free AI API Directory · Updated 2026-06-02 · Verified against official docs & TokenMix.ai

免费 AI API
资源目录 2026

汇集全球 23 个可免费调用的大模型 API 平台,包含精确的 RPM / TPM / RPD / 每日 token 限额,均来自官方文档或 2026 年 4-5 月实测数据。

数据实时更新
🇨🇳 13 个国内直连平台
🌐 8 个国际平台
🖼️ 3 个图像生成专用
📊 含精确限额 RPM/TPM/RPD
筛选
24
当前显示平台数
12
国内直连平台
100万
Cerebras 每日免费 token(最多)
$0
基础使用费用

🇨🇳 国内平台 · 无需翻墙直连

13 个
🔥
硅基流动 SiliconCloud
cloud.siliconflow.cn
国内直连 注册赠 token 支持图像生成 ⚡ 低延迟
国内首推聚合平台,支持 DeepSeek-V3/R1、Qwen3 全系、GLM-4、FLUX 图像生成等,新用户注册赠免费 token,OpenAI 格式兼容,延迟极低。
项目额度 / 限制
注册赠送免费 token(注册立得,无时限)
图像生成支持 FLUX.1-schnell,付费 ≈¥0.1/张
API 格式OpenAI 兼容
信用卡不需要
from openai import OpenAI
client = OpenAI(
    api_key="sk-你的硅基流动Key",
    base_url="https://api.siliconflow.cn/v1",
)
resp = client.chat.completions.create(
    model="deepseek-ai/DeepSeek-V3",
    messages=[{"role":"user","content":"你好!"}],
)
print(resp.choices[0].message.content)
import requests
resp = requests.post(
    "https://api.siliconflow.cn/v1/images/generations",
    headers={"Authorization":"Bearer sk-你的Key"},
    json={"model":"black-forest-labs/FLUX.1-schnell",
          "prompt":"a cat on the moon",
          "image_size":"1024x1024"},
)
print(resp.json()["data"][0]["url"])
获取 API Key 注册 → 右上角头像 → API Keys
🌋
火山引擎(字节·方舟)
volcengine.com/product/ark
国内直连 200万 token/天 ⚡ 每天重置
字节跳动旗下,每天赠 200 万 token 且每天重置,支持豆包 MoE、DeepSeek-V3/R1、Qwen3,是国内额度最慷慨的永久免费平台,适合自动化任务。
项目额度 / 限制
每日 token200万,每天 00:00 重置(永久)
适用模型豆包 MoE、DeepSeek-V3/R1、Qwen3
API 格式OpenAI 兼容
信用卡不需要
注意需在控制台创建「接入点」获取 endpoint-id
from openai import OpenAI
client = OpenAI(
    api_key="你的火山引擎 API Key",
    base_url="https://ark.cn-beijing.volces.com/api/v3",
)
resp = client.chat.completions.create(
    model="ep-你的endpoint-id", # 控制台创建接入点
    messages=[{"role":"user","content":"你好!"}],
)
print(resp.choices[0].message.content)
获取 API Key 方舟控制台 → API Key 管理 → 创建接入点
🧠
智谱 AI(Z.ai / BigModel)
bigmodel.cn
国内直连 2000万 token + 永久免费模型
实名认证后赠 2000 万 token,GLM-4-Flash 完全永久免费(不扣额度),GLM-5 系列能力强。
项目额度 / 限制
注册赠送2000万 token(实名认证后)
永久免费模型GLM-4-Flash(永不扣费)
GLM-4-Flash RPM60 RPM
API 格式OpenAI 兼容
信用卡不需要
from openai import OpenAI
client = OpenAI(
    api_key="你的智谱 API Key",
    base_url="https://open.bigmodel.cn/api/paas/v4/",
)
resp = client.chat.completions.create(
    model="glm-4-flash", # 永久免费
    messages=[{"role":"user","content":"你好!"}],
)
print(resp.choices[0].message.content)
获取 API Key 注册 → 控制台 → API Keys
☁️
阿里云百炼(DashScope)
bailian.console.aliyun.com
国内直连 赠金 + 免费模型配额
Qwen 系列全球最强中文开源模型。新用户赠金 3 个月有效,qwen-long 有长期免费月度配额。
项目额度 / 限制
新用户赠金有效期约 3 个月
qwen-long 免费配额100万 token/月(长期)
qwen-long 限速60 RPM,3万 TPM
API 格式OpenAI 兼容(DashScope endpoint)
信用卡不需要(需实名认证)
from openai import OpenAI
client = OpenAI(
    api_key="sk-你的阿里云 API Key",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
resp = client.chat.completions.create(
    model="qwen-long", # 100万 token/月免费配额
    messages=[{"role":"user","content":"你好!"}],
)
print(resp.choices[0].message.content)
获取 API Key 百炼控制台 → API-KEY 管理 → 创建
🐧
腾讯混元
hunyuan.tencent.com/dev
国内直连 400万 token + 永久免费 Lite
新用户赠 400 万 token,hunyuan-lite 模型永久免费。按量付费无最低消费,适合对接腾讯生态。
项目额度 / 限制
新用户赠送400万 token(有效期 6 个月)
永久免费模型hunyuan-lite(永不扣费)
Lite 限速5 RPM,20万 TPM
API 格式OpenAI 兼容
信用卡不需要
from openai import OpenAI
client = OpenAI(
    api_key="你的腾讯混元 API Key",
    base_url="https://api.hunyuan.cloud.tencent.com/v1",
)
resp = client.chat.completions.create(
    model="hunyuan-lite", # 永久免费
    messages=[{"role":"user","content":"你好!"}],
)
print(resp.choices[0].message.content)
获取 API Key 开发者中心 → 密钥管理 → 新建密钥
🌙
Kimi(月之暗面)
platform.moonshot.cn
国内直连 新用户赠金
长文本处理能力突出,支持 128K 超长上下文,适合文档分析和代码理解,是长文本场景首选。
项目额度 / 限制
注册赠金一次性赠金(尽快使用)
上下文长度128K tokens
主力模型moonshot-v1-8k / 32k / 128k
API 格式OpenAI 兼容
信用卡不需要
from openai import OpenAI
client = OpenAI(
    api_key="sk-你的 Kimi API Key",
    base_url="https://api.moonshot.cn/v1",
)
resp = client.chat.completions.create(
    model="moonshot-v1-8k",
    messages=[{"role":"user","content":"你好!"}],
)
print(resp.choices[0].message.content)
获取 API Key 控制台 → API Key 管理 → 新建
🦅
百度千帆(ERNIE)
qianfan.cloud.baidu.com
国内直连 ERNIE-Speed 永久免费
ERNIE-Speed / Lite 系列永久免费,工具链完整(含微调、标注),适合需要模型训练微调的企业用户。
项目额度 / 限制
永久免费模型ERNIE-Speed-8K、ERNIE-Lite-8K
ERNIE-Speed 限速60 RPM,200万 TPD
新用户赠金有效期约 1 年
API 格式OpenAI 兼容(v2 端点)
信用卡不需要(需实名认证)
from openai import OpenAI
client = OpenAI(
    api_key="你的千帆 API Key",
    base_url="https://qianfan.baidubce.com/v2",
)
resp = client.chat.completions.create(
    model="ernie-speed-8k", # 永久免费
    messages=[{"role":"user","content":"你好!"}],
)
print(resp.choices[0].message.content)
获取 API Key 控制台 → 应用接入 → 创建应用
🎯
MiniMax
platform.minimaxi.com
国内直连 试用额度
M2.7 全模态模型,支持语言、视频、语音、图像多模态,上下文最长 1M tokens,新用户有试用额度。
项目额度 / 限制
注册赠金试用额度(可调用 M2.7)
上下文最大 1M tokens
多模态语言 / 图像 / 音频 / 视频
API 格式OpenAI 兼容
信用卡不需要
from openai import OpenAI
client = OpenAI(
    api_key="你的 MiniMax API Key",
    base_url="https://api.minimaxi.com/v1",
)
resp = client.chat.completions.create(
    model="MiniMax-Text-01",
    messages=[{"role":"user","content":"你好!"}],
)
print(resp.choices[0].message.content)
获取 API Key 控制台 → 账号信息 → API Keys
讯飞星火
xinghuo.xfyun.cn
国内直连 每模型 20-200万 token
每个模型独立赠 20-200 万 token,语音 TTS/ASR 生态完整,K12 教育和自然语音交互有独特优势。
项目额度 / 限制
注册赠送各模型赠 20万~200万 token
免费限速2 QPS(每秒 2 请求)
语音能力TTS / ASR 完整生态
API 格式OpenAI 兼容(新版接口)
信用卡不需要
from openai import OpenAI
client = OpenAI(
    api_key="你的讯飞星火 API Key",
    base_url="https://spark-api-open.xf-yun.com/v1",
)
resp = client.chat.completions.create(
    model="lite", # 或 generalv3.5 / pro-128k
    messages=[{"role":"user","content":"你好!"}],
)
print(resp.choices[0].message.content)
获取 API Key 控制台 → 我的应用 → APIKey
🐱
魔搭社区(ModelScope)
modelscope.cn
国内直连 2000次/天
阿里旗下,每天 2000 次免费调用,10万+ 社区开源模型,支持 Qwen 全系与 FLUX 图像生成,适合模型探索与科研。
项目额度 / 限制
每日请求数2000次(每天 UTC+8 00:00 重置)
并发限制5 并发请求
模型数量10万+ 开源模型
API 格式OpenAI 兼容
信用卡不需要(需绑定阿里云账号)
from openai import OpenAI
client = OpenAI(
    api_key="你的 ModelScope Token",
    base_url="https://api-inference.modelscope.cn/v1",
)
resp = client.chat.completions.create(
    model="Qwen/Qwen2.5-72B-Instruct",
    messages=[{"role":"user","content":"你好!"}],
)
print(resp.choices[0].message.content)
获取 Token 个人中心 → 访问令牌 → 创建
🥒
OpenCode Zen
opencode.ai/docs/zen
国内可访问 无限额(合理范围) 需绑卡不扣费
Big Pickle、DeepSeek V4 Flash Free、Nemotron 3 Super Free 等限时免费模型,token 无明确上限,但高峰期有共享限流。⚠️ 注册后务必关闭自动充值(默认 $5 以下自动充 $20)。
项目额度 / 限制
每日 token 上限无明确上限(合理范围内无限)
速率限制共享资源池,无公开 RPM,高峰期易 429
免费模型deepseek-v4-flash-free(最稳)/ big-pickle / nemotron-3-super-free
免费期限限时免费,随时可能结束
信用卡需绑定(免费模型不扣费,但需关闭自动充值)
import time, random
from openai import OpenAI, RateLimitError
client = OpenAI(
    api_key="你的 OpenCode API Key",
    base_url="https://opencode.ai/zen/v1",
)
def chat(model, msgs, max_retry=4):
    for i in range(max_retry):
        try:
            return client.chat.completions.create(
                model=model, messages=msgs
            ).choices[0].message.content
        except RateLimitError:
            if i==max_retry-1: raise
            time.sleep(2**i + random.random())
# 最稳定: deepseek-v4-flash-free
# 备用:   big-pickle / nemotron-3-super-free
print(chat("deepseek-v4-flash-free",
          [{"role":"user","content":"Hello!"}]))
注册获取 Key ⚠️ 注册后立即关闭自动充值
🌸
Pollinations AI
gen.pollinations.ai
国内可访问 flux 图像永久无限免费 文/图/音/视频
开源平台,flux 图像生成永久无限免费,无需注册可直接 URL 调用。GPT-5、Claude、Gemini、DeepSeek Pro 等已加入免费层(2026-05-27)。
项目额度 / 限制
flux 图像永久无限免费,无需 Key,直接 URL 调用
高级模型消耗 Pollen($1 ≈ 1 Pollen),注册每天赠少量
1 Pollen 价值文字 10万次 / Kontext图 200张 / GPT图 77张
pk_ Key 限速1 Pollen/小时 per IP+Key(前端用)
sk_ Key 限速无速率限制(仅限后端使用)
信用卡不需要(基础功能)
import requests, urllib.parse
prompt = "a cat on the moon, photorealistic"
url = ("https://image.pollinations.ai/prompt/"
      + urllib.parse.quote(prompt)
      + "?model=flux&width=1024&height=1024")
# 方式1: 直接当 img src 使用(最简单)
print("图片链接:", url)
# 方式2: 下载保存
img = requests.get(url)
with open("out.png","wb") as f: f.write(img.content)
from openai import OpenAI
client = OpenAI(
    api_key="pk_你的Publishable Key", # enter.pollinations.ai 获取
    base_url="https://gen.pollinations.ai/v1",
)
resp = client.chat.completions.create(
    model="openai", # openai/claude/gemini/deepseek/qwen-coder
    messages=[{"role":"user","content":"Hello!"}],
)
print(resp.choices[0].message.content)
注册获取 Key 图像无需注册,直接调用 URL 即可
🇸🇬
Agnes AI 2.0(Sapiens AI)🆕
agnes-ai.com
永久免费·无限制 文字/图像/视频 ⚡ 全球 Top 10
新加坡 Sapiens AI 出品,全栈多模态模型,Agnes 2.0 在 Claw-Eval 全球前 10,与 Anthropic、OpenAI、DeepSeek 并列,且价格为 DeepSeek 一半。文字(Agnes-2.0-Flash)、图像(Agnes-Image-2.0-Flash)、视频三类能力均已开放 API,官方声明永久免费,无等待名单。
项目额度 / 限制
文字模型Agnes-2.0-Flash(Claw-Eval 全球前 10)
图像模型Agnes-Image-2.0-Flash(图像编辑全球前 10)
视频能力文字→视频 / 图片→视频
免费额度永久免费,无限使用(官方声明)
信用卡不需要
注意平台较新,API 文档完善中,建议先在官网注册体验
from openai import OpenAI
# 1. 注册 agnes-ai.com 获取免费 API Key
# 2. 在控制台创建 API Key
client = OpenAI(
    api_key="你的 Agnes AI API Key",
    base_url="https://api.agnes-ai.com/v1",
)
resp = client.chat.completions.create(
    model="agnes-2.0-flash", # 文字 / Agentic 旗舰模型
    messages=[{"role":"user","content":"Hello!"}],
)
print(resp.choices[0].message.content)
import requests
# 图像生成 — Agnes-Image-2.0-Flash
resp = requests.post(
    "https://api.agnes-ai.com/v1/images/generations",
    headers={"Authorization":"Bearer 你的 Agnes API Key"},
    json={
        "model":"agnes-image-2.0-flash",
        "prompt":"a cat on the moon, cinematic",
        "n":1,
        "size":"1024x1024"
    },
)
print(resp.json()["data"][0]["url"])
import requests
# 视频生成(文字→视频)
resp = requests.post(
    "https://api.agnes-ai.com/v1/videos/generations",
    headers={"Authorization":"Bearer 你的 Agnes API Key"},
    json={
        "model":"agnes-video-2.0",
        "prompt":"a cat walking on the moon, cinematic",
        "duration":5,   # 秒
        "resolution":"1080p"
    },
)
print(resp.json()) # 返回视频 URL 或任务 ID
# ⚠️ 具体参数以官方最新文档为准
# 文档: agnes-ai.com/doc
注册获取 API Key 官网注册 → 控制台 → 创建 API Key

🌐 国际平台 · 需要科学上网

8 个
🔷
Google AI Studio(Gemini)
aistudio.google.com
需翻墙 1500次/天(Flash-Lite) ⚡ 1M TPM
Gemini 系列最慷慨的免费平台,无需信用卡。⚠️ 配额按 Google Cloud Project 计(非 per Key),多 Key 不叠加。⚠️ 免费层提示词可能被用于 Google 模型训练。
模型RPMTPMRPD(每日)
Gemini 2.5 Flash-Lite1525万1,500
Gemini 2.5 Flash1025万250
Gemini 2.0 Flash15100万200
Gemini 2.5 Pro525万50(仅试用)
⚠️ 配额 reset 时间: 太平洋时间午夜(北京时间下午 3-4 点)
from openai import OpenAI
client = OpenAI(
    api_key="AIza-你的 Google AI Key",
    base_url="https://generativelanguage.googleapis.com/v1beta/openai/",
)
resp = client.chat.completions.create(
    model="gemini-2.5-flash-lite", # 1500次/天,最高吞吐
    messages=[{"role":"user","content":"Hello!"}],
)
print(resp.choices[0].message.content)
获取 API Key AI Studio → Get API Key → Create API Key
Groq
console.groq.com
需翻墙 1000~14400次/天(按模型) ⚡ 500+ t/s 全网最快
LPU 芯片极速推理,首 token 延迟约 200ms,是目前速度最快的免费 API。⚠️ 限额按组织计,多 Key 不叠加,RPM/TPM/RPD 三者同时生效,先到先触发。
模型RPMTPMRPD(每日)
Llama-3.1-8B ⭐推荐306,00014,400
Gemma2-9B3015,0001,000
Llama-3.3-70B306,0001,000
Qwen3-32B306,0001,000
Llama-4-Maverick153,000500
⚠️ TPM 仅 6000,适合短对话,大 prompt 会很快触发限流
from openai import OpenAI
client = OpenAI(
    api_key="gsk_-你的 Groq Key",
    base_url="https://api.groq.com/openai/v1",
)
resp = client.chat.completions.create(
    model="llama-3.1-8b-instant", # 14400次/天,最大 RPD
    messages=[{"role":"user","content":"Hello!"}],
)
print(resp.choices[0].message.content)
获取 API Key Console → API Keys → Create API Key
🧬
Cerebras
cloud.cerebras.ai
需翻墙 100万 token/天(最多) ⚡ 2600 t/s(业界最快)
晶圆级芯片 WSE-3,每天 100 万 token 永久免费,是所有免费 API 中日均额度最大的。⚠️ 免费层上下文最大 8,192 tokens,长对话需要付费。
项目额度 / 限制
每日 token100万(每天重置,永久免费)
RPM30 请求/分钟
TPM6万 token/分钟
Llama4 Scout 速度≈ 2,600 t/s(业界最快)
⚠️ 免费层上下文最大 8,192 tokens(付费后 64K~131K)
信用卡不需要
from openai import OpenAI
client = OpenAI(
    api_key="csk-你的 Cerebras Key",
    base_url="https://api.cerebras.ai/v1",
)
resp = client.chat.completions.create(
    model="llama-4-scout-17b-16e-instruct",
    messages=[{"role":"user","content":"Hello!"}],
    max_tokens=1024, # 免费层 context ≤ 8192 tokens
)
print(resp.choices[0].message.content)
获取 API Key 注册 → API Keys → Generate New Key
🔀
OpenRouter
openrouter.ai
需翻墙 28+ 永久免费模型
315+ 模型聚合网关,28+ 永久免费模型(ID 以 :free 结尾),一个 Key 访问所有模型。⚠️ 失败请求也计入配额!
账户状态每日配额(:free 模型)RPM
未充值(免费用户)50次/天(所有 :free 模型合计)20
充值 ≥ $10(一次性)1000次/天(永久提升)20
付费模型无平台限制无限
⚠️ 失败请求也扣额度;:free 模型高峰期可能被上游限流
from openai import OpenAI
client = OpenAI(
    api_key="sk-or-你的Key",
    base_url="https://openrouter.ai/api/v1",
)
resp = client.chat.completions.create(
    model="meta-llama/llama-3.3-70b-instruct:free",
    messages=[{"role":"user","content":"Hello!"}],
)
# 其他免费: deepseek/deepseek-r1:free
#          qwen/qwen3-coder-480b-a35b-instruct:free
#          google/gemma-3-27b-it:free
print(resp.choices[0].message.content)
获取 API Key 注册 → Keys → Create Key(无需信用卡)
🟢
NVIDIA NIM
build.nvidia.com
需翻墙 1000积分赠送
注册赠 1000 积分,91+ 款免费模型端点,含 DeepSeek R1/V3、Llama-4、Mistral Large,积分用完后按量付费。
项目额度 / 限制
注册赠积分1000 积分(约 1000 次中等请求)
免费端点数量91+ 款模型
免费 RPM约 40 RPM(因模型而异)
API 格式OpenAI 兼容
信用卡注册不需要(积分用完才需要)
from openai import OpenAI
client = OpenAI(
    api_key="nvapi-你的Key",
    base_url="https://integrate.api.nvidia.com/v1",
)
resp = client.chat.completions.create(
    model="meta/llama-3.3-70b-instruct",
    messages=[{"role":"user","content":"Hello!"}],
)
print(resp.choices[0].message.content)
获取 API Key 注册 → 任意模型页 → Get API Key
🦄
SambaNova Cloud
cloud.sambanova.ai
需翻墙 $5 赠金(30天) ⚡ RDU 极速
RDU 芯片,注册赠 $5(30 天有效)。⚠️ MiniMax-M2.7 需付费(报 402 错误),只用免费模型即可。
项目额度 / 限制
赠金$5(30天内用完,不续期)
✅ 免费模型Llama-3.3-70B / DeepSeek-V3.1 / Llama-4-Maverick
❌ 付费模型MiniMax-M2.7(用即报 402)
API 格式OpenAI 兼容
信用卡注册不需要($5 用完才需要)
from openai import OpenAI
client = OpenAI(
    api_key="你的 SambaNova Key",
    base_url="https://api.sambanova.ai/v1",
)
resp = client.chat.completions.create(
    model="Meta-Llama-3.3-70B-Instruct", # ✅ 免费
    # ❌ 别用 MiniMax-M2.7 → 402 Error
    messages=[{"role":"user","content":"Hello!"}],
)
print(resp.choices[0].message.content)
获取 API Key 注册 → API Keys → Generate Key
7️⃣
LLM7.io
api.llm7.io/v1
需翻墙 30~120 RPM,无需信用卡
英国小众平台,匿名 30 RPM 可用,注册后提升至 120 RPM,支持 DeepSeek R1、Qwen 等 27+ 模型,适合高频轻量调用。
项目额度 / 限制
匿名速率30 RPM(无需注册,无需 Key)
注册后速率120 RPM(注册领免费 token 后)
可用模型27+ 开源模型
API 格式OpenAI 兼容
信用卡完全不需要
from openai import OpenAI
client = OpenAI(
    api_key="token.llm7.io 免费领取",
    base_url="https://api.llm7.io/v1",
)
resp = client.chat.completions.create(
    model="deepseek-r1",
    messages=[{"role":"user","content":"Hello!"}],
)
print(resp.choices[0].message.content)
获取 Token 匿名可用 30 RPM,注册后提升至 120 RPM
☁️
Cloudflare Workers AI
developers.cloudflare.com/workers-ai
需翻墙 1万神经元/天(永久) FLUX 图像
永久免费每天 1 万神经元。⚠️ 图像消耗极快(1024² FLUX ≈ 3000-5000 神经元),只够生成约 2-5 张;用小文字模型则等效约 407 万 token/天。
用途每天 1万神经元 = 约多少
FLUX 图像 1024×1024约 2-5 张(消耗极快)
Llama-3.2-1B 文字约 407万 token 输入
Llama-3.3-70B 文字约 37万 token 输入
DeepSeek-R1-32B 文字约 22万 token 输入
⚠️ 生图请用硅基流动/Together;小模型聊天很划算
import requests
acct = "你的 Cloudflare Account ID"
tok  = "你的 Cloudflare API Token"
resp = requests.post(
    f"https://api.cloudflare.com/client/v4/accounts/{acct}"
    "/ai/run/@cf/black-forest-labs/flux-1-schnell",
    headers={"Authorization":f"Bearer {tok}"},
    json={"prompt":"a cat on the moon"},
)
if resp.status_code==200:
    with open("out.png","wb") as f: f.write(resp.content)
else: print(resp.json()) # 429=神经元用完
import requests
acct = "你的 Cloudflare Account ID"
tok  = "你的 Cloudflare API Token"
resp = requests.post(
    f"https://api.cloudflare.com/client/v4/accounts/{acct}"
    "/ai/run/@cf/meta/llama-3.2-1b-instruct",
    headers={"Authorization":f"Bearer {tok}"},
    json={"messages":[{"role":"user","content":"Hello!"}]},
)
print(resp.json()["result"]["response"])
获取 Token 控制台 → Workers AI → API Token

🖼️ 图像生成专用平台(性价比排名)

3 个
🤝
Together.ai 🥇 综合推荐
api.together.ai
需翻墙 3个月免费 FLUX + 文字
FLUX.1-schnell-Free 前 3 个月完全免费,2-4s/张,200+ 模型文字 + 图像双支持,OpenAI 格式,无需信用卡,是翻墙用户生图首选。
项目额度 / 限制
免费期限3 个月(注册后计时)
FLUX 生成延迟2-4s/张
图像免费模型FLUX.1-schnell-Free
文字免费模型Llama-3.3-70B-Turbo-Free
信用卡不需要(3个月内)
import requests
resp = requests.post(
    "https://api.together.xyz/v1/images/generations",
    headers={"Authorization":"Bearer 你的Key"},
    json={"model":"black-forest-labs/FLUX.1-schnell-Free",
          "prompt":"a cat on the moon",
          "n":1,"width":1024,"height":1024},
)
print(resp.json()["data"][0]["url"])
from openai import OpenAI
client = OpenAI(
    api_key="你的 Together API Key",
    base_url="https://api.together.xyz/v1",
)
resp = client.chat.completions.create(
    model="meta-llama/Llama-3.3-70B-Instruct-Turbo-Free",
    messages=[{"role":"user","content":"Hello!"}],
)
print(resp.choices[0].message.content)
获取 API Key 注册 → Settings → API Keys
fal.ai 🥈 低延迟专家
fal.ai
需翻墙 注册少量额度 1000+ 模型 ⚡ <3s/张
专为低延迟设计,FLUX 系列平均 <3s,零冷启动,1000+ 模型,付费 $0.003/张,适合实时生图应用。
项目额度 / 限制
注册赠金少量试用额度
FLUX.1-schnell 延迟<3s/张(零冷启动)
付费单价$0.003/张
模型数量1000+
信用卡付费时需要
# pip install fal-client
import fal_client as fal, os
os.environ["FAL_KEY"] = "你的 fal.ai API Key"
result = fal.subscribe(
    "fal-ai/flux/schnell",
    arguments={"prompt":"a cat on the moon"},
)
print(result["images"][0]["url"])
获取 API Key Dashboard → Keys → Add Key
🚀
Runware 🥉 亚秒极速
runware.ai
需翻墙 $0.0006/张(全网最低) ⚡ <1s
自研 Sonic 引擎亚秒级生图,$0.0006/张全网最低,40万+ CivitAI 社区模型,2025 年获 5000 万美元融资,稳定性有保障。
项目额度 / 限制
生成延迟<1s(Sonic 引擎)
最低单价$0.0006/张(全网最低)
社区模型40万+ CivitAI 模型
注册赠金少量试用额度
信用卡付费时需要
# pip install runware
import asyncio
from runware import Runware, IImageInference
async def main():
    client = Runware(api_key="你的 Runware Key")
    await client.connect()
    images = await client.imageInference(
        IImageInference(
            positivePrompt="a cat on the moon",
            model="runware:100@1",
            numberResults=1,
        )
    )
    print(images[0].imageURL)
asyncio.run(main())
获取 API Key Dashboard → API Keys → Create

📚 参考资源 & 实时跟踪

🌟 awesome-free-llm-apis(GitHub 实时跟踪)
持续更新全球所有免费 LLM API 的实时限额和模型列表。
github.com/amardeeplakshkar/awesome-free-llm-apis
📊 TokenMix.ai(精确限额数据库)
300+ 平台 RPM/TPM/RPD 精确数据,每月更新验证,本页大量限额数据来源于此。
tokenmix.ai
🔍 cheahjs/free-llm-api-resources
GitHub 上最全的免费 API 跟踪仓库,含小众实验性平台。
github.com/cheahjs/free-llm-api-resources