integrate.api.nvidia.com
免费大模型额度 · 免费模型 · 社区口碑 · 风险评估
网站介绍
NVIDIA build.nvidia.com(NVIDIA NIM / Developer Program)的第一方 OpenAI 兼容推理 API,端点为 integrate.api.nvidia.com,托管 100+ 开源与自研模型,面向开发者提供长期免费层。
免费额度
注册 NVIDIA Developer Program 即得永久 nvapi- key,无需信用卡;初始送 1000 推理 credits(企业邮箱可申请至 5000,并附 90 天 AI Enterprise license)。当前以速率限制为主:免费层约 40 RPM,可申请提升至 200 RPM。仅限原型/研究/开发/测试,生产需 AI Enterprise license。
免费模型
meta/llama-3.3-70b-instructmeta/llama-4-maverick-17b-128e-instructnvidia/llama-3.1-nemotron-ultra-253b-v1nvidia/llama-3.3-nemotron-super-49b-v1.5deepseek-ai/deepseek-v4-proqwen/qwen3.5-397b-a17bmoonshotai/kimi-k2.6openai/gpt-oss-120bmistralai/mistral-large-3-675b-instruct-2512z-ai/glm-5.1google/gemma-4-31b-itminimaxai/minimax-m3优点
- NVIDIA 官方一方服务,托管于 NVIDIA DGX Cloud,非中转,无盗用上游 key 风险
- 免费可用 100+ 模型,含 Llama/DeepSeek/Qwen/GLM/Kimi/gpt-oss 等大模型,覆盖面极广
- 注册即得永久 key,无需信用卡,无试用倒计时
- 官方声明用户数据不用于模型训练
- 全部模型 OpenAI 兼容,切换仅改模型名字符串
缺点
- 免费层 40 RPM 限速对高频 agent/编码任务偏紧,2-3 分钟内易触发 429
- 提升至 200 RPM 需申请审批,非即时
- 免费仅限原型/研究/开发,生产用途须购买 AI Enterprise license
- 部分用户反映 credits 未用即归零、出现 402 'Cloud credits expired' 错误,额度机制曾有变动
风险点
- 免费层约 40 RPM,对多 agent/RAG/编码高频调用易触发 429
- 生产用途须 AI Enterprise license,免费仅限非生产场景
- 历史上出现过 credits 过期/归零、402 'Cloud credits expired' 报错
- 免费层政策(credits vs 纯限速)曾调整,未来可能再变
社区口碑综述
NVIDIA NIM 免费层口碑总体正面,被多名独立开发者称为「出乎意料地慷慨」的免费资源;主要抱怨集中在 40 RPM 限速对 agent 工作流不够用,以及早期 credits 过期/归零的体验问题。作为大厂一方服务,稳定性与合规性可信,无跑路风险。
使用建议
作为 NVIDIA 官方免费层,适合开发者免费体验和原型验证大量开源/自研大模型;高频 agent 工作流需注意 40 RPM 限速并提前申请提速,生产部署须走 AI Enterprise license,避免依赖免费层做商用。
最近探测
社区提及 (8)
参考来源
In English
Summary: NVIDIA's first-party OpenAI-compatible inference API (NVIDIA NIM / Developer Program) at build.nvidia.com, with endpoint integrate.api.nvidia.com, hosting 100+ open-source and in-house models with a long-running free tier for developers.
Free quota: Sign up for the NVIDIA Developer Program to get a permanent nvapi- key, no credit card; 1,000 inference credits on signup (corporate email can request up to 5,000 plus a 90-day AI Enterprise license). Currently primarily rate-limited: ~40 RPM on the free tier, upgradable to 200 RPM by request. Prototyping/research/development/testing only; production requires an AI Enterprise license.