cloud.infini-ai.com
免费大模型额度 · 免费模型 · 社区口碑 · 风险评估
网站介绍
无问芯穹(Infinigence-AI / Infini-AI)GenStudio 是清华电子系背景团队创办的 AI Infra 公司旗下大模型服务平台,主营按量付费的 MaaS 大模型 API、GPU 算力云与编程订阅套餐(Coding Plan),并附带有限的免费体验层。
免费额度
LLM API 已于 2026-03-30 起改为按 Token 实际用量后付费,不再免费;仍免费的部分:网页端 GenStudio 体验中心(在线 Playground)暂不计费、向量嵌入(Embeddings)与重排序(Reranker)模型 API 免费。新用户注册无明确公开的赠金活动;基础服务档限速 RPM=12、RPD=300、TPM=12000。需更多免费资源需联系销售申请试用资格。
免费模型
Embeddings 向量嵌入模型(免费,如 bge / jina 系列)Reranker 重排序模型(免费)网页端体验中心可免费试用预置大模型(如 DeepSeek、Kimi、GLM 等,仅 Playground 暂不计费)优点
- 正规公司主体(清华系 AI Infra 团队,融资充足),跑路风险低、合规性较好
- 聚合主流国产/开源大模型,OpenAI 兼容接口(sk- 前缀,base URL /maas/v1)
- Embeddings 与 Reranker API 持续免费,适合 RAG 场景白嫖
- Coding Plan 入门套餐首月 19.9 元、次月 40 元起,按请求次数计费,覆盖 Kimi、MiniMax、DeepSeek、GLM 等,性价比被社区认为较高
缺点
- LLM API 免费层已取消,2026-03-30 后核心大模型调用需付费,不再是真正意义上的免费站
- 免费部分仅剩 Embeddings/Reranker 和网页体验,纯免费 API 大模型额度基本没有
- 基础档限速较严(RPM=12、RPD=300、TPM=12000),失败请求也消耗 Token 计费
- 社区反馈模型速度略慢于官方(如 Kimi 约 30 token/s),极小概率出现循环输出卡死 bug,售后一般
- Coding Plan 库存紧张、常被秒抢,出现闲鱼代抢黄牛(代抢约 100 元)
风险点
- 免费层已大幅收窄:2026-03-30 起 LLM API 全面转为付费,按 Token 后付费,余额/代金券扣费
- 网页体验中心标注为「暂不计费」,存在后续收费的不确定性
- 纯大模型免费 API 额度基本不存在,需绑定付费才能规模化使用
- Coding Plan 存在黄牛代抢、库存秒空现象,购买体验差
- 速度慢于官方、偶发循环输出卡死、售后响应一般
- 失败请求也消耗 Token 计费
社区口碑综述
社区(V2EX、Linux.do、知乎、博客横评)整体将无问芯穹视为正规、可信的国产 AI Infra 厂商,Coding Plan 在多家横评中被列为入门级高性价比选项,促销期 19.9 元被评为超值;负面集中在速度略慢于官方、偶发卡死、售后一般、套餐库存难抢。未见盗 key、跑路或诈骗记录。作为「免费站」价值有限——免费 LLM API 已下线,仅余 Embeddings/Reranker 及网页体验免费。
使用建议
属于主营付费 API/算力的正规一方厂商(first-party-free),跑路/盗 key 风险低、合规性好。若目标是「免费用大模型 API」,价值有限:核心 LLM 调用已收费,仅 Embeddings/Reranker 与网页 Playground 免费,适合做 RAG 嵌入/重排或在线体验,不适合当作免费大模型 API 来源。预算敏感且需编程模型者可关注其 Coding Plan(首月 19.9 元起),但注意库存紧张与售后一般。仅作信息整理,不构成背书。
最近探测
社区提及 (6)
参考来源
In English
Summary: Infinigence-AI (Infini-AI) GenStudio is the large-model service platform of an AI Infra company founded by a team with a Tsinghua University Department of Electronic Engineering background. Its main business is pay-as-you-go MaaS large-model APIs, GPU compute cloud, and a coding subscription plan (Coding Plan), with a limited free trial tier alongside.
Free quota: As of 2026-03-30, the LLM API switched to post-paid billing based on actual token usage and is no longer free. The parts still free are: the web-based GenStudio Experience Center (online Playground) is not yet billed, and the Embeddings and Reranker model APIs are free. There is no clearly publicized sign-up bonus for new users; the basic service tier is rate-limited at RPM=12, RPD=300, TPM=12000. More free resources require contacting sales to apply for trial eligibility.