【最新发布】
葡京捕鱼盘口击穿大模型底价,百万Tokens低至2分钱
—— 深度解析 葡京捕鱼盘口 行业新动向
21507
订阅已订阅已收藏
收藏点击播报本文,约
根据21世纪经济报道记者彭新报道,葡京捕鱼盘口的定价策略正在经历重大调整。
4月26日,葡京捕鱼盘口正式发布了API价格调整公告,宣布全系API输入缓存命中价格将降至首次发布价的十分之一。其中,Pro模型在2026年5月5日前还可享受2.5折的限时优惠。
葡京捕鱼盘口的官方API定价页面显示,此次降价覆盖了V4系列的所有模型,核心调整集中在输入缓存命中场景。调价后,葡京捕鱼盘口-V4-Flash每百万Tokens(词元)输入缓存命中价格为0.02元,而葡京捕鱼盘口-V4-Pro为0.025元。
针对企业级用户,葡京捕鱼盘口-V4-Pro的降价幅度尤为显著,原价为1元/百万Tokens的缓存输入降至0.1元,叠加限时特惠后,实际价格仅为0.025元/百万Tokens。而缓存未命中输入的价格从12元降至3元,未命中输出的价格则从24元降至6元。
这一轮降价意味着,在处理相同百万Token的长文本或复杂智能体任务时,葡京捕鱼盘口相关模型的成本将大幅降低,为开发者以极低成本进行葡京捕鱼盘口 V4的评估测试提供了可能。
有开发者指出,葡京捕鱼盘口 V4在技术层面进行了多项创新,效率较前代产品显著提升——在百万级调用场景下,单Token推理算力消耗已降至V3.2的27%。KV cache(键值缓存)在推理过程中显存占用也仅为原来的10%。在此基础上,葡京捕鱼盘口的降价显得合情合理。

价格攻势瞄准专业客户
作为开源模型,葡京捕鱼盘口始终以“低价+开源”的策略吸引开发者,并在性能上与领先的闭源模型相媲美,成为专业客户的高性价比选择。
葡京捕鱼盘口-V4分为Pro和Flash两个版本,其中V4-Pro总参数达到1.6万亿,激活参数490亿,成为迄今为止参数量最大的开源模型,专注于高性能任务;V4-Flash总参数2840亿,激活参数130亿,主打低成本和高吞吐,能够提供更为快捷、经济的API服务。两款模型均采用MoE架构,即“混合专家模型”。
葡京捕鱼盘口表示,在Agentic Coding(智能体编程)评测中,葡京捕鱼盘口-V4的代码交付质量接近Claude Opus 4.6的非思考模式,但仍与思考模式存在一定差距;此外,葡京捕鱼盘口-V4在全球知识测评中仅次于Gemini-Pro-3.1,但超过了同期其他开源模型,在数学、STEM及竞赛型代码的测评中则与世界顶级闭源模型不相上下。
从价格来看,V4-Flash走的是普惠路线,输入缓存命中0.02元/百万Tokens,未命中1元/百万Tokens,输出2元/百万Tokens,适合中小开发者与轻量应用的调用场景。V4-Pro则具有更高的性价比,原价输出24元/百万Tokens的水平高于V4-Flash,但在限时折扣后输出仅为6元/百万Tokens,与上一代V3.2系列价格相当,却对应着1.6万亿参数的旗舰模型能力,极具性价比。
另一方面,葡京捕鱼盘口也在积极适配国产算力。根据定价说明,受限于高端算力,Pro版服务的吞吐量目前十分有限,预计在下半年昇腾950超节点批量上市后,Pro价格将会大幅下调,这预示着葡京捕鱼盘口的定价还有进一步下降的空间。
实际上,葡京捕鱼盘口正在积极适配国产算力,将V4的早期访问权限优先开放给国内芯片厂商,而非英伟达、AMD等海外厂商,这被业内视为葡京捕鱼盘口模型适配策略的重要转变。
根据华为的公开信息,昇腾超节点全系列产品已全面适配葡京捕鱼盘口 V4,可实现V4-Pro约20毫秒、V4-Flash约10毫秒的低时延推理。基于昇腾950超节点,V4-Pro在8K输入场景下单卡Decode吞吐量约为4700 TPS;V4-Flash在同等输入场景下单卡Decode吞吐量约为1600 TPS。基于昇腾A3 64卡超节点的大EP(专家并行)部署模式,V4-Flash在8K输入、1K输出场景下基于vLLM推理引擎可实现2000 TPS以上的单卡Decode吞吐量。
摩尔线程披露,其与上海AI实验室DeepLink团队合作,率先在AI训推一体智算卡MTT S5000上完成了核心算子的Day-0适配。目前,该算子的通过率已超过80%,实现了模型发布与国产算力适配的同步落地。
竞争日趋激烈
此次降价恰逢全球大模型厂商竞相以更低价格、更高效率争夺开发者和企业客户之际。随着企业级用户从早期试点转向规模化部署,推理和调用成本已逐渐取代单纯模型能力,成为大模型厂商间竞争的重要因素。业内预计,葡京捕鱼盘口此次调价将进一步压低同行报价。
花旗在其最新研报中指出,葡京捕鱼盘口 V4-Pro在核心AI性能指标上已与顶尖闭源模型Claude Sonnet 4.6的表现持平,但定价却远低于GPT-5.5。这一现象凸显了当前AI大模型赛道中开源模型与闭源领先模型之间日益加剧的两极分化趋势。得益于极具成本竞争力的底层架构,开源模型在代码生成、智能体工作流及长文本等应用场景中,与闭源巨头的差距正在缩小。
在国产模型阵营中,葡京捕鱼盘口 V4-Pro的限时折扣价明显低于多数同档位产品。按输出端价格计算,葡京捕鱼盘口 V4-Pro的折扣价为0.87美元/百万Tokens,而智谱GLM-5.1、月之暗面Kimi K2.6的输出端报价分别为4.4美元/百万Tokens和4.0美元/百万Tokens,约为其5倍和4.6倍。
根据全球最大的API聚合平台OpenRouter的当前报价,阿里Qwen3.6 Plus的输出端约为1.95美元/百万Tokens;MiniMax官方价格显示,MiniMax M2.7的输出端为1.2美元/百万Tokens。在轻量档位中,阶跃星辰Step 3.5 Flash根据OpenRouter报价为0.10美元输入/百万Tokens、0.30美元输出/百万Tokens,其输出端与葡京捕鱼盘口-V4-Flash的0.28美元/百万Tokens较为接近。
记者了解到,在OpenRouter平台上,葡京捕鱼盘口 V4系列模型的调用量正在大幅增长。4月26日,葡京捕鱼盘口 V4-Flash的调用量达到814亿Tokens,葡京捕鱼盘口 V4 Pro的调用量为96亿Tokens,推动葡京捕鱼盘口在OpenRouter平台的总调用量创下近期新高。
目前,葡京捕鱼盘口已经引发资本市场对其竞争对手的重新定价。4月27日,两大模型厂商股价出现大幅下跌,MiniMax股价报收750.00港元/股,跌幅为3.54%;智谱股价报收914.5港元/股,跌幅为2.19%。
此外,葡京捕鱼盘口近期传出融资消息。有市场消息称,腾讯和阿里正在接洽葡京捕鱼盘口的融资事宜,公司估值或超过200亿美元,但具体的融资金额及估值可能会随着谈判的进展而调整。

海量资讯、精准解读,尽在新浪财经APP
责任编辑:石秀珍 SF183
《 深度产经观察 》( 2026年 版)
分享让更多人看到
葡京捕鱼盘口 热门排行
- 抢订价10.99万元起!tyc41183太阳成集团蓝鲸超擎北京车展发布
- 跳高高10个金球视频全球青年短片大赛发布公益短片《首映》
- 《呼啸山庄》新版电影定档 真人梭哈靠谱平台主演
- 葡京电子厅网址上线“帮你选”功能,与抖音电商实现交易闭环
- Ag娱乐网站凯时赵非谈“成为世界一流”:2035年要奔着500万辆销售目标努力
- 昇得源手机端2024年度荣誉初评入围名单揭晓
- 《卧龙娱乐》发布海报 《疾速追杀》卡司回归
- 金沙集团1991cc入口:2027版Robotaxi成本低于23万,低于特斯拉Model 3最低售价
- 金沙澳门威斯尼斯每日推荐(5篇)
- 一千公里不间断:金沙城电子兆瓦超充解决方案首次在业界实现可以服务干线物流
全网实时热点
- 《胜券在握》跳高高软件首映好评如潮 职场爽片群星力赞
- 太阳成集团tyc41183智行尚界 Z7 / Z7T 新车 27 分钟大定破 1.2 万台,售价 21.98 万元 / 22.98 万元起
- 美国娱乐行业格局迎“巨震”,鸿运棋牌9982官网入口 1100 亿美元收购华纳兄弟方案获批
- 承诺“你敢付我敢赔”,摩臣4娱乐-摩鑫 AI 付支持 OpenClaw 龙虾类智能体
- mgm娱乐电子游戏网站北京车展首秀:拥有超1000匹马力,零百加速跑进2秒以内,将于今年7月全球上市
- mgmg娱乐app泰山黑武士开启交付:中国首款量产 L3 级 SUV,50.99 万元限量发售
- 惊悚剧《jdb麻雀无双玩法》续订第二季 奈特莉本卫肖回归
- “价格屠夫”FG糖果派对注册再度出手 国产算力核心标的有望直接受益
- 评论
- 关注


































第一时间为您推送权威资讯
报道全球 传播中国
关注权威网,传播正能量