大模型厂商卷起“价格战” 折射怎样的AI新风向？

2024-05-22 雷晨 21世纪经济报道阅读 15042

艾媒咨询 | 2023年中国信创产业发展白皮书（完整版）

信创基础消费潜力较大，尤其在办公软件领域，对办公OA、编辑类的国产软件已普遍被企业应用，如企业微信、WPS等已积累了大量的用户群体。在国家信息安全驱动的需求下，信创产品及解决方案应用将在各行各业的渗透持续加深，行业规模持续增长。

利比亚经济社会发展状况及主要经济指标监测数据经济领域

全球经济特区现状及GCC经济特区发展状况调研数据经济领域

突尼斯经济社会运行状况及主要经济指标监测数据经济领域用数据说话

　　近期，国内多家大模型厂商纷纷宣布降价策略，推动大模型从“以分计价”的定价模式向更“以厘计价”新时代迈进。

　　5月21日，阿里云通义千问的主力模型Qwen-Long的API输入价格从0.02元/千Tokens降至0.0005元/千Tokens，降幅达97%。这意味着，1元可以买200万Tokens。

　　阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示：“作为中国第一大云计算公司，阿里云这次大幅降低大模型推理价格，就是希望加速AI应用的爆发。预计未来大模型API的调用量会有成千上万倍的增长。”

　　同日，百度智能云也宣布其文心大模型的两大主力模型ERNIE Speed和ERNIE Lite全面免费。

　　此前，字节跳动、智谱AI等厂商也纷纷推出了各自的降价方案。“豆包主力模型的推理输入定价只有0.0008元/千Tokens，0.8厘就能处理1500多个汉字，比行业便宜99.3%。”火山引擎总裁谭待5月15日公开表示。

　　受访人士认为，这场价格战的背后，是各家厂商对于优先做大市场的共识，各家旨在通过降低使用成本，吸引更多企业和个人开发者使用其技术，从而推动生态繁荣。

　　大模型厂商打响价格战

　　5月以来，国内厂商纷纷开启了大模型推理端的价格战。

　　5月6日，幻方量化官微宣布，旗下深度求索（DeepSeek）正式开源第二代MoE模型DeepSeek-V2。据介绍，DeepSeek-V2API的定价为：每百万Tokens输入1元、输出2元，价格为GPT-4-Turbo的近百分之一。

　　智谱AI大模型开放平台于5月11日上线了新的价格体系，新注册用户可以获得额度从500万Tokens提升至2500万Tokens，并且个人版GLM-3Turbo模型产品的调用价格从5元/百万Tokens降低至1元/百万Tokens。

　　5月15日，在火山引擎原动力发布会上，字节跳动豆包大模型家族、火山方舟2.0、AI应用及AI云基础设施等一系列最新产品正式发布。

　　火山引擎是字节跳动旗下云服务平台，据谭待介绍，经过一年时间的迭代和市场验证，字节跳动自研的豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一，目前日均处理1200亿Tokens文本，生成3000万张图片。

　　“豆包主力模型的推理输入定价只有0.0008元/千Tokens，0.8厘就能处理1500多个汉字，比行业便宜99.3%。”谭待表示，大模型从以分计价到以厘计价，将助力企业以更低成本加速业务创新。

　　谭待强调，降价是用技术优化成本来实现的。如果只是补贴，用亏损换收入是不可持续的，火山引擎不会走这条路。

　　海外方面，自2023年3月，OpenAI已经进行了多次降价。在今年1月25日夜间的更新中，OpenAI新推出了2个嵌入模型，更新了3种模型的版本，并降低了多个模型及API的使用价格。其中，GPT-3.5 Turbo模型的输入价格降低了50%，至0.0005美元/1000 Tokens，输出价格降低了25%，至0.0015美元/1000 tokens。

　　5月13日，OpenAI发布新一代大模型GPT-4o，GPT-4o能够接受文本、音频、图像和视频的任意组合作为输入，并生成文本、音频和图像输出的任意组合。GPT-4o可以在最短232毫秒内响应音频输入，平均为320毫秒，与人类正常对话的响应时间接近。与GPT-4Turbo相比，GPT-4o的速度快2倍，价格减半，速率限制高出5倍。

　　在机构分析师看来，GPT-4o的诞生进一步验证了大模型厂商API的降价趋势，其技术路径对国内大模型产业也具备积极的映射作用。

　　随着国内外大模型厂商技术角逐进一步激烈，华龙证券分析师孙伯文认为，大模型行业开启价格战信号明显。通过降低价格门槛，大模型厂商有望吸引更广泛的企业用户群体，从而进一步平衡收入和成本。

　　“同时，更多C端用户有望免费使用基础AI应用，庞大的访问量有助于企业进一步提升模型服务能力，完成良性循环。对下游企业来说，推理成本进一步降低，AI应用行业有望迎来成本拐点。”其表示。

　　AI应用有望加速普及

　　在业内看来，此轮大模型降价潮是各家厂商为了抢占市场份额，加速AI应用的商业化落地而采取的策略。

　　谈及字节跳动大模型降价原因，谭待近期指出，今年大模型技术显著提升，应用环节至关重要。繁荣生态是推广应用的关键。市场上，许多客户都渴望尝试大模型，但创新风险高，尤其是AI风险。

　　“要减少不确定性，我们必须大幅降低试错成本，使大模型能被广泛采用，无论大企业还是个人开发者。市场呼吁我们提供更低成本的核心技术。”他表示。

　　据悉，目前火山引擎的生态包括了IaaS（基础设施即服务）、PaaS（平台即服务）、SaaS（软件即服务）。

　　谈及用户场景落地情况时，谭待对21世纪经济报道记者举例道，随着汽车与手机的交互日益自然，如在驾驶中导航、查询周边信息，无需分心操作手机，车载系统可即时响应需求。手机助手AI的应用受限于技术，未充分满足用户需求。

　　他还表示，在其他场景如消费营销、金融服务中，智能体也展现出巨大潜力。

　　“为实现AI技术的广泛应用，需提升技术并构建丰富的应用生态。这需要低代码生态的支持，降低开发门槛，激发群体智慧。同时，降低AI技术成本，使更多初创企业和小规模项目得以实施，促进AI时代的创新与发展。”谭待告诉记者。

　　北京一位人工智能行业人士告诉记者，此轮大模型价格战的开启，对于AI应用的普及具有积极的推动作用，将使得更多企业和个人开发者能够负担得起AI技术的使用成本，从而更加积极地投入到AI技术的研发和应用中来。

　　“价格战的竞争将促进AI技术的不断创新和优化，推动整个行业的技术水平不断提升。随着AI应用的普及，将带动相关产业链的发展，形成更加完善的AI生态系统，为整个社会的数字化转型提供有力支撑。”该人士表示。

　　华创证券研报认为，整体来看，降低成本是推动大模型快进到“价值创造阶段”的关键要素，更低的成本价格才能真正满足企业的复杂业务场景需求，充分验证大模型的应用价值。尽管模型终端的价格压降或将促使大模型企业对上游加强成本管控，但目前我国企业正处于AI转型的关键时期，低成本下AI模型生态将进一步完善，终端应用亦将涌现出一批核心的创新应用。

艾媒咨询 | 2023年中国信创产业发展白皮书（完整版）

利比亚经济社会发展状况及主要经济指标监测数据经济领域

全球经济特区现状及GCC经济特区发展状况调研数据经济领域

突尼斯经济社会运行状况及主要经济指标监测数据经济领域用数据说话