大模型厂商卷起“价格战” 折射怎样的AI新风向?

艾媒咨询 | 2023年中国信创产业发展白皮书 (完整版)

信创基础消费潜力较大,尤其在办公软件领域,对办公OA、编辑类的国产软件已普遍被企业应用,如企业微信、WPS等已积累了大量的用户群体。在国家信息安全驱动的需求下,信创产品及解决方案应用将在各行各业的渗透持续加深,行业规模持续增长。

艾媒咨询 | 2023年中国信创产业发展白皮书 (完整版) 精品决策
利比亚经济社会发展状况及主要经济指标监测数据 利比亚经济社会发展状况及主要经济指标监测数据 经济领域全球经济特区现状及GCC经济特区发展状况调研数据 全球经济特区现状及GCC经济特区发展状况调研数据 经济领域突尼斯经济社会运行状况及主要经济指标监测数据 突尼斯经济社会运行状况及主要经济指标监测数据 经济领域 用数据说话

  近期,国内多家大模型厂商纷纷宣布降价策略,推动大模型从“以分计价”的定价模式向更“以厘计价”新时代迈进。

  5月21日,阿里云通义千问的主力模型Qwen-Long的API输入价格从0.02元/千Tokens降至0.0005元/千Tokens,降幅达97%。这意味着,1元可以买200万Tokens。

  阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示:“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。预计未来大模型API的调用量会有成千上万倍的增长。”

  同日,百度智能云也宣布其文心大模型的两大主力模型ERNIE Speed和ERNIE Lite全面免费。

  此前,字节跳动、智谱AI等厂商也纷纷推出了各自的降价方案。“豆包主力模型的推理输入定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。”火山引擎总裁谭待5月15日公开表示。

  受访人士认为,这场价格战的背后,是各家厂商对于优先做大市场的共识,各家旨在通过降低使用成本,吸引更多企业和个人开发者使用其技术,从而推动生态繁荣。

  大模型厂商打响价格战

  5月以来,国内厂商纷纷开启了大模型推理端的价格战。

  5月6日,幻方量化官微宣布,旗下深度求索(DeepSeek)正式开源第二代MoE模型DeepSeek-V2。据介绍,DeepSeek-V2API的定价为:每百万Tokens输入1元、输出2元,价格为GPT-4-Turbo的近百分之一。

  智谱AI大模型开放平台于5月11日上线了新的价格体系,新注册用户可以获得额度从500万Tokens提升至2500万Tokens,并且个人版GLM-3Turbo模型产品的调用价格从5元/百万Tokens降低至1元/百万Tokens。

  5月15日,在火山引擎原动力发布会上,字节跳动豆包大模型家族、火山方舟2.0、AI应用及AI云基础设施等一系列最新产品正式发布。

  火山引擎是字节跳动旗下云服务平台,据谭待介绍,经过一年时间的迭代和市场验证,字节跳动自研的豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成3000万张图片。

  “豆包主力模型的推理输入定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。”谭待表示,大模型从以分计价到以厘计价,将助力企业以更低成本加速业务创新。

  谭待强调,降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这条路。

  海外方面,自2023年3月,OpenAI已经进行了多次降价。在今年1月25日夜间的更新中,OpenAI新推出了2个嵌入模型,更新了3种模型的版本,并降低了多个模型及API的使用价格。其中,GPT-3.5 Turbo模型的输入价格降低了50%,至0.0005美元/1000 Tokens,输出价格降低了25%,至0.0015美元/1000 tokens。

  5月13日,OpenAI发布新一代大模型GPT-4o,GPT-4o能够接受文本、音频、图像和视频的任意组合作为输入,并生成文本、音频和图像输出的任意组合。GPT-4o可以在最短232毫秒内响应音频输入,平均为320毫秒,与人类正常对话的响应时间接近。与GPT-4Turbo相比,GPT-4o的速度快2倍,价格减半,速率限制高出5倍。

  在机构分析师看来,GPT-4o的诞生进一步验证了大模型厂商API的降价趋势,其技术路径对国内大模型产业也具备积极的映射作用。

  随着国内外大模型厂商技术角逐进一步激烈,华龙证券分析师孙伯文认为,大模型行业开启价格战信号明显。通过降低价格门槛,大模型厂商有望吸引更广泛的企业用户群体,从而进一步平衡收入和成本。

  “同时,更多C端用户有望免费使用基础AI应用,庞大的访问量有助于企业进一步提升模型服务能力,完成良性循环。对下游企业来说,推理成本进一步降低,AI应用行业有望迎来成本拐点。”其表示。

  AI应用有望加速普及

  在业内看来,此轮大模型降价潮是各家厂商为了抢占市场份额,加速AI应用的商业化落地而采取的策略。

  谈及字节跳动大模型降价原因,谭待近期指出,今年大模型技术显著提升,应用环节至关重要。繁荣生态是推广应用的关键。市场上,许多客户都渴望尝试大模型,但创新风险高,尤其是AI风险。

  “要减少不确定性,我们必须大幅降低试错成本,使大模型能被广泛采用,无论大企业还是个人开发者。市场呼吁我们提供更低成本的核心技术。”他表示。

  据悉,目前火山引擎的生态包括了IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)。

  谈及用户场景落地情况时,谭待对21世纪经济报道记者举例道,随着汽车与手机的交互日益自然,如在驾驶中导航、查询周边信息,无需分心操作手机,车载系统可即时响应需求。手机助手AI的应用受限于技术,未充分满足用户需求。

  他还表示,在其他场景如消费营销、金融服务中,智能体也展现出巨大潜力。

  “为实现AI技术的广泛应用,需提升技术并构建丰富的应用生态。这需要低代码生态的支持,降低开发门槛,激发群体智慧。同时,降低AI技术成本,使更多初创企业和小规模项目得以实施,促进AI时代的创新与发展。”谭待告诉记者。

  北京一位人工智能行业人士告诉记者,此轮大模型价格战的开启,对于AI应用的普及具有积极的推动作用,将使得更多企业和个人开发者能够负担得起AI技术的使用成本,从而更加积极地投入到AI技术的研发和应用中来。

  “价格战的竞争将促进AI技术的不断创新和优化,推动整个行业的技术水平不断提升。随着AI应用的普及,将带动相关产业链的发展,形成更加完善的AI生态系统,为整个社会的数字化转型提供有力支撑。”该人士表示。

  华创证券研报认为,整体来看,降低成本是推动大模型快进到“价值创造阶段”的关键要素,更低的成本价格才能真正满足企业的复杂业务场景需求,充分验证大模型的应用价值。尽管模型终端的价格压降或将促使大模型企业对上游加强成本管控,但目前我国企业正处于AI转型的关键时期,低成本下AI模型生态将进一步完善,终端应用亦将涌现出一批核心的创新应用。

艾媒咨询 | 2023年中国信创产业发展白皮书 (完整版)

信创基础消费潜力较大,尤其在办公软件领域,对办公OA、编辑类的国产软件已普遍被企业应用,如企业微信、WPS等已积累了大量的用户群体。在国家信息安全驱动的需求下,信创产品及解决方案应用将在各行各业的渗透持续加深,行业规模持续增长。

艾媒咨询 | 2023年中国信创产业发展白皮书 (完整版) 精品决策
利比亚经济社会发展状况及主要经济指标监测数据 利比亚经济社会发展状况及主要经济指标监测数据 经济领域全球经济特区现状及GCC经济特区发展状况调研数据 全球经济特区现状及GCC经济特区发展状况调研数据 经济领域突尼斯经济社会运行状况及主要经济指标监测数据 突尼斯经济社会运行状况及主要经济指标监测数据 经济领域 用数据说话