最懂粤语的大模型来啦? 商汤日日新:会听会说,支持百万字超长文本

艾媒咨询|2023年中国AIGC行业发展研究报告

随着人工智能技术的不断发展,AIGC技术也日益成熟,广泛应用于更多领域,其广阔的应用前景将推动AIGC市场规模快速增长。艾媒咨询预测,预计2023年中国AIGC核心市场规模将达79.3亿元,2028年将达2767.4亿元。

艾媒咨询|2023年中国AIGC行业发展研究报告 精品决策
全球数字化转型状况与技术层面改造支出调研数据 全球数字化转型状况与技术层面改造支出调研数据 经济领域全球及美国营销技术行业发展状况及消费行为调查数据 全球及美国营销技术行业发展状况及消费行为调查数据 营销智能农业市场发展状况与新技术效益调查数据 智能农业市场发展状况与新技术效益调查数据 农事 用数据说话

  近日,商汤科技发布了面向粤语用户定制的粤语大模型系列产品(包括Web端及App端),并宣布了多个大模型产品的更新迭代。

  商汤科技董事长兼CEO徐立博士表示:“商汤科技十年前于香港成立,在这个地方推出商量粤语版,对我们来说有着重大的意义。凭借日日新大模型5.0系列的创新产品及其巨大潜力,我们致力推动香港人工智能生态系统的发展。随着人工智能2.0时代的到来,我们将继续利用商汤 AI 大装置SenseCore及日日新SenseNova大模型的强大能力,通过当地语系化解决方案积极促进社会的变革。”

  此前,很少有大模型专门针对粤语用户的语言习惯,以及粤语地区文化去做开发迭代。本次发布会,商汤借“十周年”契机,宣布粤语大模型Web端及App端产品将于近期向粤语区公众开放使用,且永久免费。

  懂听懂说懂看,粤语大模型好“盏鬼”

  在通用大模型底座方面,商汤自去年4月推出“日日新SenseNova”大模型体系之后,截至今年4月“日日新”已完了5轮升级。今年4月23日技术交流日上,商汤发布的最新一轮升级中,“日日新”大模型的参数全面对标甚至在特定能力方面超越了GPT 4 Turbo。

  随后,“日日新”大模型体系在权威主流评测取得突破性成绩:在中文大模型测评基准SuperCLUE中,成为首个超越GPT-4 Turbo的国产大模型;在OpenCompass的基准表现中,客观评测超过GPT-4 Turbo,主观评测已超过GPT-4o,并位列第一。

  时隔一个月,商汤再度发布粤语版大模型,包括“商量语言大模型粤语版” 及“商量多模态大模型粤语版”,展示了优异的粤语能力,以及对粤港澳大湾区日常及文化的深入理解。

  在发布会上,商汤展示了两组与GPT 4 Turbo对照测试的截图。在输入“叫人磅水应该点做?”时,商量立马明白这是在寻求让对方给钱或还钱,但GPT 4 Turbo则误解是要称水的重量。

  当以粤英混用的方式问到“Call白车打咩number?”时,商量立马理解这是要叫救护车的意思,并给出“在香港,应拨打999”的解决方案,而GTP 4 Turbo则以为用户想叫不同颜色(公司)的出租车。

“商量粤语版”的多模态能力,则对具备粤语地区文化特色的图片展现了精准的理解。在一幅展示维多利亚港的照片中,它不但能辨认其中著名的地标建筑,如“中银大厦”“IFC金融中心”等,还介绍维多利亚港是“观赏烟花的绝佳地点”“游客欣赏香港夜景的热门场所”。

“商量多模态大模型粤语版”整合了多模态数据和超长文理解、思考、生成的能力,可支持上传50个文档,支持百万字超长文本,支持读取Word、PPT、PDF、URL、TXT、JSON、PNG、JPG等多种格式文档,并可短时间内对财报数据、复杂图表等予以对比分析、输出结果,多模态文档解析能力达到行业领先水平。

  除了文字交互、文档理解,商量粤语版App也能为用户提供语音交互功能。一方面,粤语用户可以“我口讲我心,我手写我心”,另一方面,商量则能够根据用户的需求,用书面语或者口语进行答复,更加切合粤语区用户多种场景的语言使用习惯。

  此外,商汤粤语API现已开放使用,最大支持128K窗口,定价为30港元/百万Token(输入和输出同价),该模型适用于需要粤语支持的各种场景,包括但不限于在线客服、虚拟助手等。

  借大模型应用链接香港,连接世界

  商汤率先发布粤语大模型,一方面是顺应大模型本土化的落地趋势,另一方面,“香港是一个非常独特的接轨国际和内地的市场,所以商汤在较早就开始考虑,基于日日新大模型底座做粤语模型。不仅粤港澳、广西、海南地区的人民讲粤语,不少东南亚、北美华侨也在说,算下来全球有广大人口都在说粤语。”  商汤科技亚太区副总裁兼战略执行负责人邹春慧表示。

  商汤大模型原生产品“小浣熊家族”也宣布在软件研发、数据分析等多个办公场景,支持粤语交互,实现香港地区办公场景进一步提效。同时在功能层面,办公小浣熊基于日日新·商量大模型能力迭代,发布pdf、ppt、word、sql等文档数据分析能力,支持更复杂的多源异构数据分析。

  大湾区文化一衣带水,粤语大模型在大湾区融合发展上,也能起到一定作用。例如,深港两地金融工作者此前在对话上容易产生歧义,使用粤语大模型可以自动生成会议纪要,优化业务流程;又比如,在电话沟通场景上,粤语大模型能有效对齐信息,消除沟通上的误解。

  在发布会上,商汤分别与德勤中国、隶属吉利科技集团创新业务板块的长兴吉数科技有限公司,以及香港电讯等多个合作伙伴签署合作备忘录。各方分别在商量粤语大模型应用、市场开拓、人工智能服务应用及算力资源等方面探讨合作。

  作为一个诞生于香港的科技公司,商汤已在香港扎根十年。接下来,商汤将借粤语大模型之势,通过本地化的AI能力,更好服务“生于此、长于此”的香港,探索粤港澳大湾区产业的智能化发展。

艾媒咨询|2023年中国AIGC行业发展研究报告

随着人工智能技术的不断发展,AIGC技术也日益成熟,广泛应用于更多领域,其广阔的应用前景将推动AIGC市场规模快速增长。艾媒咨询预测,预计2023年中国AIGC核心市场规模将达79.3亿元,2028年将达2767.4亿元。

艾媒咨询|2023年中国AIGC行业发展研究报告 精品决策
全球数字化转型状况与技术层面改造支出调研数据 全球数字化转型状况与技术层面改造支出调研数据 经济领域全球及美国营销技术行业发展状况及消费行为调查数据 全球及美国营销技术行业发展状况及消费行为调查数据 营销智能农业市场发展状况与新技术效益调查数据 智能农业市场发展状况与新技术效益调查数据 农事 用数据说话