主要观点
8月15日,科大讯飞举行主题为“解放生产力、释放想象力”的讯飞星火认知大模型V2.0升级发布会,讯飞星火认知大模型V2.0能力全面升级,文本生成能力提升72%、语言理解能力提升78%、知识问答能力提升70%、逻辑推理能力提升60%、数学能力提升72%。代码能力和多模态交互能力也有重点突破:代码能力方面,从业界参考测试集上的效果对比来看,讯飞星火认知大模型V2.0基于Python和C++进行代码写作能力已高度逼近ChatGPT,差距仅为1%和2%;多模态方面,讯飞星火认知大模型V2.0带来了多模态能力提升,包含图像描述、图像理解、图像推理、识图创作、文图生成、虚拟人合成等功能。基于代码处理和多模态能力的商业化产品iFlyCode1.0(编程助手)、讯飞智作2.0(视频创作平台)、星火语伴2.0(练习口语)目前已开启试用申请。在8月12日新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》报告中,讯飞星火以总体评分1013分位列大模型Top1。
8月16日,第九届WAVE SUMMIT深度学习开发者大会在京举办,会上百度重磅发布文心大模型、飞桨平台、AI原生应用如流等一系列技术、产品及生态成果。文心一言自今年3月发布至今快速成长,熟练掌握的创作体裁超过200个,内容丰富度是发布初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖达到初期的8.3倍。此次官方上线的5个原生插件,分别为百度搜索、览卷文档(基于文档的交互)、E言易图(数据洞察图表生成)、说图解画(基于图片的交互)、一镜流影(文字转视频),目前网页版可以同时使用3个插件,并通过大模型的能力进行理解、分析及调度,以适应需求场景。同时,文心一言面向开发者正式推出AI Studio星河大模型社区、插件机制以及文心大模型“星河”共创生态计划,加快大模型生态建设,推动大模型应用发展。
根据我们“大模型+小模型+应用&内容”的研究框架,我们认为国内大模型行业的发展已经从原本追赶补齐大模型能力的阶段,来到了同时推进商业化、尝试规模落地的阶段。
1)根据科大讯飞半年报,讯飞星火认知大模型已经为公司的学习、办公等消费类硬件产品销售带来显著增长。2023年5-6月,公司C端硬件GMV创历史新高,同比翻倍增长,其中搭载讯飞星火认知大模型的讯飞AI学习机GMV在5月和6月分别增长136%和217%。我们认为科大讯飞的硬件产品和终端不仅贡献收入和利润,还能够与其软件平台和云服务相结合形成一个完整的生态系统,提高用户粘性,同时也可以收集和分析用户的数据和反馈,不断优化其技术和产品。