您现在的位置是:静夜思网 > 探索

IDC最新技术评估报告:文心大模型获综合评分第一

静夜思网2024-03-28 23:35:05【探索】3人已围观

简介科技日报记者华凌IT市场研究和咨询公司IDC最新发布的《AI大模型技术能力评估报告2023》显示,百度文心大模型3.5拿到12项指标的7个满分,综合评分第一。据了解,这是IDC首次提出AI大模型技术能

科技日报记者 华凌

IT市场研究和咨询公司IDC最新发布的新技心《AI大模型技术能力评估报告2023》显示,百度文心大模型3.5拿到12项指标的术评7个满分,综合评分第一。估报告文

据了解,模型这是获综合评IDC首次提出AI大模型技术能力评估框架。参与本次评估的分第国内主流大模型包括14家厂商。结果显示,新技心百度AI大模型整体竞争力位于领先水平,术评是估报告文这场大模型技术突破者和应用引领者。百度文心在模型能力、模型工具平台、获综合评生态布局及行业覆盖上优势明显,分第并已提前进入商业化落地探索阶段。新技心

据介绍,术评IDC评估报告围绕产品技术、估报告文服务生态以及行业应用三大维度,考察大模型的10余项指标,其中“算法模型”和“行业覆盖”成为衡量大模型能力极其重要的两个指标。

产品技术能力中,“算法模型”维度是重中之重,是大模型能力最为核心的要素,也是决定大模型应用效果的根本所在。只有通过算法模型技术的突破,实现具有通用效果优势的大模型底座,才能支撑更广泛的行业覆盖,才能使各行各业充分享受技术突破带来的红利,破解AI落地门槛高的困境。

在行业应用能力中,应用覆盖的广度是当下大模型厂商最为关注的指标。“行业覆盖”通过企业级客户数量和落地行业数,体现了大模型在产业落地上的实力,是大模型效果通用领先性、行业结合能力两方面的综合体现。

“算法模型”“行业覆盖”两个核心指标有其内在的关联性,行业覆盖的广度是算法模型通用领先性的集中体现,也将为算法模型能力持续提升提供源源不断的正向反馈,形成持续迭代提升的飞轮。

本次评估中,百度文心大模型两项指标在众多厂商中均获得唯一满分。

据百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,这得益于百度四层技术栈优势、知识增强的核心特色和繁荣的大模型生态三大优势。自研的深度学习平台飞桨有力支撑了大模型的高效训练和推理。让文心大模型3.5最新版本的模型效果提升50%,训练速度提升2倍,推理速度提升30倍。知识增强则实现更高的效率、更好的效果、更强的可解释性。在大模型生态方面,百度文心已形成企业、教育、社区三位一体的生态体系。目前有15万家企业申请接入文心一言测试。

很赞哦!(45875)