(资料图片)
新华社研究院中国企业发展研究中心近期发布的《人工智能大模型体验报告》显示,百度文心一言在主流大模型产品中表现亮眼,总得分位居国内第一。在测试的多个维度中,如基础能力、智商、情商、工作提效等,百度文心一言均荣获全国第一。
值得注意的是,在智商测试方面,百度文心一言表现超出预期,并超越ChatGPT3.5,居于第二名位置,仅次于GPT4。本次评测针对基础能力、智商测试、情商测试、工作提效能力等四大维度以及36个子能力展开,共进行了300个问题的测试。研究院还严格挑选了专家评测团队,深入分析各个产品的语义理解、知识储备以及逻辑能力等方面,进而得出各家厂商大模型的综合评价。报告显示,ChatGPT系列模型的各项指标也有出色表现,其中Chat-GPT4.0版本在它的前身3.5版本上有进一步提升。由百度研发的文心一言作为国内自主研发的大模型产品,实力彰显。另外,其他大模型产品在基础能力方面也有优良表现,但在面对较为复杂的工作环境和情商需求时,依然存在提升空间。
关键词: