近日进行的DeepSeek-R1联网搜索能力首测中,腾讯元宝表现出色,成为排名第一,DeepSeek-R1测试旨在评估各种搜索引擎在联网搜索方面的能力,而腾讯元宝凭借其卓越的性能和高效的搜索体验赢得了此次测试的冠军。
经过DeepSeek-R1联网搜索能力首测,结果引人注目,腾讯元宝在测评中脱颖而出,以80.61分的优异成绩领跑第三方平台,成为本次测评的佼佼者。
在参与测评的第三方平台中,腾讯元宝不仅总分稳居第一,而且在基础检索能力和分析推理能力两个关键指标上也均位列榜首,阶跃AI和支付宝百宝箱分别以74.49分和73.47分位居第二和第三,其他平台则分布在不同的梯队,性能差异较为明显。
测评结果显示,各平台在基础检索能力上的表现相对较好,平均得分高达95.45,在分析推理能力方面,各平台的平均得分仅为35.35,与基础检索能力相差近60分,这一差距反映出在应对更高级的认知任务,如理解、分析、推理和解决复杂问题时,仍有很大的提升空间。
在回复率方面,腾讯元宝、飞书知识问答、阶跃AI和支付宝百宝箱表现优秀,联网搜索回复率高达100%,而在耗时方面,各平台之间的搜索效率差异较大,总平均耗时从最少的字节火山引擎(17.12秒/题)到最多的MiniMax(73.51秒/题),差距显著。
值得关注的是,所有平台在分析推理能力上的平均耗时都明显高于基础检索能力,这再次强调了提升分析推理能力的重要性。
本次DeepSeek-R1联网搜索能力首测揭示了各平台在认知任务方面的进步空间,并为未来的技术发展和优化提供了方向,腾讯元宝的出色表现展示了其在该领域的领先地位,为行业树立了新的标杆,其他平台也有待进一步提升自身实力,以在激烈的市场竞争中脱颖而出。