谷歌Gemini 1.5 Pro在基准测试中超越GPT-4o，成为新一代AI模型霸主

谷歌Gemini 1.5 Pro在基准测试中超越GPT-4o，成为新一代AI模型霸主

生成式人工智能领域迎来了新霸主——Gemini 1.5 Pro。在8月1日的最新基准测试中，谷歌的这款新模型超越了OpenAI的GPT-4o，成为了新的标杆。

谷歌Gemini的突围

尽管谷歌的Gemini 1.5 Pro在发布时并未大张旗鼓，但它迅速引起了人工智能社区的关注。该模型的实验版本被标记为“实验性”，但其卓越的基准测试成绩使其成为了讨论的焦点。

基准测试的变革

自GPT-3问世以来，OpenAI的ChatGPT一直在生成式AI领域占据主导地位。特别是GPT-4o与Anthropic的Claude-3，在大多数主流基准测试中均遥遥领先。最受欢迎的测试之一是LMSYS Chatbot Arena，该测试评估模型在各种任务中的能力。

在最新的基准测试中，GPT-4o的得分为1,286，Claude-3则获得了1,271分。Gemini 1.5 Pro的前一个版本得分为1,261，而新发布的实验版本（Gemini 1.5 Pro 0801）则以1,300分打破了记录。这一成绩显示，Gemini 1.5 Pro在总体表现上超越了目前的竞争对手。

AI社区的兴奋

尽管基准测试提供了有价值的比较，但它并不总能全面反映AI模型的实际能力。随着市场上AI聊天机器人的逐渐成熟，用户最终将决定哪种模型最适合他们的需求。

Gemini 1.5 Pro的发布在社交媒体上引发了热烈讨论。许多用户对其表现赞不绝口，一位Reddit用户甚至表示，该模型“完全超越了4o”。

尽管Gemini 1.5 Pro的实验版本目前广泛可用，但由于其处于早期测试阶段，未来是否会成为默认版本尚未确定。谷歌可能会根据测试反馈进行调整或撤销该模型，以确保其安全性和稳定性。

本文来源： 波场区块链浏览器

声明：本文由入驻区块链网的作者撰写，观点仅代表作者本人，绝不代表区块链网赞同其观点或证实其描述。

提示：投资有风险，入市须谨慎。本资讯不作为投资理财建议。

侵权：如发现文章侵权或者资讯不实，请发电邮jubao@qklw.com举报，平台查证后将第一时间处理。

关于区块链网发文章的介绍：

一、用户根据资质共为分五级：由低到高为C级、B级、A级、A+级、A++级，每天对应的免费发文数量为：3篇、5篇、20篇、40篇、100篇。
二、等级划分：个人用户初始为C级，企业用户初始为B级，个人用户和企业用户都根据文章质量晋升，企业用户晋升速度比个人用户快三倍，个人用户发布的文章不可顶置，不推荐第三方搜索引擎收录。
三、包含联络方式的文章（或者软文）只能发布在《企业快讯》频道下面的区新闻、区行情、区观察、区技术、区评分、区百科栏目里。
四、A级以下用户无法发布文章到区块链网的官方频道即：24小时快讯、打假、头条、百科频道。
五、文章至少一张图片（如果不上传封面，这张图片默认为封面），不可盗其它平台图片，但可以截图到本站，系统会自动上传。
六、发布优秀文章可以赚RMB，RMB可用于发布广告或软文，优秀文章指的是区块链业内新闻、打假资讯、技术分享、原创经验、百科知识等文章。
七、不管任何情况下，违反《平台协议》的文章将被删除，用户投诉经核实后亦会被删除。