PG电子APPAI榜单“变天”了！马斯克发布Grok 41盲测排名登顶第一

您现在所在位置：首页 > PG电子 > PG电子下载

PG电子

News

PG电子APPAI榜单“变天”了！马斯克发布Grok 41盲测排名登顶第一

2026-02-02 13:11:51

浏览次数：次

返回列表

　　PG电子(Pocket Games Soft )全球首屈一指的电子游戏供货商[永久网址:363050.com]，首位跨足线下线上电子游戏开发。PG电子,pg娱乐,PG电子试玩平台,pg电子app,pg电子外挂,pg电子接口,pg电子技巧,pg电子下载,欢迎注册体验！就在OpenAI发布GPT-5.1，大谈“情商”之际，埃隆·马斯克（Elon Musk）也带着他的xAI，火速加入了这场“AI体验”之战。

　　就在刚刚，xAI宣布推出Grok4.1，这是对现有Grok 4模型的重大升级，并已在X平台以及iOS和Android应用向所有用户全面开放。。官方宣称，新版本在创意表达、情感互动和协同交流方面表现尤为突出，并且出现幻觉的概率仅为此前模型的三分之一。

　　更引人注目的是，在一个公开的“盲测”竞技场（LMArena）上，Grok 4.1的“思考模式”版本已悄然登顶总榜第一，甚至其“非推理”的快速模式，都击败了所有对手的“完整推理”模式。

　　这场突如其来的“榜首易主”，无疑为日趋白热化的AI竞赛，又增添了浓重的火药味。

　　xAI本次发布了两个Grok 4.1模型：Grok 4.1（非推理模式）和Grok 4.1 Thinking（思考模式）。这两个模型均可免费使用，但付费用户面临的限制更少。

　　官方表示，新版本能更细致地理解隐含意图，与之对话引人入胜，也更能保持人设的一致性。

　　为了优化模型的风格、人格和有用性，xAI利用前沿的代理型推理模型（agentic reasoning models）作为“奖励模型”，在大规模环境中自主评估并迭代模型的回答。

　　在11月1日至14日的“静默上线”期间，xAI在真实流量上进行了盲测式的成对比较评估，结果显示，在64.78%的情况下，用户更偏好Grok 4.1。

　　LMArena是一个开源工具，用户可以通过并排、盲测的方式，比较不同大语言模型的表现。在这个竞争最激烈的“斗兽场”里，Grok 4.1取得了惊人的成绩：

　　·Grok 4.1的“思考模式”（代号：quasarflux）以1483 Elo的成绩位列总榜第一，领先所有非xAI模型31分。

　　·Grok 4.1的“非推理模式”（代号：tensor）无需使用“思考词元”（thinking tokens），可立即生成回答，并以1465 Elo的成绩排名第二。

　　·更夸张的是，Grok 4.1的“非推理”模式表现，超过了所有其他模型在“完整推理模式”下的公开排行榜成绩。

　　·情绪智能（Emotional Intelligence）为评估模型在个性与人际互动方面的进展，xAI对Grok 4.1进行了EQ-Bench3测试。这是一项由LLM作为裁判的测试，用于评估模型在主动情绪智能、理解力、洞察力、共情能力和人际技能方面的表现。

　　·创意写作能力（Creative Writing）xAI同样测量了Grok 4.1在Creative Writing v3基准测试中的表现。在该测试中，模型需要根据32个不同的写作提示，在3次迭代中生成回答。

　　快速响应模型在配备搜索工具后，虽然能迅速给出答案，但更容易出现事实性错误。

　　在Grok 4.1的后训练阶段，xAI重点降低了模型在信息查询类提示中的事实性“幻觉”。

　　根据xAI的说法，Grok 4.1出现幻觉的概率是此前模型的三分之一，这使其成为xAI迄今为止的最佳版本之一。

　　为了验证这一点，xAI不仅在真实的生产流量中进行了评估，还使用了FActScore——一个包含500道关于人物传记问题的公开基准测试。

　　更重要的是，谷歌（Google）正在准备发布Gemini 3.0，这可能会成为迄今为止最强大的模型。

　　Grok 4.1的发布，无疑是马斯克在AI竞赛中投下的一枚重要棋子。但在这场“神仙打架”的牌局中，谁能笑到最后，还远未可知。（易句）

　　金银价暴跌，国内金饰克价一夜大跌上百元；柜姐：不能因降价就退货！有珠宝城成交降至冰点，专家：不要搞“赌博式投资”

　　1949年蒋介石率部退守台湾，当时他手里到底还剩多少兵力？答案简直让人难以置信

　　实探中国最北宜家闭店前一日：家居展区几乎被搬空，食品已售罄，仍有不少顾客前来“捡漏”打卡留念

　　“非遗贺新春”2026冬游河北过大年暨共享景播•文旅优品启动活动将于2月4日在河

　　美国悦基因儿童复合维生素深度测评｜四大维度全覆盖，破解3-12岁儿童成长核心痛点

上一篇：PG电子APP据天气预报周末成都气温将突破40℃之后更是基本稳定在30℃

下一篇：岩山科技：子公司拟3000万元参投上策兴融芯投资集成电路产业PG电子技巧

首页

关于我们

PG电子

婚纱照

留言板

婚礼习俗

联系我们

PG电子

News

PG电子APPAI榜单“变天”了！马斯克发布Grok 41盲测排名登顶第一

首页

关于我们

PG电子

婚纱照

留言板

婚礼习俗

联系我们

PG电子 News

PG电子APPAI榜单“变天”了！马斯克发布Grok 41盲测排名登顶第一

PG电子

News