11项指标击败GPT4o！360攒局让16家大模型联手作战

评论 2024-10-06

在12项指标的测试中，该模型有11项超过了GPT-4o，整体能力高出10个百分点。

而且，其优势在诗歌欣赏等具有中国特色的领域更加明显，“最难汉语标杆”智障吧也取得了重大突破。

不过，这并不是大型模型厂商单打独斗的结果，而是由16家厂商组成的“联合团队”。

团队发起方为360，除自身参与外，包括BAT在内的主要厂商包括百度、火山引擎、腾讯、阿里巴巴、华为、国产大型模型“五小虎”、智普AI、月之暗面、MiniMax、百川智能、灵一万物、商汤科技、科大讯飞、好未来、环泉定量、面墙智能等五家头带厂商，共16家厂商到场。（注：以上排名排名不分先后）

现在，这个“联合团队”已经被纳入AI助手中的产品——中，所有用户都可以免费使用。

十多个大模型给你打工

AI助手中，聚集了16家厂商的大模型。您可以在同一平台上直接交谈并选择您想要的。

而且，在此过程中您可以随时切换模型。系统会记住之前的上下文，让后续的模型继续完成对话。

比如下面的对话窗口，我们问智普9.11和9.8哪个大，然后把模型切换到Spark，直接问比较怎么样。

从对话中可以看出，后来被替换的星火准确地理解了“如何比较”四个字是在询问小数大小的比较。

当然，对于同样的问题，你也可以直接召唤其他公司的模型进行现场PK。

在对模型进行PK的同时，我们还可以看到更多的信息或答案，这不仅使答案更加详细，而且还可以进行交叉验证。

例如，我们问了一个关于电视剧《雍正王朝》中两个角色之间关系的问题。这个问题首先向智浦提出。

然后我们就请温心一言来解答，看看能否得到更多的信息。结果智浦的回答是正确的，文心一言给出了更详细的补充。

更重要的是，360人工智能助手对于选择困难、或者不知道哪种机型更适合的用户也极其友好。

只要你选择“AI助手”本体作为对话模型，系统就会根据对话内容判断你的意图，然后根据任务类型自动匹配最合适的模型。

比如，在完成写作任务时，AI助手会给我们分配擅长文案写作的豆袋。

当遇到编程问题时，就会调用到编码能力较强的DeepSeek。

主要基于逻辑推理的问题可以通过智慧谱来回答。

当然，界面中显示的任务分类比较笼统。在实际操作过程中，AI助手还将任务进行了更细粒度的划分。

此外，在选择车型的同时，AI助手也会先进行在线搜索。

在11项指标上击败GPT4o！ 360游戏让16家大型模特公司联手出战

因此，使用AI助手的另一个好处是，你可以获取最新的信息，而不必担心模型的知识库更新时间。

对于一些常见的任务，AI助手平台还准备了专门的助手来更好地实现这些功能。

除了在网页上使用外，AI助手还有另外两个主要入口，——桌面和360安全浏览器。

例如，在360安全浏览器中，安装AI助手插件后，您在浏览网页时会看到右下角有一个浮动球。

一键即可召唤右侧边栏的AI助手，在书写时还可以与同窗口的AI快速对话。

此外，当鼠标移到浮动球上时，其上方会出现一个新按钮。点击后可以一键汇总当前浏览的页面。

您还可以向AI助手询问页面详情。

它还支持总结英文内容。

此外，对于页面上的个别单词和短语，选择后，会出现AI助手的工具栏，可以对所选部分进行翻译和解释，或者在线搜索更多相关信息。

桌面端基于360安全卫士实现。其功能与浏览器类似，但文字调用的范围从网页扩展到整个系统。

那么AI助手背后到底采用了什么样的技术呢？

独创“专家协同”架构

其实，这种按需求调度大模型的使用，恰好是360推出的一项新技术，——CoE（Collaboration-of-Experts），也就是专家的协同架构。

我们知道，国内很多模型在单项指标上已经追平甚至超越了OpenAI，但在整体实力上，差距就显露出来了。

360的想法是改变这种“单打独斗”的模式，打造一个大模型“专家集群”，形成混合型大模型，让各自发挥所长，与GPT-4o进行一场“联合团队”的方式。

结果，基于360 CoE架构、由16个国产大模型组成的混合大模型在12项指标的测试中取得了80.49分的综合成绩，超越了GPT-4o的69.22分。

并且除了代码之外，其他11个指标都优于GPT-4o。

尤其是在“弱智酒吧”、诗歌欣赏等具有中国特色的问题上，CoE的领先优势更加明显。

与MoE（Mixture-of-Experts，混合专家）架构相比，360的CoE模型在速度、智能和成本方面具有显着优势。

CoE通过意图识别和任务调度优化推理资源分配，提高效率，降低成本，推理成本降低90%。

为了能够以最高效的方式调度CoE架构中的模型，至少有两个方面的工作是不可或缺的。

在11项指标上击败GPT4o！ 360游戏让16家大型模特公司联手出战

首先是对这些模型能力的综合评估。只有这样，我们才能了解每个模型擅长的领域，知道应该给模型分配哪些任务。

为此，360对专家库中的模型在12个领域的性能进行了全面测试，以找出模型的独特能力。

除GPT-4o外，其他型号名称均已隐藏

另一方面，对用户意图的解读——了解任务需求，这显然是分配模型不可或缺的基础。

基于过去10年在搜索引擎行业积累的技术和数据，360训练了一个专用模型，可以识别超过1亿个意图分类。

让AI更加普惠

除了技术功底，我们不禁也想问，360是如何组织比赛，让15家大型模型厂商“入局”的？

360公司创始人兼董事长周鸿祎表示，厂商合作的出发点是大车型投入巨大。只有使用它们才能覆盖成本并不断改进产品。

360拥有大量用户，能够开启桌面和浏览器两大明星场景，能够为这些机型带来庞大的用户群体。

与插件相比，这两个入口可以让用户非常接近大模型的能力。如今大模型最大的需求恰恰就是贴近场景、贴近用户，让用户用得着。

此外，集成的AI助手避免了单一大模型的缺点，可以通过优势互补来超越GPT-4o。这给了厂商给用户使用的机会，未来还会发布更多的场景。

可以说，360人工智能助手的这个模型是在AGI到来之前提高模型水平的一个很好的解决方案，同时也有利于提高AI的渗透率。

近期，国内大型模型厂商开始形成共识，变得更加开放，纷纷提供更便宜的Token API。

因此，360向桌面和浏览器两个入口开放，不仅是为了“广纳天下英才”，更是顺应了这种开放的大趋势。

更高层面上，360也希望将AI带给更多人。

周鸿祎认为，AI不会消灭人，而是会消灭不会使用AI的人；对于那些能够使用它的人来说，人工智能将是一个强大的工具。

但同时，人工智能本身不应该居高临下，而应该给那些愿意学习它的人掌握的机会。

这就是360所说的AI普惠——，让每个人都能享受AI带来的能力，避免在AI时代落后。

AI助手门户：https://bot.360.com

- 超过-

用户评论

情字何解ヘ

哇，360游戏这次真的是大显身手了，竟然在11项指标上击败了GPT-4o！感觉360的游戏实力越来越强大了。

有11位网友表示赞同！

身影

听说360游戏这次联手了16家大型模特公司，这阵容太强大了，期待看到他们的合作成果。

有13位网友表示赞同！

汐颜兮梦ヘ

360游戏在11项指标上击败GPT-4o，看来我国游戏产业越来越厉害了！骄傲啊！

有13位网友表示赞同！

半梦半醒i

这个消息太震撼了！360游戏竟然能击败GPT-4o，这16家大型模特公司的加入是不是也起到了关键作用呢？

有9位网友表示赞同！

致命伤

360游戏这次的实力确实不容小觑，11项指标全胜，看来他们是真的下了血本啊。

有17位网友表示赞同！

你是梦遥不可及

我猜这次360游戏的成功，不仅仅是技术上的突破，还有16家模特公司的加持吧。

有14位网友表示赞同！

凉凉凉”凉但是人心

360游戏这次的合作真是太妙了，不仅提升了游戏体验，还让模特行业也有了新的发展机会。

有19位网友表示赞同！

铁树不曾开花

竟然在11项指标上击败了GPT-4o，360游戏这是要成为游戏界的王者了吗？

有17位网友表示赞同！

在哪跌倒こ就在哪躺下

这个新闻让我对360游戏充满了期待，他们这次的表现一定会给我们带来惊喜的。

有12位网友表示赞同！

笑傲苍穹

360游戏联手16家大型模特公司，这个组合太神奇了，不知道会擦出怎样的火花。

有14位网友表示赞同！

心悸╰つ

360游戏这次真的太牛了，不仅在技术上打败了GPT-4o，还让模特行业有了新的发展方向。

有16位网友表示赞同！

心脏偷懒

我一直觉得360游戏很有潜力，这次的表现更是证明了我的看法，期待他们的未来。

有13位网友表示赞同！

服从

360游戏这次的成功，让我对我国的游戏产业充满了信心，希望他们能继续创新，引领行业。

有12位网友表示赞同！

昂贵的背影

这个新闻让我对360游戏有了全新的认识，他们竟然能在11项指标上击败GPT-4o，太厉害了。

有5位网友表示赞同！

南初

360游戏这次的合作太有意义了，不仅提升了游戏品质，还对模特行业产生了积极影响。

有11位网友表示赞同！

江山策

360游戏在11项指标上击败GPT-4o，这个成绩太亮眼了，他们真的做到了！

有20位网友表示赞同！

你瞒我瞒

我一直相信360游戏有能力超越GPT-4o，现在看来，他们真的做到了，太棒了！

有7位网友表示赞同！

经典的对白

360游戏这次的胜利，不仅是对他们自己的肯定，也是对整个游戏行业的鼓舞。

有16位网友表示赞同！

短发

360游戏联手16家模特公司，这个跨界合作太有趣了，期待看到他们的精彩表现。

有12位网友表示赞同！

标签：

11项指标击败GPT4o！360攒局让16家大模型联手作战

十多个大模型给你打工

独创“专家协同”架构

让AI更加普惠

用户评论

龙珠超单机游戏下载v6.1.5-龙珠单机版游戏

龙血武魂下载v1.0.5-龙血武魂88读书网

龙魂武神下载-龙魂武尊下载

仙境Q战在线下载，礼包激活码领取-仙境官网

森林冰火人双人游戏联机版-适合异地情侣2个人玩的游戏

臣民之塔在线下载，礼包激活码领取-臣民怎么读

地面生存手机中文版-地面生存安卓版下载

帝国空袭在线下载，礼包激活码领取-帝国空间

末日前线在线下载，礼包激活码领取

致命公司正版-致命公司正版能和盗版一起玩吗

凯瑟的帽子店下载-凯瑟的照片

布阵西游在线下载，礼包激活码领取-布阵游戏

农业之谷3D下载安装-农谷之乡

蛋仔派对网易版下载安装-蛋仔派对最新版

迷你dayz2最新版下载-迷你dayz21.0.5下载

荒野大镖客2雷霆修改器下载-荒野大镖客2雷霆修改器下载手机版

下一站我的大学最新版下载-下一站我的大学修改版2020

【见习猎魔团新版本】见习猎魔团新版本下载安装

免费2012qq下载「V.2354」-2013qq免费下载安装

幻想春秋在线下载，礼包激活码领取-幻想的春天

凯瑟的帽子店下载-凯瑟的照片

布阵西游在线下载，礼包激活码领取-布阵游戏

农业之谷3D下载安装-农谷之乡

蛋仔派对网易版下载安装-蛋仔派对最新版

迷你dayz2最新版下载-迷你dayz21.0.5下载

荒野大镖客2雷霆修改器下载-荒野大镖客2雷霆修改器下载手机版

下一站我的大学最新版下载-下一站我的大学修改版2020

【见习猎魔团新版本】见习猎魔团新版本下载安装

免费2012qq下载「V.2354」-2013qq免费下载安装

幻想春秋在线下载，礼包激活码领取-幻想的春天

十多个大模型给你打工

独创“专家协同”架构

让AI更加普惠

用户评论

来来安徽麻将怀远麻将下载602次下载

城市真实驾驶竞速Real629次下载

捕鱼大咖app下载538次下载

天天爱海南麻将安卓下载539次下载

极道仙魔诀下载安装446次下载

电梯帝国游戏853次下载

温岭同城游戏大厅手机版701次下载

pvz911次下载