在12项指标的测试中,该模型有11项超过了GPT-4o,整体能力高出10个百分点。

而且,其优势在诗歌欣赏等具有中国特色的领域更加明显,“最难汉语标杆”智障吧也取得了重大突破。

不过,这并不是大型模型厂商单打独斗的结果,而是由16家厂商组成的“联合团队”。

团队发起方为360,除自身参与外,包括BAT在内的主要厂商包括百度、火山引擎、腾讯、阿里巴巴、华为、国产大型模型“五小虎”、智普AI、月之暗面、MiniMax、百川智能、灵一万物、商汤科技、科大讯飞、好未来、环泉定量、面墙智能等五家头带厂商,共16家厂商到场。 (注:以上排名排名不分先后)

现在,这个“联合团队”已经被纳入AI助手中的产品——中,所有用户都可以免费使用。

十多个大模型给你打工

AI助手中,聚集了16家厂商的大模型。您可以在同一平台上直接交谈并选择您想要的。

而且,在此过程中您可以随时切换模型。系统会记住之前的上下文,让后续的模型继续完成对话。

比如下面的对话窗口,我们问智普9.11和9.8哪个大,然后把模型切换到Spark,直接问比较怎么样。

从对话中可以看出,后来被替换的星火准确地理解了“如何比较”四个字是在询问小数大小的比较。

当然,对于同样的问题,你也可以直接召唤其他公司的模型进行现场PK。

在对模型进行PK的同时,我们还可以看到更多的信息或答案,这不仅使答案更加详细,而且还可以进行交叉验证。

例如,我们问了一个关于电视剧《雍正王朝》中两个角色之间关系的问题。这个问题首先向智浦提出。

然后我们就请温心一言来解答,看看能否得到更多的信息。结果智浦的回答是正确的,文心一言给出了更详细的补充。

更重要的是,360人工智能助手对于选择困难、或者不知道哪种机型更适合的用户也极其友好。

只要你选择“AI助手”本体作为对话模型,系统就会根据对话内容判断你的意图,然后根据任务类型自动匹配最合适的模型。

比如,在完成写作任务时,AI助手会给我们分配擅长文案写作的豆袋。

当遇到编程问题时,就会调用到编码能力较强的DeepSeek。

主要基于逻辑推理的问题可以通过智慧谱来回答。

当然,界面中显示的任务分类比较笼统。在实际操作过程中,AI助手还将任务进行了更细粒度的划分。

此外,在选择车型的同时,AI助手也会先进行在线搜索。

在11项指标上击败GPT4o! 360游戏让16家大型模特公司联手出战

因此,使用AI助手的另一个好处是,你可以获取最新的信息,而不必担心模型的知识库更新时间。

对于一些常见的任务,AI助手平台还准备了专门的助手来更好地实现这些功能。

除了在网页上使用外,AI助手还有另外两个主要入口,——桌面和360安全浏览器。

例如,在360安全浏览器中,安装AI助手插件后,您在浏览网页时会看到右下角有一个浮动球。

一键即可召唤右侧边栏的AI助手,在书写时还可以与同窗口的AI快速对话。

此外,当鼠标移到浮动球上时,其上方会出现一个新按钮。点击后可以一键汇总当前浏览的页面。

您还可以向AI助手询问页面详情。

它还支持总结英文内容。

此外,对于页面上的个别单词和短语,选择后,会出现AI助手的工具栏,可以对所选部分进行翻译和解释,或者在线搜索更多相关信息。

桌面端基于360安全卫士实现。其功能与浏览器类似,但文字调用的范围从网页扩展到整个系统。

那么AI助手背后到底采用了什么样的技术呢?

独创“专家协同”架构

其实,这种按需求调度大模型的使用,恰好是360推出的一项新技术,——CoE(Collaboration-of-Experts),也就是专家的协同架构。

我们知道,国内很多模型在单项指标上已经追平甚至超越了OpenAI,但在整体实力上,差距就显露出来了。

360的想法是改变这种“单打独斗”的模式,打造一个大模型“专家集群”,形成混合型大模型,让各自发挥所长,与GPT-4o进行一场“联合团队”的方式。

结果,基于360 CoE架构、由16个国产大模型组成的混合大模型在12项指标的测试中取得了80.49分的综合成绩,超越了GPT-4o的69.22分。

并且除了代码之外,其他11个指标都优于GPT-4o。

尤其是在“弱智酒吧”、诗歌欣赏等具有中国特色的问题上,CoE的领先优势更加明显。

与MoE(Mixture-of-Experts,混合专家)架构相比,360的CoE模型在速度、智能和成本方面具有显着优势。

CoE通过意图识别和任务调度优化推理资源分配,提高效率,降低成本,推理成本降低90%。

为了能够以最高效的方式调度CoE架构中的模型,至少有两个方面的工作是不可或缺的。

在11项指标上击败GPT4o! 360游戏让16家大型模特公司联手出战

首先是对这些模型能力的综合评估。只有这样,我们才能了解每个模型擅长的领域,知道应该给模型分配哪些任务。

为此,360对专家库中的模型在12个领域的性能进行了全面测试,以找出模型的独特能力。

除GPT-4o外,其他型号名称均已隐藏

另一方面,对用户意图的解读——了解任务需求,这显然是分配模型不可或缺的基础。

基于过去10年在搜索引擎行业积累的技术和数据,360训练了一个专用模型,可以识别超过1亿个意图分类。

让AI更加普惠

除了技术功底,我们不禁也想问,360是如何组织比赛,让15家大型模型厂商“入局”的?

360公司创始人兼董事长周鸿祎表示,厂商合作的出发点是大车型投入巨大。只有使用它们才能覆盖成本并不断改进产品。

360拥有大量用户,能够开启桌面和浏览器两大明星场景,能够为这些机型带来庞大的用户群体。

与插件相比,这两个入口可以让用户非常接近大模型的能力。如今大模型最大的需求恰恰就是贴近场景、贴近用户,让用户用得着。

此外,集成的AI助手避免了单一大模型的缺点,可以通过优势互补来超越GPT-4o。这给了厂商给用户使用的机会,未来还会发布更多的场景。

可以说,360人工智能助手的这个模型是在AGI到来之前提高模型水平的一个很好的解决方案,同时也有利于提高AI的渗透率。

近期,国内大型模型厂商开始形成共识,变得更加开放,纷纷提供更便宜的Token API。

因此,360向桌面和浏览器两个入口开放,不仅是为了“广纳天下英才”,更是顺应了这种开放的大趋势。

更高层面上,360也希望将AI带给更多人。

周鸿祎认为,AI不会消灭人,而是会消灭不会使用AI的人;对于那些能够使用它的人来说,人工智能将是一个强大的工具。

但同时,人工智能本身不应该居高临下,而应该给那些愿意学习它的人掌握的机会。

这就是360所说的AI普惠——,让每个人都能享受AI带来的能力,避免在AI时代落后。

AI助手门户:https://bot.360.com

- 超过-

用户评论

情字何解ヘ

哇,360游戏这次真的是大显身手了,竟然在11项指标上击败了GPT-4o!感觉360的游戏实力越来越强大了。

    有11位网友表示赞同!

身影

听说360游戏这次联手了16家大型模特公司,这阵容太强大了,期待看到他们的合作成果。

    有13位网友表示赞同!

汐颜兮梦ヘ

360游戏在11项指标上击败GPT-4o,看来我国游戏产业越来越厉害了!骄傲啊!

    有13位网友表示赞同!

半梦半醒i

这个消息太震撼了!360游戏竟然能击败GPT-4o,这16家大型模特公司的加入是不是也起到了关键作用呢?

    有9位网友表示赞同!

致命伤

360游戏这次的实力确实不容小觑,11项指标全胜,看来他们是真的下了血本啊。

    有17位网友表示赞同!

你是梦遥不可及

我猜这次360游戏的成功,不仅仅是技术上的突破,还有16家模特公司的加持吧。

    有14位网友表示赞同!

凉凉凉”凉但是人心

360游戏这次的合作真是太妙了,不仅提升了游戏体验,还让模特行业也有了新的发展机会。

    有19位网友表示赞同!

铁树不曾开花

竟然在11项指标上击败了GPT-4o,360游戏这是要成为游戏界的王者了吗?

    有17位网友表示赞同!

在哪跌倒こ就在哪躺下

这个新闻让我对360游戏充满了期待,他们这次的表现一定会给我们带来惊喜的。

    有12位网友表示赞同!

笑傲苍穹

360游戏联手16家大型模特公司,这个组合太神奇了,不知道会擦出怎样的火花。

    有14位网友表示赞同!

心悸╰つ

360游戏这次真的太牛了,不仅在技术上打败了GPT-4o,还让模特行业有了新的发展方向。

    有16位网友表示赞同!

心脏偷懒

我一直觉得360游戏很有潜力,这次的表现更是证明了我的看法,期待他们的未来。

    有13位网友表示赞同!

服从

360游戏这次的成功,让我对我国的游戏产业充满了信心,希望他们能继续创新,引领行业。

    有12位网友表示赞同!

昂贵的背影

这个新闻让我对360游戏有了全新的认识,他们竟然能在11项指标上击败GPT-4o,太厉害了。

    有5位网友表示赞同!

南初

360游戏这次的合作太有意义了,不仅提升了游戏品质,还对模特行业产生了积极影响。

    有11位网友表示赞同!

江山策

360游戏在11项指标上击败GPT-4o,这个成绩太亮眼了,他们真的做到了!

    有20位网友表示赞同!

你瞒我瞒

我一直相信360游戏有能力超越GPT-4o,现在看来,他们真的做到了,太棒了!

    有7位网友表示赞同!

经典的对白

360游戏这次的胜利,不仅是对他们自己的肯定,也是对整个游戏行业的鼓舞。

    有16位网友表示赞同!

短发

360游戏联手16家模特公司,这个跨界合作太有趣了,期待看到他们的精彩表现。

    有12位网友表示赞同!

标签: