在12项指标的测试中,该模型有11项超过了GPT-4o,整体能力高出10个百分点。
而且,其优势在诗歌欣赏等具有中国特色的领域更加明显,“最难汉语标杆”智障吧也取得了重大突破。
不过,这并不是大型模型厂商单打独斗的结果,而是由16家厂商组成的“联合团队”。
团队发起方为360,除自身参与外,包括BAT在内的主要厂商包括百度、火山引擎、腾讯、阿里巴巴、华为、国产大型模型“五小虎”、智普AI、月之暗面、MiniMax、百川智能、灵一万物、商汤科技、科大讯飞、好未来、环泉定量、面墙智能等五家头带厂商,共16家厂商到场。 (注:以上排名排名不分先后)
现在,这个“联合团队”已经被纳入AI助手中的产品——中,所有用户都可以免费使用。
十多个大模型给你打工
AI助手中,聚集了16家厂商的大模型。您可以在同一平台上直接交谈并选择您想要的。
而且,在此过程中您可以随时切换模型。系统会记住之前的上下文,让后续的模型继续完成对话。
比如下面的对话窗口,我们问智普9.11和9.8哪个大,然后把模型切换到Spark,直接问比较怎么样。
从对话中可以看出,后来被替换的星火准确地理解了“如何比较”四个字是在询问小数大小的比较。
当然,对于同样的问题,你也可以直接召唤其他公司的模型进行现场PK。
在对模型进行PK的同时,我们还可以看到更多的信息或答案,这不仅使答案更加详细,而且还可以进行交叉验证。
例如,我们问了一个关于电视剧《雍正王朝》中两个角色之间关系的问题。这个问题首先向智浦提出。
然后我们就请温心一言来解答,看看能否得到更多的信息。结果智浦的回答是正确的,文心一言给出了更详细的补充。
更重要的是,360人工智能助手对于选择困难、或者不知道哪种机型更适合的用户也极其友好。
只要你选择“AI助手”本体作为对话模型,系统就会根据对话内容判断你的意图,然后根据任务类型自动匹配最合适的模型。
比如,在完成写作任务时,AI助手会给我们分配擅长文案写作的豆袋。
当遇到编程问题时,就会调用到编码能力较强的DeepSeek。
主要基于逻辑推理的问题可以通过智慧谱来回答。
当然,界面中显示的任务分类比较笼统。在实际操作过程中,AI助手还将任务进行了更细粒度的划分。
此外,在选择车型的同时,AI助手也会先进行在线搜索。
因此,使用AI助手的另一个好处是,你可以获取最新的信息,而不必担心模型的知识库更新时间。
对于一些常见的任务,AI助手平台还准备了专门的助手来更好地实现这些功能。
除了在网页上使用外,AI助手还有另外两个主要入口,——桌面和360安全浏览器。
例如,在360安全浏览器中,安装AI助手插件后,您在浏览网页时会看到右下角有一个浮动球。
一键即可召唤右侧边栏的AI助手,在书写时还可以与同窗口的AI快速对话。
此外,当鼠标移到浮动球上时,其上方会出现一个新按钮。点击后可以一键汇总当前浏览的页面。
您还可以向AI助手询问页面详情。
它还支持总结英文内容。
此外,对于页面上的个别单词和短语,选择后,会出现AI助手的工具栏,可以对所选部分进行翻译和解释,或者在线搜索更多相关信息。
桌面端基于360安全卫士实现。其功能与浏览器类似,但文字调用的范围从网页扩展到整个系统。
那么AI助手背后到底采用了什么样的技术呢?
独创“专家协同”架构
其实,这种按需求调度大模型的使用,恰好是360推出的一项新技术,——CoE(Collaboration-of-Experts),也就是专家的协同架构。
我们知道,国内很多模型在单项指标上已经追平甚至超越了OpenAI,但在整体实力上,差距就显露出来了。
360的想法是改变这种“单打独斗”的模式,打造一个大模型“专家集群”,形成混合型大模型,让各自发挥所长,与GPT-4o进行一场“联合团队”的方式。
结果,基于360 CoE架构、由16个国产大模型组成的混合大模型在12项指标的测试中取得了80.49分的综合成绩,超越了GPT-4o的69.22分。
并且除了代码之外,其他11个指标都优于GPT-4o。
尤其是在“弱智酒吧”、诗歌欣赏等具有中国特色的问题上,CoE的领先优势更加明显。
与MoE(Mixture-of-Experts,混合专家)架构相比,360的CoE模型在速度、智能和成本方面具有显着优势。
CoE通过意图识别和任务调度优化推理资源分配,提高效率,降低成本,推理成本降低90%。
为了能够以最高效的方式调度CoE架构中的模型,至少有两个方面的工作是不可或缺的。
首先是对这些模型能力的综合评估。只有这样,我们才能了解每个模型擅长的领域,知道应该给模型分配哪些任务。
为此,360对专家库中的模型在12个领域的性能进行了全面测试,以找出模型的独特能力。
除GPT-4o外,其他型号名称均已隐藏
另一方面,对用户意图的解读——了解任务需求,这显然是分配模型不可或缺的基础。
基于过去10年在搜索引擎行业积累的技术和数据,360训练了一个专用模型,可以识别超过1亿个意图分类。
让AI更加普惠
除了技术功底,我们不禁也想问,360是如何组织比赛,让15家大型模型厂商“入局”的?
360公司创始人兼董事长周鸿祎表示,厂商合作的出发点是大车型投入巨大。只有使用它们才能覆盖成本并不断改进产品。
360拥有大量用户,能够开启桌面和浏览器两大明星场景,能够为这些机型带来庞大的用户群体。
与插件相比,这两个入口可以让用户非常接近大模型的能力。如今大模型最大的需求恰恰就是贴近场景、贴近用户,让用户用得着。
此外,集成的AI助手避免了单一大模型的缺点,可以通过优势互补来超越GPT-4o。这给了厂商给用户使用的机会,未来还会发布更多的场景。
可以说,360人工智能助手的这个模型是在AGI到来之前提高模型水平的一个很好的解决方案,同时也有利于提高AI的渗透率。
近期,国内大型模型厂商开始形成共识,变得更加开放,纷纷提供更便宜的Token API。
因此,360向桌面和浏览器两个入口开放,不仅是为了“广纳天下英才”,更是顺应了这种开放的大趋势。
更高层面上,360也希望将AI带给更多人。
周鸿祎认为,AI不会消灭人,而是会消灭不会使用AI的人;对于那些能够使用它的人来说,人工智能将是一个强大的工具。
但同时,人工智能本身不应该居高临下,而应该给那些愿意学习它的人掌握的机会。
这就是360所说的AI普惠——,让每个人都能享受AI带来的能力,避免在AI时代落后。
AI助手门户:https://bot.360.com
- 超过-
标签:
用户评论
哇,360游戏这次真的是大显身手了,竟然在11项指标上击败了GPT-4o!感觉360的游戏实力越来越强大了。
有11位网友表示赞同!
听说360游戏这次联手了16家大型模特公司,这阵容太强大了,期待看到他们的合作成果。
有13位网友表示赞同!
360游戏在11项指标上击败GPT-4o,看来我国游戏产业越来越厉害了!骄傲啊!
有13位网友表示赞同!
这个消息太震撼了!360游戏竟然能击败GPT-4o,这16家大型模特公司的加入是不是也起到了关键作用呢?
有9位网友表示赞同!
360游戏这次的实力确实不容小觑,11项指标全胜,看来他们是真的下了血本啊。
有17位网友表示赞同!
我猜这次360游戏的成功,不仅仅是技术上的突破,还有16家模特公司的加持吧。
有14位网友表示赞同!
360游戏这次的合作真是太妙了,不仅提升了游戏体验,还让模特行业也有了新的发展机会。
有19位网友表示赞同!
竟然在11项指标上击败了GPT-4o,360游戏这是要成为游戏界的王者了吗?
有17位网友表示赞同!
这个新闻让我对360游戏充满了期待,他们这次的表现一定会给我们带来惊喜的。
有12位网友表示赞同!
360游戏联手16家大型模特公司,这个组合太神奇了,不知道会擦出怎样的火花。
有14位网友表示赞同!
360游戏这次真的太牛了,不仅在技术上打败了GPT-4o,还让模特行业有了新的发展方向。
有16位网友表示赞同!
我一直觉得360游戏很有潜力,这次的表现更是证明了我的看法,期待他们的未来。
有13位网友表示赞同!
360游戏这次的成功,让我对我国的游戏产业充满了信心,希望他们能继续创新,引领行业。
有12位网友表示赞同!
这个新闻让我对360游戏有了全新的认识,他们竟然能在11项指标上击败GPT-4o,太厉害了。
有5位网友表示赞同!
360游戏这次的合作太有意义了,不仅提升了游戏品质,还对模特行业产生了积极影响。
有11位网友表示赞同!
360游戏在11项指标上击败GPT-4o,这个成绩太亮眼了,他们真的做到了!
有20位网友表示赞同!
我一直相信360游戏有能力超越GPT-4o,现在看来,他们真的做到了,太棒了!
有7位网友表示赞同!
360游戏这次的胜利,不仅是对他们自己的肯定,也是对整个游戏行业的鼓舞。
有16位网友表示赞同!
360游戏联手16家模特公司,这个跨界合作太有趣了,期待看到他们的精彩表现。
有12位网友表示赞同!