淘金官网主营:SSR罗茨风机、SSR罗茨鼓风机等产品
淘金官网
全国客服热线:

15020012856

案例

实测蚂蚁万亿新考虑模型Ring-1T跟DeepSeek V32拼一把

来源:淘金官网    发布时间:2025-11-10 23:18:49
SSR罗茨风机

  两周内先后开源了Ring-1T-preview、Ling-1T和Ring-1T,Ring-1T一起是全球首个开源的万亿考虑模型,这名头够嘹亮,也够让我深夜开机来个全面测验。

  在正式开测前,我觉得需求理一下蚂蚁这一系列新模型,蚂蚁,便是咱们手机里那个能种树、能付钱的支付宝蚂蚁,

  他们发布的大模型中文名叫百灵,有三个系列,Ling代表言语模型,Ring代表考虑模型,Ming则代表多模态模型。

  跟preview版不同,正式版Ring-1T完结了完好的练习流程,包括继续经过大规模可验证奖赏强化学习练习提升了推理才能,经过RLHF练习提升了模型通用才能。

  光速开测,用的是我的大模型噩梦级测验事例1.1版,跟DeepSeek V3.2(开深度考虑)来个PK。揭露一切提示语,每个提示语跑三次,取效果最好的一次作为终究成果。包括SVG、物理模仿、前端规划、可交互3D四大类

  有些提示语比较长,以及连同输出的代码和效果我都打包到文档了,大众号后台发“ring”就好啦。

  Ring-1T(左边)差个脚踏,轮子、车架、鸟本体都有了,而 DeepSeek V3.2 画出来的鹈鹕仍是如此安稳完结了脚身别离,方向也反了,车把也没了。

  为了让咱们明晰看出不同,我又又又又把其他16个模型的跑出来的鹈鹕拿出来了,什么看到能不由得不笑啊

  用 HTML、CSS 和 JavaScript 完结这样一个效果:一个小球被困在一个旋转的六边形内部。小球遭到地球重力的效果,并与六边形内壁发生冲突。小球的弹跳需求看起来逼线T:

  Ring-1T和DeepSeek V3.2都供给了多项参数挑选,包括但不限于小球重置,增减六边形旋转速度,还能够撤销动力,Ring-1T在这个根底上还增加了反弹和墙面冲突力。

  帮我做一个 Microsoft Word 的克隆版别,但只需求前端部分。

  除了加粗、斜体、下划线T还能轻松完结字体大小调整,左中右对齐。界面本体和功用切换上真能唬住我,这种case测起来就有种惊喜感,分明没有等待它能完结除了前端外的其他功用,可是抽盲盒能抽出来。

  这个属所以气候组件的变体,不做任何约束,就让模型出卡,它们都挑选了带扩大特效和按钮变色。我发现DeepSeek V3.2很喜爱用暖色,Ring-1T反而喜爱用冷色调,有点想测测它们的16品格了。

  现在已能给贪吃蛇加上速度、磁力、双倍积分和护盾了,DeepSeek V3.2把色块做出来了,可是没有起到效果。

  百宝箱我之前也做过测评,几步就能够拉起一个自己的Agent团队,还能够在支付宝上kuku收钱。

  ,中文叫棒冰的算法,它的效果便是当一根棒冰(字面意义上),给模型的强化学习练习进程降温,经过批改了练习和推理阶段的精度差异,避免了长周期练习中GRPO算法或许会呈现的溃散问题。在技能陈述里边放出了两张图,

  图右:训推差异最大值,GRPO跟着练习上升很明显,Icepop维持在较低水位

  右图看的是极点状况:GRPO不只全体不安稳,在最坏状况下的差异还在继续恶化。而IcePop在最坏状况下,差异也远小于GRPO,并保持在相对可控的范围内。

  在模型层除了根底言语模型Ling-1T和这次的推理模型Ring-1T,立刻还会更新多模态模型Ming,

  结构层也没放过,除了上面说到的Asystem,还有多智能体体系结构AWorld,

  应用层也还有,除了上面说到的多Agent百宝箱,还有AI健康管家AQ、AI理财管家蚂小财、AI日子管家

  最终,感谢你看到这个当地假如喜爱这篇文章,无妨随手给咱们点赞|在看|转发|谈论