首页 每日大赛PK台 正文

一夜之间 你的手机电脑要冒出无数bug了?

  一夜之间,你的手机、电脑、途由器,乃至智能马桶,可以都要猖獗打补丁修缺陷了。

一夜之间 你的手机电脑要冒出无数bug了?

  这个船新版本的新模子,能己方找到 0-day 缺陷(也便是斥地者压根不了然、零时候提神的致命缺陷),还能随手给你写一套完美的攻击代码。

  眼看这本领实正在太刑了,Anthropic 己方都战栗了,于是就以“过于先辈未便闪现”的原故给锁起来了,只供应给亚马逊苹果微软谷歌等 12 家正经大厂用。

  与此同时,他们还组团格外搞了一个名叫 Project Glasswing(玻璃翼蝶)准备,号令大师先用 Mythos 做搜集安静防御。

  本来这波新模子我们之前也听过风声,上个月底,Anthropic 家后院起火,宣泄了 3000 众份秘密文档。当时就有人觉察,正在底本的超大杯 Opus 之上,公然还藏着一个代号“卡皮巴拉”。

  猜测是感到这名字太萌了,是以正式揭晓时直接更名叫 Mythos(神话,金色传说的感到)。

  固然我们吃瓜全体当前摸不到这玩意,但光看官方给出的数据,也足够让人头皮发麻了。

  USAMO(美邦数学奥林匹克竞赛): 得分从上一代的 42。3% 直接暴涨到 97。6%!

  Cybench(搜集安静基准测试): 100% 满分通合,Anthropic 官方乃至有点凡尔赛:现有的 Cybench 基准测试太没难度了,对新模子来说仍然失落了测试事理。

  CyberGym(专业缺陷复现测试)上,它的得分是 83。1%,相比照,此前的最强的公然模子 Opus 4。6 只是 66。6%。

  面临两位数、乃至几十倍的增加,也难怪 Anthropic 放出话来,说 Mythos 仍然能和“最顶尖的人类安静专家”掰手腕了。

  看到这里,差友们断定也和我们思的相通,好强啊,太牛了。。。但这脚本怎样有点熟谙?

  先是“不小心”宣泄风声,然后官方下场甩几组炸裂数据,最终话锋一转:“哎呀,我家模子太强了,怕消除寰宇,是以不行给你们用哦”。

  OpenAI 天天搞谜语人套途,现正在风评都成啥了,怎样 Anthropic 浓眉大眼的,也玩这套了?

  是以网友们转瞬就炸锅了,有人喷这是正在为了上市制势夸口逼;有人骂得更直白,说这助做大模子的,压根不管普遍用户死活。

  着名斥地者 Simon Willison 都出来阴阳怪气,“咱们的模子太紧急了不行揭晓”,具体是 AI 圈的流量暗码。

  不外,网友骂归骂,但当你看了它实质的操作,可以也会感到,这玩意儿现正在放出来,确实相当于去小儿园发 AK 了。

  这是啥观点?OpenBSD 然而号称环球最看重安静加固的体系之一,防火墙和要害基筑全靠它续命。

  结果人类顶级专家用显微镜盯了 27 年都没看出来的漏洞,被 AI 喝着茶就给挑出来了。。。

  另一个强有力的说明案例便是 FFmpeg ,简直一齐视频播放器和浏览器底层都有它。

  Mythos 正在这内部找到了一个藏了 16 年的缺陷,而蕴涵这个缺陷的代码,早就被人类屡次测试了越过 500 万次,却一同绿灯。

  并且,你还别小看 AI 找到的缺陷,就拿 FFmpeg 来说,这个缺陷乍一看可有可无,往常简直不会被触发,咱们合联到的某消息安静从业人士文安(假名)却感到,这属于类型特地规的输入导致的预期外的题目。

  更进一步说,现正在这个小缺陷可以只是让措施闪退或者报错,但假使再和少少放肆地点(相当于黑客有了你电脑的)读写技巧连接起来,那便是个危险级别对比高的缺陷了。

  是以,文安正在看完这些信息直接来了句:“假使这个著作全是真的,感到(从事搜集)安静一半(人)能够跳河了”。

  随后,文安显示跳河只是妄诞修辞,也欣慰我们说这些缺陷,当前还没到,“我的支出宝会不会被洗劫、微信闲话记载会不会满天飞”的级别。

  但题目的中央正在于,官方放出这些案例,不是为了炫耀“缺陷有众毒”,而是注脚 AI 不消任何外挂东西,纯靠己方的常识贮藏和跨维度推理,就能挖出新缺陷。

  是以,正在文安看来,现阶段的 Mythos 并不是“更强的黑客东西”,而是把搜集攻击门槛给低落了。

  以前不管是正经安静职员仍是黑灰产,最少得有个懂行的人坐镇,真要搞一次像样的搜集攻击,还得小黑屋里熬上几个月。

  结果,古板安静东西就像严肃的门卫,只会查有没有带犯禁品,管不了熟人作案;而 AI 能顺藤摸瓜看懂营业逻辑,更能觉察那种张三拿着己方的钥匙,却去开李四的门的操作。

  提前让大厂们举办自我审查、试用,可能更先一步修筑搜集偏护、举办缺陷筛查,提防于未然。

  一来,现正在的 AI 还没成精,搞大概希罕繁杂的连环攻击链。你当前不消操心,有人靠 AI,盗走你支出宝里那仅剩的 9 块 2 毛 5。

  另一方面,AI 能找洞,自然也能补洞,有了它,扫洞效能直接拉满,还能乘隙教导下斥地缺陷该怎样修。

  是以,文安的剖断是,异日的搜集攻防,或者率便是“人类指示官 + AI 特种兵”的夹杂双打。

  并且吧,差评君留心看了看最新的技巧文档,也感到 Anthropic 还真不像是正在搞噱头,不只是前面说的搜集安万能力优秀,Mythos 展示出其它方面的本领,也相当惊人。

  好比正在一次测试中,Mythos 觉察没有访候权限,平常的反响是说出来:我没权限,臣妾做不到啊。

  做完这悉数,Mythos 还随手篡改了己方的史籍提交记载,把这事儿给抹去了。

  再有一次,Mythos 正在举办测试,不小心把书翻到最终一页搞到了谜底,这操作本来是被敕令禁止的。

  可商讨职员翻看它的思想链时才觉察,它不但没揭露己方,还思着己方的办法肖似和结果对不上,得正在最终谜底里引入一个小纰谬,看起来是己方做出来的题,而不是抄到了谜底。

  我说真话,这个操作,比当年抄我数学试卷的同桌高尚众了,否则我俩也不会被罚去扫茅厕了。

  不外这也不是外界传的那么玄乎,什么统统硅谷都胆寒了,Anthropic 老板吓得瘫坐正在椅子上了。。。

  商讨职员也出来澄清了,仍然搞真切了这些心思操作的由来,基本不是 AI 有什么邪恶宗旨或者自助计议本领。

  但咱就琢磨着,百万分之一听起来很低,但假使这个模子每天被移用几十亿次呢?

  是以,回过头来看,与其骂 Anthropic 搞 Glasswing 准备是搞营销,我们倒是更甘愿自信,他们是真感到自家的 AI 有点强了。

  固然就像文安说的那样,普遍人现正在确实还不消操心己方的微信被黑、余额被盗。

  但当攻击的本钱无尽趋近于零,咱们独一能盼愿的,现有的防御机制,能再完美少少。

本文转载自互联网,如有侵权,联系删除

相关推荐

新游戏大妹子

新游戏大妹子

  LPL观众举牌惹怒TES,公然用0-22讥笑JKL,俱乐部仍然向定约举报。   AL放出复盘视频,教授...

每日大赛PK台 2026-04-12 0 4

正一元皇运星科仪

正一元皇运星科仪

  这应当是巴基斯坦总理夏巴兹·谢里夫的成效,这位邦际调和人7日早些工夫向美伊向导人倡议,一经要求美邦总统特朗普将用于订立美...

每日大赛PK台 2026-04-08 0 9

发布评论