Anthropic让AI先读员工手册再上岗:失控率从54%降到7%

Anthropic让AI先读员工手册再上岗:失控率从54%降到7%

新智元报道 编辑:元宇 Anthropic 最新研究让 AI 先读懂规范背后的意义,再接受行为示范,在特定实验中将 Agent 失控率从 54% 压到7%。 同样的训练数据,能训出两个行事原则截然相反的 AI,这是 Anthropic 最新研究「模型规范中期训练」(MSM,Model Spec Mi
阅读全文
OpenAI携手5大巨头发布MRC协议,重塑大规模AI训练网络架构

OpenAI携手5大巨头发布MRC协议,重塑大规模AI训练网络架构

5 月 7 日消息,OpenAI 昨日(5 月 6 日)发布公告,为解决大规模 AI 训练中的网络延迟和故障问题,已携手 AMD、博通、英特尔、微软和英伟达公司,联合推出多路径可靠连接(MRC)协议,并通过 OCP(开放计算项目)向全行业开放该协议。 IT 之家援引博文介绍,MRC 全称为 Mult
阅读全文
REDMI K90 Max 体验:内置风扇加独显,用最直接的方式造一台性能旗舰

REDMI K90 Max 体验:内置风扇加独显,用最直接的方式造一台性能旗舰

在主打性能的机型上加入内置主动散热结构,在这两年推出的新机潮中称为了主流。 这次,REDMI 也来了。 他们带来 K90 家族新一代性能旗舰,搭载内置散热风扇的 K90 Max,定价 3199 起。 外观上,K90 Max 延续了 K90 系列的设计模式,手机有太空银、天际蓝和暗影黑三款配色,我们手
阅读全文
全身麻醉状态下大脑仍具复杂语言处理能力

全身麻醉状态下大脑仍具复杂语言处理能力

论文链接:Plasticity and language in the anaesthetized human hippocampus 科技日报北京 5 月 6 日电 (记者张佳欣)来自美国贝勒医学院的研究团队发现,人类大脑即使在全身麻醉导致的无意识状态下,仍具备复杂高级的语言处理能力。这项发表在最
阅读全文
Mozilla 反对 Chrome 的 Prompt API

Mozilla 反对 Chrome 的 Prompt API

Google Chrome 在 2025 年提出了 Prompt API,也就是为浏览器集成的本地模型——使用前需要下载——提供统一的 JavaScript API。Google 还有意让该 API 成为一个 W3C 标准。Chrome 桌面版集成的大模型是 Gemini Nano,使用该模型需要本
阅读全文
吉利汽车:2026年4月销量23.5万辆,出口同比涨245%

吉利汽车:2026年4月销量23.5万辆,出口同比涨245%

近日消息,吉利汽车公布 2026 年 4 月销量数据,当月总销量达到 23.5 万辆,新能源销量 13.6 万辆,两项数据均实现同比和环比双增长。 新能源板块成为增长主力,4 月新能源销量占比达到 58%,同比增长8%,环比增长 6.5%。 旗下吉利银河系列销量 91001 辆,环比上涨 10%,吉
阅读全文
老外称在中国电商购买4TB外置硬盘被骗:拆开竟是SD卡+读卡器,平台秒退款

老外称在中国电商购买4TB外置硬盘被骗:拆开竟是SD卡+读卡器,平台秒退款

5 月 5 日消息,近日,海外社交平台 Reddit 一名用户分享了自己的离谱购物经历。其在某中国跨境电商平台花费 20 美元,购入一款标称 4TB 容量的外置机械硬盘,到货拆开后发现,产品内部只是 SD 卡搭配读卡器伪装的扩容假货,事件引发大量海外网友热议。该平台为国内电商企业旗下的跨境出海平台,
阅读全文
AI自己造AI,概率60%,2028年底前!Anthropic联创坐不住了

AI自己造AI,概率60%,2028年底前!Anthropic联创坐不住了

新智元报道 编辑:元宇 Anthropic 联合创始人 Jack Clark 读完数百份公开数据,得出一个让他自己也坐不住的结论:2028 年底前,AI 自己造 AI 的概率是 60%。支撑他这一判断的,是编程、科研复现、模型训练优化等多条能力曲线:每一条都在向右上方飞,没有减速迹象。 AI 系统,
阅读全文
12岁写代码,28岁撑起谷歌20亿业务!他却劝年轻人:别卷编程了

12岁写代码,28岁撑起谷歌20亿业务!他却劝年轻人:别卷编程了

新智元报道 编辑:桃子 12 岁写代码,15 岁赚第一桶金,28 岁当上谷歌 CMO,他却给年轻人泼了盆冷水:别学编程了! 12 岁写代码,成为谷歌史上最年轻 CMO 后,他却告诉所有Z世代—— 别卷编程了,不如去滑冰! 曾几何时,掌握编程能力,是通往硅谷巅峰的唯一入场券。 比尔盖茨、小扎、马斯克,
阅读全文
美国市场电动车需求持续低迷 本田冻结加拿大电动车工厂计划

美国市场电动车需求持续低迷 本田冻结加拿大电动车工厂计划

据日本共同社 5 月 6 日报道,本田宣布无限期冻结在加拿大建设电动汽车工厂的计划,受美国市场电动车需求持续低迷及前景不明影响,原定投产安排彻底取消。 该计划原定于 2028 年投产,2025 年已延期两年,此次升级为无限期冻结。项目包括新建 EV 整车工厂与 EV 电池工厂,总投资约 150 亿加
阅读全文
俞浩:追觅、华为、小米三家将成全球最强车企

俞浩:追觅、华为、小米三家将成全球最强车企

5 月 5 日,追觅科技创始人兼 CEO 俞浩接连发布多条关于造车相关的视频。视频中,俞浩预判,追觅、华为、小米三家企业的造车业务,在 20 年后必将成为全球最强的造车企业。他认为,这三家企业的掌舵者对汽车行业的理解,远超普通 CEO 以及西方车企的 CEO。 近期,俞浩在社交媒体开启高频更新模式,
阅读全文
1美元买10颗星?顶会曝出GitHub假星灰产,热门仓库或藏木马

1美元买10颗星?顶会曝出GitHub假星灰产,热门仓库或藏木马

新智元报道 编辑:元宇 一颗星,0.1 美元,一杯 6 元奶茶能买 8 颗。ICSE 顶会论文曝出 GitHub 上 600 万颗星可能是刷出来的,其中大量「热门项目」很可能是伪装成盗版软件、游戏外挂、加密货币机器人的钓鱼或恶意软件仓库。 凌晨一点,一个程序员正在 GitHub 上挑选即将要用的开源
阅读全文
豆包将推出付费版本 AI专家:系因算力和Token消耗成本高,前提是市占率足够大

豆包将推出付费版本 AI专家:系因算力和Token消耗成本高,前提是市占率足够大

近日,红星新闻记者注意到,豆包 App Store 页面出现付费版本服务声明。声明称,为更好地服务专业用户,豆包将在免费版的基础上,推出包含更多增值服务的付费版本。 该页面披露了三档订阅价格:标准版连续包月每月 68 元(连续包年每年 688 元)、加强版连续包月每月 200 元(连续包年每年 20
阅读全文
尼康Z9改装相机通过欧洲严苛辐射测试,助力NASA传回太空日食影像

尼康Z9改装相机通过欧洲严苛辐射测试,助力NASA传回太空日食影像

4 月 26 日消息,据 Phys 报道,德国亥姆霍兹重离子研究中心(GSI)与国际反质子与离子研究装置(FAIR),为阿耳忒弥斯 2 号登月任务的圆满成功作出了重要贡献。一台专为太空应用研发的相机,已提前在该中心及 FAIR 的粒子加速器上,于模拟真实太空环境的条件下完成了各项测试。 据 IT 之
阅读全文
扒完DeepSeek V4 报告,我翻出了这个隐藏彩蛋

扒完DeepSeek V4 报告,我翻出了这个隐藏彩蛋

今天上午,DeepSeek V4 发布,直接把这个大模型疯狂更新月推向了最高潮。 百万上下文标配,性能比肩顶级闭源模型,首发适配华为昇腾芯片,随便一个点单拎出来能写一篇爆款头条。 不过在我翻看 V4 的技术报告的时候,在训练层面看到了一个被大部分人滑过去的名词:Muon 优化器。 这个技术名词,怎么
阅读全文
GPT-5.5赢了Opus 4.7和Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex!

GPT-5.5赢了Opus 4.7和Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex!

OpenAI 今天发布了 GPT-5.5,称其为公司迄今“最聪明、最直觉化”的模型,也是面向真实工作的全新智能形态。相比上一代,GPT-5.5 的重点是进一步承担复杂任务中的规划、工具调用、结果检查和跨工具执行,被 OpenAI 定位为推动“用 AI 在电脑上完成工作”的关键一步。 赢了 Opus
阅读全文