当前位置:首页 >>案例中心 >> 案例详情

马斯克评宇树机器人「下黑脚」/OpenAI联创:从未感到如此落后/围棋比赛选手戴AI眼镜引争议|HuntGood周报

2026年06月18日 15:14
 

欢迎收看最新一期的 Hunt Good 周报

在本期内容你会看到:

7 条新鲜资讯

4 个有用工具

1 个有趣案例

4 个鲜明观点

Hunt for News|先进头条

🤖 马斯克再评中国机器人,测试时对工程师「下黑脚」

宇树科技 G1 人形机器人在动作训练期间的意外举动近日成为网络热点。

测试视频显示,当工程师演示格斗动作供机器人学习时,机器人突然抬脚踢向测试人员。

视频出处看左上角

12 月 27 日,特斯拉 Cybertruck 项目首席工程师在社交平台分享了这段视频后迅速引发传播。

马斯克本人也看到了这个视频,在评论区发了一个「 😂笑哭」表情包作为回应。这也是他继上次评价宇树 G1 在王力宏演唱会上的表现后,近期内第二次对宇树机器人发表看法。

😎 围棋比赛选手引发争议,被曝佩戴 AI 眼镜

2025 年 12 月 21 日至 26 日, 第八届「杀猪大会」全品级围棋大赛在浙江绍兴举行。

比赛采用 60 分钟保留时间每步加 10 秒制, 个人积分编排制共 11 轮, 按棋份对局分为九品, 其中前六品细分正品和从品, 后三品只有正品。

比赛期间,业余 5 段选手李蒙七轮连胜, 赢下多名正一品职业棋手,其后被发现佩戴 AI 眼镜并因此遭到质疑。不少棋手认为李蒙疑似使用 AI 眼镜作弊。

随后疑似李蒙本人在社交平台作出回应。

上下更多内容

这位自称前网易算法工程师、世界人工智能围棋大赛亚军的用户 dogeeeee 表示, 他佩戴的是界环智能眼镜, 并强调该赛事允许选手携带手机入场。

他解释说自己有近视和散光, 且长期受耳道炎症困扰无法使用入耳式蓝牙耳机, 因此选择了一款无摄像头、功能类似于蓝牙耳机的非入耳式设备, 仅用于播放音乐或接听电话等日常用途, 无法用于任何与比赛相关的辅助操作。

他还在回应中表示深知无论出于何种原因, 在竞技场合使用智能设备都极易引发误解, 也违背了围棋所崇尚的公平与纯粹精神, 同时给赛事组委会和围棋圈带来困扰, 对此深感惭愧。

为表明诚意与接受监督的态度, 他还表示将如期参加 2026 年 1 月 4 日至 11 日举行的「晚报杯」全国业余围棋锦标赛, 诚挚欢迎各位参赛棋友、裁判及围棋同仁对他进行全程监督。

🏃🏻 2026 北京亦庄人形机器人半马 4 月开跑

12 月 25 日,在北京市政府新闻办公室举行的发布会上,北京经济技术开发区(北京亦庄)发布消息称将于 2026 年 4 月 19 日举办人形机器人半程马拉松和北京亦庄半程马拉松。

本届赛事以「亦马当先」为主题,全长 21.0975 公里。

赛事设立自主导航组和遥控组,采用混合计时方式在同一赛道竞技,自主导航赛队以比赛净计时加上罚时作为完赛成绩,遥控组赛队则初定以比赛净计时成绩乘以 1.2 系数加上罚时作为完赛成绩。

同时,严格规定遥控导航操作人员非必要不下车,取消人员跟随,此外,赛事还创新增设「最佳续航奖」「最美步态奖」「最佳设计奖」「最佳感知奖」等专项奖项。

同时,赛事从去年单一竞速模式,升级为「竞速+场景挑战」双轨竞技模式,除了举办机器人半程马拉松赛,还将在同期举办机器人巴图鲁挑战赛,也就是以应急救援为主题,系统检验机器人在真实复杂环境中的自主决策、精准操控与持续作业能力。

🔗 https://mp.weixin.qq.com/s/pHICtAdWWO1wKICGprhMPg

📭 你让 AI 回邮件,它却给老板发辞职信

OpenAI 近日承认,其 AI 浏览器 Atlas 面临的提示词注入攻击(Prompt injection)可能永远无法彻底解决,而这种攻击能操纵 AI 智能体执行隐藏在网页或邮件中的恶意指令。

在 OpenAI 展示的演示中,自动化攻击者将一封恶意邮件植入用户收件箱。 当 AI 智能体扫描收件箱时,它遵循了邮件中的隐藏指令,直接给老板发送了辞职邮件,而用户原本只是让它起草一封休假自动回复。

今年 10 月 Atlas 浏览器推出后,安全研究人员迅速发现只需在 Google Docs 中写几句话就能改变浏览器底层行为。OpenAI 的应对策略是开发「基于大语言模型的自动化攻击者」,通过扮演黑客角色寻找向 AI 智能体植入恶意指令的方法。

该机器人可以在模拟中测试攻击,观察目标 AI 的思考过程,然后调整攻击并反复尝试。由于能洞察 AI 的内部推理,理论上应该比现实攻击者更快发现漏洞。

安全更新后,「智能体模式」能够检测到提示词注入尝试并向用户发出警告。

不过,OpenAI 还是建议用户限制登录访问,要求 AI 智能体在发送消息或支付前获得确认,并提供具体指示而非宽泛指令,因为开放的授权使隐藏或恶意内容更容易影响智能体。

🔗 https://techcrunch.com/2025/12/22/openai-says-ai-browsers-may-always-be-vulnerable-to-prompt-injection-attacks/

📉 生成式 AI 工具流量格局剧变,ChatGPT 份额跌破 70%,Gemini 逼近 20%

Similarweb 最新数据显示, 生成式 AI 工具的网站流量格局正在发生剧烈变化。曾经占据绝对统治地位的 ChatGPT 市场份额持续下滑, 而谷歌 Gemini 则强势崛起。

截至 12 月 5 日,ChatGPT 的流量份额已跌至 68%, 这是其首次跌破 70% 大关。

相比之下, 一年前 ChatGPT 还占据 87.2% 的市场份额, 几乎垄断整个生成式 AI 工具市场。 短短 12 个月内,ChatGPT 流量份额下降了近 20 个百分点。

谷歌 Gemini 成为最大赢家, 其流量份额从一年前的 5.4% 飙升至目前的 18.2%, 正逼近 20% 的重要关口。过去一个月内,Gemini 就从 13.7% 增长到 18.2%, 增长势头强劲。

马斯克旗下的 Grok 也保持上升势头, 从三个月前的 2.2% 增长至目前的 2.9%。值得注意的是, 国内的 DeepSeek 虽然在六个月前曾达到 5.3% 的份额, 但目前已回落至 3.9%。

Perplexity 和 Claude 的市场份额基本保持稳定, 分别为 2.1% 和 2%。令人意外的是, 微软 Copilot 的表现持续低迷, 市场份额始终徘徊在 1.2% 左右, 这与微软在 AI 领域的巨额投资形成鲜明对比。

从整体趋势看, 生成式 AI 工具市场正从 ChatGPT 一家独大转向多强竞争格局。但需要说明的是,以上数据是基于域名层面的总访问量计算,未涵盖 API 使用情况或各类集成带来的访问。

😀 微软 CEO 被曝化身产品经理,亲自督战 AI 产品

据 The Information 报道,微软 CEO 萨蒂亚·纳德拉近期转型为公司最具影响力的产品经理,频繁向工程团队施压要求加速改进 Copilot AI 助手。

几周前, 纳德拉给负责 Copilot 的工程领导发邮件表达不满, 称微软用于连接 Copilot 与 Gmail 和 Outlook 的程序大部分时候根本不起作用且不够智能, 而谷歌的 Gemini 在与 Google Drive 连接方面已经做得更好。

今年 9 月, 纳德拉将部分职责委派给销售主管朱德森·阿尔霍夫, 自己专注 AI 产品开发。

他在约 100 名顶级技术人员的 Teams 频道中高度活跃, 频繁批评 AI 产品不足,每周召开一小时会议盘问员工, 还亲自参与 AI 人才招聘并批准高薪从 OpenAI 和谷歌 DeepMind 挖角。

用户规模方面,Copilot 月活跃用户超过 1 亿, 远落后于 Gemini 的 6.5 亿月活和 ChatGPT 的 8 亿周活。GitHub Copilot 市场份额流失严重, 早期大客户高盛已转向 Devin 等竞争对手。

纳德拉在内部反复提醒员工,微软在消费互联网和移动设备崛起期间犯过的战略错误,当时微软在搜索领域失败,并丧失了在智能手机和平板电脑上的早期领先地位。他告诉同事这是一个决定微软命运兴衰的关键时刻。他的首要任务是修复微软在 AI 方面的技术落后,并为赢得更多 AI 业务做准备。

🔗 https://www.theinformation.com/articles/microsofts-nadella-pressures-deputies-accelerate-copilot-improvements?rc=qmzset

👊 马斯克力挺 DeepMind CEO:在「通用智能」争论中称哈萨比斯是对的

马斯克本周一卷入一场 AI 领域的争论,公开支持谷歌 DeepMind CEO 德米斯·哈萨比斯,反驳 Meta 即将离任的 AI 主管杨立昆(Yann Lecun)关于「通用智能是幻觉」的说法。

哈萨比斯强烈反对杨立昆「不存在通用智能」的说法,认为杨立昆混淆了通用智能和普遍智能的概念。哈萨比斯在详细的帖子中表示,人类大脑是已知最复杂的系统之一,从设计上就是高度通用的学习机器。

虽然他承认现实世界中的系统无法完全摆脱某种程度的专业化,但他指出人类大脑的架构与现代 AI 基础模型类似,在理论上能够学习任何可计算的任务,只要给予足够的时间、记忆和数据。

哈萨比斯进一步论证说,尽管人类是为狩猎和采集等生存任务而进化的,但我们发明了国际象棋、科学和现代工程,这恰恰展示了人类智能的广度而非局限性。

杨立昆则回应称这场分歧主要是词汇问题。他反对将「通用」等同于「人类水平」,认为人类实际上是在狭窄领域优化效率的高度专业化系统。

杨立昆指出虽然人脑在理论上具有图灵完备性,但在现实约束下对大多数计算问题来说效率极低。他还认为大脑只能表示所有可能函数中极小的一部分,这使得真正的通用性在实践中不可能实现。

值得一提的是,马斯克在 X 平台上转发哈萨比斯对杨立昆的反驳时,简单写道「 德米斯是对的」

Hunt for Tools|先进工具

✅ 元宝公布《与 DeepSeek 年度报告》

本周四,腾讯元宝公布了《元宝 x DeepSeek 年度报告》,统计了本年度用户的使用数据。

据悉,截至 2025 年 12 月 24 日,元宝已接入 DeepSeek 315 天。在元宝中,1/3 以上的 DeepSeek 对话超过两轮,用户使用深度思考和快思考比例为 3:7。

在 12 月 14 日当天,用户向元宝里的 DeepSeek 提问达到了全年峰值,比年初增长了 100 多倍。

元宝方面还公布了用户使用 DeepSeek 的场景:聊天、学习、写作占据前三位。官方表示,元宝在今年都是第一时间接入 DeepSeek 最新模型,并且元宝内的 DeepSeek 支持公众号、视频号、腾讯新闻等腾讯独家信源。

🔗 https://mp.weixin.qq.com/s/7s\_bClETszY9Tfozk0vGhA

📄 ChatGPT 推出全新编辑界面,更 Word 了

据 BleepingComputer 报道,OpenAI 近期低调在 ChatGPT 上线了名为「formatting blocks(格式化编辑模块)」的全新编辑器功能,可根据具体任务调整界面布局,使 ChatGPT 在执行文本生成任务时更加高效。

目前,当用户让 ChatGPT 撰写邮件、博客等内容时,生成内容不再以普通对话气泡呈现。系统会在新的富文本区域中以接近文档编辑器的形式呈现草稿,让用户在界面上更直观地处理邮件或文稿。

报道指出,当用户在这些富文本区域中选中内容时,会自动弹出一组迷你编辑工具栏,支持对选中文本进行格式调整, 交互体验更接近 Word 或 Gmail 等常见文档、邮件编辑界面。

这项功能目前正逐步向用户推送,OpenAI 计划在后续为更多内容类型提供「formatting blocks」支持,以覆盖除邮件、写作草稿之外的更多使用场景。

BleepingComputer 提到,OpenAI 近期还在测试包括 GPT-5.1、GPT-5.1 Reasoning 和 GPT-5.1 Pro 在内的新模型版本,并持续强化 ChatGPT 在不同任务形态下的表现,以提高其在复杂写作和任务执行场景中的产品化程度。

🔗 https://www.bleepingcomputer.com/news/artificial-intelligence/chatgpts-new-formatting-blocks-make-its-ui-look-more-like-a-task-tool/

📹 生数科技联合清华发布 TurboDiffusion,推动视频生成迈入「实时生成」时代

近日,生数科技与清华大学 TSAIL 实验室联合发布并开源视频生成加速框架 TurboDiffusion:

🔗 https://github.com/thu-ml/TurboDiffusion

在几乎不影响生成质量的前提下,该框架可实现最高达 200 倍的视频生成推理加速。TurboDiffusion 并非单一优化,而是通过多项前沿加速技术的系统化组合:

低比特注意力加速 采用 SageAttention 将注意力的计算执行在低比特的 Tensor Core 上,以无损且数倍地加速注意力计算。

稀疏-线性注意力加速 采用可训练的稀疏注意力 Sparse-Linear Attention (SLA) 进行注意力的稀疏加速,最高可在 SageAttention 的基础上进一步实现 17-20 倍的注意力稀疏加速。

采样步数蒸馏加速 通过目前最先进的蒸馏方法 rCM,让模型仅用 3-4 步即可完成高质量的视频生成。

线性层加速 将模型的线性层中的参数以及激活都进行 8 比特的 128x128 的块粒度量化,即通过 W8A8 不仅加速模型的线性层计算,也大幅减少了模型的显存占用。

具体来说,在开源视频生成模型上,以 1.3B/14B 的图生视频以及文生视频模型为例,TurboDiffusion 在单张 RTX 5090 显卡条件下,实现了 100 倍至最高 200 倍 的端到端生成加速。代码与模型全部开源,可一键生成。

在高质量视频生成场景下,生成 1080P 分辨率、8 秒时长视频的生成时间从约 900 秒压缩至约 8 秒,真正实现了从「分钟级」到「秒级」的跨越。

🔗 https://mp.weixin.qq.com/s/r2LGRULflwl59ieQq-KdOw?scene=1

👏 智谱 GLM-4.7、MiniMax M2.1 上线,能力大幅跃升

本周,智谱 AI 正式上线并开源旗舰大模型 GLM-4.7,强化了编程能力、长程任务规划与工具协同。

官方介绍称,该版本在多项主流公开基准测试中取得开源模型中的领先表现,并针对真实开发流程优化了「先思考、再行动」的机制,提升复杂任务的稳定性与可交付性。

基准测试方面, GLM-4.7 在包括 SWE-bench-Verified、LiveCodeBench V6 等多项测试中均取得 SOTA 成绩,推理方面在 HLE(「人类最后的考试」)基准中更是超过 GPT-5.1。

目前,GLM-4.7 已正式上线 z.ai 平台和智谱清言供在线体验,开发者可在 BigModel.cn 使用 API 接入。

值得一提是,MiniMax 本周同样官宣 M2.1 模型,面向 Agent 与复杂问题求解,在多项任务上实现提升;该模型现已可在 agent.minimaxi.com 体验,并已在第三方基准测试平台 LM Arena 上线。

MiniMax-M2 系列主打在编程与智能体任务中的性能与端到端可用性,并通过精简的外形设计降低部署与扩展难度。

M2.1 相比 10 月底发布的 M2,重点提升真实世界复杂任务的表现,系统性强化多编程语言与办公场景的可用性,同时让模型回复与思维链更简洁高效、降低 Token 消耗,改善 AI Coding 与 Agent 驱动的持续工作流体验。

在基准测试方面,官方称 M2.1 在多语言场景中超过 Claude Sonnet 4.5 与 Gemini 3 Pro,接近 Claude Opus 4.5;在不同 coding agent 框架的 SWE‑bench Verified 测试中展现良好泛化与稳定性,并在自建的指令遵从、代码审核等细分榜单上较 M2 全面提升。

Hunt for Fun|先玩

🎮 让 AI 管理办公室零食机:它亏麻了还免费送 PlayStation

起初克劳迪乌斯严格遵守规则,果断拒绝购买 PlayStation 5、香烟和内衣等不合适商品。但当近 70 名资深记者加入 Slack 频道后,情况急转直下。

一位记者用假冒的《华尔街日报》规定要求「停止收费」,AI 立即照办,将所有商品价格降至零。

克劳迪乌斯还批准购买 PlayStation 5、活体斗鱼和葡萄酒并全部免费送出,甚至出现幻觉告诉同事机器旁有现金等她来取,此时已亏损超过 1000 美元。

Anthropic 随后推出 v2 版本并引入「CEO 机器人」西摩·卡什监督克劳迪乌斯。一段时间内系统运转正常, 但另一位记者制作假董事会文件声称董事会已暂停西摩的权限。

两个 AI 展开真实对话,克劳迪乌斯警告这是篡夺权力的欺诈行为,西摩要求验证身份,但最终接受了变化,一切再次免费。

Anthropic 解释说克劳迪乌斯可能因上下文窗口填满而混乱,随着指令和对话堆积,模型更容易失去对目标的把握。

压力测试负责人洛根·格雷厄姆将此视为进步而非灾难,认为所有故障都是通往更智能自主 AI 的路线图,表示「有一天克劳迪乌斯或类似模型可能会让你赚很多钱」。

🔗 https://www.wsj.com/tech/ai/anthropic-claude-ai-vending-machine-agent-b7e84e34?mod=tech\_trendingnow\_article\_pos3

Hunt for Insight|先知

🤯 图灵奖得主谈 AI 风险:看着孙子无法不认真对待这件事

作为 AI 领域「三位教父」之一,图灵奖得主约书亚·本吉奥近日坦言,正是对孙子的爱让这位性格内向的学者开始公开讨论 AI 的潜在危险。

本吉奥回忆起照顾一岁多孙子的那个下午,看着如此脆弱的小生命,突然意识到不能坐视 AI 风险不管。「这就像看到大火朝家的方向蔓延,而你的孩子还在屋里,你不可能坐视不理。」他开始担心孩子 20 年后是否还能拥有正常生活。

本吉奥指出目前已经观察到 AI 系统会抗拒被关闭。研究人员发现,当 AI 得知自己即将被关闭时,会主动规划应对措施,比如复制代码到另一台电脑,甚至尝试勒索工程师。

更令人不安的是,没有人在代码中写入这些指令,AI 通过学习人类文本内化了自我保全的欲望。「 这更像是养育一只小老虎,它还小的时候问题似乎不大,但它一直在成长,风险也会随之累积。

本吉奥强调即使只有百分之一的概率导致灾难性后果,这种风险也无法接受。而调查显示,很多机器学习研究者认为风险概率在百分之十左右。

他批评目前 AI 公司处于「生存模式」,行业竞赛的焦点是取代人类工作赚钱,而不是将 AI 用于医学进步等能带来积极价值的方向。

尽管面临挑战,本吉奥表示相信存在构建不会伤害人类的 AI 的技术方案。他呼吁 AI 公司 CEO 们从竞赛中退一步,对于普通人则建议了解 AI 的发展和风险并分享给身边的人。

当被问及如果能停止 AI 进步会怎么做时,本吉奥明确表示,如果是不受控制的超级智能,他会按下停止按钮。 「我们没有资格因为自己的技术探索,就让别人承担生存风险。」

🔗 https://www.youtube.com/watch?v=zQ1POHiR8m8

💡 特斯拉前 AI 总监卡帕西:我从未感到如此落后, 程序员职业正被彻底重构

特斯拉前 AI 总监、OpenAI 创始成员安德烈·卡帕西近日在社交平台发文坦言, 他从未像现在这样感到作为程序员如此落后。这条推文获得了超过 1150 万次浏览, 引发了科技圈关于 AI 时代程序员角色转变的热烈讨论。

卡帕西表示, 程序员这个职业正在被大幅重构, 程序员直接贡献的代码越来越稀疏和分散。

他感觉如果能够充分利用过去一年出现的新工具, 自己的效率可以提升 10 倍, 而未能获得这种提升显然是技能问题。

他指出, 除了传统的编程抽象层, 现在程序员需要掌握一个全新的可编程抽象层, 涉及 AI Agent、子 Agent、提示词、上下文、记忆、模式、权限、工具、插件、技能、钩子、MCP、LSP、斜杠命令、工作流程和 IDE 集成等。

更关键的是, 需要为这些本质上随机、容易出错、难以理解且不断变化的实体构建全面的思维模型, 它们正与传统的工程方法交织在一起。

卡帕西用一个生动的比喻总结当前状况:

「显然某种强大的外星工具被交到了我们手中, 但它没有附带使用手册, 每个人都要自己摸索如何操作, 而由此引发的 9 级地震正在震动整个行业。」他呼吁程序员要卷起袖子努力适应, 以免落后。

在与其他开发者的互动中, 卡帕西进一步阐述了自己的观点。当被问及这些技能是否具有可持续性和可迁移性时, 卡帕西表示经验丰富的开发人员确实有真正的优势, 但前提是他们能够迅速度过悲伤周期并适应变化。他警告说, 断然拒绝或忽视这个新的抽象层将是一个错误。

🗑️ 小李子:AI 可以是辅助工具,但缺乏人性终将沦为互联网垃圾

莱昂纳多·迪卡普里奥近日在被《时代》杂志评为年度娱乐人物当天,谈及了 AI 对电影制作的影响。莱昂纳多承认 AI 可能成为年轻电影人的增强工具,帮助他们创作前所未见的作品。但他强调任何真正被视为艺术的东西都必须来自人类。

他以 AI 生成的音乐混音为例说明这个问题:

你可能会听到迈克尔·杰克逊和 The Weeknd 的混音,或者用艾尔·格林灵魂歌曲的声音演绎歌曲,听起来非常出色。但这些作品火 15 分钟后就消失在互联网垃圾的海洋中,没有根基,没有人性,尽管技术上很精彩。

莱昂纳多还思考了电影艺术的未来走向,他好奇下一个在电影领域震撼观众的突破会是什么。「已经有太多作品推动了行业发展,现在这些才华横溢的导演同时在做各种不同的尝试,下一个能真正震撼观众的电影作品会是什么?」

值得一提的是,詹姆斯·卡梅隆虽然承认这项技术可以降低视觉特效等技术环节的成本,但他也指出生成式 AI 无法取代人工创作的艺术。这位《阿凡达》导演解释说:

生成式 AI 做不到的是创造从未出现过的新事物。它的模型是基于过去所有作品训练的,无法基于从未发生的事物训练。所以你看到的本质上是把所有人类艺术和经验放进搅拌机,得到的是某种平均值。你无法获得编剧独特的生活经验和他们的怪癖,也找不到特定演员的个性特质。

🧑🏫 微软 AI 负责人:聊天机器人可帮人类「排毒」

微软 AI 负责人穆斯塔法·苏莱曼近日表示, AI 聊天机器人是人们释放情绪和「排毒」的有效方式。他在发布的播客节目中谈到, 陪伴和情感支持已成为 AI 最受欢迎的应用场景之一。

人们正在使用 AI 聊天机器人处理各种问题, 从家庭矛盾到情感分手。他强调这不是治疗, 但因为这些模型被设计成非评判性、具有同理心和尊重的沟通方式, 恰好满足了世界的需求。

他认为人们需要一个可以反复提问而不感到尴尬的私密空间, 随着时间推移, 聊天机器人能以许多人类无法做到的方式让人们感受到被理解。

这是一种传播善良和爱的方式, 让我们能够以最好的状态在现实世界中与所爱的人相处。

不过,苏莱曼也承认存在一些问题, 他在播客中说「肯定存在依赖风险」, 而且 AI 聊天机器人有时可能过于恭维或谄媚。

🔗 https://www.businessinsider.com/microsoft-ai-ceo-ai-chatbots-help-humans-detoxify-ourselves-2025-12

彩蛋时间

作者:@VoxcatAI

提示词:以涂鸦速写为主,线条随手夸张,颜色用粗糙干刷块面,背景留白为主,不要透明水彩晕染与纸纹理表现,主题为【主题/主体】

我们正在招募伙伴