Anthropic撤回可能"破坏"AI研究人员的Claude政策
Anthropic宣布撤回Fable 5中关于前沿LLM开发的安全策略,该政策要求Claude识别并限制针对其他前沿LLM的请求,引发AI研究社区强烈反对。Anthropic在声明中承认:我们做出了错误的权衡,对未能把握好平衡深表歉意。Wired的Maxwell Zeff报道了这一重大反转,政策调整后研究人员在安全环境下使用Claude的限制被大幅放宽。
一篇关于重大法律判决的报道,Google可能需为其AI系统的幻觉问题承担法律责任。Gary Marcus指出这一决定意义重大,尤其如果类似判决扩散到其他国家。Marcus还提及当天早些时候关于软银和OpenAI的通讯,以及华尔街的负面消息,暗示生成式AI行业可能迎来艰难的一周。
Gary Marcus探讨美国《通信规范法》第230条是否能够保护AI公司免于用户诉讼。Marcus提到当天多个重磅事件:Elizabeth Warren对SpaceX IPO的反对、Oracle获得市场质疑的融资、以及Anthropic因其Fable系统的安全策略在社交媒体上遭受大量负面评价。核心论点在于第230条原本为互联网平台设计,其保护范围可能不适用于新兴的AI技术。
Gary Marcus回顾与Steve Eisman(因预测次贷危机闻名的《空头大师》原型)的访谈,该访谈于5月22日录制,讨论了AI热潮可能如何崩溃。Eisman在采访中询问AI行业可能的崩塌路径,Marcus认为这次对话现在看来极具预见性。Marcus预告将解释为何这场对话如今变得尤为重要,暗示AI行业面临系统性风险。
Anthropic宣布撤回Fable 5中关于前沿LLM开发的安全策略,该政策要求Claude识别并限制针对其他前沿LLM的请求,引发AI研究社区强烈反对。Anthropic在声明中承认:我们做出了错误的权衡,对未能把握好平衡深表歉意。Wired的Maxwell Zeff报道了这一重大反转,政策调整后研究人员在安全环境下使用Claude的限制被大幅放宽。
Simon Willison发布datasette-agent 0.2 alpha版本,带来工具与用户交互的重要升级。工具现在可以在执行过程中向用户提问,通过声明context参数接收ToolContext对象,并使用context.ask_user()方法发起询问。支持的交互类型包括是/否二选一、多选(options=[...])和自由文本(free_text=True)。问题未回答时,代理轮次暂停,聊天UI中渲染为表单并持久化到内部数据库,确保对话在服务重启后仍可恢复。
Gary Marcus报道OpenAI正在考虑激进的价格下调策略。Marcus指出这一消息并不令人意外,因为完全符合他在2024年1月撰写的OpenAI验尸分析中的第三点预测。他为非付费读者插入了一个罕见付费墙(这是他历史上第四次),并表示这类有先见之明的分析具有相当价值,期望读者考虑支持他的工作。Marcus认为这一降价消息印证了他对OpenAI商业模式的担忧。
Google将去年短暂公开的实验性Gemini Diffusion模型以开源权重形式回归,发布 DiffusionGemma 26B(Apache 2许可证)。作者去年测试时记录到857 tokens/秒的生成速度,印象深刻但当时未获后续公告。NVIDIA目前在其NIM云API上免费托管该模型,作者使用该API成功生成了示例图片。该模型将扩散架构与轻量级Gemma系列结合,为本地部署提供了新选择。
Apple 的 Siri 团队在 WWDC 后由 Craig Federighi 主持技术演讲,公布了 iOS 27 及全新 Siri AI 的更多细节。Federighi 与 AI 副总裁 Amar Subramanya、Siri 负责人 Mike Rockwell 及软件副总裁 Sebastien Marineau-Mes 共同出席。演讲重点阐述了 Apple 与 Google 在 AI 领域的深度合作细节,以及 Siri 在智能化和跨平台协作方面的技术突破。Federighi 强调双方合作旨在为用户带来更自然的 AI 交互体验。
Apple 官方声明,由于欧盟《数字市场法》(DMA) 的要求,Siri AI 功能将不在欧盟的 iOS 27 和 iPadOS 27 中上线。DMA 法规要求 Apple 向任何 AI 系统提供近乎无限的设备访问权限,包括读取和发送消息、完成购买、访问文件、以及跨应用执行操作。Apple 指出安全研究人员已证明 AI 系统可能被劫持以窃取个人数据。
Prolog 是最早的逻辑编程语言之一,名称源自"逻辑编程"。其核心优势在于能直接表达逻辑问题,但语法较为特殊。文章探讨了将 Claude 等大语言模型与 Prolog 结合的可能性——当 LLM 负责编写代码时,Prolog 的语法复杂性不再构成障碍,人类可以专注于逻辑设计本身。
作者进行实验测试 Claude 是否能生成 Lean 代码来形式化证明一段六行积分计算。提示中要求 Claude 从一篇博文的 alt 标签提取 LaTeX 源码,然后生成傅里叶系数与贝塞尔函数关系的正式 Lean 证明。Claude 仅凭初始提示就成功生成了完整证明,无需人工干预。
Simon Willison发布Datasette 1.0 alpha第33版,距离稳定版1.0又近一步。新版本将1.0a3引入的?_extra=模式扩展到查询和行级别,不再仅限于表级别,该模式现已完整文档化。Willison提到利用Claude Code(Fable 5)和GPT-5.5来构建API浏览器工具,认为这类工具的构建成本已几乎为零。
asyncinject 是一个用于 asyncio 依赖注入模式的工具库,已更新至 0.7 版本。该库最初为支持 Datasette 项目而开发,现已开源供社区使用。在 0.7 版本开发过程中,Claude Fable 5 模型主动发现了依赖中的 bug 并自动修复,体现了 AI 辅助编程的实际价值。
安全研究员分享了参加2025年10月bugSWAT Mexico活动后重返Google研究的经历。作者利用过去一年使用Claude构建小项目的经验,发现了用AI自动大规模模糊测试Google API的潜力。关键发现涉及Google的disco项目,暗示存在可被利用的攻击面。文章记录了将AI工具应用于安全研究的实战方法,目标是通过AI辅助发现漏洞获得Google漏洞赏金。
一个名为"The Gentlemen"的网络犯罪组织已成为按受害者数量计算的第二大活跃勒索软件团伙,通过激进招聘策略迅速吸引顶尖黑客加入。该组织向附属成员承诺获得90%的赎金分成。Brian Krebs调查了该组织管理员在Breachforums上的活动线索,其网名为Hastalamuerte,文章追踪了相关数字证据指向的真实身份。