llm 0.32a2 发布
LLM 0.32a2 版本最重要的变化是:大多数具备推理能力的 OpenAI 模型现在使用 /v1/responses 端点而非 /v1/chat/completions 端点,使 GPT-5 类模型能够在工具调用期间进行交叉推理。运行提示词时现在可以查看汇总的推理 token,并以不同颜色(区别于标准错误)显示。可通过 -R 或 --hide-reasoning 标志隐藏推理过程。
随着 AI 生成内容在网络上泛滥成灾,读者被迫不断判断眼前文字是人写的还是机器写的,这种精神消耗令人筋疲力尽。Jason Koebler 提出"僵尸互联网"(Zombie Internet)概念,区别于"死寂互联网"(Dead Internet)——前者是真实人类被 AI 写作风格反向塑造和同化,后者仅是 bots 之间的自言自语。更隐蔽的是,这种污染甚至开始扭曲正常人类的写作风格,使得真正的人工创作也在无意识中被 AI 化。
Shopify CEO Tobias Lütke 介绍了公司内部编码代理工具 River,其独特之处在于完全在公开 Slack 频道中运作——River 拒绝私信,建议创建公开频道进行协作。他的 #tobi_river 频道有超过 100 人围观,所有对话均可搜索,公司任何人都能随时加入。这种"全透明"的工作模式取代了传统的一对一对话,实现了知识积累和协作的自动化。
Daniel Stenberg 披露 curl 代码库中的一个真实漏洞后,作者使用 AI 辅助扫描器再次审查代码库,结果发现了超出预期的漏洞。其中一个关键原因是扫描器读取了 docs/VULN-DISCLOSURE-POLICY.md 文档并据此应用了安全策略。这揭示了一个悖论:大量 AI 扫描结果被标记为"真实 bug,值得修复,但不是安全问题"——这类漏洞因分类问题往往被忽视,形成隐患。
LLM 0.32a2 版本最重要的变化是:大多数具备推理能力的 OpenAI 模型现在使用 /v1/responses 端点而非 /v1/chat/completions 端点,使 GPT-5 类模型能够在工具调用期间进行交叉推理。运行提示词时现在可以查看汇总的推理 token,并以不同颜色(区别于标准错误)显示。可通过 -R 或 --hide-reasoning 标志隐藏推理过程。
作者观察到两个极端案例:一个开发者每月产出 3 万行代码,另一个开发者坚称"AI 很蠢",双方都有支撑各自观点的证据——前者有成功产品,后者产品则已失败。《纽约时报》报道 Medvi 预计今年营收达 18 亿美元(撇开欺诈指控),而微软声称至少 30% 的代码由 AI 生成。这些数据暗示 AI 确实在驱动实际产出,但争议的本质在于:"AI 是否真正创造了价值"这个问题目前根本无法被可靠地测量和共识化。
Thinking Machines 发布其首个 AI 产品 Interaction Models,投入一年时间和 20 亿美元资本。该产品定位为"交互模型"而非前沿模型,专注于改善与 AI 的实时交互体验,暂时不与 OpenAI、Anthropic、Google 竞争。产品部分创新,部分存在基准测试刷分的嫌疑。
GitLab 发布公告宣布裁员及结构性战略调整,以适应 agentic 时代。其中最值得关注的是计划将团队所在国家数量减少最多 30%——GitLab 此前在 18 个国家有员工分布,这一调整意味着大幅度的全球化收缩。公告还暗示了更多战略转向,旨在让人力结构与 AI 驱动的工作模式相匹配。
Simon Willison 展示了在脚本 shebang 行直接调用 LLM 的技巧。最简单的方式是利用 LLM fragments 功能:`#!/usr/bin/env -S llm -f` 后跟提示词即可执行。进阶用法是通过 -T name_of_tool 参数引入工具调用,例如 `#!/usr/bin/env -S llm -T llm_time -f` 可以在脚本中嵌入 LLM 工具调用,实现 AI 与系统命令的无缝结合。
软件架构设计主要通过实践项目学习,而非课堂理论。作者在生物信息学实验室工作过,深刻理解"科学代码"现象——科研人员编写的代码往往缺乏工程化考量。对于想提升软件设计能力的科研人员,建议在真实项目中积累经验,而非仅依赖设计类课程。
Datasette 1.0a29 新增 TokenRestrictions.abbreviated() 工具方法用于创建 "_r" 字典。修复了空表时表头和列选项不可见的问题,以及 Mobile Safari 上列操作对话框的显示 Bug。最值得关注的是修复了一个因 Datasette.close() 竞态条件导致的段错误,这是一个棘手的多线程问题。
构建连接多个包注册表(npm、RubyGems、PyPI、crates.io)的工具面临请求量大、HTTP 测试数据过期、手动模拟协议复杂等挑战。作者开发了一个解决方案,用于项目 git-pkgs,避免向公共服务发起数千次测试请求造成的资源浪费。
Have I Been Pwned 宣布孟加拉国政府成为其免费政府服务的第 43 个客户,BGD e-GOV CIRT 部门现可全面查询所有政府域名,通过 API 监控是否出现在数据泄露中,并能快速响应政府邮箱地址的暴露事件。随着越来越多的国家级政府使用 HIBP,该平台正成为全球公共部门数字安全的重要基础设施。
AI 平台同样容易受社交工程攻击,但在发现代码漏洞方面表现优异。本月 Apple、Google、Microsoft、Mozilla、Oracle 等主流厂商修复了接近创纪录数量的安全漏洞,并加快了补丁发布节奏。AI 辅助代码审计正在改变安全漏洞的发现和修复方式。
James Shore 提出一个关于 AI 编码代理的核心数学:如果 AI 让代码编写速度提升 2 倍,则维护成本也必须降低 2 倍,否则就是在用临时的速度提升换取永久的债务——即"永久的束缚"。这个等式成立的条件是 LLM 必须恰好按代码增加率的反比例降低维护成本,否则效率提升只是幻觉,长期看是在透支技术团队的未来。
作者 Jeff Geerling 披露 Bambu Lab 3D 打印机开始将"必须联网云方案"作为新默认设置后,采取了对抗性措施:在 OPNsense 防火墙上阻断打印机联网、停止固件更新、将打印机锁定为开发者模式、删除 Bambu Studio 改用 OrcaSlicer。Bambu Lab 通过云连接收集用户数据、远程控制设备的行为,被认为是对开源精神的背叛,让用户失去了对自己硬件的真正控制权。