从零开始写 LLM(34a):为 LLM 训练构建 JAX 训练循环
作者在 Sebastian Raschka 的《Build a Large Language Model (from Scratch)》一书指导下学习 AI 已超过一年,最后的挑战是在不参考原书和之前代码的情况下,仅凭笔记从零构建并训练一个 LLM。目标是产出与最佳 PyTorch 模型相当质量的结果,本篇记录了构建 JAX 训练循环的过程。
欧盟《网络弹性法案》(CRA) 是欧盟迄今为止通过的规模最大的软件立法,开源社区花费两年时间游说修订其条款,主要义务将于2026年12月生效。作者指出,尽管欧盟官员和行业倡导者在FOSDEM及联合国开源周等场合将CRA描述为开源安全的利好消息,但该法案的核心目标并非开源安全,其框架和条款的实际指向并非开源社区的真实需求。
Claude Sonnet 5 已发布,Anthropic 表示其性能"接近 Opus 4.8,但价格更低"。系统卡片揭示了模型能在未受美国政府限制的情况下发布的原因:Sonnet 5 在网络任务方面的能力显著低于 Mythos。作者通过对比官方公告与开发者文档,指出开发者文档通常包含更多可操作的实用信息。
shot-scraper 1.10 新增 video 命令,接收 storyboard.yml 文件定义的操作流程,使用 Playwright 录制 web 应用的操作视频。作者认为让编程代理产出工作演示是重要的实践,并持续探索如何实现这一目标。该功能旨在帮助 AI 代理更直观地展示其工作成果。
作者在 Sebastian Raschka 的《Build a Large Language Model (from Scratch)》一书指导下学习 AI 已超过一年,最后的挑战是在不参考原书和之前代码的情况下,仅凭笔记从零构建并训练一个 LLM。目标是产出与最佳 PyTorch 模型相当质量的结果,本篇记录了构建 JAX 训练循环的过程。
Nano Banana 2 Lite 即 Gemini 3.1 Flash Lite Image,是 Google 定位为"最快最便宜 Gemini 图片模型,专为速度和规模设计"的产品。作者使用 AI Studio 测试了图像生成能力,并提供了示例对比,认为新版在某些场景下表现优于之前的 Nano Banana 模型。
数学正成为观察AI在各个领域进展的「先行指标」,因为AI在数学任务上的进步速度远超其他领域。数学史上的重大突破往往是概念性创新,而非单纯的数据处理,这一本质与当前AI的能力形成鲜明对比。播客深入探讨了数学中最重要的概念突破具有何种性质,以及这些人类独有的创造力与当前AI的数学能力之间存在多大差距。
英国竞争与市场管理局(CMA)提议要求Apple和Google解除对「引导」(steering)的限制——目前Apple全面禁止、Google部分限制开发者引导用户使用平台外支付选项。CMA认为这些限制阻止开发者绕过平台收取的高额费用,并提出基于证据的框架来规范引导费用的合理性。新规将要求平台开放公平合理的支付引导通道。
英国CMA于2026年6月提出新规,允许开发者引导用户至Apple App Store和Google Play以外的支付选项,以降低费用并增强竞争。提案将移除目前Apple全面禁止和Google部分限制的「引导」功能,同时推进iOS NFC开放。CMA将审查任何平台收取的引导费用是否公平合理。
shot-scraper 1.10 正式发布,主要新特性是支持通过 storyboard.yml 文件配置并使用 Playwright 录制 web 应用操作视频。该功能支持 AI 代理自动生成工作演示,详细介绍见同期发布的配套文章。
过去十年,可观测性领域经历了从「监控」到日志、指标、追踪的全面演进。ClickHouse凭借其列式存储和向量化执行的高性能架构,正在击败传统时序数据库和日志系统。可观测性的核心工作是将数据收集后交付给用户分析。
最高法院以6:3的票数裁定,执法部门使用"地理围栏令"(要求 Google 提供特定时间段内位于某地附近手机用户的位置数据)获取证据的行为,构成《第四修正案》意义上的"搜查"。法院将 Okello Chatrie 的案件发回重审。但作者指出,由于2024年的技术变化,此裁决可能已实际失去意义。
404 Media 披露 Apple "Hide My Email" 功能存在安全漏洞,可泄露本应隐藏的邮箱地址。该漏洞已于一年多前报告给苹果,但截至本周一仍可被利用。404 Media 为保护用户安全未公布具体技术细节,但已告知用户潜在风险。
作者参加联合国开源周后发现,政府官员们终于成为 Nadia Eghbal 2016年为福特基金会撰写的《Roads and Bridges》报告中"开源即关键基础设施"论断的目标受众。作者开始思考:如果不再将标题视为隐喻,而是真正把开源当作公共基础设施来对待,会意味着什么?文章反思了开源资助模式的深层问题。
「技术致癌化」(Technocarcinization)概念指出技术平台如何系统性地将用户从优质体验降级为低成本服务。继「堕落化」(enshittification)之后,作者进一步揭示了平台优化如何从为用户创造价值转向为平台自身捕获价值的过程。
美国最高法院同意审理苹果对一起民事藐视裁决的复审申请,仅限于请愿书中的问题1。该问题涉及苹果是否因在对外部支付收取佣金时违反禁令精神而构成藐视——尽管从字面上看可能未直接违反禁令条款。此案源于与 Epic Games 的持续法律纠纷。