为什么AI服务中缓存输入token更便宜?
文章解释了AI模型API中缓存token定价差异的技术原理。以DeepSeek为例:deepseek-chat模型缓存命中价格为$0.07/1M tokens,缓存未命中价格为$0.27/1M tokens,若能将大部分输入token设为缓存可节省约$0.20/1M tokens。这是因为缓存的KV状态可复用,减少了重复计算成本。
Claude Fable 5被描述为"relentlessly proactive"(不懈主动)的AI编程助手,它掌握大量技巧并会主动部署任何手段达成目标。作者Simon Willison实测发现:当他在Datasette Agent项目中遇到跳菜单出现不该有的水平滚动条bug时,只需截一张图并拖入新的Claude会话,AI就能自动识别问题并完成修复,无需用户明确指示要做什么。
Apple援引欧盟监管者观点,称DMA(数字市场法案)要求AI系统获得几乎不受限制的设备访问权限,包括读写发送消息、进行购买、访问文件、在任何应用间执行操作等。Apple以此为由宣布Siri AI功能将在欧盟市场延迟至iOS 27和iPadOS 27版本。安全研究人员已证明AI系统可被劫持窃取个人数据。
作者延续此前对Google远程证明(remote attestation)方案的批评,认为新版方案与旧版一样糟糕。远程证明技术旨在验证远程设备的可信状态,但作者暗示该方案存在根本性缺陷,并戏谑地评论"即使是二维码也无法产生可亲吻的猪"。文章还链接了多个话题讨论,包括G20峰会期间的多伦多拘留事件、租金领主统治、第一修正权误读等。
文章解释了AI模型API中缓存token定价差异的技术原理。以DeepSeek为例:deepseek-chat模型缓存命中价格为$0.07/1M tokens,缓存未命中价格为$0.27/1M tokens,若能将大部分输入token设为缓存可节省约$0.20/1M tokens。这是因为缓存的KV状态可复用,减少了重复计算成本。
Gary Marcus报道OpenAI正在考虑大幅降价,并指出这完全符合他在2024年1月为OpenAI撰写的"premortem"(预后分析)中预测的第三点趋势。文章设置了付费墙,作者解释这是他第四次使用付费墙,认为这类有预见性的分析具有重要价值。
Simon Willison引用Andrew Singleton的一个讽刺性寓言:Jenny拥有一家火葬场,John的丙烷公司向她投资200亿美元换取5%股份;Jenny烧掉100亿,John再卖给她100亿丙烷烧掉这些钱;最终John报告他的AI投资产生了100亿收入并拥有价值1000亿业务的5%股份。讽刺AI投资中常见的财务操作手法和估值泡沫。
Windows文档为进程和线程相关回调函数指定了最佳实践规则:保持例程简短简单、不要调用用户模式服务验证、不要做注册表调用、不要做阻塞/IPC调用、不要与其他线程同步以避免重入死锁。Raymond Chen通过解释这些规则背后的原理,帮助开发者理解为何在特定场景下需要遵守或可以合理规避这些约束。
Prolog是经典的逻辑编程语言,其名称源自"programming in logic",由法国人Philippe Roussel发明。Prolog的优势在于能直接表示逻辑问题,缺点是语法较为古怪。作者展示了如何借助Claude辅助编写Prolog代码来解决国际象棋难题,LLM可以帮助处理Prolog的语法复杂性,使开发者专注于逻辑本身。
Apple终于允许用户远程开启Mac,无需物理按电源按钮。虽然媒体将此解读为对Mac mini电源按钮位置投诉的回应,但作者认为这忽略了远程开机功能的更大实际价值——这对需要远程管理多台Mac的开发者、系统管理员来说是长期痛点终于解决。
Datasette 1.0a33是迈向稳定1.0版本的重要一步,终于将?_extra=模式从表扩展到查询和行,该模式现已在文档中完整记录。作者利用Claude Code(Claude 5)和GPT-5.5 xhig辅助构建API explorer工具,展示了大模型在代码辅助方面的实际应用。
欧盟委员会发言人Thomas Regnier在LinkedIn声明中明确表示:Apple决定不在欧盟推出"Siri AI"完全是Apple自己的决定,与欧盟监管无关。他强调DMA"绝对没有禁止Apple在欧盟推出新功能",虽然欧委会与Apple就Siri AI有过一些接触,但欧委会没有要求任何未经请求的功能限制,Apple本可以提供合规解决方案。
作者认为当前时代即将结束:OpenAI和Anthropic都已提交上市文件,开始为两家每年烧钱数十亿美元且无盈利路径的公司寻求退出流动性。作者称这两家公司都是"dogs"(垃圾),无论多少金融工程或政府入股建议都无法改变AI实验室根本不可行的经济模型。Clamm(可能指Claude/Anthropic)的相关情况也被提及。
Miguel Grinberg重申他不用LLM写代码的立场,同时透露一个令人沮丧的变化:他的开源项目收到的贡献几乎全部由LLM生成。作者对这个趋势感到非常压抑,暗示LLM生成的代码可能带来质量或伦理问题。
作者从教妹妹编程的经历出发,表达对LLM辅助编程的保留态度,认为信任经过验证的库函数比逐行理解代码更重要。核心论点是:调用他人精心编写的、被充分测试的库函数是更合理的编程方式,而非试图理解每一行实现细节。作者暗示这种理念同样适用于LLM生成的代码——过度依赖或试图完全理解AI生成的代码可能是一种误区。
tea.xyz于2024年6月4日上线了承诺已久的开源维护者激励加密货币项目,代币在上线首小时内即从开盘价暴跌75%。一周后交易价格比首日高点低约90%,公司GitHub组织近半年几乎沉默,创始人公开提交已转向其他项目。官方6月8日的博客文章《工作继续》承认"正确的回应是"(文章未完整显示),暗示项目方已意识到危机。