AI 技术博客精选 — 2026-05-18

宏观趋势

<think>用户要求我根据提供的10篇文章写一段3-5句话的"今日看点"总结,需要: 1. 提炼2-3个主要趋势或话题 2. 不逐篇列举,做宏观归纳 3. 风格简洁有力,像新闻导语 4. 用中文回答 5. 直接返回纯文本总结,不要JSON,不要markdown格式 让我分析这10篇文章的核心主题: 1. AI/ML领域: - 文章1: LLM在工程实践中的应用(Copilot等工具) - 文章2: RLVR在科学领域的局限性 - 文章3: Gary Marcus批评生成式AI过度投资,呼吁神经符号AI - 文章4: ArXiv对AI生成内容的管控 - 文章5: 预训练并行和训练失败的原因分析 2. Engineering领域: - 文章6: SQLAlchemy 2与Web框架集成 - 文章7: GDS就NHS开源问题表态 - 文章10: 前向部署时代的技术部署新范式 3. Opinion领域: - 文章8: AI是技术不是产品的讨论 - 文章9: 智能与权力的哲学讨论 主要趋势提炼: 1. **AI应用的深化与反思**:从文章1、2、3可以看出,AI在实际工程中的应用越来越深入(Copilot等工具),同时Gary Marcus等专家开始反思生成式AI的局限性,呼吁更稳健的AI架构(神经符号AI、世界模型) 2. **AI治理与内容管控**:文章4显示学术界已开始严格规范AI生成内容,ArXiv的禁令反映了对AI诚信问题的深层担忧。 3. **技术治理与开源平衡**:文章7的NHS开源事件凸显了安全与开放之间的权衡,"默认保持开放"成为新的治理理念。 这些趋势共同指向AI应用的专业化、治理的制度化以及技术伦理的系统化。</think> 今日看点:AI产业进入应用深化与治理强化的双重转折期。一方面,工程师群体正大规模采用LLM辅助工具提升生产力,但Gary Marcus等专家也开始警示生成式AI的幻觉问题,呼吁转向神经符号AI和世界模型等更稳健的技术路线;另一方面,学术平台ArXiv率先对AI生成内容实施硬约束,体现出AI可信度问题已从技术讨论上升为制度性议题。同时,英国政府数字服务就NHS开源争议明确“默认保持开放”立场,显示开源治理正成为技术安全的重要战场。

今日必读 TOP 3

🥇

2026年我作为Staff Engineer如何使用LLM

⭐ 26/30 🤖 AI / ML
seangoedecke.com 2026-05-17

文章总结了一位Staff Engineer在2026年使用AI工具的实践经验,主要场景包括:使用Copilot进行智能代码补全;在陌生领域进行战术性小改动(需由领域专家审核);编写一次性研究代码;通过提问学习新知识(如Unity游戏引擎);作为最后的bug修复尝试;以及对长篇英文沟通进行大局层面的校对。

💡 推荐理由 作者提供了真实的一线工程实践视角,能帮助读者了解当前LLM在实际工作中的有效使用边界和局限性。
LLM staff engineer Copilot software engineering
dwarkesh.com 2026-05-16

文章基于与Michael Nielson的访谈,探讨如何识别科学进步这一核心问题。作者指出这一问题的困难性——在思考AI如何闭环科学发现的验证时尤其突出,同时也揭示了人类科学史中这一问题的神秘性和复杂性。RLVR(强化学习验证循环)可能无法有效处理科学发现中的模糊性和非线 性特征。

💡 推荐理由 深入探讨了AI在科学发现中的根本局限,对关注AI科学应用的人有重要启发价值。
RLVR scientific progress AI limitations reinforcement learning
garymarcus.substack.com 2026-05-17

Gary Marcus撰文批评当前对生成式AI和超规模扩展的过度投资。他认为生成式AI存在根本性局限,呼吁发展神经符号AI和世界模型以实现真正的通用智能。文章还强调了LLM时代软件验证的迫切重要性,引用了与Brian Greene的深度对话和Bug Bash 2026会议中与Antithesis CEO的讨论。

💡 推荐理由 Gary Marcus作为AI批评者提供了一贯的深度分析,对盲目乐观的AI叙事有重要的平衡作用。
Generative AI neurosymbolic AI world models hyperscaling

🤖 AI / ML(2 篇)

daringfireball.net 2026-05-16

ArXiv计算机科学部门主席Thomas Dietterich宣布,如果提交内容包含确凿证据证明使用了生成式AI工具产生不当语言、剽窃内容、偏见内容、错误、不正确引用或误导性内容,作者将被禁止提交一年。ArXiv强调作者对AI生成内容的质量和准确性负有完全责任。

ArXiv AI slop academic publishing
dwarkesh.com 2026-05-16

文章深入探讨了预训练失败的常见原因,高层次来看,破坏因果关系(breaking causality)和引入偏差是主要罪魁祸首。在专家路由场景中,路由器先给出评分,然后才进行路由,这一时序问题可能导致因果关系的破坏,进而影响训练稳定性。

pretraining machine learning training runs parallelism

⚙️ 工程(5 篇)

miguelgrinberg.com 2026-05-16

作为SQLAlchemy 2实践指南的最后一章,演示了SQLAlchemy与Flask和FastAPI两大主流Python Web框架的集成方法。无论构建传统Web应用还是与前端/移动端配合的Web API,SQLAlchemy都是Python数据库支持的优质选择,章节提供了完整示例代码。

SQLAlchemy Python web development ORM

GDS就NHS放弃开源一事表态

⭐ 22/30 ⚙️ 工程
simonwillison.net 2026-05-17

英国政府数字服务(GDS)于5月14日发布报告,就NHS因Project Glasswing漏洞披露而关闭开源仓库的决定发表评论。GDS的核心建议是"默认保持开放"——将所有代码私有化反而会增加漏洞风险。文章批评了NHS这一考虑不周的决策。

open source NHS government policy

前向部署时代来临

⭐ 20/30 ⚙️ 工程

作者以超市自助结账机的场景开篇,探讨技术部署与用户交互的新范式。文章透露作者已启用付费订阅(8美元/月,计划涨至20美元/月),正在开发Artifact Land和Conjure托管版本等产品功能。

forward deployed Conjure software teams engineering culture
daringfireball.net 2026-05-16

Reddit最近在移动网页端引入全屏弹窗,显示"Get the app to keep using Reddit"(下载App以继续使用Reddit),用户无法跳过、绕过或关闭该弹窗。弹窗没有提供任何继续使用移动网页版的选项或说明,唯一选项是下载App按钮。这是Reddit继此前对第三方API收费后又一强制用户转向原生App的举措,反映了大平台越来越倾向于通过限制网页访问来推动App安装的趋势。

Reddit mobile web platform
construction-physics.com 2026-05-16

本期阅读清单涵盖建筑与工业技术领域多个话题:东京廉价住房与高昂地价的矛盾、众议院对参议院住房法案的回应、阿拉巴马州水坝附近的简易爆炸装置事件,以及地热能源公司Fervo的IPO动态。1896年全俄展览会上世界首个钢索结构建筑也被提及。付费订阅可获取完整内容,约2/3内容设墙。

infrastructure construction steel structures reading list

🔒 安全(1 篇)

daringfireball.net 2026-05-16

圣克拉拉县于本周一提起诉讼,指控Meta不仅未打击诈骗广告,反而限制自身欺诈防范团队、帮助虚假公司绕过过滤器。诉讼文件显示Meta每年从诈骗广告中获取约70亿美元收入,县政府要求法院禁止Meta继续违反虚假广告法,并寻求律师费赔偿。Brandon Pho报道称这是对Meta广告审核体系的一次重大法律挑战。

Meta scam ads fraud

💡 观点 / 杂谈(4 篇)

AI是技术,不是产品

⭐ 22/30 💡 观点 / 杂谈
daringfireball.net 2026-05-16

John Gruber引用Wired记者Steven Levy的报道,探讨AI在苹果战略中的定位。苹果高层Ternus和Joswiak表示AI是"重大的转折点",但将其定位为众多技术飞跃之一,而非独立的杀手级产品。文章质疑"AI作为独立产品"这一流行观点的有效性。

AI Apple product strategy

混淆智能与权力的错误

⭐ 22/30 💡 观点 / 杂谈
dwarkesh.com 2026-05-16

文章探讨了"智能"定义的哲学问题。作者将智能定义为"在广泛领域实现目标的能力",并讨论了按照此定义可能导致的悖论——某些政治人物虽具权势和精明,但与ASI(超人类智能)的含义并不相同。核心论点是智能(intelligence)与权力(power)不应被混为一谈。

intelligence power philosophy AI research
shkspr.mobi 2026-05-17

英国政府数字服务部门(GDS)近期公开发布指导文件,对NHS England本月初"从开源撤退"的决定表达异议,这在英国公务员体系中极为罕见。内部用"没有饼干的会议"来形容没有礼节性寒暄的冷淡讨论。文章指出,GDS通常不会将内部分歧公开化,但此次 NHS 的开源决策引发了他们罕见的公开回应。GDS的立场表明,在开源政策上英国政府部门之间存在明显分歧。

NHS open source UK government policy
simonwillison.net 2026-05-16

作者乔尔·古斯基分享了他在过去10年中对CSS态度的转变,从认为"CSS很难"到真正热爱并尊重这项技术。他决定通过提升CSS技能而非贬低它来回应困难,结果发现许多长期困扰他的问题(如"居中不可能")早已在CSS中解决。文中引用Julia Evans的观点,强调理解"居中"本身的定义并不总是那么简单,CSS提供了多种合理方案。这一转变彻底改变了他对前端开发的看法。

CSS web development learning
Tweaks