Hacker News
Codex for almost everything
OpenAI Codex 大更新:助力开发者加速软件开发全生命周期
OpenAI 发布了 Codex 的重大更新,旨在提升其作为开发者强大助手的能力,加速超过 300 万每周使用者的工作流程。本次更新的核心在于使 Codex 能够更深入地融入开发者工作环境,提供更广泛的功能和更智能的自动化支持。
主要更新内容:
- 计算机操作能力: Codex 现在可以像人类一样在电脑上操作,包括点击、输入等,能使用电脑上的所有应用程序。可以运行多个 Codex 代理,互不干扰,方便迭代前端修改、测试应用程序或使用不支持 API 的应用程序。
- 原生网页支持: 集成了一个内置浏览器,允许开发者直接在页面上添加注释,提供精确的指令给代理。未来计划扩展此功能,使 Codex 能够完全控制浏览器,超越本地主机上的 Web 应用程序。
- 图像生成能力: 集成了
gpt-image-1.5 模型,可生成和迭代图像,配合截图和代码,方便创建产品概念、前端设计、Mockup 和游戏中的视觉元素。
- 插件扩展: 发布了 90 多个新的插件,结合技能、应用集成和 MCP 服务器,为 Codex 提供更多收集上下文和在工具之间执行操作的方式。 开发者可以利用如 Atlassian Rovo (JIRA)、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、Neon by Databricks、Remotion、Render 和 Superpowers 等插件。
- 深度开发者工作流程支持:
- 支持处理 GitHub 代码审查评论。
- 支持运行多个终端标签页。
- 支持通过 SSH 连接远程开发环境。
- 可以直接在侧边栏中打开文件,提供 PDF、电子表格、幻灯片和文档的预览。
- 新增摘要面板,跟踪代理计划、来源和工件。
- 自动化增强:
- 允许重用现有的对话线程,保留之前建立的上下文。
- 支持为 Codex 安排未来的工作,并自动唤醒以继续长期任务,可能持续几天或几周。
- 团队可以使用自动化来处理诸如合并未解决的拉取请求、跟进任务和及时了解 Slack、Gmail 和 Notion 等工具中的快速对话。
- 记忆功能 (预览版): Codex 能够记住以往的经验,包括个人偏好、修正和需要花费时间收集的信息,从而加快未来任务的完成速度,并提升质量。
- 主动工作建议: 基于项目、连接的插件和记忆,Codex 可以主动建议如何开始工作或继续之前的项目,例如识别 Google Docs 中需要关注的评论,提取 Slack、Notion 和代码库中的相关上下文,并提供优先行动列表。
发布与计划:
- 这些更新正在向已使用 ChatGPT 登录的 Codex 桌面应用用户推出。
- 个性化功能(如上下文感知的建议和记忆)将很快推出到企业、教育和欧盟及英国用户。
- 计算机使用功能最初在 macOS 上可用,并将很快推出到欧盟和英国用户。
总结与展望:
自 Codex 推出以来,开发者使用 Codex 的方式不断扩展,从编写代码到理解系统、收集上下文、审查工作、调试问题、协调团队合作和推进长期工作。 OpenAI 的目标是确保 AGI 惠及全人类,本次更新使 Codex 更接近于软件构建过程中涉及的工具、工作流程和决策,并承诺未来将推出更多功能。 鼓励用户尝试 Codex 在整个工作流程中的应用。
|
Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7
总结:关于Qwen3.6-35B-A3B和Claude Opus 4.7 的“鹈鹕骑自行车”基准测试
日期: 2026年4月16日
这篇博文主要分享了作者使用Qwen3.6-35B-A3B 和 Claude Opus 4.7 两个大型语言模型(LLM)在“鹈鹕骑自行车”基准测试中的表现,并对LLM评估的意义进行了思考。
测试结果:
- Qwen3.6-35B-A3B: 生成的鹈鹕骑自行车图像质量较高,自行车车架形状正确,并有云彩和鹈鹕具有特征性的囊袋。作者使用Unsloth量化的20.9GB模型,在MacBook Pro M5和LM Studio环境下运行。
- Claude Opus 4.7: 生成的图像质量较差,自行车车架形状错误,缺少云彩,太阳为黄色。即使尝试使用
thinking_level: max参数,图像质量也没有明显改善。
- Flamingo骑独轮车SVG测试: 在生成 Flamingo 骑独轮车的 SVG 图像测试中,Qwen3.6-35B-A3B 表现更好,甚至包含了“Sunglasses on flamingo! -->”的SVG注释。
作者观点:
- 对“训练针对基准”的怀疑: 作者承认,结果让他怀疑实验室是否在针对他的“愚蠢”基准进行训练,但仍然持保留态度。
- 基准测试的意义: 作者强调“鹈鹕骑自行车”基准测试原本只是一个玩笑,旨在说明比较这些模型任务的难度。
- 质量与实用性的关联: 过去,鹈鹕图像的质量与模型的整体实用性存在一定的正相关关系。早期的图像质量很差,而最近生成的图像质量已经可以用于实际用途。
- 关联性被打破: 但这次测试结果打破了这种关联。作者认为,即使是Qwen3.6-35B-A3B 的量化版本,也不应比 Anthropic 的最新专有版本更强大或更有用。
- 特定场景下的选择: 尽管如此,如果需要 SVG 格式的鹈鹕骑自行车插图,目前在笔记本电脑上运行的 Qwen3.6-35B-A3B 仍然是更好的选择。
总结: 这篇博文展示了LLM在特定任务上的表现差异,并提醒人们在评估LLM时,要谨慎对待单一基准测试的意义,并结合实际应用场景进行综合考量。
|
US Bill Mandates On-Device Age Verification
Parents Decide Act (H.R. 8250) 总结
概述:
美国众议员Josh Gottheimer提出的《Parents Decide Act》(H.R. 8250) 旨在要求美国境内的所有操作系统供应商(包括苹果和谷歌)在用户设置新设备时验证其年龄。该法案以儿童安全为幌子,但实际上将建立一个广泛的身份识别系统,影响美国3亿用户的数字生活。
核心内容:
- 年龄验证强制: 法案要求所有操作系统用户在设置帐户和使用设备时必须提供出生日期。成年人也受到此项要求。
- 年龄经纪人: 苹果和谷歌将成为“年龄经纪人”,允许应用程序开发者访问用户的年龄信息以验证其年龄。这创建了一个新的数据管道,将操作系统层与所有应用程序连接起来。
- 内容控制: 通过年龄验证,操作系统可以控制用户看到的内容,可能导致审查和言论限制。
- 数据保护模糊: 法案将数据保护责任交给联邦贸易委员会(FTC),但并未明确规定数据保留期限、最小化措施、或禁止将年龄数据与其他标识符关联等具体要求。
- 身份验证方式: 法案未明确规定具体的年龄验证方式,如政府ID、信用卡或生物识别扫描,将由FTC决定。
- 商业壁垒: 法案对小型操作系统开发者和隐私保护替代方案造成了不公平的负担,实际上巩固了苹果和谷歌在操作系统市场的地位。
- 范围扩大: “操作系统”的定义非常广泛,涵盖了笔记本电脑、台式电脑、游戏机、智能电视、汽车信息娱乐系统等各种通用计算设备,使得该法案的影响范围远超手机和平板电脑。
问题与担忧:
- 侵犯隐私: 该法案将导致大规模的身份识别,侵犯了用户的隐私和匿名性。
- 言论审查: 年龄验证机制可能被滥用,用于审查内容,限制言论自由。
- 缺乏替代方案: 存在更具侵入性的替代方案,如设备级别的家长控制和应用商店的年龄评级,但该法案却选择了强制的通用年龄验证。
- 监管不明确: 法案缺乏明确的监管框架,将数据保护责任推给了尚未制定规则的FTC,存在潜在的安全风险。
- 巩固巨头地位: 法案实际上巩固了苹果和谷歌在操作系统市场的地位,阻碍了竞争和创新。
总结:
《Parents Decide Act》以解决儿童安全问题为借口,构建了一个可能对所有美国用户数字生活产生深远影响的身份识别系统。该法案引发了对隐私、言论自由和市场竞争的担忧,并提出了监管不明确和缺乏替代方案的问题。
|
Playdate’s handheld changed how Duke University teaches game design
杜克大学利用 Playdate 手持游戏机革新游戏设计教学
核心内容:
杜克大学新设立的游戏设计、开发与创新硕士项目 (GDDI) 面临着一个常见挑战:如何在学生掌握复杂工具之前,让他们快速地进行实际创作。起初,课程使用手绘游戏屏幕的索引卡进行反馈,但后来发现了更有效的解决方案——Playdate 手持游戏机。
Playdate 介绍:
Playdate 由位于波特兰的 Panic 公司 (一家拥有 30 年历史的软件公司) 开发,于 2022 年推出。它体积小巧、配备单色显示屏,并采用独特的曲柄控制器。Playdate 拥有活跃的独立开发者社区,已经产生近 2000 款游戏。
Playdate 在教育中的优势:
- 易于上手: Playdate 开发工具免费,Panic 提供无需编程经验的浏览器游戏构建器 Pulp,以及可以在 PC 和 Mac 上运行的免费 Playdate 模拟器,降低了学习门槛。
- 快速迭代: Playdate 的简洁性和便携性,促进了快速的设计、构建、测试和修改循环,培养了游戏设计师所需的思维模式。
- 限制激发创造力: Playdate 的黑白显示屏和有限的处理能力,迫使学生仔细考虑游戏的核心需求,做出更精简的设计。
- 便于测试: 游戏机小巧且外观友好,方便学生在校园内进行快速的玩家测试。
杜克大学 GDDI 的实践:
自 2024 年秋季起,Playdate 成为 GDDI 基础游戏设计课程的关键组成部分。学生们被赋予一个特定的主题:在游戏中融入“猫头鹰”元素。
- 学生 Omar Masri 创建了 Owl Invasion,一款结合了塔防机制的无尽波数游戏。
- 学生 Brandon Huffman 则开发了 Owlphabet Soup,一款利用曲柄控制器来舀取字母并拼写单词的拼写游戏。
影响与未来:
- 目前,杜克大学已向超过 50 名学生提供了 Playdate。
- Panic 公司推出了“Playdate 教育计划”,向教育机构提供折扣的 Playdate 设备,促进其在教育领域的应用。
- 杜克大学的经验表明,Playdate 使学生能够在短时间内就开始在物理硬件上进行游戏原型设计,从而加速学习过程。
- GDDI 计划在更多课程中引入 Playdate,探索其教学潜力。
相关链接:
|
The "Passive Income" trap ate a generation of entrepreneurs
总结: "被动收入" 陷阱与真实创业
这篇文章探讨了近年来盛行的“被动收入”理念对创业生态的影响,并以“玉滚轮哥”的故事为开端,揭示了这种理念的陷阱和负面后果。
核心观点:
- “被动收入”的扭曲: 文章指出,在2015年至2022年间,“被动收入”从一个理财术语演变成了一种救赎叙事,人们沉迷于寻找无需持续投入就能产生收入的“系统”。
- “被动收入”模式的缺陷: 这种模式鼓励人们追求“系统”而非关注客户需求,忽略了“关怀”和“努力”的重要性。作者认为,将“被动性”作为优化的目标,会导致生产出低质量的产品和服务。
- Shopify 商店的失败: 2019年至2021年间,约70万家新的Shopify商店涌现,但其中90%在第一年内就失败了。这些商店通常存在产品质量差、客户服务差、品牌同质化等问题。
- 互联网内容质量下降: “被动收入”理念推动了大量SEO优化内容泛滥,这些内容往往缺乏真实性和价值,导致互联网信息质量下降,搜索引擎结果受损。
- 对人才的误导: 许多有能力的人花费宝贵的青春在各种“被动收入”项目中,最终一无所获,错失了积累真实技能和建立真正事业的机会。
- 真实创业的价值: 文章强调,真正的经济价值来自于解决实际问题,为真实的人提供服务,并持续改进。这需要付出长期努力和持续的投入,并非“被动”的。
- “被动收入”的终结: 随着AI技术的进步和社交媒体环境的变化,许多“被动收入”模式正在失效,那些曾经依赖算法和广告的人们面临困境。
- 回归真实: 作者呼吁人们回归对工作的传统认知,关注那些真正提供价值的行业和产品,并以“关怀”和“努力”为核心驱动力。
关键细节:
- 玉滚轮哥案例: 作者通过描述“玉滚轮哥”的经历,生动地展现了“被动收入”理念的荒谬和失败。
- Shopify数据: 强调了大量Shopify商店的失败率,突出了这种模式的不可持续性。
- 对海滩的隐喻: 批评了人们对“被动收入”的幻想,认为其往往与不切实际的梦想(如在海滩上享受生活)联系在一起。
- 对MLM的类比: 将“被动收入”运动比作一种社会认可的直销模式,产品是“无需工作”的梦想。
总之,文章批判了“被动收入”理念的虚妄和危害,呼吁人们回归传统的创业价值观,通过努力和关怀创造真正的价值。
|
Discourse Is Not Going Closed Source
Cal.com 关闭源代码以及 Discourse 的回应:开源依然是最佳选择
本文主要讨论了 Cal.com 宣布关闭其源代码并放弃开源模式的决定,以及 Discourse 对此决定的回应。Cal.com 的理由是人工智能 (AI) 使得开源软件面临更大的安全风险,因为 AI 可以快速扫描并利用源代码中的漏洞。
Cal.com 的观点与 Discourse 的反驳:
- **Cal.com 的观点:**开源代码暴露给攻击者,AI 可以利用其加速漏洞利用,因此隐藏代码可以争取时间。
- Discourse 的反驳:
- AI 并不需要源代码就能发现漏洞,它们也能分析编译后的二进制文件和黑盒 API。
- 隐藏源代码并不能使系统完全隐形,反而减少了能够检查系统整体情况的防御者数量。
- 开源软件的真正优势在于透明度,它能让更多的研究人员、贡献者和安全专家参与到漏洞发现和修复中。
- 开源软件,尤其是像 Linux 这样的关键基础设施,经受着持续的攻击,但也因此不断被加固。
Discourse 的立场:
Discourse 明确表示将继续保持开源模式,并强调以下几点:
- **开源带来的优势:**开源促进了更快速的漏洞发现和修复,并能让社区参与到安全改进中。
- **AI 的影响:**AI 的出现确实改变了安全形势,但开源软件利用 AI 工具进行扫描和修复漏洞仍然是更优的选择。
- **Discourse 的安全实践:**Discourse 团队使用 AI 扫描工具(如 GPT-5.4 xhigh)进行多日代码分析,并会在发现漏洞后迅速修复。他们还通过漏洞奖励计划鼓励安全研究人员参与漏洞发现。
- **开源的价值观:**Discourse 的诞生是为了让社区拥有对自身讨论平台的控制权,并坚持这一价值观。
其他讨论点:
- **公司选择关闭源代码的其他原因:**除了安全考虑,公司可能还会受到竞争压力和治理问题的驱动。竞争对手可以阅读源代码并模仿产品,而开源社区的反馈和管理可能耗费精力。
- **未来趋势:**随着 AI 技术的发展,漏洞发现的速度将加快,开源软件的防御策略需要适应这一变化。Discourse 认为,让更多人能够检查和防御代码,比隐藏代码更有利。
- **Discourse 的发展历程:**Discourse 成立于 2013 年,最初是为了解决当时社区软件的安全和升级问题。经过 13 年的开源发展,已经有超过 22,000 个社区使用 Discourse。
总结:
Cal.com 的决定引发了关于开源软件安全性的讨论。Discourse 认为,开源依然是最佳选择,通过透明和社区参与来应对 AI 带来的安全挑战,并坚持其对开源价值观的承诺。他们相信,快速发现和修复漏洞,以及让更多人参与到防御中,是应对未来安全威胁的关键。
|
Everything we like is a psyop
乐队 Geese 和 Gen Z 营销策略:一场虚构的盛况? (Geese Band and Gen Z Marketing Strategies: A Fabricated Hype?)
这篇文章探讨了乐队 Geese 及其背后引发争议的营销策略,以及更广泛的 Gen Z 时代利用类似手段进行推广的现象。
Geese 乐队的争议:
Geese 乐队在过去一年中迅速走红,被一些人认为是摇滚乐的救星,甚至被拿来与 The Strokes 乐队相提并论。然而,对于乐队的突然走红,一些人对此表示怀疑,认为这背后可能存在某种操纵。
Chaotic Good 营销公司:
调查显示,Geese 乐队与一家名为 Chaotic Good 的营销公司合作,该公司专门创建数千个社交媒体账户,以人为制造趋势,代表其客户(包括 TikTok 上的 Alex Warren 和 Zara Larsson 等)进行推广。Chaotic Good 的策略包括:
- 制造虚假趋势: 通过大量账户发布内容,模拟歌曲或内容正在流行。
- 控制评论: 充斥评论区,引导舆论,塑造公众认知。
Gen Z 初创企业的营销模式:
这种营销策略并非 Geese 乐队独有,许多 Gen Z 时代的初创企业也采用了类似的方法。例如,时尚 App Phia 就通过支付学生创建大量关于该 App 的视频,来提升其知名度。
Katseye 乐队的案例:
文章还提到了全球女孩组合 Katseye,她们的成功故事被 Netflix 纪录片《Pop Star Academy》详细记录。该纪录片展示了 HYBE 和 Geffen 如何将这些年轻女性塑造成“人肉广告牌”,推广产品,例如 Erewhon 冰沙和发膜。纪录片本身也成为了营销的一部分,培养了粉丝对女孩们的支持和忠诚。
互联网的虚假性:
文章引用了“死互联网理论”,认为互联网上充斥着机器人生成的内容,并指出所有在线意见都可能受到操纵。
结论:
文章提出了一个关键问题:面对如此普遍的营销手段,我们应该如何看待这些现象? 我们需要明确界定什么是必要的营销,什么是虚假的增长黑客。最终,粉丝们需要自己决定在哪里划清界限,并对艺术家与营销手段之间的关系进行更深入的思考。
|
Android CLI: Build Android apps 3x faster using any agent
Android 开发代理工具套件发布:Android CLI、Android Skills 和 Android Knowledge Base
本文介绍了 Google 为 Android 开发人员推出的新工具套件,旨在提升使用代理(agents)进行 Android 应用开发的效率和质量。该套件包含 Android CLI(命令行界面)、Android Skills(技能) 和 Android Knowledge Base(知识库) 三部分,旨在消除 Android 开发流程中的猜测,并确保代理遵循最新的推荐模式和最佳实践。
主要内容:
Android CLI: 这是一个重塑的命令行界面,提供环境设置、项目创建和设备管理等功能。与传统的工具集相比,使用 Android CLI 能够减少 LLM (大型语言模型) 的 token 使用量超过 70%,任务完成速度提升 3 倍。
- 主要功能:
- SDK 管理: 可精确下载所需的 SDK 组件。
- 快速项目创建: 使用官方模板生成新项目,确保遵循最佳实践。
- 设备创建与部署: 轻松创建和管理虚拟设备,以及部署应用程序。
- 可更新性: 方便更新到最新版本。
Android Skills: 为了弥合传统文档和 LLM 之间差距,Google 推出 Android Skills GitHub 仓库。 Skills 是基于 Markdown 的指令集,提供特定任务的技术规范,并能自动触发,从而节省手动附加文档的工作量。
- 初始版本包含的 Skills:
- Navigation 3 设置和迁移
- 实施无边框支持
- AGP 9 和 XML-to-Compose 迁移
- R8 配置分析
- Android CLI 可以用来浏览和设置 agent 工作流,并支持第三方技能。
Android Knowledge Base: 这是一个专门的数据源,通过 android docs 命令和 Android Studio 的最新版本可访问。 它为代理提供最新的官方开发者指南,作为相关上下文。 即使 LLM 的训练数据过时,也能提供关于最新框架和模式的指导。
与其他工具的联动:
这些新工具旨在与 Android Studio 无缝集成。开发者可以先使用 Android CLI 快速创建原型,然后将其导入 Android Studio 进行更精细的 UI 设计、代码编辑、调试和性能分析。 Android Studio 也集成了 AI 代理,可以帮助开发者构建高质量的应用,支持多种设备类型。
总结:
Google 旨在通过 Android CLI、Android Skills 和 Android Knowledge Base,简化 Android 应用开发流程,提高代理的效率和准确性,并鼓励开发者利用 AI 技术构建更强大的应用。 这些工具可以单独使用,也可以与 Android Studio 结合使用,为 Android 开发提供更全面的支持。开发者可以从 d.android.com/tools/agents 下载 Android CLI 开始使用。
|
Ada, Its Design, and the Language That Built the Languages
安达:被忽视的巨擘
在国防部构建、业界忽视、但现代编程语言却悄然借鉴的安达语言中,蕴藏着许多先见之明。它在广泛应用系统语言中,率先实现了泛化的首等特性,规范化了包机制,将并发构建在规范而非库中,强制分离接口与实现,并引入了范围约束类型、区分联合体以及一种任务通信模型,而Go语言三十年后才以另一种方式独立实现。后续修订增加了受保护对象、编译时空指针排除以及语言级别的契约。Rust花了整整十年时间从一个方向趋近于安达,而Python则从另一个方向趋近。C#也花了近二十年时间,逐步地模仿安达的特性。它是一个业界一致认为冗长、晦涩、不相关的语言,但它以一种直白的方式预见——并以惊人的精度预见——现代编程语言都在努力获得的安全性特性。
安达并非名扬天下。它不常出现在激动人心的会议演讲或令人屏息的博客文章中。它没有一位有魅力的创始人进行哲学编程的基调演讲,也没有一个社区编写框架或发布具有巧妙名称的软件包。它拥有自1983年起修订四次的正式标准;在许多大型商业飞机和航空电子系统软件中的存在;以及美国国防部在20世纪70年代末通过政府合同做出的设计决策,而整个行业花了四十年的时间独立地重新发现这些决策;以及在知晓该语言的程序员中,它以“说不”的语言而闻名——它的编译器强制执行合法性、可见性、类型安全以及一定程度的安全检查,让大多数语言依赖于约定或工具来实现,它要求程序员明确表达其意图,将歧义视为错误而非特性。这些品质长期以来被认为是它的弱点,但仔细研究后,它们恰恰是当前所有被描述为“现代”语言都在试图获得的特性。
安达的出现源于美国国防部在20世纪70年代初面临的特定危机——一场采购危机,当时它试图调查其武器系统、后勤基础设施和指挥控制系统的软件。调查结果并非单一的软件生态系统,而是与之相反:在军方系统中,有超过四百五十种不同的编程语言和方言在使用,每种语言都与特定的承包商或开发时代相关联,大多数难以维护,许多作者已不复存在。导弹制导软件无法由负责维护船舶导航软件的人员维护。后勤调度软件无法与通信处理软件共享代码。这些语言的积累方式,就像技术债务的积累一样:悄无声息、渐进式,每一次的单独决策在局部看来是合理的,但总体的结果却是灾难性的。
国防部的回应,对于政府机构而言,出乎意料地复杂。它没有简单地强制使用现有语言——COBOL、Fortran 和 PL/1 都被考虑过并被拒绝了——而是进行了一项持续了五年的需求过程,并生成了一系列不断细化和严格的文档:Strawman、Woodenman、Tinman、Ironman,最终是 Steelman,每个文档都对国防部编程语言必须具备的特性进行精炼和严格定义。1978年发布的 Steelman 文档是一篇杰出的工程需求文献:它没有指定一种语言,而是描述了一种语言必须具备的特性——这些特性源于国防部现有软件的实际失效模式。它要求具有显式分离接口和实现的模块系统;要求强、静态类型,没有类型之间的隐式转换;要求内置对并发任务的支持;要求一致的异常处理机制;要求该语言与机器无关;要求程序易于作者以外的人阅读;要求该语言使程序验证具有可行性。这些并非理想的偏好,而是源于程序缺乏这些特性的后果的实际要求。
1979年,四支决赛队伍(Green、Red、Blue 和 Yellow 队伍)的竞争产生了赢家:由 Jean Ichbiah 领导的 CII Honeywell Bull 法国团队的设计。该设计被命名为 Ada,以纪念 19 世纪的数学家 Ada Lovelace 伯爵夫人,她编写了通常被认为是为机械计算设计的第一个算法。选择这个名称是故意的:国防部希望使用一个名称而不是缩写,希望纪念一位在很少有女性受到庆祝的领域中的女性,并希望表明该语言是一项意图声明,而不是委员会妥协。Ichbiah 对这项任务非常认真,以至于附带了一份理由文档——对每个设计决策及其背后的理由的完整解释——这仍然是所有阅读过它的人看来,对编程语言设计真正
|
New unsealed records reveal Amazon's price-fixing tactics, California AG claims
亚马逊涉嫌操纵价格:加州总检察长公布新证据 (Amazon Allegedly Manipulates Prices: California Attorney General Releases New Evidence)
以下是对文章内容的总结:
核心指控: 加州总检察长办公室指控亚马逊利用其市场主导地位,通过施压独立卖家提高竞争对手(如沃尔玛、塔吉特)的价格,从而使其自身商品在价格上更具优势。
证据来源: 加州总检察长办公室在2022年对亚马逊提起民事诉讼,指控其进行大规模价格操纵。近日,该办公室公布了此前被删减的证据,包括内部邮件、宣誓证词和保密的公司报告。
主要手段:
- 价格监测与惩罚: 亚马逊使用自动化工具跟踪独立卖家在其他网站上的价格,并对那些在其他平台提供更低价格的卖家进行惩罚。
- Buy Box 抑制: 亚马逊会剥夺那些在其他网站提供更低价格的卖家的“Buy Box”使用权(即购买按钮所在的区域),导致其在亚马逊上的销量大幅下降(高达80%)。
- 价格匹配要求: 亚马逊会要求卖家在其他网站匹配或高于亚马逊的价格,以恢复其Buy Box的使用权。
- 干预竞争平台: 亚马逊内部员工甚至设计了内部项目(如SC-FOD)来阻止卖家在竞争平台(如Temu)上销售商品。
卖家证词:
- Leveret (服装公司): 因其虎纹睡衣套装在沃尔玛上的价格仅比亚马逊高一分钱,就被亚马逊移除Buy Box。该公司随后将沃尔玛的价格调整为与亚马逊相同或更高。
- Terry Esbenshade (园艺用品供应商): 他的产品因在Wayfair上的价格低于亚马逊而失去Buy Box,导致亚马逊上的销量骤降。他被迫提高其他零售商的价格,以恢复Buy Box的使用权。
亚马逊的回应: 亚马逊否认了这些指控,声称其做法是为了促进竞争并向客户提供低价。该公司表示,它致力于“展示具有低价的优惠”,并维护客户信任。但加州总检察长办公室认为,新发布的证据表明亚马逊员工积极寻求破坏市场竞争,并意识到了其行动对价格的影响。
市场地位: 亚马逊是美国最大的在线零售商,截至2022年底,占据美国电商零售支出的近一半,远高于沃尔玛的8%。
后续行动: 加州总检察长办公室表示将继续推进诉讼,预计将于2027年1月19日开庭审理。
(中文翻译结束)
|
|
Isaac Asimov: The Last Question
https://hex.ooo/library/last_question.html
|
A Better R Programming Experience Thanks to Tree-sitter
R 代码开发体验的提升:基于 Tree-sitter 的工具生态
大约两年前,在 Jim Hester 和 Kevin Ushey 的工作基础上,Davis Vaughan 完成了一个对 R 社区影响深远的 JavaScript 文件:用于 Tree-sitter 解析生成器的 R 语法。他在 useR! 2024 会议上为此获得了热烈的掌声!那么,他为 JavaScript 文件 中的 [语法规则] 获得了喝彩吗?😅
实际上,观众的兴奋源于该文件为 R 开发者带来的更好的开发体验。基于 Tree-sitter 构建的 R 工具可以实现:
本文将解释什么是 Tree-sitter,以及基于 Tree-sitter 构建的工具如何改善 R 开发工作流程。
代码解析:什么是 Tree-sitter?
Tree-sitter 是用 C 编写的代码解析生成器,并支持多种语言的绑定,包括 Rust (以及 R!)。
简单来说,给定一段代码,例如:
a <- mean(x, na.rm = TRUE)
如何知道 mean 是函数名,na.rm 是参数名,TRUE 是逻辑值? 你需要将代码解析成一个所谓的解析树。当你阅读 R 代码时,你就在脑海中进行解析。😸
R 本身也能够解析 R 代码,这得益于它的语法。例如,可以查看引入 R 原生管道的提交,该提交修改了 R 的语法。
可以使用 parse() 和 getParseData() 来解析 R 代码。
parse(
text = "a <- mean(x, na.rm = TRUE)",
keep.source = TRUE
) |>
getParseData()
或者,可以使用 Gábor Csárdi 的 {xmlparsedata} 包将解析后的数据转换为 XML:
parse(
text = "a <- mean(x, na.rm = TRUE)",
keep.source = TRUE
) |>
xmlparsedata::xml_parse_data(pretty = TRUE) |>
xml2::read_xml() |>
as.character() |>
cat()
在以上两种情况下,你都可以识别出诸如 LEFT_ASSIGN 或 SYMBOL_FUNCTION_CALL 之类的词汇。解析是执行代码前的必要步骤,但解析后的代码也可用于其他目的,例如分析代码(而不使用脆弱的正则表达式)或修改代码。
Tree-sitter 执行相同的代码解析,但速度更快,特别是得益于其增量解析的支持,这对于在编辑器中输入时实时更新语法树至关重要! Tree-sitter 是通用的,只要有针对特定语言的语法定义,就可以解析任何代码(例如,像 Rosetta Stone 插件一样)。它已被用于许多语言,因此围绕它构建了许多工具。
要让 Tree-sitter “学习” 一种新的语言,需要提供一个包含该语言语法定义的文件的 语法。 这就是 Davis Vaughan 和他的合作者提供的 JavaScript 文件发挥作用的地方! [treesitter-r repo](https://github.com/r-lib/tree-sitter
|
Hospital at centre of child HIV outbreak caught reusing syringes in Pakistan
巴基斯坦旁遮普省一医院不卫生的注射行为导致数百儿童感染艾滋病
概述
BBC Eye 调查揭示了巴基斯坦旁遮普省陶恩萨市一所政府医院(THQ Taunsa)存在严重的医疗安全问题,导致至少 331 名儿童在 2024 年 11 月至 2025 年 10 月期间感染艾滋病毒 (HIV)。调查显示,医院工作人员在注射时重复使用注射器,并存在其他不卫生的医疗行为,这很可能导致了大规模感染。
主要发现
- 感染爆发: 在陶恩萨市,有 331 名儿童被诊断出感染 HIV,其中大部分母亲检测结果为阴性,表明感染并非母婴传播。
- 重复使用注射器: BBC Eye 在 THQ Taunsa 医院进行了 32 小时的卧底拍摄,目睹工作人员在 10 个场合重复使用注射器注射药物,并有 4 个案例中,同一支注射器用于注射不同的儿童。
- 不规范操作: 医院工作人员,包括医生,在 66 次注射过程中没有戴手套,护士在医疗废物箱中翻找物品时也未戴手套。
- 存在问题: 医院墙上张贴了安全注射实践的指示牌,但这些指示牌并未得到执行。
- 医生否认: 医院新任医监督,Qasim Buzdar 否认调查结果的真实性,声称视频可能是拍摄于他上任之前,或者为摆拍。
- 早期预警: 当地私人诊所医生 Gul Qaisrani 在 2024 年底发现儿童 HIV 感染人数增加,并将其与 THQ Taunsa 医院联系起来。
- 医疗物资短缺: 医院存在医疗物资短缺的问题,患者有时需要自备药物。
- 之前爆发: 该事件并非孤立事件,此前在巴基斯坦的其他地区也曾发生过类似的 HIV 感染爆发。
背景信息
- Mohammed Amin 和 Asma: 8 岁的 Mohammed Amin 因 HIV 相关并发症去世,他的 10 岁妹妹 Asma 也被诊断出感染 HIV。
- 医疗安全问题普遍存在: 巴基斯坦存在过度依赖注射治疗的文化,且医疗安全培训不足,这些因素加剧了感染风险。
- 政府回应: 当地政府声称已采取行动,并指责不规范的私人医疗实践和未经筛查的输血是爆发的原因。然而,联合国儿童基金会、世界卫生组织和地方卫生部门于 2025 年 4 月进行的联合检查报告也发现了类似的医疗安全问题。
- 长期影响: 感染 HIV 的儿童面临着终身治疗和歧视的困境。
结论
BBC Eye 的调查揭示了巴基斯坦陶恩萨市 THQ Taunsa 医院存在严重的安全隐患,导致数百名儿童感染艾滋病毒。尽管政府声称已采取措施,但调查结果表明,这些措施并未得到有效执行,不卫生的医疗行为仍在继续。此次事件凸显了巴基斯坦医疗系统存在的问题,包括医疗安全培训不足、医疗物资短缺以及过度依赖注射治疗等。
|
Japan implements language proficiency requirements for certain visa applicants
日本将要求部分外国人在申请特定工作签证时提供语言能力证明 (Japan to Require Language Proficiency Proof for Certain Foreign Nationals Applying for Work Visas)
核心要点 (Key Points):
从本周三起,日本将要求部分申请“工程师/人文科学专家/国际服务”签证(该签证是外国人在日本最常见的白领工作签证)的外国人在工作需要使用语言技能的情况下,提供语言能力证明。
详细内容 (Detailed Information):
- 适用签证 (Applicable Visa): “工程师/人文科学专家/国际服务”签证,广泛应用于口译员、公司职员和酒店员工等。
- 生效时间 (Effective Date): 本周三起生效。
- 语言能力标准 (Language Proficiency Standard): 达到欧洲共同语言参考框架 (CEFR) B2 水平。
- 证明方式 (Proof of Proficiency): 可以通过以下方式证明日语能力:
- 日本语能力测试 (JLPT) N2 证书。
- 商务日语能力测试 (BJT) 400 分或更高的分数。
- 目的 (Purpose): 要求旨在评估申请人在工作中使用语言技能的能力。
总结 (Summary):
日本政府为了评估外国人在工作中使用语言技能的能力,将对申请“工程师/人文科学专家/国际服务”签证的部分外国申请者,要求提供语言能力证明,标准达到CEFR B2水平,可以通过JLPT N2 或 BJT 400 分以上来证明。 此政策从本周三开始实施。
|
Official Clojure Documentary page with Video, Shownotes, and Links
Clojure 术语解释:文档摘要 (Clojure Terminology: Documentary Summary)
本文档列举了一些在观看关于 Clojure 的纪录片时可能会遇到的关键术语,并对其进行了定义。以下是对这些术语的总结:
核心编程语言概念:
- Lisp (李斯): 一类编程语言,其代码以嵌套的括号内的列表形式表示。Clojure 是 Lisp 的一种方言 (dialect)。这意味着 Clojure 继承了 Lisp 的一些核心语法和编程范式。
- Functional programming (函数式编程): 一种编程风格,围绕函数进行构建,函数接收值并返回值,最大限度地减少可变状态和副作用。Clojure 鼓励使用函数式编程风格。
- Value (值): 创建后不会改变的数据片段,例如数字、字符串或持久集合。Clojure 默认使用值,只有在需要时才显式地选择可变状态。这有助于代码的可预测性和可维护性。
Clojure 特有概念:
- REPL (Read-Eval-Print Loop, 读取-求值-打印循环): 一个交互式会话,读取一个表达式,对其求值,打印结果,然后重复这个过程。Clojure 开发者使用 REPL 来构建和测试程序,在程序运行时进行交互式开发。
- Persistent data structure (持久数据结构): 一种集合,在修改时会保留其先前的版本。添加元素会返回一个新的集合,原始集合保持不变。 “持久” 在这里指的是版本保留,而不是存储到磁盘。这对于维护数据一致性和历史记录非常有用。
- STM (Software Transactional Memory, 软件事务内存): 一种并发模型,通过事务协调共享状态的变化,而不是使用锁。这简化了多线程编程,并减少了死锁的风险。
Clojure 的运行环境:
- Hosted language (托管语言): 一种设计为在现有平台上运行的语言,而不是其自己的运行时。Clojure 是一个托管语言,它可以运行在 JVM (Java 虚拟机) 上,ClojureScript 可以编译成 JavaScript,ClojureCLR 则针对 .NET CLR。这意味着 Clojure 可以利用这些平台的强大功能和生态系统。
其他重要概念:
- Accidental complexity (意外复杂性): 由于工具和设计选择造成的软件困难,而不是问题本身固有的困难。 与 essential complexity (本质/偶然复杂性) 相对,后者是问题域固有的。 目标是减少意外复杂性,提高代码的清晰度和可维护性。
|
The beginning of scarcity in AI
人工智能算力短缺:新时代的五个标志
本文探讨了当前人工智能领域面临的算力短缺问题,以及这一问题对行业格局的影响。这是自2000年代以来,科技公司首次面临如此显著的供应链限制。
主要问题:
- 算力价格飙升: Nvidia Blackwell芯片的GPU租赁价格在短短两个月内上涨了48%,达到每小时4.08美元。CoreWeave也提高了20%的价格,并将最低合同期限延长至三年。
- 访问受限: OpenAI首席财务官Sarah Friar表示,公司正在艰难地决定哪些项目能够继续进行,因为算力不足。Anthropic已经将其最新模型的使用限制在约四十家组织内。
- 根本原因: 需求远超供应,导致算力成为一种稀缺资源。
新时代的五个标志:
- 基于关系的销售 (Relationship-Based Selling): 最先进的模型(SOTA)将不再向所有人开放,供应商将优先向利润丰厚或具有战略意义的客户提供服务。
- AI 竞拍 (AI to the Highest Bidder): 即使模型可用,其成本也可能变得高昂,拥有大量资金或强大盈利能力的公司将占据优势。
- 可用但速度慢 (Available but Slow): 即使支付了费用,也无法保证模型运行速度。
- 通货膨胀商品 (Inflationary Commodity): 供需失衡将不可避免地推高价格,软件公司需要重视采购和利润管理。
- 被迫多元化 (Forced Diversification): 开发者将被迫寻找其他选择,例如较小的模型或本地部署,直到能源基础设施和数据中心建设赶上需求,这可能需要数年时间。
总结:
人工智能的“充裕时代”已经结束,并且在未来几年内将继续存在。算力短缺正在重塑人工智能行业,并为初创公司带来了更大的挑战。企业需要适应这种新的现实,并探索替代方案以应对算力限制。文章预测,这种状况将持续到能源基础设施和数据中心建设能够满足日益增长的需求之前。
|
Bluesky has been dealing with a DDoS attack for nearly a full day
Bluesky遭遇DDoS攻击,服务中断
摘要:
社交媒体平台Bluesky自昨日凌晨开始遭受分布式拒绝服务攻击 (DDoS)。
主要内容:
- 攻击事件: Bluesky自昨日凌晨2:40 ET开始报告出现DDoS攻击,持续至今(发布时间为2026年4月17日凌晨)。
- 服务影响: 用户体验到“间歇性的服务中断”,具体表现为信息流、通知、线程和搜索功能受到影响。
- 数据安全: Bluesky表示目前没有发现任何未经授权访问用户私有数据的证据。
- 后续更新: Bluesky将在本周五下午1点 ET之前发布进一步更新。
**总结:**Bluesky平台正经历DDoS攻击,导致用户服务中断,但平台方声明用户数据安全未受影响,并承诺会尽快提供更新。
|
European civil servants are being forced off WhatsApp
摘要:Anthropic AI 黑客技术引发的欧盟监管挑战及相关法律变化
根据Politico的报道,Anthropic公司研发的AI黑客技术引发了欧盟内部的担忧和监管挑战,并伴随着新的法律变化。以下是主要内容:
1. Anthropic AI 黑客技术及其潜在风险:
- Anthropic公司推出了一种新的AI技术,具备强大的“超级黑客”能力,可能对网络安全构成重大风险。该技术能够模拟黑客行为,从而发现和利用系统漏洞。
- 德国网络安全机构对此表示担忧,并预计该技术将带来显著的 disruption (破坏、干扰)。
2. 欧盟监管机构面临的困境:
- 负责监管最先进AI模型的欧盟机构面临人员不足的问题,批评者认为其需要增加人员配置以有效监管。
- 许多欧洲监管机构在Anthropic的“超级黑客”AI模型方面缺乏充分的监督和了解,导致他们可能被边缘化,无法有效应对潜在风险。
3. 欧盟新的法律变化:儿童性虐待内容扫描的限制:
- 从4月3日开始,欧洲范围内对私人在线空间进行扫描以查找儿童性虐待内容的行为变得非法。
- 这项法律变化给科技公司带来了法律上的不确定性,因为他们需要在保护儿童和尊重个人隐私之间寻求平衡。
总结:
Anthropic的AI黑客技术凸显了欧盟在监管先进AI安全风险方面的挑战。 欧盟监管机构需要加强自身能力,以有效监控和应对这类技术带来的潜在威胁。 同时,新的法律规定限制了对私人在线空间的扫描,这给科技公司带来了新的合规压力。
|
Guy builds AI driven hardware hacker arm from duct tape, old cam and CNC machine
AutoProber 概要
AutoProber 是一个硬件黑客的飞行探针自动化堆栈,旨在为设备提供所需的一切,使其能够从“有新的目标待测”到以安全方式探针单个引脚。
核心功能:
AutoProber 允许用户自动化硬件测试流程,通过一个网页仪表盘、Python 脚本或设备自身来控制所有硬件。它主要用于识别PCB上的元件、引脚和芯片,并进行精确的探针测试。
工作流程:
- 告诉设备导入项目。
- 连接所有硬件。
- 确认所有部件正常工作。
- 进行归零和校准。
- 安装自定义探针和显微镜头。
- 告知设备有新的目标待测。
- 设备自动定位目标,拍摄图像,记录 XYZ 坐标,并识别焊盘、引脚、芯片等特征。
- 将图像拼接在一起,标注地图,包括引脚和识别的元件。
- 在网页仪表盘中添加探针目标,供用户批准或拒绝。
- 探针测试已批准的目标并报告结果。
安全模型:
AutoProber 控制物理硬件运动,因此需要严格的安全措施:
- 忽略 CNC 探针引脚 (GRBL
Pn:P)。
- 从示波器通道 4 读取独立的安全端点。
- 持续监控通道 4,任何触发、电压异常、CNC 报警或限位引脚触发都将停止运动。
- 操作员必须停止并报告,不进行自动恢复。
项目结构:
apps/: 包含操作员脚本和 Flask 仪表盘入口点。
autoprober/: 包含 CNC、示波器、显微镜、日志记录和安全控制的 Python 包。
dashboard/: 单页 Web 仪表盘。
docs/: 包含架构、设备参考、操作和安全指导文档。
cad/: 包含可打印的 STL 文件,用于当前的自定义工具头。
config/: 包含示例环境变量/配置文件。
LICENSE: PolyForm 非商业许可 1.0.0。
硬件架构:
AutoProber 使用以下硬件:
- GRBL 兼容的 3018 型 CNC 控制器(通过 USB 串口)
- 通过
mjpg_streamer 提供的 USB 显微镜
- 通过 LAN/SCPI 连接的 Siglent 示波器(用于通道 4 安全监控和通道 1 测量)
- 连接到外部 5V 电源和示波器通道 4 的光学限位开关
- 可选的网络控制插座,用于实验室电源控制
- 自定义工具头部件(位于
cad/ 目录)
快速入门:
- 安装依赖项:
uv sync
- 在已配置的硬件主机上启动仪表盘:
PYTHONPATH=. python3 apps/dashboard.py
许可证:
该项目采用 PolyForm 非商业许可 1.0.0 发布。非商业用途可以自由使用,商业用途需要单独购买商业许可。
当前限制:
- 必须测量显微镜到探针的 XY 偏移量。
- 校准不能被伪造,运行时间校准文件必须在将要移动的机器上生成。
- 仪表盘是一个实验室控制工具,不应暴露给不可信的网络。
负责任的使用:
该项目仅用于在您有权测试的设备和目标上进行受控的实验室工作。未经授权,请勿将其用于探针、损坏或分析系统。
|
How Big Tech wrote secrecy into EU law to hide data centres' environmental toll
欧盟数据中心环境影响信息保密:科技巨头游说下的政策变化 (欧盟数据中心环境影响信息保密:科技巨头游说下的政策变化)
主要内容:
本文揭示了微软和DigitalEurope(一个包括亚马逊、谷歌和Meta在内的行业游说团体)如何成功游说欧盟,在欧盟法律中加入一项保密条款,阻止公众获取有关数据中心环境影响的关键信息。
背景:
- 欧盟计划在未来五年内将数据中心容量增加一倍。
- 为了评估数据中心的环境影响,欧盟委员会开始收集能源效率和用水量等关键指标。
- 然而,在行业游说的影响下,欧盟委员会修改了2024年的立法,将单个数据中心的具体环境影响信息归类为“商业机密”,从而限制了公共访问。
关键细节:
- 保密条款的内容: 欧盟委员会和成员国有义务对单个数据中心的“所有信息和关键绩效指标”保密,并将这些信息视为影响数据中心运营商和所有者商业利益的机密信息。
- 违反透明度原则: 10位法律专家认为该条款可能违反欧盟的透明度规则,特别是违反了《阿瓦斯提协议》(Aarhus Convention),该协议保障公众获取环境信息的权利。
- 欧盟委员会的指示: 欧盟委员会通过内部邮件,指示成员国拒绝公众对数据中心环境信息的公开请求。
- 行业游说的影响: 微软和DigitalEurope在2024年初向欧盟委员会提交反馈意见,建议将所有单个数据中心的信息归类为保密。最终的立法文本几乎逐字采用了他们的建议。
- 公开数据的局限性: 目前,只有笼统的国家层面的数据是公开的,而单个数据中心的具体影响信息仍然不为人知。
- 其他政策变化: 欧盟委员会还提议加快审批大型建设项目(包括数据中心)的环境影响评估流程,并设置了时间限制和加速通道,这也被批评为有利于企业。微软和亚马逊等公司曾公开游说加快审批流程。
影响:
- 公众、学术界、记者等无法获取数据中心的环境影响数据。
- 可能导致数据中心运营商报告数据减少,从而难以评估其真实环境影响。
- 当地社区和生态系统可能因数据中心带来的污染和能源消耗而受到影响。
欧盟委员会的回应:
欧盟委员会表示,保密条款一直存在于其提案中,并且在咨询过程中收到了许多关于此话题的反馈。他们声称,他们遵循标准程序,采纳了反映这些反馈的文本。
批评:
观察企业欧洲组织(Corporate Europe Observatory)认为,欧盟委员会似乎更代表科技巨头而非公众利益,并质疑欧盟法律的修改是否符合公众利益。
总结:
本文揭示了科技巨头通过游说影响欧盟政策,限制公众获取数据中心环境影响信息的情况。这一做法引发了对透明度、公众参与和数据中心可持续性的担忧。
|
Europe has "maybe 6 weeks of jet fuel left"
国际能源署警告:全球能源危机严重,欧洲燃油供应告急
主要内容:
国际能源署(IEA)负责人法蒂赫·比罗尔(Fatih Birol)周四表示,由于伊朗战争导致霍尔木兹海峡(Strait of Hormuz)受阻,全球正面临前所未有的能源危机。这一危机对全球经济造成严重影响,可能导致通货膨胀加剧、经济增长放缓甚至衰退。
关键细节:
- 燃油供应告急: 欧洲剩余的喷气燃料可能只够飞行六周时间。如果霍尔木兹海峡无法恢复畅通,预计很快将出现航班取消。
- 全球影响: 比罗尔警告称,危机将导致汽油、天然气和电价上涨,并对全球经济造成广泛影响,尤其对亚洲、非洲和拉丁美洲等发展中国家冲击更大。
- 霍尔木兹海峡的重要性: 正常情况下,约20%的世界石油贸易通过霍尔木兹海峡。
- 伊朗的“过路费”政策: 比罗尔反对伊朗对通过海峡的船只收取费用的做法,认为这可能为其他水域设置类似先例,影响全球贸易。
- 基础设施受损: 伊朗战争造成该地区超过80个能源设施受损,其中超过三分之一受到严重损害。 即使达成和平协议,恢复战前产量也可能需要长达两年的时间。
- 能源储备释放: IEA此前已协调释放了创纪录的紧急石油储备,以缓解危机。
- 未来能源格局: 比罗尔认为,这场危机可能会加速其他能源技术的应用,例如核能,并重塑全球能源格局。
航空公司反应:
- 荷兰航空 KLM 计划下个月削减飞往和从阿姆斯特丹史基浦机场起降的 160 个航班,理由是“煤油成本上涨”。
- 英国廉价航空公司易捷航空(easyJet)表示目前没有燃油短缺问题,但未就IEA的警告发表评论。
- 美国航空公司达美航空(Delta Air Lines)表示,已注意到欧洲的潜在燃油供应问题,并正在监控情况,但预计不会立即受到影响。
比罗尔总结:
比罗尔强调了地缘政治对能源的影响,并表示全球能源危机前所未有,令人担忧。 他呼吁尽快解决危机,恢复霍尔木兹海峡的畅通,以避免全球经济遭受更大的损失。
|