[2026-02-06] Claude Opus 4.6

0 views

Skip to first unread message

HNews Digest

unread,

Feb 6, 2026, 9:11:43 PMFeb 6

to mo-...@googlegroups.com

This post is also available on the web as a GitHub issue.

Claude Opus 4.6

好的，以下是根据原文生成的摘要，字数控制在800字以内，使用markdown格式，中文呈现：

Anthropic 发布 Claude Opus 4.6：更强大的 AI 模型

Anthropic 发布了最新模型 Claude Opus 4.6，对前代模型进行了全面升级，尤其是在编码能力方面表现显著。

主要改进：

编码能力提升： Opus 4.6 在代码规划、执行长期任务、处理大型代码库、代码审查和调试方面都有明显提升，能够更有效地识别和纠正自身错误。
更大的上下文窗口： 首次在 Opus 系列模型中引入 1M token 上下文窗口（beta 版本），使其能够处理更长的文本和更复杂的任务。
更广泛的应用： Opus 4.6 不仅擅长编码，还能应用于金融分析、研究、文档、电子表格和演示文稿等日常工作。
卓越的性能表现：
- 在 agentic coding 评估 Terminal-Bench 2.0 中取得最高分。
- 在复杂的多学科推理测试 Humanity’s Last Exam 中领先其他前沿模型。
- 在经济知识工作任务评估 GDPval-AA 中，比 OpenAI 的 GPT-5.2 高出约 144 Elo 点，比前代模型 Claude Opus 4.5 高出 190 点。
- 在信息检索评估 BrowseComp 中表现优异。

新功能和工具：

Agent 团队： 在 Claude Code 中，用户现在可以组建 Agent 团队协同工作。
上下文压缩： 在 API 中，Claude 可以使用上下文压缩功能总结自身内容，从而在不超出限制的情况下执行更长时间的任务。
自适应思考： 模型能够根据上下文提示判断何时使用扩展思考能力。
Effort 控制： 开发者可以通过 Effort 参数控制模型的智能程度、速度和成本。
Claude in Excel 和 PowerPoint： 大幅升级了 Claude in Excel，并发布了 Claude in PowerPoint 的研究预览版，增强了其日常办公能力。

安全性和可用性：

安全保障： Opus 4.6 的安全 profile 达到或优于行业内其他前沿模型，具有较低的不良行为率。
广泛可用： Claude Opus 4.6 现已在 claude.ai、API 和所有主要云平台上可用。
定价不变： 价格保持在每百万 token 5 美元/25 美元，具体信息请参阅定价页面。

用户反馈：

早期用户反馈显示，Opus 4.6 具有自主工作、解决之前模型无法解决的问题、以及改变团队工作方式的能力。用户评价其更像一个有能力的合作者，而非简单的工具。

评估结果：

Anthropic 对 Opus 4.6 进行了全面的评估，在 agentic coding、计算机使用、工具使用、搜索和金融等多个方面均表现出领先的性能。特别是在长文本上下文处理方面，Opus 4.6 表现出显著的优势，减少了“上下文腐烂”现象。

总结：

Claude Opus 4.6 是 Anthropic 在 AI 领域的一次重要进步，它不仅在性能上取得了显著提升，还在安全性和可用性方面进行了优化，为用户提供了更强大、更安全、更便捷的 AI 体验。

anthropic.com | 1625 points by HellsMaddy at 01:38:53 | 700 comments

GPT-5.3-Codex

GPT-5.3-Codex：更强大的编码助手

以下是对 OpenAI 新模型 GPT-5.3-Codex 的总结：

核心功能与优势:

更强大的编码能力: GPT-5.3-Codex 是迄今为止最强大的编码代理模型，结合了 GPT-5.2-Codex 的编码性能和 GPT-5.2 的推理与专业知识，速度提升 25%。
更长的任务处理能力: 能够处理涉及研究、工具使用和复杂执行的长时间任务，更像一位协作的同事。
交互式协作: 用户可以在模型工作时进行互动、提问和引导，保持上下文一致性。
自我训练: GPT-5.3-Codex 是 OpenAI 首次使用自身来调试训练、管理部署和诊断测试结果。
更广泛的应用范围: 从编写和审查代码到几乎任何开发人员和专业人士可以在计算机上完成的任务。

性能表现:

在 SWE-Bench Pro (软件工程评估)、Terminal-Bench 2.0 (终端技能评估)、OSWorld (计算机使用能力) 和 GDPval (专业知识工作评估) 四项基准测试中表现出色，尤其在 SWE-Bench Pro 和 Terminal-Bench 2.0 上取得了领先优势。
能创建复杂游戏和应用程序，例如基于 Codex 应用发布的赛车游戏和潜水游戏。
更好地理解用户意图，在构建网站时提供更具功能性和实用性的默认设置。
在 GDPval 评估中与 GPT-5.2 表现相当，涵盖 44 种职业的知识型工作任务。

技术细节:

GPT-5.3-Codex 能够支持软件生命周期的各个环节，包括调试、部署、监控、编写产品需求文档 (PRD)、编辑文案、用户研究、测试和指标分析。
模型使用自定义技能，并利用 NVIDIA GB200 NVL72 系统进行设计、训练和服务。

安全措施:

GPT-5.3-Codex 被归类为“高能力”的用于网络安全任务模型，并直接训练以识别软件漏洞。
OpenAI 部署了最全面的网络安全安全措施，包括安全训练、自动化监控、受信任访问、威胁情报以及执行流程。
推出“网络安全可信访问”试点项目，加速网络防御研究，并提供 API 额度支持开源软件和关键基础设施系统。

可用性:

GPT-5.3-Codex 现已在所有支持 Codex 的 ChatGPT 付费计划中使用（应用程序、CLI、IDE 扩展和 Web）。
未来将开放 API 访问。

未来展望:

Codex 不再仅仅是编写代码的工具，而是可以利用代码来操作计算机并完成端到端工作。
OpenAI 致力于将 Codex 发展成更通用的计算机助手，扩展谁可以进行构建以及 Codex 的可能性。

附录（部分指标）：

指标	GPT-5.3-Codex	GPT-5.2-Codex	GPT-5.2
SWE-Bench Pro (Public)	56.8%	56.4%	55.6%
Terminal-Bench 2.0	77.3%	64.0%	62.2%
OSWorld-Verified	64.7%	38.2%	37.9%
GDPval (wins or ties)	70.9%	-	70.9%
Cybersecurity CTF Challenges	77.6%	67.4%	67.7%
SWE-Lancer IC Diamond	81.4%	76.0%	74.6%

openai.com | 1079 points by meetpateltech at 02:08:08 | 411 comments

Flock CEO calls Deflock a “terrorist organization” (2025) [video]

Flock CEO 将 Deflock 称为“恐怖组织” - 总结

根据一份与 Forbes 的采访，Flock 的 CEO 将 Deflock 描述为“恐怖组织”。

主要信息：

核心指控： Flock 的 CEO 称 Deflock 为“恐怖组织”。
采访来源： 这番言论出自与 Forbes 的采访。
采访链接： 采访视频链接为：https://youtu.be/fVCVQcd9PLc?si=qVLkcKMDD...
图片来源： 配图来自 YouTube 视频的缩略图。
版权信息： 页面底部显示 © 2026 Google LLC，表明页面内容可能包含 YouTube 的信息。

补充说明：

此总结仅基于提供的内容，并未包含任何个人观点或补充信息。报道的重点是 CEO 的指控以及相关来源信息。

youtube.com | 507 points by cdrnsf at 03:04:37 | 346 comments

It's 2026, Just Use Postgres

虎格数据 (Tiger Data) 简介

主要内容：

这段内容主要展示了虎格数据 (Tiger Data) 的网站底部信息。

核心要点：

公司名称： 虎格数据 (Tiger Data) 是 Timescale, Inc. 的一个品牌，其法律名称为 Timescale, Inc., d/b/a Tiger Data。
产品与服务： 网站包含“产品 (Products)”、“学习 (Learn)” 和 “公司 (Company)” 等链接，暗示虎格数据提供产品、学习资源和公司相关信息。
订阅： 网站提供订阅虎格数据新闻通讯 (Tiger Data Newsletter) 的选项。订阅者需同意虎格数据隐私政策 (Privacy Policy)。
版权声明： 版权归 Timescale, Inc. 所有，年份为 2026。
隐私设置： 网站包含“隐私偏好 (Privacy preferences)” 链接，允许用户管理他们的隐私设置。

总结：

虎格数据 (Tiger Data) 是 Timescale, Inc. 的一个品牌，提供产品、学习资源和公司信息。用户可以订阅新闻通讯并管理隐私偏好。该网站版权归 Timescale, Inc. 所有，并遵守其隐私政策。

tigerdata.com | 435 points by turtles3 at 05:24:03 | 242 comments

We tasked Opus 4.6 using agent teams to build a C Compiler

Claude Agent Teams: 构建一个自动化的 C 编译器

这篇文章介绍了 Nicholas Carlini 如何利用多实例 Claude 模型 (agent teams) 来构建一个 C 编译器，目标是能够编译 Linux 内核。以下是文章的主要内容：

1. Agent Teams 的概念与优势

定义: Agent Teams 是一种新的语言模型监督方法，允许多个 Claude 实例并行工作在共享代码库上，无需人工干预。
优势: 显著扩展了 LLM agent 的能力范围，可以处理更复杂、更长时间的任务。

2. 项目背景：构建 C 编译器

目标: 利用 16 个 Claude 实例构建一个从头开始的 Rust 编译器，能够编译 Linux 内核。
成果: 经过近 2000 个 Claude Code 会话和约 2 万美元的 API 费用，agent teams 产出了一个 10 万行代码的编译器，能够在 x86、ARM 和 RISC-V 平台上构建 Linux 6.9。
代码仓库: https://github.com/anthropics/claudes-c-compiler

3. 实现方法与关键技术

持续运行的 Claude Harness: 通过一个简单的循环 (类似 Ralph-loop) 持续运行 Claude，使其自动选择并执行下一个任务。
并行 Claude:
- 解决单 Agent 的局限性: 解决单个 Claude 会话一次只能执行一个任务的限制，提高调试效率，并允许进行专业化分工。
- 任务锁定机制: 使用文本文件在 current_tasks/ 目录下进行任务锁定，防止多个 agent 同时处理同一任务。
- Git 同步: 利用 Git 的同步机制解决合并冲突。
多角色分工: 除了主要的编译任务外，还分配了专门的 agent 来负责文档维护、代码质量检查、性能优化、设计评审和代码结构改进。
GCC 作为编译器 Oracle: 利用 GCC 作为在线编译器，随机编译内核的多数文件，并使用 Claude 编译器编译剩余文件，从而实现并行编译。

4. 项目经验与教训

高质量测试至关重要: 必须编写高质量的测试，确保 Claude 解决的是正确的问题。
站在 Claude 的角度思考: 考虑到 Claude 的局限性，例如上下文窗口污染和时间盲视，设计测试环境和反馈机制。
简化并行化: 在存在大量独立失败测试时，并行化很容易实现。
持续集成: 引入持续集成流程，严格测试新提交的代码，防止破坏现有功能。

5. 项目评估与局限性

评估指标: 经过近 2000 个 Claude Code 会话，消耗了 20 亿美元的 token，总成本约为 2 万美元。
能力上限: 编译器虽然可以构建 Linux 内核，但仍存在一些局限性，例如：
- 无法编译 16 位 x86 代码（调用 GCC 作为替代）
- 缺少自己的汇编器和链接器
- 生成的代码效率不高
- Rust 代码质量有待提高

6. 未来展望

自主开发: Agent Teams 预示着 LLM 在自主开发方面的潜力。
潜在风险: 完全自主的开发也存在风险，例如代码质量难以保证。
安全策略: 需要新的策略来安全地应对 LLM 带来的代码生成挑战。
技术进步: 作者认为，LLM 和相关工具的快速进步将带来更多可能，但同时也需要谨慎应对。

总结:

这篇文章展示了通过 Agent Teams 能够实现复杂软件构建的潜力，并强调了在开发过程中需要关注测试质量、并行化和 LLM 的局限性。该项目也突出了 LLM 技术的快速发展和未来可能带来的机遇与挑战。

anthropic.com | 395 points by modeless at 03:07:51 | 378 comments

My AI Adoption Journey

AI 工具使用经验总结

本文分享了作者在使用 AI 工具过程中的经验，并提出了一个渐进式的采用方法，强调了在拥抱 AI 工具时需要保持理性和务实的态度。以下是文章的主要观点：

1. 放弃聊天机器人，拥抱 Agent:

作者认为，直接通过聊天机器人进行代码编写效率低下，因为需要反复纠正。
Agent是行业内对能够循环聊天并执行外部行为的 LLM 的称呼，它至少需要具备读取文件、执行程序和发送 HTTP 请求的能力。

2. 重复自己的工作，培养经验:

作者建议，在开始使用 Agent 之前，尝试用 Agent 复制自己手动完成的工作，以了解 Agent 的局限性，并掌握有效的使用技巧。
具体建议包括：将任务分解为明确的步骤、区分规划和执行阶段、并让 Agent 能够验证自己的工作。

3. 利用工作日的尾巴进行研究和实验:

作者尝试在每天的最后 30 分钟，启动 Agent 进行一些研究或实验，例如查找特定类型的库、并行尝试不同的想法、进行 Issue 和 PR 的分类整理。
这种方式可以利用空闲时间，为第二天的工作做好准备。

4. 外包简单的任务:

当对 Agent 的能力有一定信心后，可以将一些容易解决的任务外包给 Agent，从而将精力集中在更重要的工作上。
重要提示: 禁用 Agent 的桌面通知，避免频繁的上下文切换。

5. 工程化 Agent 的“工具箱”:

为了提高 Agent 的效率，需要构建一个完善的“工具箱”，包括改进的隐含提示 (例如维护一个 AGENTS.md 文件) 和编写专门的工具，用于验证 Agent 的工作结果。
作者称此过程为 Harness Engineering (工具箱工程)。

6. 始终保持一个 Agent 运行:

作者的目标是始终保持一个 Agent 运行，并积极寻找可以委托给 Agent 的任务。
这有助于提高工作效率，并为第二天的工作做好准备。

**总而言之，**作者认为，AI 工具的使用应该是一个渐进的过程，需要不断尝试、学习和调整。关键在于了解 AI 工具的优势和局限性，并将其与自身的工作流程相结合，从而提高工作效率，而不是盲目地追求新技术。作者强调了保持理性和务实的态度，以及避免过度依赖 AI 工具的重要性。

mitchellh.com | 371 points by anurag at 03:04:40 | 98 comments

European Commission Trials Matrix to Replace Teams

https://www.euractiv.com/news/commission-trials-european-open-source-communications-software/

euractiv.com | 322 points by Arathorn at 00:33:56 | 165 comments

Orchestrate teams of Claude Code sessions

Claude Code 代理团队：概述

Claude Code 的代理团队功能允许您协调多个 Claude Code 实例协同工作，从而实现并行探索和更高效的软件开发。

核心概念：

团队领导 (Team Lead)： 主要的 Claude Code 会话，负责协调工作、分配任务和综合结果。
团队成员 (Teammates)： 独立的 Claude Code 实例，每个实例在自己的上下文窗口中独立工作，并直接与其他成员通信。
共享任务列表 (Shared Task List)： 团队成员协作完成工作项的共享列表。

与子代理 (Sub-Agents) 的区别：

子代理： 在单个会话中运行，结果只能报告给主代理，适用于快速、专注的任务。
代理团队： 团队成员完全独立，可以互相通信和协调，适用于需要讨论和协作的复杂工作。

启用代理团队：

需要设置环境变量 CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 或在 settings.json 中配置。

创建代理团队：

使用自然语言描述任务和团队结构，Claude 会创建团队，启动成员并协调工作。例如：

我正在设计一个 CLI 工具，用于帮助开发者跟踪代码库中的 TODO 注释。创建一个代理团队来从不同角度探索这个问题：一个成员负责 UX，一个负责技术架构，一个扮演“唱反调”的角色。

控制代理团队：

显示模式：
- 内联模式 (In-process)： 所有成员在主要终端内运行，使用 Shift+Up/Down 选择成员并进行消息交互。
- 分屏模式 (Split panes)： 每个成员拥有独立的面板，方便同时查看所有成员的输出。需要 tmux 或 iTerm2 支持。
任务分配： 领导者可以明确分配任务，或成员可以自行认领任务。
计划审批： 复杂任务可以要求成员先计划，领导者审批后再执行。
委派模式 (Delegate Mode)： 限制领导者仅进行协调，避免直接编写代码。

最佳实践：

为团队成员提供足够的上下文信息。
合理划分任务大小。
等待团队成员完成任务。
从研究和审查开始。
避免文件冲突。
监控并引导团队工作。

工作原理：

Claude 可以根据任务自动创建团队，也可以根据用户的明确请求创建。
团队由团队领导、团队成员、任务列表和消息传递系统组成。
每个成员拥有独立的上下文窗口。
团队和任务信息存储在本地文件。

使用场景：

研究和审查： 多个成员同时调查问题，然后共享和挑战彼此的发现。
新模块或功能： 成员各自负责一部分，避免互相干扰。
调试（竞争假设）： 成员并行测试不同的理论，更快地找到答案。
跨层协调： 涉及前端、后端和测试的更改，每个部分由不同的成员负责。

局限性：

无法恢复内联模式下的会话。
任务状态可能滞后。
关闭成员可能需要时间。
每个会话只能管理一个团队。
团队成员不能创建子团队。
领导者是固定的，无法转移。
权限在创建时设置，无法按成员单独设置。
分屏模式需要 tmux 或 iTerm2。

总而言之，代理团队功能为 Claude Code 提供了更强大的协作能力，适用于需要并行探索和复杂协调的任务。

code.claude.com | 314 points by davidbarker at 01:49:54 | 175 comments

LinkedIn checks for 2953 browser extensions

LinkedIn Chrome 扩展指纹识别项目摘要

该项目旨在记录 LinkedIn 悄悄地在每次页面加载时检查的 2953 个 Chrome 扩展程序，并提供识别它们的工具。

主要内容：

项目目标： 记录 LinkedIn 检查的 Chrome 扩展程序及其信息，并提供相关工具。
数据来源：
- LinkedIn 的页面脚本 fingerprint.js，其中包含原始的扩展程序 ID 列表 (存储在 chrome_extension_ids.txt 中)。
- Chrome Web Store 和 Extpose 用于获取扩展程序的名称和链接。
数据文件：
- chrome_extensions_with_names_all.csv：包含扩展程序 ID、名称和 Chrome Web Store 或 Extpose 的链接的完整列表。该文件包含两列：
  - Extension ID (扩展程序 ID): 32 字符的 Chrome 扩展程序标识符。
  - Name (名称): 扩展程序名称。
  - URL (链接): 链接到 Chrome Web Store 或 Extpose。
脚本：
- fetch_extension_names.js：从 Chrome Web Store 获取扩展程序名称，如果扩展程序在 Chrome Web Store 中不可用，则使用 Extpose 作为备用。
  - 用法： node fetch_extension_names.js (获取所有扩展程序), node fetch_extension_names.js --offset 0 --limit 500 (获取子集), node fetch_extension_names.js --help (显示帮助信息)。
- test_fetch.js：测试脚本，处理前三个扩展程序并提供详细输出 (node test_fetch.js)。
统计数据：
- LinkedIn 的指纹列表中总共有 2953 个扩展程序。
- 大约 78% 的扩展程序在 Chrome Web Store 中找到。
- 大约 22% 的扩展程序通过 Extpose 备用方案找到（已从 Chrome Web Store 中移除或不可用）。

项目结构：

该项目包含以下文件和文件夹：

.claude: 未知用途。
README.md: 项目说明文档。
chrome_extension_ids.txt: 原始的扩展程序 ID 列表。
chrome_extensions_with_names_all.csv: 包含扩展程序名称和链接的 CSV 文件。
fetch_extension_names.js: 用于获取扩展程序名称的脚本。
fingerprint.js: LinkedIn 的页面脚本（压缩版）。
test_fetch.js: 用于测试的脚本。

github.com | 306 points by mdp at 04:00:39 | 144 comments

GitHub Actions is slowly killing engineering teams

GitHub Actions 評估：為何 Buildkite 更勝一籌 (GitHub Actions Evaluation: Why Buildkite is Better)

這篇文章由一位 CircleCI 的早期員工撰寫，分享了他對各種持續整合 (CI) 系統的使用經驗，並對 GitHub Actions 提出了強烈的批評。作者認為 GitHub Actions 僅憑其內建於 GitHub 倉庫的便利性獲得市場份額，而並非因為其優秀的設計。以下是文章的主要觀點：

GitHub Actions 的問題：

冗長的日誌瀏覽體驗： 錯誤發生時，使用者需要點擊多個頁面才能查看日誌，過程緩慢且不直觀，甚至可能導致瀏覽器崩潰。
YAML 陷阱： GitHub Actions 的 YAML 配置複雜且充滿陷阱，其表達式語法難以理解，容易導致錯誤。
市場上的動作 (Actions) 品質參差不齊： GitHub Actions Marketplace 類似於 npm，充斥著品質不一的第三方動作，存在安全風險。
受限的計算資源： 使用者依賴 Microsoft 的運行器，速度慢、資源受限，且無法進行有意義的定制。
其他小問題： 缓存机制不可靠、可重用工作流程功能受限、GITHUB_TOKEN 权限模型复杂等。

Buildkite 的優勢：

優質的日誌瀏覽器： Buildkite 的日誌瀏覽器快速、穩定，能正確顯示 ANSI 顏色，提供更好的閱讀體驗。
YAML 的定位： Buildkite 的 YAML 僅用於描述流程，邏輯部分使用真實的編程語言實現，更易於理解和維護。
自主的計算資源： 使用者可以在自己的基礎設施上運行 Buildkite 代理程式，擁有完全的控制權。
動態管道： Buildkite 允許在運行時動態生成管道步驟，更具靈活性。
插件系統： Buildkite 的插件系統運行在使用者自己的基礎設施上，降低了安全風險。
細節上的優化： Buildkite 提供了諸如自定義表情符號等細節上的優化，體現了對使用者體驗的關注。

文章結論：

作者建議，對於小型專案或公共程式碼庫，GitHub Actions 可能尚可。但對於需要高效、安全、可控的 CI 系統的團隊來說，Buildkite 是一個更好的選擇。作者認為，GitHub Actions 贏得市場份額並非因為其優良的設計，而是因為其便利性。Buildkite 則更注重 CI 系統的實際效能，提供更佳的使用體驗。

針對 Nix 使用者：

文章也提到了 Nix，並建議 Nix 使用者可以考慮使用 Garnix，它能自動評估 Flake 並構建所需的元件，無需手動配置 YAML。

iankduncan.com | 302 points by codesuki at 10:58:31 | 152 comments

The RCE that AMD won't fix

Okay, understood. Since the content is temporarily unavailable, I will provide a general response acknowledging the situation and outlining what I would do when the content is available, formatted in markdown and Chinese. I'll also include a link to the provided alternative write-up.

内容暂时不可用，后续补全

当前您提供的文档内容暂时不可用。一旦内容恢复，我将按照您的指示进行操作：

阅读并理解内容: 我会仔细阅读并理解文档的内容，确保完全掌握其核心信息。
提炼主要观点和细节: 我会识别并提取文档中的主要观点、关键细节和重要信息。
撰写精炼摘要: 我将根据提取的信息，撰写一篇简洁、准确的摘要。摘要将：
- 控制字数: 确保摘要长度不超过 800 字。
- 保持客观: 不包含任何个人观点或超出原文的信息。
- 准确反映内容: 准确地概括原文的主要内容和核心信息。
- 突出重点: 强调文档的关键点和重要细节。
- 如果内容为技术文档（例如代码或文档）: 我会重点总结其目的、结构和关键功能。例如，如果是一段代码，我会描述代码的作用，主要组成部分，以及关键的实现逻辑。
使用Markdown格式: 摘要将使用 Markdown 格式进行排版，以便于阅读和理解。
使用中文回复: 摘要将用中文书写。

关于替代文章：

您可以阅读您提供的替代文章：1.4 Billion exposed user records via insecure Firebase instances in top Android apps。我期待将来能够对该文章进行摘要总结。

我将随时准备好在内容恢复后立即执行您的指示。请您在内容可用时告知我。

mrbruh.com | 264 points by MrBruh at 07:29:18 | 112 comments

Unsealed court documents show teen addiction was big tech's "top priority"

新解密文件揭露科技巨头操纵青少年成瘾，并试图控制舆论

华盛顿特区 – 今日，科技监管项目 (The Tech Oversight Project) 发布了一份新报告，重点介绍了 2026 年社交媒体成瘾诉讼中解密的最新文件。这些文件提供了确凿证据，表明 Meta、Google、Snap 和 TikTok 均有目的地设计其社交媒体产品，旨在让儿童和青少年上瘾，无视其对幸福感造成的已知危害，并且这种大规模青少年成瘾是这些公司商业模式的核心。文件包含公司员工之间的内部讨论、内部会议演示、专家证词，以及大型科技公司与科技资助团体（包括全国家长教师协会 (PTA) 和在线家庭安全研究所 (FOSI)）协调一致，试图控制对担忧家长的舆论的证据。

科技监管项目执行主任 Sacha Haworth 表示：“这些解密的文件证明，大型科技公司多年来一直在欺骗公众，现在是时候让家长和年轻人得到公正的审判了。” “破坏学习和社交媒体成瘾是大型科技公司商业模式的核心，虽然 JCCP 和 MDL 案件有可能削弱他们的不当行为，但国会需要兑现其多年来的承诺，通过参议院版本的《儿童在线安全法案》。”

解密文件内容摘要:

Meta:

优先青少年用户: 2016 年的电子邮件显示，Mark Zuckerberg 决定 2017 年上半年公司首要任务是吸引青少年用户。
Lifestage 应用: Facebook 参与 Lifestage 应用的开发，但对内部安全顾虑置之不理。
“学校突发信息”策略: Meta 曾考虑使用“学校突发信息”策略来吸引更多高中用户。
鼓励使用消息功能: Meta 内部消息强调，吸引青少年使用产品对于提高整体使用时长至关重要，尤其是消息功能。
“Tweens on Facebook”计划: Meta 曾考虑推出“Tweens on Facebook”产品和“私人模式”，旨在让青少年在父母和老师不知情的情况下使用 Facebook。
“青年成长团队”战略: Meta 制定了从 6-10 岁儿童到 13 岁以上青少年的多阶段青少年用户获取战略。
Instagram 大使计划: Meta 通过大使计划招募 13-17 岁的青少年，让他们在当地高中宣传产品。
Instagram 高中目录: Meta 计划推出 Instagram 高中目录功能，并利用大使网络和社区渠道进行宣传。
控制舆论: Meta 的内部文件建议利用学校网络来获取用户，并试图将 Instagram 定位为青少年社交关系的重要组成部分。
承认负面影响: 内部数据表明，Facebook 使用与青少年幸福感较低有关联。

Google/YouTube:

Autoplay 功能: YouTube 的 Autoplay 功能可能扰乱睡眠模式，但公司未能有效解决。
学校的限制模式: YouTube 限制模式在学校环境中难以有效使用，学生可以通过多种方法绕过。
吸引儿童: Google 制定了计划，扩大其产品和服务在儿童中的使用范围。
对青少年健康的担忧: YouTube 内部研究表明，青少年在使用平台时容易受到负面影响。
承认成瘾性: YouTube 内部文件承认平台具有成瘾性，并对用户使用习惯表示担忧。

Snap:

青少年使用数据: Snap 内部研究表明，64% 的 13-21 岁 Snapchat 用户在学校期间使用该应用。
未满 13 岁用户: Snap 内部电子邮件显示，公司知晓未满 13 岁的用户通过谎报年龄使用该平台。
负面认知: Snap 内部文件显示，公司知悉用户对青少年和社交媒体的负面认知。

TikTok:

与 PTA 和 FOSI 合作: TikTok 与 PTA 和 FOSI 合作举办活动，但活动中透露出未满 13 岁用户使用平台的情况。
承认成瘾性: TikTok 内部文件承认用户对平台的依赖性，并表示需要更好的工具来帮助用户管理使用情况。

总而言之，这些解密的文件揭示了大型科技公司为了追求利润，有意设计产品来吸引和上瘾青少年，并试图通过各种手段控制舆论。这也引发了人们对监管科技公司及其对青少年影响的必要性的进一步讨论。

techoversight.org | 256 points by Shamar at 02:00:07 | 143 comments

Ardour 9.0

Ardour 9.0 发布公告 (Announcement of Ardour 9.0 Release)

2026年2月5日，Ardour项目团队宣布发布Ardour 9.0版本。这次发布是项目的一个重大里程碑，包含多个用户长期呼吁的新功能。主要更新包括：区域效果（Region FX）、剪辑录制（Clip Recording）、触控支持GUI、钢琴卷帘窗口（Pianoroll Windows）、剪辑编辑以及其他数十个错误修复、新的MIDI绑定映射、macOS上的GUI性能改进等。

项目团队期待用户对新功能的反馈，并计划根据反馈进行改进和完善。建议新用户阅读关于剪辑启动实现的差异和Ableton Live的对比。

下载地址：https://community.ardour.org/download

主要新功能：

钢琴卷帘窗口 (Pianoroll Windows): 双击MIDI区域即可在独立窗口或主窗口底部面板中编辑。编辑操作与主时间轴类似，但减少了其他用户界面干扰。同时也支持显示MIDI自动化信息（力度、CC参数等），可选择叠加显示。
MIDI和音频提示编辑 (MIDI and Audio Cue Editing): 提示页面现在允许直接编辑MIDI提示（“剪辑”适用于Live & Bitwig用户）。打开钢琴卷帘区域，提供与主时间轴相同功能的MIDI编辑操作。
提示录制 (Cue Recording): 用户可以直接录制到提示槽，使Ardour在循环录制方面类似于Live、Bitwig等DAW。可以预先指定录制时长（如“录制4小节”），也可以在认为完成时停止录制。录制内容将在下一个量化点（如小节/节拍）开始播放。
区域效果 (Region FX): 允许用户将效果应用于特定音频区域，类似于区域增益。效果及其自动化信息与区域一起移动。尽管可以通过混音器中的通道条插件实现相同效果，但直接在时间轴上应用于区域更方便许多工作流程。效果离线应用，读取区域时不增加额外的DSP负载。
实时感知分析仪 (Realtime Perceptual Analyzer): 提供实时频谱可视化窗口，可以叠加多个信号源（音轨和总线）进行分析，帮助识别频率范围冲突或频谱空缺。
音符刷 (Note Brushing): 通过按住Shift键并拖动鼠标，可以快速绘制十六分音符或四分音符的切分弦等模式。按住Alt键可以绘制隔音符。启用Caps Lock键，可以从MIDI键盘或垫设备中选择绘制的音符。
键盘驱动的自动化编辑 (Keyboard-Driven Automation Editing): 使用键盘修饰键、方向键和Enter键添加新的自动化控制点，并更改它们的位置和值。
混音器条目导入和导出 (Mixer Strips Importing and Exporting): 可以从其他Ardour会话中导入混音器条目作为新的音轨，或将现有音轨映射到外部会话的混音器条目中。还可以将条目导出为本地（会话级别）或全局预设以供重复使用。
多点触控GUI (Multi-Touch GUI): 在Linux和Windows上，Ardour现在支持操作系统提供的多点触控交互。 macOS上的多点触控机制有所不同，需要进一步开发。

用户界面变更：

更新的应用栏和面板控件 (Updated Application Bar and Pane Control): 应用栏已清理和重新组织，每个上下文都有不同的布局。
改版的编辑器列表 (Revamped Editor List): 编辑器列表面板重新设计，简化了切换两个常用标签的操作。
更新的新会话对话框 (Revamped New Session Dialog): 使用选项卡界面，方便创建新会话、打开最近会话以及从磁盘打开任意会话。
更新的标尺区域 (Updated Ruler Area): 标尺增加了添加新标记和导航到先前/下一个标记的功能。
改进的库管理器 (Improved Library Manager): 管理剪辑库的对话框已进行清理，仅在下载/安装时显示进度条。
MIDNAM控件位置调整 (MIDNAM Controls Relocated): 将MIDI NAM相关控件从MIDI音轨的标题栏移动到上下文菜单中。

ardour.org | 244 points by PaulDavisThe1st at 02:30:16 | 56 comments

The time I didn't meet Jeffrey Epstein

关于我在Epstein Files中出现的情况：摘要

本文讲述了作者Scott Aaronson意外发现自己的名字出现在了Epstein Files中，并在26份文件中出现。作者澄清表示，他从未与Jeffrey Epstein会面，也从未与其有任何形式的联系。

事件经过：

2010年，Charles Harper联系作者： Harper通过中间人联系作者和Seth Lloyd，希望能安排一次关于“Cryptography in Nature”研究项目的资金会议。
Harper的邮件： Harper随后发送邮件，详细介绍了该项目，并首次提到了Epstein是该项目的资金来源，并暗示作者应该熟悉Epstein。
作者的反应： 作者将邮件转发给父母、兄弟和当时的未婚妻，其兄弟分享了关于Epstein性犯罪定罪的新闻报道，而作者也分享了相关文章。作者的母亲建议他不要卷入其中。
后续尝试与忽略： Harper后来试图再次安排作者与Epstein的会面，但作者听从母亲的建议，婉拒了。
被遗忘： 作者完全忘记了此事，直到最近才发现自己出现在了Epstein Files中。作者指出，类似寻求资金的联系经常发生，因此他没有过多关注。
Charles Harper的信件： 在 Epstein Files 中，还发现了一封2010年11月Charles Harper写给Epstein的信，信中提议举办一个关于“Cryptography in Nature”的会议，并以作者的年龄为主题，认为应该在作者还年轻时（20多岁）与其合作，暗示作者在30岁后会变得“衰老”。
Facebook上的调侃： 作者在Facebook上分享了此事，朋友们开玩笑说Epstein可能并非对女性持有性别歧视的态度。作者表示希望自己能否认朋友的说法。

作者的总结：

作者感谢自己拥有如此明智的家人，并调侃如果Bill Gates和Larry Summers也能得到母亲的建议，或许可以避免一些麻烦。作者也提到，他的博客评论区已于2024年7月开始限制评论，采用“个人来信”模式，仅在特定情况下选择性发布评论。

关键词: Epstein Files, Jeffrey Epstein, Charles Harper, Cryptography in Nature, Scott Aaronson, 资金, 会议, 衰老, 评论限制.

scottaaronson.blog | 228 points by pfdietz at 03:29:41 | 255 comments

A new bill in New York would require disclaimers on AI-generated news content

A new bill in the New York state legislature would require news organizations to label AI-generated material and mandate that humans review any such content before publication. On Monday, Senator Patricia Fahy (D-Albany) and Assemblymember Nily Rozic (D-NYC) introduced the bill, called The New York…

niemanlab.org | 206 points by giuliomagnifico at 17:56:55 | 81 comments

Opus 4.6 uncovers 500 zero-day flaws in open-source code

Anthropic Claude Opus 4.6 发现开源代码漏洞：总结

Anthropic 最新的人工智能模型 Claude Opus 4.6 在测试中发现了超过 500 个此前未知的严重安全漏洞，这些漏洞存在于开源代码库中，且几乎不需要任何提示。这一发现标志着人工智能工具在网络安全防御领域的应用可能出现拐点。

主要内容：

模型介绍： Claude Opus 4.6 是 Anthropic 最新的大型 AI 模型，于本周四发布。
漏洞发现过程： 在正式发布之前，Anthropic 的红队团队在一个沙箱环境中测试了 Opus 4.6 的漏洞发现能力。测试中，模型被赋予了 Python 和漏洞分析工具（包括调试器和模糊测试器）的访问权限，但没有接收到任何特定的指令或专业知识。
发现结果： Claude Opus 4.6 在“开箱即用”的情况下，成功发现了 500 余个此前未知的零日漏洞，并且每个漏洞都得到了 Anthropic 团队或外部安全研究人员的验证。
漏洞类型： 发现的漏洞范围广泛，包括可能导致系统崩溃或内存损坏的漏洞。例如，Claude 发现了 GhostScript（处理 PDF 和 PostScript 文件的常用工具）中的崩溃漏洞，OpenSC（处理智能卡数据的工具）和 CGIF（处理 GIF 文件的工具）中的缓冲区溢出漏洞。
创新方法： Claude 在发现漏洞时，展现出了强大的推理能力，甚至在传统安全工具失效后，能够找到新的漏洞。例如，在 GhostScript 漏洞的发现过程中，Claude 查阅了项目的 Git 提交历史，最终发现了漏洞。在 CGIF 案例中，Claude 甚至主动编写了概念验证代码，以证明漏洞的真实性。
安全措施： 为了防止恶意利用这些网络安全功能，Anthropic 在最新版本的 Claude Opus 模型中添加了新的安全控制措施，例如实时检测工具，以阻止可疑流量。
未来展望： Anthropic 计划将漏洞检测能力扩展到更广泛的网络安全社区，并可能推出新的工具。该公司认为，Opus 4.6 的能力将极大地改善开源软件的安全状况，甚至可能成为未来开源软件安全保障的主要方式。

核心要点：

Claude Opus 4.6 展现了 AI 在漏洞检测方面的巨大潜力，超越了传统工具。
Anthropic 正在积极将这项技术推广到更广泛的安全领域，以增强整体防御能力。
虽然这项技术带来了新的安全保障，但也需要注意潜在的滥用风险，并采取相应的安全措施。

axios.com | 190 points by speckx at 02:25:05 | 116 comments

Review of 1984 by Isaac Asimov (1980)

《一九八四》读后感：对一部预言的评估 (《田野报》专栏文章摘要)

本文作者回顾了他在1980年为《田野报》撰写的关于乔治·奥威尔的《一九八四》评论，并对这本书及其影响进行了深入分析。文章分为四个部分，探讨了《一九八四》的写作背景、内容、政府结构以及国际局势。

一、写作背景 (The Writing of 1984):

作者最初对重写评论感到犹豫，但在阅读后对书中描绘的极权主义世界感到震惊。
乔治·奥威尔（本名埃里克·亚瑟·布莱尔）是一位出身英国绅士家庭的作家，他曾在殖民地生活，并因对社会阶级的不满而选择与贫民窟居民为伍，以寻找写作素材并减轻良心上的不安。
奥威尔在西班牙内战中与共产主义者发生冲突，并因此对斯大林主义产生了深刻的私人战争。
《动物庄园》是对俄国革命的讽刺，为他创作《一九八四》奠定了基础。
《一九八四》描绘了一个由斯大林主义模式塑造的极权社会，通过暴力、歪曲真相和篡改历史来维持统治。

二、科幻小说 (The Science Fiction of 1984):

虽然被认为是科幻小说，但《一九八四》并非对未来的真正预言。它更像是将1949年的社会现实移植到35年后，并将故事背景从英国转移到莫斯科。
奥威尔缺乏对未来的想象力，对技术发展也存在偏见，例如将钢笔贬为“划痕”，而将圆珠笔视为低劣之物。
书中对监控技术的描述并不现实，例如持续监控需要庞大的人力，且缺乏电脑和机器人等现代技术手段。
书中人物形象单一，缺乏多样性，缺乏对女性角色的深入刻画。

三、政府 (The Government of 1984):

《一九八四》展现了一个权力至上的政府，对极权主义的恐惧感影响了读者。
作者指出，历史上确实存在像斯大林、墨索里尼和希特勒这样的暴君，但这些暴君最终都会被推翻。
作者认为，现代政府相对较弱，而城市恐怖主义的威胁反而日益增加。
书中提到的控制手段，如制造仇恨对象和篡改历史，在现实中同样存在，但其程度和方式与书中描述存在差异。
奥威尔对“新闻peak”的描述，即通过语言控制思想，实际上是一种语言的简化，而非扩展。

四、国际局势 (The International Situation of 1984):

奥威尔预见到世界分裂为三个超级大国：大洋国（美英）、欧亚国（苏联）和东亚国（中国）。
他预见到苏联和中国将敌对，这反映了他对左翼教派斗争的深刻理解。
作者认为，奥威尔对科技发展和经济变化的预测有所不足，未能预见到石油的重要性以及科技进步对战争和和平的影响。
尽管书中描绘了持续不断的战争，但作者认为冷战才是维持世界格局的关键。

结论：

作者认为，《一九八四》更多的是对斯大林主义的私人战争，而非对未来的准确预言。尽管这本书对极权主义的警示具有重要意义，但其描绘的世界与1980年代的现实存在很大差异。作者对未来表示担忧，并质疑1984年之后人们将如何表达对未来的恐惧。

newworker.org | 163 points by doruk101 at 05:39:57 | 109 comments

Things Unix can do atomically (2010)

UNIX 系统中可原子执行的操作总结

本文档列举了在 UNIX-like/POSIX 兼容操作系统中可以原子执行的操作，这些操作可以用于构建线程安全和多进程安全程序，而无需使用互斥锁或读写锁。作者强调，应尽可能依赖内核来完成工作，因为信任内核开发者比自己更可靠。

注意： 以下操作最好应用于本地文件系统，在 NFS 挂载时可能会出现问题。

1. 文件路径操作

mv -T <oldsymlink> <newsymlink>: 原子地更改 <newsymlink> 的目标，指向 <oldsymlink> 所指向的目录。适用于部署新代码。它实际上调用 rename(2) 系统调用。 (Mac OS X 存在差异，其 mv(1) 命令不使用 rename(2)。)
link(oldpath, newpath): 创建一个指向 oldpath 同一个 inode 的硬链接 newpath，并增加链接计数。如果 newpath 已经存在，则返回 EEXIST 错误。可用于线程或进程之间的文件锁，锁信息在 ls(1) 命令中可见。
symlink(oldpath, newpath): 类似于 link(2)，但创建的是指向不同 inode 的符号链接。符号链接可以指向目录，而硬链接不能。同样，如果 newpath 已经存在，则返回 EEXIST 错误。
rename(oldpath, newpath): 如果 oldpath 和 newpath 位于同一文件系统上，则可以原子地更改文件路径。如果 oldpath 不存在，则返回 EEXIST 错误，类似于 link(oldpath, newpath) 的用法。
open(pathname, O_CREAT | O_EXCL, 0644): 创建并打开一个新文件。O_EXCL 标志确保如果文件已经存在，则返回 EEXIST 错误。用于确定哪个进程应该处理特定任务。
mkdir(dirname, 0755): 创建一个新目录，如果目录已经存在则返回 EEXIST 错误。类似于 open(2) 使用 O_EXCL 的机制，但适用于目录。

2. 文件描述符操作

fcntl(fd, F_GETLK, &lock), fcntl(fd, F_SETLK, &lock), fcntl(fd, F_SETLKW, &lock): 允许合作进程锁定文件区域以序列化访问。 F_SETLKW 会阻塞调用进程，直到获取锁。
fcntl(fd, F_GETLEASE) 和 fcntl(fd, F_SETLEASE, lease): 请求内核在其他进程 open 或 truncate 文件时，使用 SIGIO 信号通知调用进程。需要通过 fcntl(fd, F_SETLEASE, F_UNLCK) 移除租约。
mmap(0, length, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0) 和 msync(addr, length, MS_INVALIDATE): mmap(2) 返回一个指向文件内容的指针，允许通过常规内存操作进行读写。频繁使用 msync(2) 可在映射相同文件的多个进程之间共享数据。

3. 虚拟内存操作

__sync_fetch_and_add, __sync_add_and_fetch, __sync_val_compare_and_swap 等: 提供完整的屏障，确保内存操作不会前后移动。这些操作是构建无锁算法的基础。

作者欢迎读者提供反馈，以发现和修复潜在的竞争条件。

rcrowley.org | 159 points by onurkanbkrc at 13:29:55 | 52 comments

I now assume that all ads on Apple news are scams

Apple News 广告质量下降及潜在诈骗问题总结 (Summary of Declining Apple News Ad Quality and Potential Scam Issues)

本文主要讨论了苹果新闻 (Apple News) 广告质量的显著下降，以及由此引发的潜在诈骗问题。

主要内容：

广告服务商变更： 2024年，苹果与Taboola达成协议，将Taboola作为苹果新闻广告的服务商。John Gruber 评论指出，现有的苹果新闻广告已经类似于 Taboola 的“chumbox”广告，并且重复性很高。
广告质量问题： 作者发现苹果新闻中的广告质量明显下降，许多广告看起来像是诈骗，甚至很可能就是诈骗。其中，至少有两则广告明显由人工智能生成，第三则可能也使用了人工智能。
域名注册信息： 作者调查了相关广告的域名注册信息，发现这些域名都注册时间非常短（2025年11月至2026年2月），这增加了诈骗的可能性。
“即将退休”虚假广告： 苹果新闻中出现了一个名为 Tidenox 的广告，声称该公司已有 26 年历史，并展示了一位“退休”老妇的照片。作者怀疑照片是人工智能生成的，并且域名注册信息显示该公司实际注册时间远低于 26 年，且注册地位于中国。此外，广告中还发现了 Google Gemini 的标志，暗示使用了 AI 生成图像。
诈骗模式： 这些广告类似于“即将清算”的虚假广告，骗取用户资金后迅速关闭，美国消费者联盟 (Better Business Bureau) 已经对此类诈骗行为发布过警告。
作者观点： 作者认为苹果对广告质量监管不力，任由 Taboola 提供包含诈骗广告的内容，并对苹果、Taboola 缺乏责任感表示失望。作者认为，苹果不应再将广告服务委托给 Taboola。

总结：

苹果新闻广告质量下降，出现大量可疑的、甚至可能是诈骗性质的广告。这些广告的域名注册时间短，内容虚假，且可能使用了人工智能技术生成。作者认为苹果和 Taboola 应该对此负责，并采取措施改善广告质量。

kirkville.com | 151 points by cdrnsf at 20:16:43 | 97 comments

Systems Thinking

大型软件系统构建：演化与工程的权衡 (大型软件系统构建：演化与工程的权衡)

本文探讨了在构建大型、复杂软件系统时，两种主要的开发思路：演化式开发和工程式设计。

两种思路对比：

演化式开发 (Evolutionary Development): 类似于创业公司，从小处着手，逐步迭代添加功能。优点是启动快，可以快速开始。缺点是容易忽略依赖关系，导致后期需要花费更多时间和精力来解决这些问题，最终可能形成一个脆弱且难以维护的系统。
工程式设计 (Engineering Design): 类似于建造摩天大楼，在开始之前制定详细的规范，预先考虑所有复杂性。优点是系统更可靠、更具弹性，成本更低，更易于维护。缺点是启动较慢，需要大量的人员进行协调和沟通，可能导致开发速度变慢。

核心问题：依赖关系 (Dependencies)

两种思路的核心区别在于处理依赖关系的方式。演化式开发倾向于先忽略依赖关系，后期再处理；而工程式设计则将依赖关系作为设计的基础，从一开始就考虑它们。忽略依赖关系会导致后期修复成本更高，并且会产生“hack”层，使得系统越来越复杂。

影响因素：知识与经验 (Knowledge & Experience)

工程式设计面临的挑战之一是缺乏足够的知识。技术栈快速变化，最佳实践难以建立，很多问题被错误地认为是主观判断。此外，大多数程序员经验有限，难以应对大型设计的复杂性。

两种思路的优缺点：

演化式开发: 更有趣，会议更少，可以更快地投入工作。但如果项目规模过大，容易失控，最终可能导致严重压力和对结果的不满。
工程式设计: 从压力角度来看通常更好，虽然启动和中间阶段可能较慢，但整体开发过程更平稳。通过重用代码和关注细节，可以有效压缩工作量，提高代码质量。

大型项目与现有系统替换 (Large Projects & System Replacement)

对于大型商业应用，特别是替换现有系统时，工程式设计往往更合适。因为通常已经有清晰的长期路线图和对需求的充分了解。

平衡之道 (Balanced Approach)

作者认为，两者之间应该存在一种平衡的路径，但尚未找到成熟的模式。一种可能的方案是：

首先识别依赖关系。
确定可以暂时忽略的依赖关系。
在演化式开发的同时，保持一个大的设计蓝图作为长期目标。
在发现新的依赖关系时，不断调整设计。
定期评估迭代结果，并进行必要的调整。

迭代规模与清理 (Iteration Size & Cleanup)

迭代规模很重要。小迭代可能意味着盲目前进，而较大的迭代则更有效。每次迭代后都应该停下来评估，并进行必要的清理。快速编码和长时间不清理会导致代码库变得混乱，最终导致项目停滞。

结论 (Conclusion)

演化式开发可以避免陷入工程学的泥潭，而工程学可以确保系统真正实现其预期功能。对于不同的系统部分，可以采取不同的方法：有些部分需要工程化处理，有些部分则可以演化。随机的演化路径会增加需要重写和丢弃的代码量。最终目标是构建一个统一的大型系统，但实现这一目标需要时间和耐心。

theprogrammersparadox.blogspot.com | 144 points by r4um at 13:24:36 | 73 comments

Advancing finance with Claude Opus 4.6

Claude Opus 4.6：面向金融行业的AI升级

Anthropic发布了Claude Opus 4.6，旨在提升金融行业专业人士的决策效率和分析能力。该模型在金融推理、多任务处理和长期任务专注度方面表现优异，相较于之前的Claude Sonnet 4.5提升了超过23%。

主要更新与功能：

Claude Opus 4.6: 在金融研究、分析和内容创作方面均表现出卓越性能。在研究方面，在BrowseComp和DeepSearchQA基准测试中有所改进。在分析方面，在Finance Agent和TaxEval基准测试中取得领先。在内容创作方面，能够生成更准确、更符合要求的结构化输出（如电子表格和演示文稿）。
Cowork (新产品): 一种新的使用Claude的方式，允许用户在桌面文件夹中直接访问、编辑和创建文件。支持插件，可以自定义工作流程，例如，金融插件可以自动完成常见的财务工作流程。目前仅限于Mac版本，Windows版本即将推出。
Claude in Excel: 将Claude Opus 4.6集成到Excel中，支持复杂的任务，如电子表格编辑、图表修改、条件格式、排序、筛选和金融级格式化。改进了规划和假设澄清能力，并支持拖放多文件功能。
Claude in PowerPoint (研究预览): 将Claude集成到PowerPoint中，可以读取现有布局、字体和母版，并创建新的内容。能够从客户模板中创建演示文稿、编辑现有幻灯片，并生成高质量的初始演示文稿。

关键优势：

提升效率: 大幅缩短金融分析和内容创作的时间，例如，创建财务演示文稿的时间从数小时缩短到数分钟。
增强准确性: Claude Opus 4.6能够生成更准确的结构化输出，减少人工校正的需求。
简化工作流程: Cowork和Claude in Excel等工具将AI集成到日常工作流程中，方便用户进行研究、分析和内容创作。
多任务处理能力: Claude Opus 4.6 在处理复杂、多步骤任务时表现更佳，能够保持专注和准确。

适用人群：

适用于投资银行、私募股权、公共投资和企业金融等领域的金融专业人士。

重要提示：

虽然Claude Opus 4.6功能强大，但在高风险工作中使用时，仍需人工审查其输出，以确保符合规范。

获取方式：

Claude Opus 4.6、Cowork 和 Claude in Excel 均可在所有付费的Claude计划中使用。 Claude in PowerPoint 作为研究预览版本，可供Max、Team和Enterprise计划的用户使用。详细信息和使用指南请参考 Anthropic 官方网站。

claude.com | 137 points by da_grift_shift at 01:42:47 | 38 comments

Claude Opus 4.6 extra usage promo

Claude Opus 4.6 发布之际，Pro 和 Max 用户限时赠送 $50 额外使用额度总结

Anthropic 为庆祝 Claude Opus 4.6 发布，向 Pro 和 Max 用户提供限时赠送 $50 (美元或当地货币等值) 的额外使用额度。

资格要求：

不适用于 Team、Enterprise 或 API/Console 用户。
此优惠不可兑换现金，不可转让或转让给他人。
不可与其他优惠叠加使用。

如何领取 $50 额度：

已启用额外使用额度： 额度将自动应用于您的账户，无需任何操作。
未启用额外使用额度： 您需要启用额外使用额度才能领取。

领取时间： 2026 年 2 月 5 日星期四上午 10 点 PT 至 2026 年 2 月 16 日星期一晚上 11:59 PT。逾期将无法领取。

使用范围：

此 $50 额度可用于 Claude、Claude Code 和 Cowork，包括您计划中可用的所有模型和功能。

额度有效期：

$50 额度自领取之日起 60 天内有效。
到期后或额度用完后，额外使用额度将继续保持在您的账户中。
如果您在 设置 > 使用 下的 额外使用 启用了自动续费，超出计划限制的使用将按照标准额外使用费率计费。
您可以随时在账户设置中禁用额外使用。

总结: 本次促销活动旨在鼓励用户体验 Claude Opus 4.6，并为 Pro 和 Max 用户提供额外的使用机会。务必在指定时间内领取并使用额度，并注意额度的有效期和自动续费设置。

support.claude.com | 116 points by rob at 04:15:48 | 35 comments

The Wyden Siren: Senator's Cryptic CIA Letter Pattern Has Never Been Wrong

总结：Wyden 警报拉响，CIA 活动引发担忧

本文讲述了美国参议员 Ron Wyden 长期以来的惯例，即在掌握机密信息且无法公开说明的情况下，发出警报，提示公众注意政府内部可能存在的严重问题。这种现象被称作“Wyden 警报”（Wyden Siren）。

主要内容：

Wyden 警报的模式： Wyden 经常通过简短的公开信件或问题，暗示政府内部存在令人担忧的活动，但由于信息机密而无法详细说明。历史表明，每次 Wyden 这样警示，最终都会被证明是正确的。
历史案例： 文章列举了 Wyden 过去多次发出警报并最终被证实的情况，包括：
- 2011年，揭露政府秘密重新解释《爱国者法案》。
- 2015年，警告有关司法部对网络安全立法相关的秘密法律意见。
- 2017年，指出国家情报总监对 Section 702 监控问题的回答与实际问题不符。
- 揭露美国移民和海关执法局（ICE）非法收集美国公民的金融数据。
- 揭露政府从苹果和谷歌收集推送通知数据。
当前情况： Wyden 近期向中央情报局（CIA）局长 John Ratcliffe 发出简短信件，表示对 CIA 的活动“深感担忧”，但无法透露具体细节。这表明 CIA 内部存在严重问题。
潜在风险： 文章指出，当前政府的行事风格使得可能出现的问题范围广泛，例如国内监控、与 ODNI Tulsi Gabbard 相关的问题、国际行动失误，或对 CIA 权力的新解释。
结论： Wyden 警报再次拉响，提醒公众关注政府的秘密行动，并保持警惕。历史经验表明，这些秘密行动往往存在真实的问题和滥用行为。

总而言之，文章强调了 Wyden 警报的可靠性，并敦促公众关注 CIA 活动可能存在的潜在风险。

techdirt.com | 110 points by hn_acker at 02:14:59 | 11 comments

感觉千问的这个活动产品负责人实在动脑子了

一个是投入的成本确实足够，再一个可以通过实物（结合外卖生活）的形式给到用户实打实的获利，还能宣传：“我靠，用你 app 都可以点奶茶了，现在的智能体真牛逼” 相比元宝的拼多多式红包，个人感觉千问在活动规划和格局上赢了（个人简介，没有广告）

173 comments by mrsongopen1 at 09:54:34 in 问与答

为了省这几块钱外卖，真的值吗？

最近发现身边很多同事点外卖，标准几乎只有一个：
15 元以内，越便宜越好。

但说实话，这个价位的外卖，很多都是小作坊，
甚至有些店 连堂食都没有，
食品安全什么情况，其实大家心里都有数。

这让我想到老一辈的“剩菜剩饭”观念——
不是因为好吃，而是舍不得扔、舍不得花钱，
长期下来，反而把身体搭进去了。

我个人觉得，外卖 20 元左右 才是一个相对合理的区间。
多花这 5 块钱，
至少在食材、卫生、环境上，概率会好一点。

简单算一笔账：

每顿省 5 块
中饭 + 晚饭 = 一天省 10 块
一个月也就 300 块

为了这 300 块，
长期吃来源不明、卫生堪忧的外卖，
是不是有点 丢西瓜捡芝麻 了？

当然，也不是说所有便宜外卖都不能吃，
而是想讨论一个问题：在健康这件事上，过度追求“最低价”，真的值得吗？

169 comments by keaidian at 10:55:01 in 生活

第二套房你会选择装小便斗吗？ 第一套房只有 90 多平，空间偏紧，当初装修时没装小便斗。一直不太习惯坐着小便，想着年后再装修时加一个，感觉对男性来说确实更顺手一些。

想请教下，入住装小便斗的人，后悔的概率高不高？

143 comments by CNN at 12:09:49 in 生活

只要是结婚了的人，个人生活质量都各方面下降了

在这个时代结婚的好处是什么，懂的人给我说说别说以后孩子给你养老之类的，说其他的好处

137 comments by sport123 at 11:22:56 in 生活

BTC 最低 60000，又上热搜了，你们还好么？ 黄金，白银，比特币暴跌，超 21 万人爆仓。

120 comments by david1025 at 09:07:24 in 加密货币

德国爱他美爆了，涉及多个批次 https://imgur.com/EzHk9v1.jpeg

应该不少 V 友买的德爱吧，打算怎么办？转什么奶？而且转奶据说也没那么容易，要慢慢转。

https://www.aptaclub.de/stellungnahme.html

105 comments by lchkid at 11:37:45 in 生活

工位搬迁，发生了一件不愉快的事 最近，工位从 2 楼搬到了 3 楼，发现 3 楼只有马桶，没有蹲坑

现在遇到的麻烦就是上大号的时候，不知道牛子放在哪里合适？

放在马桶内部，稍微蹲久点，牛子很容易就嗯了，由于我割过包皮，🐢头直接暴露在外面，很容易就直接接触到马桶

放在外部，一个是要用手扶着比较麻烦，除非一直保持嗯的状态，二一个是，上大号的过程中，有时候也会挤几滴尿出来，就容易尿到外面，还可能尿到裤子上

有什么比较舒服的蹲马桶姿势吗？我之前一直只用的惯蹲坑

99 comments by renchong at 14:47:40 in 职场话题

个人长期出点 U，只出个人，目前还剩 3919U 楼主因为做外贸的副业生意，经常客户都是付 U ，我一般都是让他们直接给打到我币安 TRC20 地址
这样的操作，如果 U 有问题，币安平台自己一般能快速查出来，这样也能马上跟客户对质，最后真正到我币安账户的，基本都是安全的 USDT 了，这算是我做外贸副业收 U 的一点心得吧，不去用冷钱包，借用一下币安的风控系统
到现在积累了 3919U 了，所以准备出一出，出完这波后面陆陆续续也还会有，所以是长期出，只出个人，多少 U 都可以出，价格就按照币安的市场价来
交易方式是扫我支付宝二维码，然后我直接通过币安平台内转账给你（需要给我你的币安 UID ），这样 0 手续费。
昨天已经出了 100U 给 @zenfsharp , 有需要的 V 友可以留言，我会联系你。

93 comments by NoCash at 08:55:30 in 加密货币

豆包的聪明程度很一般，为什么却是国内最火的 ai 应用?

根据这个排行榜 https://artificialanalysis.ai/leaderboards/models 豆包排名非常低，国内最聪明的是 kimi 和 deepseek 。豆包只有 34 分，kimi 47 分，deepseek 42 分不过说实话我也没用过 kimi 之前在手机上我用豆包，因为它可以语音输入，比较方便。现在 ds 也有语音输入了，我就不用豆包了。为什么豆包这么火呢，豆包的聪明程度也不是很高啊。

87 comments by cpalead at 14:44:33 in 分享发现

claude-opus-4-6 已上架|内附 30*10 刀小抽奖 opus-4.6 已上线以下分组，充值 4 折!
MAX 高速分组 1.12/刀
AmazonQ 分组 0.32/刀
注册地址： https://code.giot.edu.kg

评论平台 ID ，每 5 楼抽一个 10 刀

全网最低价格 kiro 分组 1000$KEY ，不限制使用场景
API 节点：
香港 2000M 节点： https://hk.giot.edu.kg
美国 100M 节点： https://us.giot.edu.kg

1000$key
sk-yY0e5WMmidxqnQcxODWFbBxA5nhpHAOIsikhjdvhTLWWJXG9

80 comments by xuecci at 10:12:54 in 推广

如果人生是场游戏，我的幸运值恐怕是负数

以下内容纯发泄，因为我真的不知道怎么样才能宣泄我的负面情绪。

我毕业于一所“有名”二本学校，当然，这个有名是负面的，不过和本次话题没啥关系。期间认识了不少朋友，甚至还有大牛。

14 年年底大四去了杭州一家独角兽公司实习写 Nodejs 。公司发展从小到大，最后又从盛道衰。实习到 15 年 5 月，正式毕业，也就是转试用。工资只有 6k ，并且三个月实习期只有 80%。后来我才知道同期一起实习的 iOS 开发同事，他们的试用工资百分百。

期间还有一件搞笑的事，按照规定，实习时间超过 3 个月的员工可以申请提前申请结束试用期。结果我报给我们 boss 之后，一直没有消息。直到一个月后告诉我，他忘了。然后说，反正你试用还有一个月，就别去申请了。

就这样迷迷糊糊干了两三年，老同事加薪的加薪，离职的离职。我干到三四年，结果好像税前就 9k 工资？反正很低。公司业务也认真做了，也没出过啥问题。当时觉得就那样吧。结果还是一个后辈（职位比我高）看不下去了，说干了这么多年还是入门 P ，硬生生帮我提升了 P 级。才勉强过了万工资。

现在想想，当时自己都是懵逼的，甚至都没有请他吃个饭什么的。感觉自己当年在杭州，就是个机器人一样。

后来那个后辈离职了。

期间出了一次事，客户投诉我们对接服务不积极，响应差。其实当时是我和别的部门一起对接的，相应差是别的部门回复慢。

可是一群人走到一起开会，结果却开始变成批判性的会议，批判的内容全是我负责的内容。对，不去问到底是谁响应客户慢，不去问到底客户投诉什么内容。全部变成了我负责的项目。但当时的我选择了避让。

然后过了半年，我又吃了一个 3.25 okr ，然后被 hr 告知，我被开除了。之前已经有一次 okr 了，理由其实就是迟到早退（上班的确迟到，但是下班其实是六点，只不过企业文化就是加班。实际上我回家也是需要处理对应的业务，只不过当时公司网络太糟糕，不想呆在公司）。

这个我其实也能接受，本质上的确是我的考勤问题比较差，况且我第二年也准备回老家宁波。

只是说起原因，我的 boss 轻描淡写的说了句：除了考勤比较差，也出现和客户沟通出现不好的情况。我当时：？？？敢情你们他妈把那件事全部甩在我头上了？？

先说当时批判会，我这个顶头 boss 没参加，但是类似我们的一个组长参加了。当时和他的关系相当不好，很大程度是不喜欢他的性格和风格，个人觉得偏向作秀。可是他和 boss 的关系特别好，属于私交。

也就是，在我不知道的情况下，我完全被背了这个锅。

回想起在这家公司的这几年，其实自己磕磕绊绊已经走的相当辛苦了。原本实习的时候，接手的是公司的一个核心项目，结果其他的同事要么离职，要么转手去做别的项目。搞笑的在我实习期还没结束的时候，我已经是这个项目最核心的开发了。

结果烂摊子我收拾，有业绩有面子的新项目都被别人分走。这我也能理解，毕竟也有我自己的能力不足的问题。

19 年年底被开除，因为房租没到期并且还有别的原因，待到了 20 年 7 月。本想着期间能找个工作应付下，可是却刚好遇到疫情。

20 年之后疫情缓和了点，尝试找个工作。期间有个插曲，去面试一家 .net 公司，我说我没 .net 开发经验，但是我很擅长学习，而且有五年开发经验。一般实习生 3k 工资，你这边单休，我要个 3.5k 不过分吧。然后被拒了。

原本觉得 nodejs 工作比较难找，又听说宁波本地的公司比较低。结果碰巧现在的公司招 node ，就把我拉过去干活。

其实现在的公司干的也还好，为了避免发生以前的问题。我极力去缓和和同事之间的关系。 nodejs 干了两年。结果 nodejs 项目少了，我主动把仅剩的项目让给其他同事。自己接受去写 Java 。

我接受代码的能力和学习能力其实不错，虽然之前没写过 Java ，但是基本马上就可以入手开发。然后就写了三年。虽然没有系统性的学写 Java ，但是配合我多年开发经验，我能写出功能完善，结构合理的项目代码。

其实到这时候我觉得还是不错的。即使我身边的朋友在杭州，在上海，在别的地方，可能都是我好几倍的工资。因为我一直认为宁波程序员的工资比较低。

直到我在帮同事处理问题，不小心瞄到 hr 给他发的平均工资。对，即使他比我晚入职（但是他是 Java 开发入职的，并且开发 Java 时间比我久）。但是他薪资还比我高一千。

我真的破防了。

我不认为我业务干的差，或者我的能力比别人差。相反，我在公司的业务干的比谁都好。

我不仅帮忙公司的服务器搭建调试，还经常帮助别的同事解决问题。即使我写 Java 的时间短。但是我可以自信的说，除了架构师之外，我是代码写的最棒的一个。除了会 Java ，我也会 Node ，甚至前端也多少会一点。所以经常帮忙解决前后端协调问题。

即使是这样。即使我的同事代码水平不如我，业务能力也不如我，甚至我解决 bug 的效率都是最高的。他的薪资依然比我高。哪怕他薪资和我一样，我都可以接受啊。

我真的不知道问题出在哪边。难道真的是我运气真的比较差吗？我身边的朋友，在阿里、在字节、在微软，拿着高薪。我理解我做不到他们那样，因为我不够努力，也没有天赋。可是，即使在这样的一家小公司，我为什么在公司拿的工资都是最低一档？？？

我现在想着换一个工作了，虽然这一切看起来莫名其妙。公司环境也不错，双休，还支持弹性工作制。但是我真的接受不了，为什么我的工资连一个能力比较普通的同事都不如。

马上到三月，我就正式 34 了，连传说中的斩杀线也只剩一年。换新工作，能不能找到是一个问题，能不能承受也是一个问题。

我真的不知道我该怎么办了

72 comments by mapleincode at 16:48:13 in 职场话题

「求助」日本旅游攻略制定

前提：签证以下，必须得去了，不考虑不出行方案

准备春节和女朋友去日本旅游，然后初步做了一个方案，请比较有经验的 v 友帮忙看看，哪里需要调整这些的，大致计划是东进阪出，不考虑北海道（滑雪摔麻了）

Day 1 (2.15): 抵达东京 -> 入住。

Day 2 (2.16): 东京市区 (浅草/秋叶原)。

Day 3 (2.17): 迪士尼海洋 DisneySea (全天)。

Day 4 (2.18): 东京 -> 镰仓/江之岛 (看海/灌篮高手) -> 晚上回东京。

Day 5 (2.19): 东京 -> 伊豆河津 (看早樱🌸) -> 晚上住伊豆或热海温泉。

Day 6 (2.20): 伊豆 -> 京都 (坐新干线)。晚上京都鸭川散步。

Day 7 (2.21): 京都 (清水寺/和服体验)。

Day 8 (2.22): 京都 -> 奈良 (喂鹿) -> 大阪。

Day 9 (2.23): 大阪 (购物) + 神户 (吃牛肉/看夜景) 半日游。（中午去神户吃肉，晚上回大阪睡）

Day 10 (2.24): 大阪关西机场返程。

我的准备：google maps （地图）、换乘案内（类似亿通行）、klook （旅行软件）、几万日元、零钱包、垃圾袋

有点疑问：

1.我准备买一张大流量卡插在 u60pro 上面用，我查了一下，外国的 5g 频段也是 n78 这些，u60pro 完全支持的，就是不知道实测如何,然后再准备一张小流量卡给我对象，以防上下错车的时候联系，不过这些卡都不含通话，通话应该是不需要吧，微信联系就行

2.关于交通卡，我有一个苹果机(澳版)，可以加西瓜卡，我女朋友没有，本来想着在淘宝下单一张西瓜卡的，后来了解到机场也能办，计划去了之后再机场办

3.我看红薯上面推一个叫 kuli kuli 的菜单翻译软件，但是有很多人也说这个不好用，我看还得付费，又怕付费之后不好用，想问一下各位，能不能用 chatgpt 的视频模式，和 gpt 实时对话让他给我翻译

4.纠结的是伊豆和富士山的行程冲突了，这块大家有什么好的建议吗，因为感觉富士山还挺经典的

5.关于气温方面，我看温度和北京的差不多，应该穿衣这些穿在北京的衣服就行吧，还是要减一点衣服

6.关于迪士尼这个，我看迪士尼海洋更好一点，不知道是不是这样，准备花钱买俩三个项目的 DPA 好好玩玩

当前现状：酒店和机票还没订，基本没啥日语口语能力，这次出行主要靠 airpods pro3 和 chatgpt 了

目前我考虑到的只有这么多，还请各位大佬不吝赐教，有什么不合理或者需要调整的地方请狠狠地提出来，帮助我完善一下出行计划，跪谢各位大佬

70 comments by sakurawzt at 11:37:36 in 旅行

帮朋友问下如何跨过情色一关

常言道色字头上一把刀。（为什么我打的是句号呢。因为键盘的逗号太难按出来了）但是即使东子这样的千亿大佬家有娇妻也难逃过。所以普通人除了出家怎么跨国情色一关。

或者说尽量花费少的时间，（咦这次居然一下就按出逗号了，神奇，神奇。又没了）。而不是天天胡思乱想

[2026-02-06] Claude Opus 4.6

HNews Digest

Hacker News

Anthropic 发布 Claude Opus 4.6：更强大的 AI 模型

GPT-5.3-Codex：更强大的编码助手

Flock CEO 将 Deflock 称为“恐怖组织” - 总结

虎格数据 (Tiger Data) 简介

Claude Agent Teams: 构建一个自动化的 C 编译器

AI 工具使用经验总结

Claude Code 代理团队：概述

LinkedIn Chrome 扩展指纹识别项目摘要

GitHub Actions 評估：為何 Buildkite 更勝一籌 (GitHub Actions Evaluation: Why Buildkite is Better)

内容暂时不可用，后续补全

新解密文件揭露科技巨头操纵青少年成瘾，并试图控制舆论

Ardour 9.0 发布公告 (Announcement of Ardour 9.0 Release)

关于我在Epstein Files中出现的情况：摘要

Anthropic Claude Opus 4.6 发现开源代码漏洞：总结

《一九八四》读后感：对一部预言的评估 (《田野报》专栏文章摘要)

UNIX 系统中可原子执行的操作总结

1. 文件路径操作

2. 文件描述符操作

3. 虚拟内存操作

Apple News 广告质量下降及潜在诈骗问题总结 (Summary of Declining Apple News Ad Quality and Potential Scam Issues)

大型软件系统构建：演化与工程的权衡 (大型软件系统构建：演化与工程的权衡)

Claude Opus 4.6：面向金融行业的AI升级

Claude Opus 4.6 发布之际，Pro 和 Max 用户限时赠送 $50 额外使用额度总结

总结：Wyden 警报拉响，CIA 活动引发担忧

V2EX