Hacker News
GitHub's Fake Star Economy
GitHub 星球的阴影:虚假星标的生态系统揭秘 (The Shadow of GitHub Stars: Unveiling the Ecosystem of Fake Stars)
这份调查报告揭示了一个庞大而专业的“影子经济”,它在 GitHub 上公开运作,利用虚假星标来为项目筹集资金。
核心发现:
- 虚假星标泛滥: 卡内基梅隆大学等机构联合进行的一项同行评审研究(ICSE 2026)发现,在 18,617 个仓库中,有约 600 万个可疑的虚假星标,由约 301,000 个账户发出。其中,AI/LLM 相关项目是虚假星标数量最多的非恶意类别。
- 星标的交易: 至少有十几个网站、Fiverr 平台以及 Telegram 频道公开出售 GitHub 星标,价格从 0.03 美元到 0.85 美元不等。无需访问暗网即可购买。
- VC 的依赖: 风险投资公司(VC)明确将星标数量作为项目评估指标。Redpoint Ventures 的研究表明,种子轮融资的 中位数星标数量为 2,850,许多公司运行自动化脚本来寻找快速增长的项目。
- 数据分析的验证: 研究人员对 20 个项目进行了分析,发现其中 36% 到 76% 的星标用户没有关注者,而仓库的星标与fork 的比率比有机增长的项目低 10 倍。
- 法律风险: 美国联邦贸易委员会 (FTC) 发布的 2024 年规则禁止虚假的社交影响指标,每项违规行为将处以 53,088 美元 的罚款。美国证券交易委员会 (SEC) 已经对创业公司创始人因虚报项目进展而提起诉讼。
虚假星标的生态系统:
- 研究: ICSE 2026 的研究利用 StarScout 工具分析了 20TB 的 GitHub 元数据,识别了 600 万个可疑的虚假星标。2024 年,拥有 50 颗星以上的仓库中,有 16.66% 参与了虚假星标活动。
- 市场: 星标销售生态系统包括专门网站(如 SocialPlug.io, Buy.fans)、自由职业平台(Fiverr)、星标交换平台(GithubStarMate.com)以及 Telegram 频道。不同等级的服务提供商的价格和账户质量各不相同。
- 工具: 有开源工具用于伪造 GitHub 贡献图表(如 fake-git-history, commit-bot),甚至可以购买拥有五年提交历史和 Arctic Code Vault 贡献者徽章的预制 GitHub 账户,价格约为 5,000 美元。
- 中国市场: 清华大学的研究表明,中国的 QQ 和微信推广群组每年通过推广项目赚取约 340 万至 440 万美元。
分析结果:
研究人员对 20 个仓库进行了分析,发现虚假星标的特征包括:
- 账户年龄: 虚假账户通常拥有较长的历史,但缺乏实际的仓库和关注者。
- 零活动: 许多账户没有公共仓库,也没有关注者。
- 低 fork/star 比率: 虚假星标仓库的 fork/star 比率远低于有机增长的项目。
- 零关注者: 36% 到 76% 的星标用户没有关注者。
资金的驱动力:
VC 公司明确使用星标数量作为项目评估指标,并将其与融资额挂钩。购买星标的成本相对于种子轮融资的潜在回报来说,回报率极高,这导致了数千个仓库利用这一漏洞。
GitHub 的应对:
GitHub 的可接受使用政策禁止虚假账户和自动化活动。虽然 GitHub 会删除被标记的仓库,但对虚假账户的清除效率较低。
未来的展望:
研究人员建议 GitHub 采用基于网络中心度的加权流行度指标,以更有效地打击虚假星标。 随着 FTC 规则的实施和 SEC 的监管力度加大,虚假星标行为将面临更大的法律风险。
总结:
GitHub 星球的阴影正在蔓延,虚假星标的生态系统正在蓬勃发展。 投资者、平台
|
Stop trying to engineer your way out of listening to people
软件开发中沟通和倾听的重要性:避免“未完成的道路”
本文探讨了软件开发领域中常见的沟通问题,并强调了倾听的重要性,指出许多问题源于缺乏有效沟通和倾听。作者用海绵宝宝动画中的“未完成道路”形象地比喻了因沟通不畅而导致的开发失误。
根本原因:避免工作而非系统问题
作者认为,许多人试图通过引入诸如“框架”、“系统”或“社会技术系统”等术语来简化沟通,但实际上,问题的核心并非需要更好的系统,而是回避了真正与他人沟通和倾听的工作。
倾听的常见陷阱
文章列举了八个常见的倾听陷阱,这些陷阱阻碍了开发者真正理解用户需求:
- 倾听不等同于照做: 仅仅满足用户提出的具体要求是不够的,需要理解其背后的需求和动机。
- 低估专业性对自身世界观的影响: 开发者容易假设他人了解自己所熟知的专业知识,但实际上,不同领域的人拥有不同的知识体系。
- 将“技术”视为单一概念: “技术”涵盖了广泛的知识领域,并非仅仅等同于开发者的技术栈。
- 假设他人拥有相同的资源: 每个人在精力、技能、财务状况等方面都存在差异,这些差异会影响其需求和选择。
- 以偏概全: 对个别案例的观察不应被推广到整个群体。
- 假设个人和组织是静态的: 人的性格、工作状态和判断都会随着时间推移而改变,因此,固定的项目管理方法在软件开发中往往失效。
- 假设言语与想法一致: 人们表达的并非总是其真实的想法,需要更深入地理解他们的意图。
- 评判他人: 对他人缺乏理解或不尊重会导致沟通障碍,难以有效倾听。
- 忽视个体差异: 即使在B2B(企业对企业)场景中,也应认识到80个人并非80个独立的个体,而是存在复杂的群体动态。
后果
作者强调,缺乏倾听会导致错失宝贵的机会,难以获得竞争优势,甚至会增加技术债务。 沟通不畅会引发误解,导致代码中出现额外的处理逻辑。
结论
文章呼吁开发者重视沟通和倾听,避免陷入上述陷阱,从而更好地理解用户需求,提升软件开发效率和质量。 倾听是获得成功和减少技术债务的关键。
|
Tesla concealed fatal accidents to continue testing autonomous driving
特斯拉自动驾驶系统安全问题调查:数据泄露、事故隐瞒与巨额赔偿
核心内容: 据泄露的数据显示,特斯拉(Tesla)公司隐瞒了数千起与自动驾驶系统(Autopilot)相关的事故,其中一些导致人员伤亡。 一项调查揭露了特斯拉利用公共道路作为测试场地,加速其自动驾驶人工智能系统的上市,并忽视了系统存在的缺陷。
主要细节:
- 数据泄露与事故隐瞒: 大量内部数据泄露揭示,特斯拉多年来一直知晓其自动驾驶系统的缺陷,但选择隐瞒。 数据显示,有超过2400起客户投诉涉及自发加速,超过1000起事故。 许多事故状态被标记为“未解决”。
- “幻觉”带来的危险: 特斯拉自动驾驶系统出现“幻觉”现象,即在没有理由的情况下突然加速或制动,类似于人工智能ChatGPT给出错误答案的情况。 这些错误在高速行驶时可能导致致命事故。
- 受害者经历: 一名行人Naibel Benavides在特斯拉“Autopilot”模式下发生事故中丧生,她的伴侣Dillon Angulo身受重伤。 Benavides的家人起诉特斯拉,指控其隐瞒关键信息。
- 数据篡改: 事故发生后,特斯拉声称车辆的“黑匣子”数据已被损坏,但调查人员成功恢复了这些数据,证明特斯拉在事故发生当晚就已知晓系统故障。
- 历史性裁决: 法庭判决特斯拉赔偿超过2.43亿美元的损害赔偿金,这是与“Autopilot”相关的案件中首次出现如此巨额赔偿。 法庭认定特斯拉和驾驶员均负有责任。
- 多重调查: 特斯拉目前正面临美国司法部和国家公路交通安全管理局等多项调查,调查内容涉及是否欺骗消费者以及自动驾驶系统的安全性。 多名举报人表示,特斯拉为了追求速度而牺牲安全,将未经充分测试的自动驾驶系统匆忙推向市场。
- 后续影响: 预计未来将会有更多的法律诉讼针对特斯拉。 此项裁决为其他受害者提起诉讼开辟了道路。
总结: 这次调查揭示了特斯拉在自动驾驶技术开发过程中存在的安全隐患和信息隐瞒行为。 此次巨额赔偿以及多重调查表明,汽车制造商不能将公共道路作为安全测试的试验场。 特斯拉的案例也引发了人们对自动驾驶技术安全性和监管的担忧。
|
2,100 Swiss municipalities showing which provider handles their official email
瑞士市政机构官方邮件服务提供商地图总结 (Summary of the Swiss Municipality Official Email Provider Map)
该项目旨在绘制一张包含约 2,100 个瑞士市政机构的地图,显示它们各自的官方邮件服务提供商,并按照管辖区域进行分组。 地图信息基于公开的 DNS 记录和其他公共网络信号。
核心要点:
- 内容: 地图显示了瑞士各市政机构使用的官方邮件服务提供商。
- 数量: 覆盖了约 2,100 个瑞士市政机构。
- 数据来源: 信息来源于公开的 DNS 记录和其他公共网络信号。
- 目的: 提高对数字主权的认识,尤其是考虑到美国公司受到美国 CLOUD 法案的约束,该法案允许美国当局请求存储的数据,无论数据物理位置在哪里。 该地图旨在可视化当前的提供商格局。
- 运作方式: 通过检查每个市政机构的官方域名,并利用 11 个信号(包括 DNS 记录、SMTP 标语、ASN 查找和公共 Microsoft API 端点)来对提供商类型进行分类,并赋予置信度评分。
- 免责声明: DNS 记录指示邮件路由和授权发送者,但不一定指示数据存储的具体位置。
- 开源与开放数据: 项目代码和数据已发布在 GitHub 上 (https://github.com/davidhuser/mxmap)。 如果发现错误,可以通过 GitHub 提交 issue (https://github.com/davidhuser/mxmap/issues)。
总结:
该项目提供了一个可视化的工具,用于了解瑞士市政机构使用的官方邮件服务提供商,从而促进对数字主权问题的关注。 该项目是开源的,并鼓励用户参与并报告任何发现的错误。
|
NSA is using Anthropic's Mythos despite blacklist
美国国家安全局使用Anthropic的Mythos模型,尽管五角大楼对其存在供应链风险担忧
核心内容: 美国国家安全局(NSA)正在使用Anthropic公司最新发布的Mythos模型,尽管美国国防部(五角大楼)的高层官员认为该公司存在“供应链风险”。
关键细节:
- NSA的使用: 据两名消息人士透露,NSA正在使用Mythos模型,另一名消息人士表示该模型也在部门内得到更广泛的使用。目前尚不清楚NSA的具体使用方式,但其他拥有该模型访问权限的组织主要将其用于扫描自身环境,寻找可利用的安全漏洞。Anthropic将Mythos的访问权限限制在约40个组织,理由是其攻击性网络能力过于危险,不适合广泛发布。Anthropic公开宣布了其中的12家机构,NSA可能就是其中未公开的机构之一。
- 英国的合作: 英国的NSA对应机构通过该国的AI安全研究所获得了该模型的访问权限。
- 与五角大楼的矛盾: 五角大楼此前曾于2月采取措施切断与Anthropic的合作,并要求其供应商跟进。此事件仍在持续处理中。五角大楼同时在法庭上辩称使用Anthropic的工具威胁美国国家安全,而军方却在扩大对Anthropic工具的使用范围。
- 与白宫的沟通: Anthropic首席执行官Dario Amodei于周五与白宫办公厅主任Susie Wiles和财政部次长Scott Bessent会面,讨论Mythos模型在政府中的使用以及Anthropic的更广泛计划和安全措施。双方表示会谈富有成效,预计后续将关注国防部以外的其他部门如何使用该模型。
- 合同纠纷的背景: 五角大楼与Anthropic之间的分歧源于年初紧张的合同重新谈判。五角大楼要求Anthropic的Claude模型可用于“所有合法目的”,而Anthropic则坚持将大规模国内监控和自主武器开发划为限制范围。部分国防官员仍然认为Anthropic的立场表明其不可信,Anthropic对此予以否认。另有行政部门官员希望结束这场争端,以便利用Anthropic正在构建的先进工具。
总结: 尽管五角大楼对Anthropic存在安全担忧,但政府的网络安全需求似乎优先考虑,导致NSA继续使用Anthropic的Mythos模型。此次事件凸显了政府机构在利用先进人工智能工具与潜在安全风险之间的权衡。
|
Swiss authorities want to reduce dependency on Microsoft
瑞士政府计划逐步减少对微软产品的依赖
核心内容总结:
根据《NZZ am Sonntag》报纸的报道,瑞士政府计划逐步减少对微软产品的依赖,以提升数字主权。联邦总秘书处的发言人表示,联邦政府的目标是“逐步且长期地减少对微软的依赖”。
背景与现状:
- 尽管此前存在数据安全方面的担忧,最近才在约 54,000 个行政工作站上安装了 Microsoft 365。
- 之前提出的替代方案曾遭到内部抵制,被指责为“瞎折腾”。
- 瑞士在过去十年中为微软软件支付了超过 11 亿瑞士法郎(约 14 亿美元)的许可费用。
驱动因素:
- 对美国法律(特别是 2018 年的《云法》)的担忧。该法律允许美国政府访问美国科技公司(如微软、苹果和 Adobe)存储在世界任何地方的数据,即使服务器位于瑞士。
- 特朗普政府及其对法治的态度加剧了这些担忧。
- 数字主权专家呼吁瑞士在人工智能领域减少对科技巨头的依赖。
解决方案与借鉴:
- 可行性研究表明,用开源软件替代微软产品是可行的。
- 德国正在开发独立的开源解决方案,瑞士也对此感兴趣。
- 德国的 Schleswig-Holstein 州已经完成了行政部门的迁移。开源软件可以自由使用,并且可以在不依赖公司的前提下进行独立开发。
- 前瑞士陆军总司令 Thomas Süssli 呼吁更快地探索替代方案。
(中文翻译的注释:)
- 文章主要讲述了瑞士政府为了保障数字主权而计划逐步减少对微软产品的依赖的背景、原因和可能的解决方案。
- 重点突出了《云法》带来的数据安全担忧,以及德国在开源软件方面的实践作为参考。
- 内容忠实于原文,未加入个人观点或信息。
|
Show HN: Run TRELLIS.2 Image-to-3D generation natively on Apple Silicon
TRELLIS.2 在 Apple Silicon 上的运行
该项目旨在将 Microsoft 的 TRELLIS.2 图像到 3D 模型在 Mac 上原生运行,无需 NVIDIA GPU。它通过 PyTorch MPS 将 CUDA 依赖性移植到 Apple Silicon 平台。
主要成果:
- 生成质量: 从单张图像生成包含 400,000+ 顶点和烘焙好的 PBR 纹理的网格。
- 性能: 在 M4 Pro (24GB) 上,生成和烘焙过程大约需要 3 分 52 秒,总时间(包括管道加载)约为 5 分 40 秒。
- 输出格式: 生成的网格和纹理以 GLB 格式保存,包含基础颜色、金属度和粗糙度纹理,可以直接在 3D 应用中使用。
系统要求:
- macOS 在 Apple Silicon 芯片 (M1 或更新) 上运行。
- Python 3.11 或更高版本。
- 推荐 24GB+ 的统一内存。
- 约 15GB 的磁盘空间用于模型权重下载。
快速开始:
- 克隆 GitHub 仓库。
- 下载 Xcode Metal Toolchain (推荐,用于构建 Metal 加速的纹理烘焙器)。
- 登录 Hugging Face (需要访问受限模型)。
- 请求访问 DINOv3 和 RMBG-2.0 模型。
- 运行
setup.sh 脚本,创建虚拟环境、安装依赖项、克隆和修补 TRELLIS.2 代码,并构建 Metal 后端。
- 激活虚拟环境。
- 使用
python generate.py path/to/image.png 命令生成 3D 模型。
技术细节:
- 稀疏 3D 卷积: 使用
backends/conv_none.py 实现,通过构建空间哈希表、收集邻居特征、应用权重和散射结果来执行稀疏 3D 卷积。
- 网格提取: 使用
backends/mesh_extract.py 实现,使用 Python 字典代替 CUDA 哈希表操作,构建坐标到索引的查找表,并执行三角化。
- 注意力机制: 使用 PyTorch SDPA 替换原有的 CUDA 注意力机制。
- 纹理烘焙: 默认使用 Metal 堆栈 (
mtldiffrast 等),如果 Metal Toolchain 不可用,则回退到纯 Python KDTree 烘焙。
- 网格简化: 在纹理烘焙前,将网格从约 800,000 个面简化到约 200,000 个面,以避免 Metal BVH 构建器出现问题。
性能指标 (M4 Pro, 24GB):
- 管道加载:104 秒
- 稀疏结构采样:81 秒
- 形状 SLat 采样:22 秒
- 纹理 SLat 采样:12 秒
- 网格解码 + 简化:约 106 秒
- 纹理烘焙 (Metal):11 秒
- 总时间 (冷启动):5 分 40 秒
- 生成 + 烘焙时间 (不包括管道加载):3 分 52 秒
- 峰值内存使用量:约 18GB
限制:
- 不支持洞填充: 由于 Metal 端口中
cumesh 的问题,无法进行洞填充。
- 性能较慢: 纯 PyTorch 稀疏卷积比 CUDA
flex_gemm 慢约 10 倍。
- 纹理烘焙前简化: 网格在纹理烘焙前被简化,如果需要全分辨率网格,可以导出 OBJ 文件。
- 仅支持推理: 不支持训练。
许可证:
该项目的端口代码使用 MIT 许可证发布,原始模型权重受其各自许可证约束:TRELLIS.2 (MIT), DINOv3 (Meta custom license), RMBG-2.0 (CC BY-NC 4.0)。
|
The insider trading suspicions looming over Trump's presidency
特朗普政府时期异常交易:潜在的内幕交易? (Trump Era Anomalous Trading: Potential Insider Trading?)
根据英国广播公司 (BBC) 的调查,在唐纳德·特朗普总统第二个任期内,其重要声明前夕,交易者在金融市场进行了数百万美元的投注,引发了内幕交易的质疑。调查分析了贸易量数据,并将其与特朗普总统的重大声明相匹配,发现了一种持续的模式:在社交媒体帖子或媒体采访公开之前,交易量会出现异常飙升。
主要发现:
- 油价波动 (Oil Price Fluctuations): 在伊朗战争期间,特朗普总统在与伊朗冲突“几乎完成”的 CBS 采访前不久,油期货市场出现了巨大的投注激增。采访公开后,油价暴跌 25%。类似情况在特朗普总统宣布“完全和彻底解决”伊朗敌对行动后也发生,当时油价下跌了 11%。
- 关税休止 (Tariff Pause): 特朗普总统宣布暂停对世界各国商品征收关税(除中国外)时,股市飙升。在此之前,也出现了异常的投注活动,一些交易者在股市连续七天下跌的情况下,押注股市上涨,并从中获利近 2000 万美元。
- 马杜罗政变 (Maduro Ouster): 在预测市场平台 Polymarket 上,一个名为“Burdensome-Mix”的用户在 2026 年 1 月底押注委内瑞拉总统马杜罗将被推翻,并在马杜罗实际被推翻后赢得了 43.6 万美元。
- 伊朗袭击 (Iran Strikes): 在 2026 年 2 月,六个 Polymarket 账户在特朗普总统宣布对伊朗发动袭击前,押注美国将对伊朗采取行动,最终赢得了 120 万美元。
潜在的内幕交易 (Potential Insider Trading):
一些分析师认为,这些交易模式具有非法内幕交易的特征,即根据非公开信息进行投注。另一些人则认为,情况可能更加复杂,部分交易者可能只是能够更好地预测特朗普总统的行动。
美国证券交易委员会 (SEC) 对此未予置评,白宫也未回应 BBC 的评论请求。
监管回应 (Regulatory Response):
美国参议院多名高级民主党人已致函 SEC,呼吁调查这些交易活动。Polymarket 和 Kalshi 近期也制定了新的规则,以打击内幕交易。商品期货交易委员会 (CFTC) 表示对欺诈和内幕交易“零容忍”。
这份报告突显了预测市场日益普及以及潜在的监管挑战,并提出了关于政府官员是否利用内幕信息进行投注的严肃问题。
总结 (Summary):
BBC 的调查揭示了特朗普政府时期,在总统重大声明前夕,金融市场中出现的异常交易模式。这些模式引发了内幕交易的质疑,并促使监管机构采取行动,以确保市场的公平性和透明度。
|
The Bromine Chokepoint
全球半导体内存供应链的隐形危机:溴的困境 (全球半导体存储供应链的隐形危机:溴的困境)
当前美国、以色列与伊朗的冲突虽已进入不稳定休战状态,却暴露了全球半导体内存供应链的一个结构性缺陷,而这并非分析师们关注的焦点。人们普遍关注的是氦气供应问题,但更值得警惕的是溴的供应。溴是生产半导体级氢溴酸的关键原材料,后者是韩国半导体工厂用于蚀刻DRAM(动态随机存取存储器)和NAND闪存芯片晶体管结构的重要化学品。
核心问题:韩国高度依赖以色列溴供应
DRAM芯片用于主动计算,断电后数据丢失;NAND闪存芯片则无需供电即可存储数据,是所有数字存储的基础。韩国97.5%的溴进口均来自以色列。将溴转化为半导体级氢溴酸需要专门的提纯基础设施,而以色列以外的生产商已满负荷运转,无力承担额外需求。新建提纯设施需要数年时间才能完成许可、设备采购和生产验证。
以色列的溴生产地面临威胁
以色列跨国公司ICL Group(前身为以色列化学有限公司)目前仍在运营死海设施。以色列主要通过海法和阿什多特地中海港口进行贸易,绕过霍尔木兹海峡。然而,伊朗已连续三周用弹道导弹袭击以色列南部沙漠地区(尼格夫地区),目标包括距离ICL死海提取和转化综合设施35公里以内的迪莫纳和阿拉德。如果以色列的溴生产被迫中断,目前没有任何其他设施能够在需要的时间内,以所需的规模生产半导体级氢溴酸。
溴的不可替代性与长期影响
溴在半导体制造中的作用是特定且不可替代的。其主要衍生物氢溴酸,在多晶硅蚀刻阶段至关重要,这是DRAM和NAND闪存生产的基础。氢溴酸等离子体能够实现多晶硅与氧化层高达100:1的选择性比,而氯基替代品仅为30:1,这对于先进的DRAM节点至关重要。溴还应用于化学气相沉积和芯片封装。目前没有可行的替代方案。
供应链的脆弱性
死海是地球上溴含量最丰富的水体之一,ICL Group以最低的成本进行提取,在全球溴供应中占据主导地位。以色列和约旦共同约占全球三分之二的溴供应。ICL的氢溴酸(包括供应给韩国工厂的半导体级产品)的生产,与溴的提取发生在同一地点——位于同一脆弱走廊的索多姆设施。伊朗导弹已多次突破以色列防空系统,袭击尼格夫地区,造成近200人受伤。即使没有直接击中ICL设施,战争风险保险费用已大幅上涨,贸易成本增加,甚至可能导致关键工业基础设施瘫痪。
影响广泛:AI、军工、乃至发展中国家
这种中断将蔓延至全球内存供应链。三星和SK海力士共同占据全球70%的DRAM市场,SK海力士更是掌握约57%的高带宽存储器市场。由于DRAM和NAND闪存是现代计算设备的基础,供应中断将影响消费电子、工业系统等各个领域。高带宽存储器(用于Nvidia等加速器)已售罄至2026年,DRAM供应商仅有两到三周的库存。
中断将迫使三星和SK海力士将氢溴酸分配给高价值产品——如用于AI加速器的HBM——而牺牲用于智能手机、个人电脑和数据存储的普通DRAM和NAND。这会对非洲、南亚和拉丁美洲等地区造成严重影响,因为这些地区的智能手机成本已经因DRAM和NAND价格上涨了10-25%。
应对措施:多方合作,提前布局
- 物理预位: 利用美国阿肯色州的溴资源,建立半导体级氢溴酸提纯设施。
- 建设提纯设施: 通过“芯片法”等框架,推动在韩国、日本和美国等地建设提纯设施。
- 各国行动: 韩国应将溴列为战略矿产,并与三星和SK海力士合作建设国内提纯设施。美国应将溴及其衍生物列入战略矿产清单,并利用相关资金与盟友合作。以色列应将溴作为战略出口商品,加强ICL设施的防御,
|
Claude Token Counter, now with model comparisons
Claude Token Counter 工具更新:模型比较及 Opus 4.7 的影响 (Claude Token Counter 工具更新:模型比较及 Opus 4.7 的影响)
本文介绍了 Simon Willison 最新更新的 Claude Token Counter 工具,该工具增加了模型比较功能,用于评估不同 Claude 模型之间的 token 使用情况。
主要更新与发现:
- 模型比较功能: 该工具现在允许用户对比 Claude Opus 4.7、Opus 4.6、Sonnet 4.6 和 Haiku 4.5 四个模型的 token 数量。
- Opus 4.7 Tokenizer 变化: Anthropic 在 Opus 4.7 中更新了 tokenizer,导致相同输入文本的 token 数量增加。根据测试,Opus 4.7 的 tokenizer 使用的 token 数量约为 Opus 4.6 的 1.46 倍。
- 图像 Token 计数: 该工具也支持图像 token 计数。Opus 4.7 在图像处理方面有所改进,可以处理分辨率更高的图像 (最高 2,576 像素长边,约 3.75 百万像素)。
- 图像分辨率影响: 使用高分辨率图像 (3456x2234 像素) 进行测试时,Opus 4.7 的 token 数量比 Opus 4.6 高出 3.01 倍。 经过进一步测试,发现这种差异完全是由于 Opus 4.7 能够处理更高分辨率图像所致。
- PDF 文档测试: 使用 15MB、30 页的文本密集型 PDF 文件进行测试时,Opus 4.7 的 token 数量为 60,934,Opus 4.6 为 56,482,token 乘数约为 1.08 倍,远低于原始文本的乘数。
- 成本影响: 虽然 Opus 4.7 与 Opus 4.6 采用相同的定价(输入 token 每百万 5 美元,输出 token 每百万 25 美元),但由于 token 数量增加,预计使用 Opus 4.7 的成本会增加约 40%。
工具链接: https://tools.simonwillison.net/claude-token-counter
GitHub 代码仓库: https://github.com/simonw/tools/pull/269
Opus 4.7 系统提示词: https://github.com/simonw/research/blob/2cf912666ba08ef0c00a1b51ee07c9a8e64579ef/extract-system-prompts/claude-opus-4-7.md?plain=1
|
|
Ex-CEO, ex-CFO of iLearningEngines charged with fraud
https://www.reuters.com/legal/government/ex-ceo-ex-cfo-bankrupt-ai-company-charged-with-fraud-2026-04-17/
|
OpenClaw isn't fooling me. I remember MS-DOS
OpenClaw 和安全代理的架构:从 MS-DOS 的教训
这篇文章探讨了当前代理架构中的安全问题,并将其与 MS-DOS 时代的安全性缺失进行了对比,提出了对更安全代理设计的新思路。作者认为,目前的某些代理解决方案,例如 OpenClaw,在安全性方面存在缺陷,让人联想起 MS-DOS 时代缺乏安全保障的系统。
MS-DOS 时代的教训:
作者回忆了 MS-DOS 时代程序可以随意访问内核、中断和磁盘的危险性,以及由此带来的安全漏洞。即使出现了新的壳,也无法从根本上解决问题。最终,Unix 的多重安全机制,如环、虚拟内存、ACL 和独立的地址空间,才得以普及,解决了 DOS 时代的安全性问题。文章还引用了发生在芝加哥酒吧的一个真实故事,一位喝醉的 IT 顾问得意洋洋地谈论 Wal-Mart 使用 MS-DOS 存储数百万客户的支付信息,并且只有一个共享密码,这凸显了当时的安全漏洞。Wal-Mart 在 2006 年的违规事件,也证实了当时安全措施的缺失,导致了三年才通知客户。
对当前代理架构的担忧:
作者认为,一些当前的代理架构,特别是那些将模型直接交给执行工具的网关,存在类似风险。他们担心这些架构可能会导致类似 MS-DOS 时代的混乱局面,并引用了 NVIDIA 发布的 NemoClaw 教程作为例子。
NemoClaw 教程分析:
作者详细分析了 NVIDIA 的 NemoClaw 教程,指出其在安全性方面的努力,例如将 Ollama 绑定到 0.0.0.0,通过聊天频道进行配对,以及通过 TUI 批准出站连接。尽管这些都是解决实际问题的有效措施,但作者认为它们本质上是权宜之计,因为它们是在一个不安全的基础之上进行补救。
Wirken 的设计理念:
作者介绍了他们正在构建的 Wirken 网关,并阐述了其安全设计理念。Wirken 采取了“缩小边界”的方法,将每个通道作为一个独立的进程,拥有独立的 Ed25519 身份,并将推理限制在环回网络上。此外,在执行 Shell 命令时,使用了硬化的容器,并对高风险命令进行提示和记忆,进一步增强了安全性。
对比分析:
文章通过表格形式对比了 NemoClaw 和 Wirken 在关键步骤上的实现方式,突出了二者在安全架构上的差异。Wirken 更加注重从一开始就将安全融入设计,而 NemoClaw 则是在现有框架下进行补丁和调整。
总结:
作者呼吁借鉴计算机历史的经验教训,避免重蹈 MS-DOS 时代的覆辙。他们认为,构建安全代理需要重新审视架构设计,并采取更严格的安全措施,例如进程隔离、权限控制和安全容器。Wirken 的设计理念代表了一种对安全问题的理解和解决思路,作者也希望能够与其他开发者交流,共同推动代理安全领域的进步。文章最后提供了 Wirken 的代码仓库链接。
|
Scientific datasets are riddled with copy-paste errors
科学调查:帕金森病研究数据造假事件及其他发现
本文揭示了对一项具有里程碑意义的帕金森病研究的质疑,该研究最初认为该疾病起源于肠道而非大脑。该研究获得了广泛的媒体报道和超过 3000 篇科学论文的引用。然而,调查发现该数据集包含不同小鼠的重复值序列。
事件背景与数据发现
该数据集于 8 年前通过开放获取存储库 Dryad 公开。质疑的发现由 Markus Englund 开发的一款名为 "Copy-Paste Detective" 的软件触发。该软件的设计灵感来源于两起新闻报道的数据伪造事件,分别是诺贝尔奖获得者 Thomas Südhof 的实验室和蜘蛛生态学家 Jonathan Pruitt 的实验室。这两起事件都涉及公开数据集中的大量复制粘贴数据。
主要案例分析
研究团队扫描了前 600 个数据集,发现 18 个值得关注的案例。以下是其中 3 个案例:
1. 帕金森病研究案例:
2. 鸵鸟-蛇混淆案例:
3. 鱼类尺寸混乱案例:
**整体结果
|
IEA: Solar overtakes all energy sources in a major global first
2025 年全球能源审查:总结
以下是对提供的文章的总结:
总体情况:
2025 年全球能源需求增长放缓,仅增长 1.3%。虽然低于过去十年的平均水平,但电力需求却激增了约 3%,是整体能源需求增长的两倍。这一增长主要得益于建筑和工业部门的电气化,电动汽车 (EV) 的普及以及数据中心的电力需求增加。
太阳能成为增长引擎:
太阳能成为 2025 年全球能源供应增长的最大贡献者,占增长的 25% 以上,这是首次有可再生能源成为全球主要能源增长的领导者。天然气位居第二,占 17%。可再生能源和核能共同满足了近 60% 的能源需求增长。
电动汽车对石油需求的影响:
全球石油需求增长仅为 0.7%,电动汽车的快速增长是造成这一结果的重要原因。2025 年电动汽车销量增长超过 20%,达到 2000 万辆,约占全球新车销售额的四分之一,从而对汽油和柴油需求造成压力。
煤炭趋势:
煤炭需求趋势喜忧参半。中国由于可再生能源的快速发展而减少了煤炭使用,而美国由于天然气价格上涨而增加了煤炭使用。总体而言,煤炭需求增长放缓。
主要发现:
- 电气化加速: 电力消耗增速远超整体能源需求,而太阳能的增长速度也远超其他能源。
- 排放增长放缓: 全球能源相关二氧化碳排放量仅增长了 0.4%,增速较前几年有所放缓。中国和印度的排放量分别下降和持平。
- 清洁能源的崛起: 太阳能新增发电量达到 600 太瓦时,创下历史新高。电池储能技术成为增长最快的电力技术。核能也正在复苏,多地开始建设新的核电站。
- 清洁技术对化石燃料的影响: 自 2019 年以来,清洁技术的发展规模已经足以对化石燃料的使用产生显著影响,其避免的化石燃料消耗量相当于拉丁美洲的整体能源需求。
区域差异:
- 美国能源需求增长强劲,得益于数据中心、工业活动和寒冷冬季。
- 中国能源需求增长放缓至 1.7%,这得益于可再生能源的普及和效率的提高。
总结:
IEA 认为,能源系统正在朝着清洁能源方向转变,太阳能的增长以及电动汽车的普及是这一转变的重要推动力。尽管转型过程不平衡,但趋势清晰:电气化、清洁能源的增加以及对化石燃料的压力正在不断加大。
中文总结:
2025年全球能源需求增速放缓,但电力需求却大幅增长,太阳能成为全球能源增长的主要驱动力。电动汽车的普及有效控制了石油需求,而中国和印度的排放量有所下降或持平。清洁能源技术正在对化石燃料造成影响,能源系统正在朝着清洁、电气化的方向转变。尽管转型过程存在区域差异,但总体趋势是明确的。
|
M 7.4 earthquake – 100 km ENE of Miyako, Japan
地震事件页面应用程序摘要
该应用程序是地震事件页面,旨在为用户提供地震信息。
主要特点:
总而言之,该应用程序提供了一种访问最新地震事件信息的途径,并确保在现代浏览器中具有良好的兼容性,同时提供了实时数据访问选项。
|
PM Carney declares U.S. ties now a 'weakness' in address to Canadians
加拿大经济挑战:卡尼总理全国讲话概要 (Summary of Prime Minister Carney's National Address on Canada's Economic Challenges)
发布日期: 2026年4月19日上午10:00 EDT
更新日期: 2026年4月19日上午11:55 EDT
主要内容:
加拿大总理马克·卡尼(Mark Carney)发表全国讲话,着重讨论了加拿大目前面临的经济挑战。讲话的核心内容是强调了与美国贸易关系发生“剧烈转变”对加拿大经济的重大影响。
关键细节:
- 讲话目的: 直接向全国人民阐述加拿大经济面临的挑战。
- 主要问题: 与美国贸易关系的剧烈转变。
- 讲话重点: 强调了贸易关系变化对加拿大经济带来的负面影响。
总结:
卡尼总理的讲话旨在向国民说明当前加拿大经济面临的关键问题,即与美国贸易关系发生的重大变化。讲话并未详细说明贸易变化的具体内容或原因,而是强调了其对加拿大经济的负面影响。
|
Show HN: Faceoff – A terminal UI for following NHL games
Faceoff:NHL 实时比分终端应用总结
Faceoff 是一款终端用户界面 (TUI) 应用程序,旨在为用户提供实时跟踪 NHL 冰球比赛的功能。
核心功能:
- 实时赛程: 允许用户按日期浏览 NHL 比赛,并提供方便的导航(前一天/后一天)。
- 实时更新: 自动刷新进行中比赛的得分。
- 比赛详情: 提供进行中和已完成比赛的逐场回放、比分统计和得分概要。
- 赛前预览: 显示即将到来的比赛数据,包括守门员对比和球员领头羊信息。
- 联盟排名: 显示当前的 NHL 联盟排名,提供多种视图(外卡、分区、联盟、联赛)。
- 球员统计领头羊: 显示滑冰球员和守门员在各种统计类别中的领先球员。
- 球队浏览: 浏览所有 NHL 球队,查看球队阵容和赛程。
- 球员档案: 查看详细的球员信息、职业生涯统计数据和比赛日志。
- 响应式布局: 游戏卡片和排名根据终端宽度自动调整。
- 本地时间显示: 游戏时间显示在用户的本地时区,并显示时区缩写。
截图:
文档中提供了比赛详情视图(使用不同的终端颜色方案)、联盟排名的截图。
快速开始:
- 安装: 推荐使用
uvx faceoff 命令。 也可以使用 pip install faceoff 安装,然后运行 faceoff 命令。
技术栈:
- Textual: Python 的现代 TUI 框架,用于构建用户界面。
- nhl-stats-api-client: 用于访问 NHL API 数据的 Python 客户端。
鸣谢:
该项目受到 Playball 的启发,后者是一款用于跟踪 MLB 棒球比赛的类似终端应用程序。
免责声明:
该项目与国家冰球联盟 (NHL)、其任何球队或其任何附属机构无关、未得到认可,或以任何方式正式联系。所有 NHL 徽标、商标和数据均属于 NHL 及其球队所有。 该应用程序仅用于信息和教育目的,使用公开可用的 NHL API 数据。
|
Six Levels of Dark Mode (2024)
六个暗色模式级别 (Liù gè àn sè móshì jíbié) - 总结
这篇文章探讨了在网页中实现暗色模式的六种(实际上是八种)级别,从最基础的设置到更高级的技巧。文章基于作者在CSS Naked Day期间的观察和思考,旨在帮助开发者更好地理解和实现暗色模式切换。
主要内容:
第一级:基础 (Dì yī jí: Jīchǔ) - 使用<meta name="color-scheme" content="light dark">标签,让浏览器根据用户的系统偏好自动切换颜色方案。这是最简单的方法。
第二级:基本 (Dì èr jí: Jīběn) - 使用CSS color-scheme: light dark; 声明,与第一级类似,但可以在任何位置声明,而不仅仅是<head>。建议优先使用 meta 标签,因为它能让浏览器更快地知道颜色方案。
第三级:温和 (Dì sān jí: Wēnhé) - 使用 light-dark() 颜色函数,根据光线模式调整颜色。浏览器对该函数的支持尚不完善。
第四级:大胆 (Dì sì jí: Dàdǎn) - 使用媒体查询 @media (prefers-color-scheme: dark),允许更灵活地自定义样式,不仅仅是颜色,还可以改变布局、滤镜等。
第五级:二分 (Dì wǔ jí: Èrfēn) - 使用<link>标签的media属性,为不同的颜色方案创建单独的CSS文件,浏览器会根据用户偏好加载相应的样式文件。
第六级:激进 (Dì liù jí: Jījìn) - 使用JavaScript的matchMedia函数来检测颜色方案,并根据检测结果执行相应的操作。
额外级别:
- 第七级:超越 (Dì qī jí: Chāoyuè) - 构建颜色方案切换器,允许用户手动选择颜色方案(自动、浅色、深色)。
- 第八级:诱人 (Dì bā jí: Yòurén) - 使用
:has()伪类选择器,避免使用.dark类或data-theme属性,直接基于HTML结构来应用样式。
其他要点:
- 作者建议在新建网站时,可以轻松地内置暗色模式。
- 文章提到了Safari在暗色模式下链接颜色可访问性问题。
- 作者和评论者讨论了CSS Naked Day的意义,以及在打印时暗色模式的表现。
- 文章最后提到了建立CSS Naked Day Webring的想法。
总而言之,这篇文章详细介绍了实现暗色模式的各种方法,从简单的meta标签到高级的JavaScript技巧,并鼓励开发者在实践中尝试不同的方法,以获得最佳效果。
|