Hacker News
Gemma 4 on iPhone
AI Edge Gallery 应用总结 (Summary of AI Edge Gallery App)
AI Edge Gallery是一款专为iPhone设计的免费生产力应用程序,旨在在移动设备上运行世界领先的开源大型语言模型(LLMs)。该应用的主要特点是完全离线、私密和快速的生成式AI体验。
核心功能:
- Agent Skills (代理技能): 将LLM模型扩展为主动助手,通过集成工具(如维基百科、交互式地图和视觉摘要卡)增强模型能力。用户可以从URL加载自定义技能或浏览GitHub社区贡献。
- AI Chat with Thinking Mode (AI聊天与思考模式): 允许进行多轮对话,并通过“思考模式”查看模型的推理过程,便于理解复杂问题。目前仅支持Gemma 4系列等特定模型。
- Ask Image (提问图像): 利用多模态能力识别图像中的物体、解决视觉谜题或获取详细描述。
- Audio Scribe (音频记录): 使用设备上的高效语言模型实时转录和翻译语音录音。
- Prompt Lab (提示实验室): 提供一个测试不同提示和单次使用案例的工作区,可以精细控制模型参数,如温度和Top-k。
- Mobile Actions (移动操作): 通过FunctionGemma 270m模型微调,解锁离线设备控制和自动化任务。
- Tiny Garden (微型花园): 一个使用自然语言种植和收获虚拟花园的实验性小游戏,同样基于FunctionGemma 270m模型微调。
- Model Management & Benchmark (模型管理与基准测试): 支持下载和加载各种开源模型,包括自定义模型。可以轻松管理模型库并进行基准测试,以了解模型在特定硬件上的性能。
- 100% On-Device Privacy (100%设备端隐私): 所有模型推理都在设备硬件上进行,无需互联网连接,确保用户提示、图像和敏感数据的完全隐私。
最新更新 (版本1.0.2):
- 引入Gemma 4:体验最新的高性能离线模型。
- Agent Skills:扩展LLM,集成交互式地图和维基百科等模块化工具,支持社区自定义技能加载。
- AI Chat中的思考模式:可视化模型的推理过程,提高透明度 (目前仅支持Gemma 4系列)。
- 修复bug。
其他信息:
开发者: Google LLC (地址: 1600 Amphitheatre Parkway, Mountain View California 94043, 美国; 电话: +353 14361000; 电子邮件: eea-s...@google.com)
|
France pulls last gold held in US for $15B gain
法国央行将持于纽约黄金转移至巴黎:总结
法国央行(BdF)已完成将此前持存于纽约联邦储备银行的剩余黄金(129吨,约占其总储备的5%)转移至巴黎金库的操作。此次行动是在内部审计的建议下进行的,于2025年7月至2026年1月期间完成。
背景与历史:
- 法国自20世纪20年代末起,部分黄金储存在纽约联邦储备银行。
- 20世纪60年代开始,法国启动了黄金归国计划,部分原因是为了应对布雷顿森林体系的终结。
- 尽管如此,法国仍然保留了一小部分黄金储存在纽约。
操作细节:
- 过去20年,法国央行一直在逐步用符合现代国际标准的黄金条替换其“较旧”或“非标准”黄金储备,包括位于纽约的黄金。
- 此次转移并未选择将纽约黄金进行提炼和运输,而是选择出售纽约黄金,并在欧洲购买新的符合标准的黄金条。
- 法国央行行长 Francois Villeroy de Galhau 强调,此举并非出于政治动机,而是基于欧洲市场的交易。
财务影响:
- 由于黄金价格上涨,此次交易使法国央行获得了130亿欧元(约150亿美元)的资本收益,使2025财年的净利润达到81亿欧元,此前2024财年净亏损为77亿欧元。
当前状况与未来计划:
- 法国的黄金储备总量(约2,437吨)并未改变,目前全部储存在法国央行位于La Souterraine的地下金库中。
- 法国央行仍有134吨黄金需要升级至符合标准,计划在2028年前完成。
|
Why Switzerland has 25 Gbit internet and America doesn't
瑞士、德国和美国的互联网:为什么自由市场并不总是最佳选择?
这篇文章探讨了瑞士、德国和美国在互联网速度和价格方面的巨大差异,并分析了导致这些差异的根本原因。 瑞士提供高达25Gbps的对称光纤互联网服务,价格合理,而美国和德国的互联网速度则相对较慢,选择也较少。
文章主要观点:
- 瑞士的成功: 瑞士拥有领先的互联网速度和竞争,这得益于其高度监管的电信行业和政府支持的基础设施项目。其关键在于将物理基础设施(光纤)视为中立的共享资产,每个家庭都拥有独立的四根光纤,任何互联网服务提供商都可以接入,从而促进了真正的竞争。
- 美国和德国的困境: 美国和德国都面临着互联网服务提供商垄断、基础设施过度建设和速度较慢的问题。
- 美国: 采取了“自由市场”策略,导致了地域性垄断,消费者选择有限,并且往往共享带宽,导致实际速度下降。
- 德国: 尽管有严格的监管,但也存在基础设施竞争,导致冗余建设,浪费资源,并且在获取现有管道信息方面面临繁琐的程序和法律纠纷。
- 自然垄断的本质: 文章解释了“自然垄断”的概念,即基础设施建设成本高昂,新增客户成本低廉的行业。例如,铺设水管或光纤网络,如果有多家公司各自铺设,会造成不必要的浪费。 解决办法是建立共享中立的基础设施,让不同的公司在基础设施上竞争服务。
- 瑞士模式的关键: 瑞士的成功在于强制实行开放接入,要求运营商共享光纤,确保每个家庭拥有独立的连接,并允许任何服务提供商接入。瑞士监管机构COMCO也发挥了重要作用,通过对违反反垄断法的行为进行处罚,例如对Swisscom的罚款,确保了竞争环境的公平性。
- 政策建议: 文章提出了以下政策建议,以促进其他国家的互联网发展:
- 强制要求运营商共享物理基础设施。
- 强制要求采用点对点架构,确保每个家庭拥有独立的纤维连接。
- 建立全国性的光纤标准。
- 赋予竞争机构更大的权力。
- 支持地方政府建设光纤网络。
总结:
文章认为,尽管自由市场通常被认为是驱动创新的最佳方式,但在自然垄断行业(如互联网基础设施)中,适当的监管和共享基础设施是促进竞争、降低价格并提高服务质量的关键。瑞士的经验表明,政府干预,通过建立中立的共享基础设施和确保开放接入,可以创造一个更具竞争力的互联网环境。
|
Age verification as mass surveillance infrastructure
身份验证基础设施的监控:调查 Persona、Palantir 和相关生态系统 (2026 年 4 月更新)
方法: DNS 分析、证书透明度、WHOIS/RDAP、企业注册、SEC EDGAR、HTTP 指纹识别、SDK 反编译、JS bundle 分析、Sourcegraph 代码搜索、theHarvester、dnsrecon。所有来源均为公开信息。
本调查揭示了巴西、英国和美国的年龄验证法律正在创造一个强制性的生物识别身份验证基础设施市场,同时也被用于监控。 彼得·蒂尔同时控制监控分析公司 Palantir (通过 Founders Fund) 并资助身份验证公司 Persona (通过 Founders Fund)。 协调的立法管道在跨境创建了对这些服务的法律需求。身份验证生态系统现在正在与 AI 代理基础设施融合,身份成为互联网上每个自动化交易的前提。
关键发现:
- 彼得·蒂尔控制 Palantir (监控分析) 和 Persona 的主要投资者 Founders Fund,而 Persona 的泄露源代码揭示了 269 项验证检查和政府报告模块,用于 FinCEN/FINTRAC。
- SDK 反编译显示硬编码的 AES 密钥 (v1.15.3 后已轮换)、零证书固定、通过 Vonage 的静默运营商电话验证以及 7 个同时进行的分析服务。
- Paravision 为 Persona 的面部识别提供支持,但未列在子处理器页面。 在 DHS 生物识别集会上排名第一。
- LinkedIn 运行 4 个身份验证供应商 (AU10TIX 自 2021 年以来、Persona、CLEAR、DigiLocker) 以及一个平行中国的监控堆栈,包括 Sesame Credit 社交信用评分、ShanYan 运营商身份验证和政府设备标识符。
- 扫描了 197 个子域名在 withpersona.com 上,揭示了 40 多个客户 (Roblox、Robinhood、Kaggle、Playboy、意大利政府)。 65 个暂存子域名揭示了内部 ML 服务、TigerGraph 和 AAMVA 网关。
- Roblox 嵌入了完整的 Persona SDK 到儿童游戏,带有 NFC 护照读取功能,用户无法退出流程。
- Telesign (Proximus/比利时国有企业) 执行静默网络身份验证,用户不知情。
- 在 25+ 个州、巴西和英国的立法 mandates 创建了强制性的市场。 Meta 花费了 2630 万美元游说,以推动这项立法。
结构性发现:
蒂尔 nexus:收集 + 分析
彼得·蒂尔于 2003 年共同创立了 Palantir Technologies,这是一家在全球范围内运营的监控和数据分析公司,与 CIA、NSA、DHS、ICE、英国国防部和 NHS 等机构签订了合同。 他还领导 Founders Fund,该公司领投了 Persona 的 1.5 亿美元 C 轮融资,并共同领投了 2 亿美元的 D 轮融资 (2025 年 4 月,估值 20 亿美元)。 相同的个人控制监控分析公司和身份验证公司的主要投资者,而该身份验证公司的泄露源代码揭示了向 FinCEN 和 FINTRAC 提交政府报告的能力。
Founders Fund 在巴西的数据足迹
| 公司 |
投资 |
接触数据 |
| Persona |
C 轮领投 (1.5 亿美元)、D 轮共同领投 (2 亿美元) |
通过 Serpro (2.2 亿公民) 的生物识别身份 |
| Nubank |
C 轮领投 (5200 万美元,2016 年 1 月) |
金融交易 (拉丁美洲最大的新银行) |
| Enter |
A 轮共同领投 (3500 万美元,2025 年 9 月) |
法律/诉讼数据 (客户:Itau、Santander、Nubank) |
| Jusbrasil |
未披露 |
法律数据 (75 万名律师,每月 2000 万用户) |
Palantir 的平行运营
| 国家 |
客户 |
数据规模 |
价值 |
| 巴西 |
Grupo Globo |
2+ PB,每天 1 亿观众 |
未披露 (自 2019 年以来) |
| 英国 |
NHS 英国 (FDP) |
110+ 医院信托 |
3.3 亿英镑 (7 年) |
|
|
Show HN: I made a YouTube search form with advanced filters
Okay, I'm ready. Please provide the content you want me to summarize. I will do my best to create a concise and accurate summary in markdown format and Chinese, adhering to the specified constraints (less than 800 words, no personal opinions, focus on purpose/structure/functionality for technical content).
Just paste the content here, and I'll get to work!
|
Microsoft hasn't had a coherent GUI strategy since Petzold
微软 Windows GUI 开发三十年混乱史:总结
这篇文章讲述了过去三十多年来,微软 Windows GUI 开发生态系统陷入混乱的故事,并追溯了其背后的原因。文章的核心观点是,一个平台如果不能在 10 秒内回答“如何构建 UI?”这个问题,就代表其已经失败。
历史回顾:
- 1988-1992: Win32 的清晰答案: Charles Petzold 的 Programming Windows 提供了清晰、权威的 Win32 API 使用指南,为开发者提供了明确的开发路径,形成了 Windows 平台的“策略”。
- 1992-2000: 面向对象狂热: 微软开始引入 MFC、OLE、COM、ActiveX 等技术,试图在 Win32 的基础上进行扩展,然而这导致了开发复杂性的急剧增加,开发者需要自行构建整体解决方案。
- 2003: Longhorn 和 WPF 的希望: Longhorn 项目带来了 WPF,这是一个基于 GPU 加速、使用 XAML 声明式语言的 UI 子系统。 然而,项目被取消重置,并禁止使用 .NET 托管代码,导致了 Windows 团队和 .NET 团队之间的长期冲突。
- 2007-2010: Silverlight 的陨落: WPF 发布后,微软推出了 Silverlight 作为 Flash 的竞争对手。然而,在 MIX 2010 大会上,微软宣布 Silverlight 的重点转向 Windows Phone,并鼓励使用 HTML5,导致 Silverlight 开发者被突然抛弃。
- 2012: Metro 恐慌和双团队战争: 为了应对 iPhone 和 iPad 的冲击,微软推出了 Windows 8 和 Metro,并使用 WinRT 运行时,与 WPF 完全分离。Windows 团队和 .NET 团队各自推广不同的技术,导致开发者困惑。
- 2015-至今: UWP 和 WinUI 的混乱: Windows 10 引入了 UWP,旨在实现跨平台应用开发。然而,由于 Windows Phone 的失败以及微软自身旗舰应用未采用 UWP,UWP 发展停滞。随后,微软不断推出新的技术和 API,包括 WinUI 3、Project Reunion 等,但这些都未能解决根本问题。
当前局面:
文章列举了目前 Windows 平台上的 17 种 GUI 技术,包括:
- 微软原生框架: Win32, MFC, WinForms, WPF, WinUI 3 / Windows App SDK, MAUI
- 微软 Web 混合: Blazor Hybrid, WebView2
- 第三方框架: Electron, Flutter, Tauri, Qt, React Native for Windows, Avalonia, Uno Platform, Delphi, Java Swing/JavaFX
这表明 Windows GUI 开发生态系统已经变得极其混乱,开发者面临着选择困难和技术迁移的挑战。
文章总结:
文章指出,Windows GUI 开发失败的原因主要有三种:团队政治斗争、开发者大会驱动的过早平台赌注、以及业务战略调整导致开发者被抛弃。 虽然技术本身可能优秀,但组织上的失败才是导致混乱的根本原因。
核心教训:
成功的 GUI 平台需要一个可行的成功理论,涵盖整个生命周期,包括采用、投资、维护和迁移。 否则,最终只会陷入三十年的混乱局面。
|
Running Gemma 4 locally with LM Studio's new headless CLI and Claude Code
Google Gemma 4:本地运行的强大选择
本文探讨了使用本地大型语言模型(LLM)的优势,并重点介绍了Google发布的Gemma 4,特别是在本地硬件上的使用。
核心观点:
- 本地模型的优势: 相比于依赖云端API的模型,本地模型无需API费用、数据隐私更有保障、可用性更高,适合快速任务,例如代码审查、草稿撰写和提示测试。
- Gemma 4 的亮点: Gemma 4 采用混合专家(MoE)架构,26B参数的模型每次前向传递仅激活4B参数,使其能在资源有限的硬件上流畅运行。作者在MacBook Pro M4 Pro (48GB) 上运行速度可达每秒51个token。
- Gemma 4 系列模型: Google发布了包含四个模型的Gemma 4系列,目标硬件各异。其中,“E”型号(E2B, E4B)支持音频输入(语音识别和翻译),31B模型性能最强。
- 26B-A4B 的优势: 26B-A4B模型采用MoE架构,虽然拥有128个专家(加上1个共享专家),但每次只激活8个,相当于一个10B参数的密集模型,推理成本与4B密集模型相当,但性能更佳。在MMLU Pro和AIME 2026上的表现接近31B模型,但速度更快。
- LM Studio 的改进: LM Studio 0.4.0引入了
llmster核心推理引擎,支持命令行操作,并具有并行请求处理、状态ful REST API、MCP集成等功能。
- Gemma 4 的硬件需求: 在48GB内存的Mac上,26B-A4B是理想选择,31B模型占用更多内存并运行较慢,E4B模型功能较弱。26B-A4B提供256K最大上下文、视觉支持、工具调用和可配置的思维模式。
- 配置和优化: 通过
lms CLI可以下载、加载、聊天和提供模型服务,并通过--estimate-only参数预估内存需求。Flash Attention可以减少KV缓存的内存使用,提高效率。
- Claude Code 的本地化: 作者通过配置环境变量,将Claude Code连接到本地运行的Gemma 4模型,实现完全离线的代码辅助功能。
- 总结: Gemma 4 26B-A4B是本地LLM的理想选择,结合LM Studio的优化,可以实现高效、隐私安全、低成本的AI应用。
关键技术要素:
- MoE (混合专家): 降低了GPU内存需求,提升了推理效率。
- LM Studio: 提供了易于使用的本地LLM运行和管理平台。
- Flash Attention: 优化了KV缓存,支持更大的上下文窗口。
总而言之,本文介绍了Gemma 4及其在本地环境中的应用,强调了其性能、硬件要求以及使用LM Studio进行优化的方法,为开发者提供了一个强大的本地AI解决方案。
|
Media scraper Gallery-dl is moving to Codeberg after receiving a DMCA notice
Fakku 和 Irodori Comics 的运作模式:一份总结
本文揭示了 Fakku 和 Irodori Comics 的运营模式及其与版权、内容审查和艺术家之间的复杂关系。以下是主要内容的总结:
Fakku 的起源与发展:
- 起源: Fakku 最初由 Jacob 创建,目的是作为 Exhentai 的爬虫,利用其日益增长的受欢迎程度和盈利能力。Jacob 最初依靠学生贷款和销售带有版权作品的商品来维持运营。
- 与 Wanimagazine 的关系: Fakku 曾试图通过向 Wanimagazine 举报 Exhentai 未经授权分享纸质杂志扫描版来吸引用户。结果,Wanimagazine 同时向 Exhentai 和 Fakku 提出了相同的合作方案:成为员工并停止分享未授权内容。Exhentai 拒绝,而 Fakku 接受,并继续分享未授权内容大约一年,直到 Wanimagazine 再次发出最后通牒。
- 公开泄露 Exhentai 所有者的个人信息 (Doxing): Jacob 因 Exhentai 的所有者揭露 Fakku 试图暗中审查内容而公开泄露其个人信息。
- 虚假宣传: Fakku 经常声称支持言论自由、支持艺术家、反对盗版和将版权声明视为审查。当这些说法失效时,他们会承认其行为是为了“合法”地压制用户。
Fakku 的商业模式与操纵:
- 内容限制: Fakku 将已故艺术家的作品置于付费墙之后。
- 募捐行为: 当 Fakku 盈利超过一百万美元后,他们公开募捐 47,000 美元用于购买授权翻译。捐款超过 2500 美元的捐赠者,Jacob 承诺在东京与艺术家会面,但需要捐赠者承担旅行费用。
- 大规模版权移除请求: Fakku 在 2021 年 11 个月内向 Google 发送了超过 4500 万份版权移除请求,并试图通过向新闻媒体发送此类请求来审查对他们的批评。
- 缺乏原则: Fakku 专注于金钱,并经常撒谎,因此缺乏原则性立场。
Irodori Comics 的角色:
- 与 Fakku 的相似性: Irodori Comics 经常重复 Fakku 的反共享谎言,频率更高。
- 拒绝免费合作: Fakku 和 Irodori Comics 不允许任何人免费使用其商店,因此 Fakku 拒绝禁止 Irodori Comics,尽管后者被指控为获得报酬翻译受欢迎作品,在大型论坛中发布 Nhentai 链接,并帮助募集资金进行更多未授权翻译。
- 内容审查与盈利: Fakku 和 Irodori Comics 很少出售他们审查的作品,因为他们实际上会向艺术家收取费用,以代表艺术家发送版权移除请求。
- 潜在的代理关系: 有传言称 Irodori Comics 可能是 Fakku 的代理。Fakku 避免与低质量的翻译、排版和字幕联系在一起。
- 低工资: 据报道,Irodori Comics 的工资远低于最低工资标准。
- 审查数量: Irodori Comics 可能已经审查了 Exhentai 上高达 10 万个画廊。
- 与 Wanimagazine 的联系: 允许 Irodori Comics 翻译自己作品的第一批艺术家,要么是 Wanimagazine 的员工,要么之前是 Wanimagazine 的员工。
- 早期合作: 几年前,Jacob 在 Fakku 上为 Edsel Ayes(EdMX)建立了一个博客。
总结:
总而言之,本文揭示了 Fakku 和 Irodori Comics 之间存在着复杂的、以盈利为导向的运营模式。 他们利用版权移除请求进行内容审查,并可能通过代理关系进行操作。 他们的行为被指责为虚假宣传、压制言论自由,并且缺乏对艺术家的真正支持,而是追求自身利益最大化。
|
The 1987 game “The Last Ninja” was 40 kilobytes
总结:关于X.com (Twitter) 访问问题的提示
这段内容提供了一个简单的提示,说明在使用 X.com (以前的 Twitter) 时可能遇到问题。
主要内容:
- 问题: 用户在使用 X.com 时可能会遇到问题。
- 潜在原因: 某些与隐私相关的浏览器扩展程序可能是导致问题的原因。
- 解决方案: 建议用户禁用这些隐私扩展程序,然后再次尝试访问 X.com。
总结: 如果在使用 X.com 时遇到问题,请尝试禁用你的隐私扩展程序。
|
Is Germany's gold safe in New York ?
德国三分之一黄金储备仍存美联储,引发担忧 (Summary)
核心要点: 德国大约三分之一的黄金储备,价值约1600亿欧元,目前仍存放在纽约联邦储备银行的保险库中。此情况引发了关于跨大西洋金融稳定性和全球经济规则未来的担忧。
详细内容:
- 黄金储备现状: 德国的黄金储备中,约三分之一(价值1600亿欧元)位于纽约联邦储备银行。
- 官方立场: 德国联邦银行官员表示,这些储备受到特别保护。
- 潜在风险: 一些专家担心,美国联邦储备银行领导层的变动可能会改变长期以来的信任规范。
- 更广泛的担忧: 这项讨论突显了更广泛的担忧,即跨大西洋金融稳定以及未来全球经济规则的走向。
总结: 尽管德国联邦银行声称黄金储备受到保护,但大量黄金储备存放在美国,并受到潜在的美国政策变化影响,这引发了对德国、美国乃至全球金融稳定的关注。
|
LibreOffice – Let's put an end to the speculation
LibreOffice 项目历史回顾与现状总结 (LibreOffice Project Historical Overview and Current Status)
本文旨在澄清近期围绕 LibreOffice 项目的讨论和猜测,回顾项目发展过程中的关键事件和问题。以下是主要内容总结:
项目起源与早期挑战 (Project Origins and Early Challenges):
- LibreOffice 项目和 The Document Foundation (TDF) 在 2010 年启动时充满热情,但面临着资源和管理经验的挑战。
- 早期决策中存在一些错误,主要体现在:
- 仅允许生态系统内的公司使用 LibreOffice 品牌,以便在 Microsoft 和 Apple 的在线商店销售软件。
- 将 LibreOffice 的开发合同授予了董事会成员所属的公司,这些公司在招标过程中参与决策。
法律问题与董事会冲突 (Legal Issues and Board Conflicts):
- 上述决策违反了非营利组织法的规定。当法律顾问指出这些问题后,受益公司试图维持现状,而非寻求解决方案。
- 自 2020 年起,董事会内部存在紧张关系,部分原因是新董事会决定终止将 TDF 的任务和资产转移到名为 TDC 的平行组织的项目。
- TDC 项目的设立原因是部分董事认为 TDF 团队效率低下,但未能通过重新组织或培训来解决问题,反而创建了平行结构,加剧了团队之间的矛盾,并试图利用 TDF 的资金作为启动资金。
- 经过多年旷日持久的讨论和指责,审计结果证实必须解决这些问题,否则 TDF 将面临失去非营利组织地位的风险。
董事会利益冲突与解决措施 (Board Conflicts of Interest and Resolution Measures):
- 董事会中存在来自同一公司的员工代表,这进一步延缓了问题的解决。
- 为了解决问题,TDF 采取了限制措施,例如取消了 Collabora 员工的 TDF 会员资格,并冻结了招标。同时,引入了更严格的开发采购政策。
- 这些措施在第三次审计中取得了积极成果,表明董事会愿意打破自 2022 年以来的僵局。
治理改进与未来展望 (Governance Improvements and Future Outlook):
- 董事会回顾了过去的治理问题,并制定了新的规则,以降低未来再次发生类似问题的风险,包括《道德与信托义务准则》、《利益冲突政策》和《社区章程》等。
- TDF 已经为 Collabora 的声明做好了准备,通过招聘开发者和探索新的合作伙伴关系,以支持桌面、云端和移动设备上日益增长的 LibreOffice 需求。
- 由于自由开源软件和开放文档格式标准的日益普及,The Document Foundation 和 LibreOffice 项目在未来具有良好的发展前景。
总结 (Conclusion):
尽管过去几年 LibreOffice 项目经历了一些挑战和争议,但通过采取积极的纠正措施和加强治理,项目正朝着积极的方向发展。TDF 致力于维护 LibreOffice 的开放性和持续发展,并积极应对未来的机遇和挑战。
|
An open-source 240-antenna array to bounce signals off the Moon
MoonRF 项目总结
MoonRF 是一个开源的通信硬件与软件项目,旨在通过利用月球反射信号,赋能大众进行全球通信。该项目已正式更名为 MoonRF。
项目目标:
MoonRF 致力于降低地球-月球-地球 (EME) 通信的门槛,这一直以来是业余无线电爱好者的终极挑战。传统 EME 通信需要大型天线、昂贵的设备和精确的手动指向与跟踪。MoonRF 通过提供开源软件定义相控阵技术,力求让更多人能够体验太空通信的乐趣。
硬件产品:
MoonRF 计划推出一系列低成本的数字相控阵硬件套件,预计于 2026 年 7 月开始发货。
- QuadRF 模块: 这是一个 4 根天线 SDR 模块,可作为独立 SDR 使用,也可用于构建更大的相控阵。主要参数包括:
- 频率:4.9–6.0 GHz (C 波段),全双工
- 每根天线带宽:40 MHz,8+8 位 I/Q
- 发射功率:每根天线 1W
- 接收噪声系数:~1.2 dB
- 极化:Tx (RHCP),Rx (LHCP)
- FPGA:Lattice ECP5,延迟 < 1 ms
- 小型相控阵: 这是一个紧凑、经济实惠的相控阵,旨在提供可观的直接ivity,并用于实验和相控阵技术的实践学习。
- 阵列尺寸:18 个模块 (72 根天线)
- 波束偏转:约 60°
- 预计阵列增益:~34.0 dBi
- EIRP:~52.6 dBW
- 高孔径相控阵: 专为地球-月球-地球 (EME) 实验和射电天文学设计。
- 阵列尺寸:60 个模块 (240 根天线)
- 波束偏转:约 60°
- 预计阵列增益:~39.3 dBi
- EIRP:~63.1 dBW
应用场景:
MoonRF 的硬件产品可用于以下应用:
- EME (月球跳跃) 通信: 传输并接收来自月球的信号,或与其他爱好者进行通信。
- 射电天文学: 例如银河系 C 波段成像、射电天空调查。
- 地面 RF 成像
- 大气和电离层传感实验
- 高级相控阵研究
- 通用 4×4 MIMO 软件定义无线电
- 狐狸狩猎、到达方向 (DOA)、RF 探索
- Open Wi-Fi 路由器、Open 4G/5G 基站
- 无人机高清链路、机器人通信
- 高增益回传链路和定向链路,中继回传
重要说明:
- 所有硬件都需要业余无线电执照 (Technician+ 以上) 才能操作,且可能受到国家限制。
- 该项目不适用于雷达应用,因为缺少雷达应用所需的核心功能,并且受到出口管制限制。
MoonRF 致力于创建一个开放的社区,鼓励大家参与到太空通信的探索之中。
|
Show HN: Real-time AI (audio/video in, voice out) on an M3 Pro with Gemma E2B
Parlor: 实时多模态 AI (Real-time Multimodal AI) 总结
Parlor 是一个研究预览项目,旨在实现设备本地、实时的多模态 AI 交互,用户可以通过语音和视觉与 AI 进行对话。
核心功能:
- 本地运行: 所有处理都在用户设备上完成,无需服务器,消除了服务器成本。
- 语音和视觉交互: 用户可以通过麦克风说话,并使用摄像头展示视觉信息,AI 能够理解并做出回应。
- 多语言支持: 模型支持多种语言,用户可以随时切换到母语。
技术架构:
- 语音和视觉理解: 使用 Google 的 Gemma 4 E2B 模型。
- 文本转语音: 使用 Kokoro 模型。
- 通信: 通过 WebSocket 传输音频 PCM 和 JPEG 帧。
- 语音活动检测 (VAD): 使用 Silero VAD 在浏览器端进行,实现免按键的语音交互。
- Barge-in: 支持在 AI 回答过程中打断并进行新的输入。
- 流式 TTS: 语音开始播放前,AI 已经开始生成回复。
系统要求:
- Python 3.12+
- Apple Silicon 芯片的 macOS 系统,或支持 GPU 的 Linux 系统
- 约 3GB 的可用内存
快速开始:
- 克隆 Parlor 代码仓库:
git clone https://github.com/fikrikarim/parlor.git
- 进入
src 目录:cd src
- 同步依赖并运行服务器:
uv sync && uv run server.py
- 在浏览器中访问
http://localhost:8000,授予摄像头和麦克风权限,即可开始使用。
- 首次运行会自动下载模型(约 2.6GB for Gemma 4 E2B,以及 TTS 模型)。
配置:
MODEL_PATH: 指定 Gemma 4 E2B 模型的本地路径,默认自动从 HuggingFace 下载.
PORT: 服务器端口,默认为 8000。
性能 (Apple M3 Pro):
- 语音和视觉理解:大约 1.8-2.2 秒
- 响应生成 (约 25 个 token):大约 0.3 秒
- 文本转语音 (1-3 句话):大约 0.3-0.7 秒
- 端到端延迟:大约 2.5-3.0 秒
- GPU 解码速度:大约 83 token/秒
项目结构:
src/server.py: FastAPI WebSocket 服务器 + Gemma 4 推理
src/tts.py: 平台相关的文本转语音模块 (MLX on Mac, ONNX on Linux)
src/index.html: 前端 UI (VAD, 摄像头, 音频回放)
src/pyproject.toml: 依赖项
src/benchmarks/: 包含端到端 WebSocket 基准测试和 TTS 后端比较的脚本。
鸣谢:
许可证:
Apache 2.0 LICENSE
|
Copilot is 'for entertainment purposes only', per Microsoft's terms of use
微软 Copilot 使用条款引发关注:仅供娱乐,不可作为重要建议
核心内容概要:
本文报道了微软 Copilot 的使用条款引发的讨论。尽管微软正积极推动企业客户购买 Copilot 服务,但其使用条款中明确声明 Copilot “仅供娱乐目的”,并警告用户其可能出错,不可依赖其提供重要建议,用户需自行承担风险。
主要细节:
- 条款内容: 微软 Copilot 的使用条款(最后更新于 2025 年 10 月 24 日)明确指出 Copilot 仅用于娱乐,可能存在错误,不应作为重要建议的来源。
- 微软回应: 微软发言人表示,这些条款属于“遗留语言”,将在下一次更新中进行修改,以更好地反映 Copilot 的当前使用情况。
- 行业普遍现象: 微软并非唯一使用此类免责声明的公司。OpenAI 和 xAI 等其他 AI 公司也提醒用户不要将 AI 输出视为绝对的事实或唯一信息来源。
- 背景: 报道出现于微软积极推动 Copilot 商业化的背景下,强调了 AI 公司自身对 AI 模型输出可靠性的担忧。
总结:
尽管 AI 技术快速发展,但 AI 公司自身也承认其存在局限性,并提醒用户在使用 AI 工具时保持谨慎,不要盲目信任其输出结果。微软 Copilot 的使用条款就是一个典型的例子,体现了 AI 行业对模型准确性和用户风险意识的关注。
|
In Japan, the robot isn't coming for your job; it's filling the one nobody wants
物理 AI:日本应对劳动力短缺的产业革新 (Physical AI: Japan's Industrial Revolution to Address Labor Shortages)
本文探讨了日本正在兴起的物理 AI 领域,以及其背后的驱动因素、独特策略和未来发展趋势。
背景与目标:
日本正面临人口老龄化和劳动力短缺的严峻挑战。为了应对这些问题并维持产业竞争力,日本政府将发展物理 AI 产业作为国家战略,目标到 2040 年占全球市场份额的 30%。日本在工业机器人领域已具优势,2022 年占全球市场约 70%。
驱动因素:
- 劳动力短缺: 人口持续下降,适龄劳动力比例不断降低,使得企业不得不寻求自动化解决方案以维持运营。
- 文化接受度: 日本社会对机器人技术的接受度较高。
- 工业基础: 日本在精密机械、传感器和控制系统等硬件领域拥有强大的工业基础。
日本与美、中差异:
- 日本优势: 日本在机器人核心组件(如执行器、传感器和控制系统)方面具有优势,尤其是在机器人运动控制方面。
- 美国优势: 美国在软件和服务层面上更具优势,并擅长整合硬件、软件和数据。
- 中国优势: 中国在硬件制造方面实力雄厚。
- 新模式: 日本倾向于将软件与硬件深度整合,避免美国依赖亚洲供应商的模式。
关键技术与应用:
- 软件控制平台: 像Mujin这样的公司正在开发软件控制平台,使现有硬件能够更自主、高效地执行任务。
- 全栈解决方案: WHILL 公司结合了电动车辆、传感器、导航系统和云端管理,提供自主出行解决方案。
- 应用领域: 物理 AI 的应用正在从工业自动化扩展到物流、设施管理、国防等领域。例如,自动化叉车、仓库系统、数据中心巡检机器人等。
- 混合模型: 软银等公司正在将视觉-语言模型与实时控制系统相结合,使机器人能够自主理解环境并执行复杂任务。
政府支持:
日本政府已承诺投入约 63 亿美元,用于加强核心 AI 能力、推进机器人集成和支持产业部署。
投资趋势:
投资正在从硬件转向软件、数字孪生、模拟工具和集成平台等领域。
未来展望:
- 混合生态系统: 预计日本的物理 AI 生态系统将形成一种混合模式,大型企业提供规模和可靠性,而初创公司则推动软件和系统设计方面的创新。
- 互补合作: 初创公司和大型企业将形成互补合作关系,大型企业利用其资产和专业知识,初创公司提供颠覆性创新。
- 可防御价值: 部署、集成和持续改进将成为最具可防御价值的关键领域。
总而言之,日本将物理 AI 视为应对劳动力短缺、维持产业竞争力的关键战略,并正在积极推动其发展和应用。
|
Bacteria found in the human intestine capable of improving muscle strength
格拉纳达大学参与研究,揭示细菌与身体状况改善的关联
这项发现可能导致开发益生菌,帮助老年人维持力量和健康
研究成果已发表在著名科学期刊《Gut》上
格拉纳达大学的研究人员与阿尔梅里亚大学、荷兰莱顿大学医学中心(LUMC)的研究人员合作,共同发现了一种名为 Roseburia 属的肠道细菌与更强壮的肌肉和更好的身体状况相关联。
这项研究支持了肠道-肌肉轴的概念。格拉纳达大学体育与运动科学系教授、联合大学体育与健康研究所(iMUDS)研究员 Jonatan Ruiz 表示:“我们的研究结果提供了确凿的证据,证实了肠道-肌肉轴的存在,这种已识别的细菌能够积极调节肌肉代谢和肌肉力量。”
研究人员还观察到,在老年人中,这种细菌的丰度比年轻人少,这表明其水平可能随着年龄的增长而降低,而年龄增长通常伴随着肌肉质量的流失。
阿尔梅里亚大学研究员 Borja Martínez Téllez 解释说:“这为利用这种细菌作为益生菌来帮助老年人保持肌肉力量打开了可能性。”
肠道细菌与肌肉表现之间的关系
研究团队分析了某些肠道微生物是否与肌肉力量和身体状况相关。为此,他们研究了 90 名健康年轻成人(18-25 岁)和 33 名老年成人(65 岁或以上)的粪便样本。
实验参与者还进行了多项身体健康测试,包括握力、腿部力量和上肢力量(胸肌),以及测量最大氧气消耗量,该指标是心肺功能的重要指标。
在检测到的众多细菌群体中,Roseburia 属尤为突出,其丰度与肌肉质量和力量的增加相关。特别是,一种菌种——Roseburia inulinivorans —与身体健康状况表现出关系。
在存在这种细菌的老年人中,实验中握力比没有检测到这种细菌的人增加了 29%。在年轻成年人中,这种细菌的丰度增加与更大的握力以及更高的心肺功能相关。
Roseburia 属的其他菌种也显示出不同的模式:Roseburia intestinalis 与年轻成人的腿部和上肢力量相关,而 Roseburia faecis 和 Roseburia hominis 与研究的指标没有显著关联。
评估肠道-肌肉的联系
为了探索 Roseburia 是否能直接影响肌肉功能,研究人员进行了小鼠实验。在暂时用抗生素降低其肠道微生物群后,每周给动物一次人类来源的细菌。
接受这种细菌治疗的小鼠在它们的四肢握力方面比未接受治疗的动物增加了约 30%。
此外,小鼠的肌纤维更大,并且在小腿的 soleus 肌肉中,II 型肌纤维(快速收缩的肌纤维)的比例更高,这些纤维对力量和爆发力至关重要。这些变化也伴随着与肌肉能量产生相关的蛋白质和酶的代谢改变。
局限性
研究人员指出了一些局限性。在小鼠实验中,人类来源的 Roseburia 菌种未能永久性地在肠道中定殖,并且该研究没有直接评估某些生物学机制,例如炎症通路或神经肌肉信号。 因此,需要进行长期研究来确定 R. inulinivorans 水平的变化是否会导致肌肉功能改善,或者仅仅是其结果。
这项研究由阿尔梅里亚大学护理、物理治疗和医学系的研究员 Borja Martínez-Téllez 领导,与格拉纳达大学教授 Jonatan Ruiz 和莱顿大学医学中心研究员 Patrick CN Rensen (LUMC) 合作。来自格罗宁根大学(荷兰)、以及西班牙瓦伦西亚和卡迪斯的其他机构的科学家也参与了这项工作。 该项目由马丁·埃斯库德罗基金会、卡洛斯三世健康研究所的健康研究基金和莱顿大学基金会资助。
参考文献:
Martinez-Tellez B, Schönke M, Kovynev A, Garcia-Dominguez E, Ortiz-Alvarez L, Verhoeven A, Gacesa R, Vich Vila A, Ducarmon QR, Jimenez-Pavon D, Gomez-Cabrera MC, Weersma R, Smits WK, Giera M, Ruiz JR, Rensen PCN. Roseburia inulinivorans increases muscle
|
Show HN: I built a tiny LLM to demystify how language models work
GuppyLM 项目总结
GuppyLM 是一个小型语言模型,模拟一条名叫 Guppy 的小鱼。它的主要目标是展示训练语言模型并非高深莫测,不需要博士学位或大型 GPU 集群,只需要一个 Colab 笔记本和几分钟即可完成。
核心特点:
- 模型大小: 约 900 万参数。
- 角色设定: 模拟一条小鱼,用简短的、小写的句子描述水、食物、光线和水箱生活。
- 训练数据: 使用 6 万条合成对话数据,涵盖 60 个主题。
- 运行环境: 可以在单个 GPU 上运行,训练时间约为 5 分钟,模型体积小,可以在浏览器中运行。
- 目的: 旨在揭示大型语言模型的工作原理,消除“黑盒”感。
架构:
GuppyLM 采用标准的 Transformer 架构,没有使用 GQA、RoPE、SwiGLU 等复杂技术。主要参数如下:
- 参数量: 870 万
- 层数: 6
- 隐藏维度: 384
- 注意力头数: 6
- 前馈网络 (FFN): 768 (ReLU)
- 词汇量: 4,096 (BPE)
- 最大序列长度: 128 个 token
- 归一化: LayerNorm
- 位置编码: 学习到的嵌入
个性:
Guppy 的个性特点包括:
- 使用简短的小写句子
- 通过水、温度、光线、震动和食物来体验世界
- 不理解人类的抽象概念
- 友好、好奇、略显笨拙
- 经常思考食物
快速上手:
- 浏览器试用: 通过 WebAssembly 在浏览器中直接运行,无需安装。
- Colab 聊天: 在 Colab 中运行预训练模型进行聊天。
- 自定义训练: 使用提供的 Colab 笔记本自行训练模型。
- 本地聊天: 通过命令行工具进行本地聊天。
数据集:
- 名称: arman-bd/guppylm-60k-generic
- 样本数量: 6 万个 (5.7 万个训练样本,3 千个测试样本)
- 格式: {"input": "...", "output": "...", "category": "..."}
- 主题数量: 60 个
- 生成方式: 通过模板合成
项目结构:
项目包含以下主要模块:
config.py: 模型和训练的超参数
model.py: 标准 Transformer 模型
dataset.py: 数据加载和批处理
train.py: 训练循环
generate_data.py: 会话数据生成器
eval_cases.py: 评估测试用例
prepare_data.py: 数据预处理和 tokenizer 训练
inference.py: 聊天界面
tools/: 包含辅助工具,如 Colab 笔记本生成、ONNX 模型导出、数据集上传等。
docs/: 包含浏览器演示、下载脚本、模型文件和 tokenizer 文件。
设计决策:
GuppyLM 的设计决策包括:
- 没有系统提示: 训练样本使用相同的系统提示,简化模型设计。
- 单轮对话: 多轮对话由于上下文窗口限制,质量下降。
- 标准 Transformer 架构: 避免使用复杂技术,简化代码。
- 合成数据: 确保训练数据的持续性和一致性。
许可证:
MIT 许可证。
|
|
Music for Programming
https://musicforprogramming.net
|
|
Employers use your personal data to figure out the lowest salary you'll accept
https://www.marketwatch.com/story/employers-are-using-your-personal-data-to-figure-out-the-lowest-salary-youll-accept-c2b968fb
|
OpenAI's fall from grace as investors race to Anthropic
OpenAI 股票市场遇冷,Anthropic 备受追捧:总结
本文主要讲述了 OpenAI 在二级市场遭遇需求下降,而其主要竞争对手 Anthropic 的股票却备受投资者追捧的现象。以下是主要内容总结:
OpenAI 股票市场现状:
- 需求锐减: 尽管 OpenAI 近期成功融资 1220 亿美元,但二级市场上对 OpenAI 股票的需求大幅下降,甚至出现无人愿意接手的局面。
- 大量抛售: 多个机构投资者(包括对冲基金和风险投资公司)试图在二级市场出售价值约 6 亿美元的 OpenAI 股票,但未获得买家。
- 估值下调: Next Round Capital 看到 OpenAI 的报价为 7650 亿美元,较之前的 8500 亿美元估值下降了 10%。
Anthropic 股票市场火爆:
- 需求旺盛: 多个二级市场平台(如 Augment 和 Hiive)都记录到对 Anthropic 的巨大需求。
- 估值飙升: 投资者认为 Anthropic 的估值有望赶上 OpenAI,因此积极抢购 Anthropic 股票。Augment 和 Next Round 都看到 Anthropic 股票的报价高达 6000 亿美元,比上一轮融资高出 50% 以上。Hiive 注册了超过 16 亿美元的 Anthropic 股票需求。
- 资金涌入: 投资者准备部署的资金主要流向 Anthropic,有 20 亿美元的现金准备用于投资 Anthropic。
原因分析:
- 风险回报: 投资者认为 Anthropic 的风险回报比更高,因为其估值尚未达到 OpenAI 的水平,且在企业客户市场表现更佳。
- 运营成本: OpenAI 的运营成本高昂,且在吸引高利润的企业客户方面进展缓慢。
- 增长潜力: Anthropic 在高利润的企业市场占据主导地位,增长轨迹似乎比 OpenAI 更强劲。
其他信息:
- 公司立场: OpenAI 不认可二级市场交易,并认为这违反了其转让限制。
- 银行行为: 摩根士丹利和高盛等银行开始向客户提供 OpenAI 股票,但高盛对 Anthropic 股票收取通常的利润分成费用(约 15%-20%)。
- 未来展望: 两家公司都计划上市,OpenAI 的上市预计最早可能在今年。
- Anthropic 面临的挑战: Anthropic 面临美国国防部的诉讼,以及近期出现的内部源代码泄露事件。
总而言之,投资者正在从 OpenAI 转向 Anthropic,反映了对 AI 公司增长潜力、运营效率和市场定位的重新评估。
|
Show HN: Gemma Gem – AI model embedded in a browser – no API keys, no cloud
Gemma Gem 概述
Gemma Gem 是一个浏览器扩展程序,它利用 Google 的 Gemma 4 模型,直接在设备上运行,无需 API 密钥或云服务,保障用户数据隐私。它允许用户在浏览网页时进行交互,例如提问、执行操作等。
核心功能:
- 本地运行 AI 助手: Gemma Gem 将 Gemma 4 模型完全在本地运行,无需网络连接。
- 网页交互: 用户可以提问关于当前网页的问题,或要求执行特定操作(例如点击按钮、输入文本、滚动页面等)。
- 无数据泄露: 所有处理都在本地进行,用户数据不会离开设备。
技术架构:
Gemma Gem 采用分层架构,主要由以下组件构成:
- Offscreen Document: 托管 Gemma 4 模型(通过
@huggingface/transformers + WebGPU),并运行智能体循环。
- Service Worker: 作为消息路由器,在内容脚本和 Offscreen Document 之间传递消息。 负责
take_screenshot 和 run_javascript 功能。
- Content Script: 注入 Gemma Gem 图标和 Shadow DOM 聊天界面。 执行 DOM 工具,例如
read_page_content、click_element、type_text 和 scroll_page。
可用工具:
read_page_content: 读取页面文本或 CSS 选择器的内容。
take_screenshot: 捕获可见页面的 PNG 截图。
click_element: 通过 CSS 选择器点击元素。
type_text: 通过 CSS 选择器在输入框中输入文本。
scroll_page: 通过像素量向上或向下滚动页面。
run_javascript: 在页面上下文中执行 JavaScript 代码,并拥有完整的 DOM 访问权限。
设置选项:
用户可以通过聊天头部的齿轮图标调整以下设置:
- 模型: 在 Gemma 4 E2B (约 500MB) 和 E4B (约 1.5GB) 之间切换。
- 思考: 启用或禁用 Gemma 4 的 “思考” 功能。
- 最大迭代次数: 限制工具调用循环的次数。
- 清除上下文: 重置当前页面的对话历史记录。
- 禁用此站点: 按域名禁用扩展程序。
技术栈:
- WXT: Chrome 扩展框架 (基于 Vite)。
- @huggingface/transformers: 浏览器端机器学习推理。
- marked: 聊天界面 Markdown 渲染。
- Gemma 4 E2B / E4B: 量化为 q4f16,上下文长度为 128K。
调试:
日志以 [Gemma Gem] 开头。开发版本显示详细日志,生产版本仅显示错误。可以通过 chrome://extensions 页面访问 Service Worker 和 Offscreen Document 的日志。
要求:
- Chrome 浏览器,支持 WebGPU。
- 约 500MB 的磁盘空间用于 E2B 模型,约 1.5GB 用于 E4B 模型(首次运行会缓存)。
|
Musician says AI company is cloning her music, filing claims against her
总结:关于X.com (Twitter) 访问问题的提示
这段内容提供了一个简单的提示,说明在使用 X.com (以前的 Twitter) 时可能遇到问题。
主要内容:
- 问题: 用户在使用 X.com 时可能会遇到问题。
- 潜在原因: 某些与隐私相关的浏览器扩展程序可能是导致问题的原因。
- 解决方案: 建议用户禁用这些隐私扩展程序,然后再次尝试访问 X.com。
总结: 如果在使用 X.com 时遇到问题,请尝试禁用你的隐私扩展程序。
|