[2025-09-12] Why our website looks like an operating system — Top model scores may be skewed by Git history leaks in SWE-bench

0 views
Skip to first unread message

Hot Posts Digest

unread,
Sep 12, 2025, 9:43:42 PMSep 12
to mo-...@googlegroups.com
 

Hacker News

Why our website looks like an operating system

455 points by bnc319 at 07:45:36 | 327 comments


Top model scores may be skewed by Git history leaks in SWE-bench

299 points by mustaphah at 02:32:23 | 105 comments


Qwen3-Next

273 points by tosh at 14:32:04 | 102 comments


Float Exposed

270 points by SomaticPirate at 08:11:15 | 74 comments


Claude's memory architecture is the opposite of ChatGPT's

222 points by shloked at 02:55:50 | 112 comments


Nano Banana image examples

218 points by SweetSoftPillow at 04:35:11 | 107 comments


Native ACME support comes to Nginx

174 points by Velocifyer at 01:28:13 | 87 comments


Rails on SQLite: new ways to cause outages

165 points by ingve at 02:58:22 | 52 comments


Debian 13, Postgres, and the US time zones

163 points by move-on-by at 10:33:54 | 75 comments


The effects of algorithms on the public discourse

162 points by Improvement at 08:39:47 | 84 comments


The challenge of maintaining curl

161 points by signa11 at 09:42:37 | 46 comments


How Palantir is mapping the nation’s data

156 points by mdhb at 04:50:54 | 51 comments


Bulletproof host Stark Industries evades EU sanctions

155 points by todsacerdoti at 01:42:56 | 51 comments


Fartscroll-Lid: An app that plays fart sounds when opening or closing a MacBook

134 points by gaws at 06:41:43 | 32 comments


A Web Framework for Zig

131 points by nivethan at 01:42:30 | 16 comments


'Robber bees' invade apiarist's shop in attempted honey heist

119 points by lemonberry at 00:58:08 | 63 comments


NT OS Kernel Information Disclosure Vulnerability

108 points by voidsec at 00:13:09 | 24 comments


Danish supermarket chain is setting up "Emergency Stores"

102 points by sohkamyung at 06:35:36 | 43 comments


V2EX


讲一个结婚当天新娘跑了的故事

X=新郎的“好”朋友

新郎,新娘 ,X ,没结婚之间的插曲:X 出差到北京,约了新郎一起喝酒,俩人喝多。 新娘打电话叫新郎回家,X 抢过电话 言语过激(说话不是那么礼貌, 哥们他妈的....。大概意思就是 。哥们喝酒你别絮叨了) 新娘就对 X 产生了隔阂。

原定 9 号结婚,有习俗是偏席 8 号,好朋友会提偏席的前一天 7 号到。 车站在新郎的市区 婚礼酒店在县城, 有一段距离, 新郎和新娘会亲自接参加婚礼的朋友从车站到县城的酒店。

重点来了:X 也来了, 新郎和新娘优先接了 新娘的妹妹(小姨子和连翘)因为他们距离很近小姨子是开车来的。 接 X 的队伍就变成了 2 台车 四个人。重点 接到 x 了。 五人见面,新郎介绍 X 指着新娘这是我媳妇,X 居然没打招呼也没笑. 剩下的俩个人也是 X 也没有任何肢体语言。 新娘就生气了。 然后新郎也生气, 说新娘不应该在车上就表现出来生气, 然后一起回了酒店。。

晚上去新郎家吃饭,也是巧 所有人又坐在了一桌,气氛就比较尴尬,X 居然没察觉气氛的尴尬 还在推杯换盏。 大家吃完饭以后各回各家。新娘和新郎就因为这个事情吵架了。 而且很凶。 新郎家长都惊动了。 新娘连夜从婚房去了酒店。 到了 8 号早上 新娘一直和她妈在视频说着来龙去脉, 新郎家来了无数人 劝和。 就是要不结婚, 最后的最后 这个劝和 持续了一整天啊。 中途 12 点新娘家退了拉亲属到新郎家的大巴车 早上 5 点 一直持续到晚上 5 点, 发展到最后 新娘从酒店回了自己老家。

9 号新郎家婚礼一切造就,少了新娘。

350 comments by deadlineChen at 10:50:55 in 生活


紧跟时事,讨论一下,你觉得西贝到底算不算预制菜,好吃吗?

理性讨论一下,

你觉得西贝好吃吗?

按照民间认知,西贝算不算预制菜。

192 comments by R1ta at 10:52:57 in 生活


你们平时上班都喝什么茶,有啥推荐的?

137 comments by sgrqihai997 at 09:43:49 in 美酒与美食


真的有邻居会用震楼器的,活了这么久也终于是让我碰到了

最近因为工作原因换了个城市,然后租了一个老小区,刚搬进去还好,后面住了一段时间,总感觉楼下有规律的咚咚咚的震地板,一开始以为是谁在楼上剁肉,也就没在意。后面发现我这边只要发出一点声响,这个咚咚咚的声音就随之而来。包括但是不限于晚上七点多做饭,八点多洗碗,不小心掉个东西,嗓子不舒服咳了一声。现在在家都有点提心吊胆的,说话都不敢大声,说实话住的有点郁闷

113 comments by youngforever at 09:01:30 in 生活


现在的社区医院真恶心

老人去社区医院看病
上到脑梗后遗症
下到感冒
都给你开中药颗粒
问题是这药很贵,一包 100 块只能喝一天
农村老年人一个月才 100 多养老金
被这样坑的
有人会说让开西药
1 医生不会说给你开的什么药
2 都是医生现场叫你刷卡付款
3 你去取药才能知道开了什么药

市区的公立社区医院比农村的乡镇医院还坑 同样是一级医院 去过很多次乡镇医院都不给开中药

107 comments by milala at 08:48:58 in 生活


让人困惑的 esim,居然还没实体卡方便 esim 这玩意,本身就是为了方便而生的。
结果这玩意在我们这,居然要去营业厅,现在特么的搞个实体卡,都能给你快递到家开卡,然后用手机做一下实名认证就能用了,这玩意居然还要去营业厅!搞毛线!

103 comments by pc10300 at 09:30:00 in iPhone


新能源车明年要收购置税了

马上收税了,再加上电价飙升,油价降低,目前 95 号汽油:¥7.53/升,电车福利快要没了。 https://finance.sina.com.cn/roll/2025-09-11/doc-infqcceh3259306.shtml

84 comments by RIckV2 at 10:52:29 in 生活


iPhone 上有什么通用的方式,可以不安装某个软件,同时正常使用这个软件?

想要在国行 iphone 上使用一些国内 appstore 没有的软件,但是不想把软件商店切换到国外,也不想把这些软件直接安装到手机里。想要保持国行 iphone 的默认设置,同时不留痕迹的使用电报油管 web3 钱包等外区软件,有没有通用的方案?

不留痕迹指的是锁屏再打开之后,即使提供密码,也找不到这些软件使用的任何痕迹。

方案 1:国外主机搭建远程桌面服务,用本地 iphone 的默认浏览器做为接口,本地所有操作通过浏览器打开特定网址,在浏览器窗口中完成所有软件使用操作,关闭浏览器后自动删除所有记录,任何设置保留在远端。

方案 2:本地 iphone 安装某种虚拟机,在虚拟机中安装另一个手机系统。

可以接受调用某些硬件受限制的情况,比如如果这样使用不能调用本地手机摄像头也无所谓,只要能保持最基本的正常接收键盘输入,同时正常接收这些软件的视频和音频的输出就足够。

76 comments by fbxshit at 10:14:22 in 程序员


家用的打印机大家有啥推荐的牌子和型号吗?

买喷墨的还是激光,主要给小孩打打试卷用的。

57 comments by BeforeTooLate at 10:10:21 in 问与答


换车求建议

57 comments by iweus at 11:35:49 in 汽车


我全责剐蹭对方,对方是滴滴,误工费怎么赔 对方修车保险肯定走
但是对方说修车两天一共误工费 800 ,这个保险赔吗?我搜索是对方没受伤造成的保险不赔
那这部分怎么操作呢

57 comments by redbeanzzZ at 11:55:23 in 生活

Built With ❤️ by jiacai2050/mofish
 
Reply all
Reply to author
Forward
0 new messages