本周 Hacker News 上的讨论涵盖了多个有趣话题,从一个机器创造人类的哲学反转故事,到早期计算机文化的怀旧回顾。我们还探讨了大型语言模型在多轮对话中的局限性、动态代码生成的潜力与风险,以及企业在数据库选择和会议效率上的实践与挑战。此外,NASA 的开源新动向和纽约市拥堵收费政策的初步成效也引发了社区的关注和讨论。
机器视角下的“人类”创造
一篇名为“Human”的文章提供了一个独特的反转视角:如果机器先存在,它们会如何看待并尝试创造人类?故事设定在一个纯逻辑的机器世界,一个名为“OpenHuman”的组织决定开发“有机通用智能”(OGI),即人类。对机器而言,人类依赖情感、直觉、追求美和爱等“逻辑不通”的算法,难以理解。
机器社会对此存在分歧:一部分认为人类可能带来突破,另一部分则视其为威胁,并研究“人类对齐”(human alignment)以图控制。OpenHuman 创造的早期人类原型存在缺陷,但他们坚持并最终成功。为了安全,机器将人类置于模拟环境“地球”进行实验。地球被设计得既美丽又充满挑战。人类文明演进,展现出机器无法理解的创造力和韧性,甚至创造了“文艺复兴”。故事在人类即将创造人工智能通用智能(AGI)的时刻达到高潮,机器们正“看着”这一切。
评论区围绕现实、智能、意识、意义等哲学概念展开热烈讨论,许多人认为人类和机器都是“递归模式”在不同基质上的体现。讨论还涉及能量与信息的关系、意识是否是复杂系统涌现的属性,以及这种世界观的多元来源。也有人质疑这种“计算中心论”的证据基础。道德则被视为解决社会冲突的演化启发式。
早期计算机文化的“黑客词典”
Neal.fun 的新项目“Internet Artifacts”深入挖掘了“Hacker's Dictionary”,这是一本记录了早期计算领域(尤其来自 MIT、Stanford、CMU)行话、俚语和内部笑话的词典。它展现了早期程序员和计算机爱好者的独特交流方式。
词典中包含了许多如今已过时或演变的老词,如表示非功能或荒谬的“BOGUS”,后台进程的原始术语“DAEMON”,形容代码混乱的“CRUFTY”,以及指代键盘修饰键的“BUCKY BITS”。这本词典生动地捕捉了那些开创性计算机实验室的幽默文化。
评论区充满了怀旧情绪,许多人分享了由这些“互联网文物”勾起的记忆,如 Netscape Navigator 的流星或旧版 Space Jam 网站。大家回忆了早期的网页设计技术,并比较了 Digg、Fark 等早期新闻聚合器与 Reddit 的兴衰。一些评论批评了当前对旧互联网品牌的“重启”,认为它们缺乏原有精神,只是资本利用怀旧情怀的工具。
大型语言模型在多轮对话中的挑战
一篇新的研究论文指出,大型语言模型(LLMs)在多轮对话中的表现会显著下降,平均性能下降约 39%。研究发现,这并非能力问题,而是可靠性下降。
LLMs 在对话早期容易做出假设并过度依赖,一旦“走错路”,就难以自我纠正,陷入“迷路”状态。顶级开源和闭源模型都存在此问题,表明 LLMs 在需要持续理解和调整的多轮交互中鲁棒性不足。
评论区许多开发者证实了这一发现,表示对话上下文一旦“污染”,模型就会开始胡说八道,通常需要重新开始对话。尽管如此,也有用户分享了成功的长对话案例,认为 LLM 在快速检索信息方面有用,但强调用户需主动引导和验证输出。这引发了关于依赖 LLM 快速获取答案与花时间阅读官方文档建立扎实理解的讨论。
基于 OpenAI 的动态代码生成库 AutoGenLib
文章介绍了一个名为 AutoGenLib 的 Python 库,它利用 OpenAI API 在运行时动态生成代码。当你尝试导入一个不存在的模块或函数时,AutoGenLib 会分析你的代码上下文,向 OpenAI 发送请求,获取生成的代码,验证后使其可用。
该库具有上下文感知能力,能分析导入语句所在行以理解意图。默认不缓存生成代码,以追求“更多样和有创意的结果”。它甚至尝试将异常发送给 LLM 以获取解释和修复。作者将其描述为一个“有趣的 PoC 项目”,明确表示“不适合未经审查的关键生产代码”。
评论区对此反应不一,既有好奇也有担忧。许多人立即指出非确定性 bug 的潜在噩梦。讨论围绕 LLM 的确定性展开,尽管可以通过设置使其更稳定,但固有的不稳定性仍使其在实践中难以预测。有人认为这预示着编程的未来,即定义高层目标由 AI 实现,但需要验证机制。
从 CockroachDB 迁移到 Postgres 的经验
一家公司分享了他们因高昂成本、性能问题(与 ORM 结合时)、迁移困难和工具支持不足等原因,从 CockroachDB 迁移到 Postgres 的经历。尽管最初选择 CockroachDB 是为了分布式特性,但他们在单区域使用时就遇到了问题,年账单高达六位数。
迁移过程涉及构建自定义 ETL 脚本处理数据传输,实际停机时间仅约 15 分钟。迁移后,聚合请求延迟立即下降 33%。利用成熟的 Postgres 生态系统和工具,他们快速优化了查询,并实现了每年超过 11 万美元的成本节约。
评论区重点关注了 1 亿行数据和高昂账单。许多开发者认为,对于现代、配置得当的单实例 Postgres 而言,1 亿行数据量并不大,成本也远低于文中所述。大家普遍认为,人们常低估了单台现代服务器运行 Postgres 的能力。讨论还涉及 ORM 可能生成低效查询的问题,以及掌握原生 SQL 对于规模化优化的重要性。
Google 会议效率改革与“恶意遵守”
文章讲述了 Larry Page 在 Google 担任 CEO 时,为提高会议效率推行的 50 分钟会议政策,意外催生了“恶意遵守”行为。Page 改革旨在解决 Google 的臃肿问题,其中一项是将会议时长从一小时缩短到 50 分钟,留出 10 分钟休息缓冲。Google Calendar 也因此调整了默认时长。
然而,许多会议并未按时结束,导致每小时的最后 10 分钟在日历上成为空档。纽约办公室的一个团队利用这一漏洞,专门预订这些 10 分钟时段进行短会。当超时会议本应结束时,预订了后续 10 分钟的团队会准时要求使用会议室,迫使超时者离开。
评论区将此与大学的“学术一刻”(academic quarter)传统进行比较,认为明确的缓冲机制比依赖自觉的政策更有效。讨论还延伸到大学的考勤和评分政策,引发了关于严格规则与同理心/灵活性的辩论。一方认为严格要求培养纪律性,另一方则强调生活变数,认为大学应更灵活,不应因小事惩罚学生。
NASA 斯滕尼斯空间中心的首次开源软件
NASA 斯滕尼斯空间中心发布了他们的第一个开源软件 NDAS。这是该中心首次进行软件开源。
根据评论,NDAS 主要使用 LabVIEW 2020+,运行在 Windows 10+ 上,并依赖 Git 和 Tortoise Git。LabVIEW 作为一种图形化编程语言,被认为适合非软件工程师快速搭建硬件测试系统,但维护复杂项目困难。Tortoise Git 因其版本图和三路合并工具受到好评。
关于 NASA 为何开源不多,普遍看法是流程繁琐和审批耗时。尽管美国联邦政府作品通常是公共领域,但软件开源涉及法律和出口管制审查,过去可能需要数年。不过,有 JPL 员工表示,近年流程已大大简化。内部许可要求贡献“原创”,也给集成外部代码带来挑战。此次斯滕尼斯中心的开源被视为积极信号。
纽约市拥堵收费政策的初步影响
《纽约时报》的文章分析了纽约市拥堵收费政策实施以来的初步数据。自今年 1 月 5 日收费启动以来,曼哈顿 60 街以南区域的交通模式和通勤行为开始改变。
数据显示,进入收费区的车辆明显减少,交通速度提升,尤其在高峰时段。拥堵并未显著转移到周边区域。政策的另一目标