技术分享归档 - 第11页共18页 - 枫选

技术分享归档 - 第11页共18页 - 枫选-枫选-第11页

Bambu Lab向OrcaSlicer开发者发律师函，维修权博主Rossmann承诺支付1万美元法律费用-枫选

Bambu Lab向OrcaSlicer开发者发律师函，维修权博主Rossmann承诺支付1万美元法律费用

3D打印机厂商Bambu Lab向开源切片软件OrcaSlicer开发者发律师函，维修权博主Louis Rossmann承诺出资1万美元帮助应对。开源与商业利益的冲突再次引发社区热议。

迪滴36天前

03310

ClojureScript 终于支持 async/await：1.12.145 版本重要更新-枫选

ClojureScript 终于支持 async/await：1.12.145 版本重要更新

ClojureScript 发布 1.12.145 版本，正式支持 JavaScript async 函数，开发者可以通过 ^:async 标记直接使用 async/await 语法，无需额外依赖。

# 编程语言 # ClojureScript # async/await

迪滴38天前

04010

Linus 怒了：AI 自动生成漏洞报告让 Linux 安全邮件列表几乎无法管理-枫选

Linus 怒了：AI 自动生成漏洞报告让 Linux 安全邮件列表几乎无法管理

Linux 内核创始人 Torvalds 在周报中严厉批评 AI 漏洞报告泛滥问题：不同研究者用相同 AI 工具发现相同漏洞，重复报告让安全邮件列表几乎无法管理。本文分析问题原因和对开发者的启示。

迪滴28天前

02310

小米17 Pro Max外观曝光：2亿像素+骁龙8 Elite 2，年底旗舰之争提前打响-枫选

小米17 Pro Max外观曝光：2亿像素+骁龙8 Elite 2，年底旗舰之争提前打响

小米17 Pro Max外观设计曝光，后摄模组优化、窄边框全面屏、陶瓷/素皮材质。预计搭载骁龙8 Elite 2处理器、2亿像素主摄和6000mAh大电池，2026年底或2027年初发布。

迪滴33天前

0429

NVIDIA发布CUDA-oxide：用Rust写CUDA内核的官方编译器来了-枫选

NVIDIA发布CUDA-oxide：用Rust写CUDA内核的官方编译器来了

NVIDIA Labs开源了CUDA-oxide，一个将标准Rust代码编译为CUDA PTX的实验性编译器。无需DSL、无需FFI绑定，直接在Rust中编写GPU内核，支持所有权和借用检查。

迪滴35天前

0289

Shutterstock 被 FTC 罚款 3500 万美元：订阅难取消的时代该结束了-枫选

Shutterstock 被 FTC 罚款 3500 万美元：订阅难取消的时代该结束了

FTC 宣布 Shutterstock 支付 3500 万美元罚款，原因是订阅取消流程涉嫌违反消费者保护法。这对所有运营 SaaS 和订阅制产品的站长都有警示意义。

迪滴28天前

0289

Microsoft报告AI成本高于人工：站长该如何看待AI投入产出比-枫选

Microsoft报告AI成本高于人工：站长该如何看待AI投入产出比

Microsoft内部报告显示AI项目的运营成本高于雇佣人工。这一发现引发行业讨论，站长在使用AI服务时也应理性评估投入产出比。

迪滴23天前

0419

moq.dev - OpenAI's WebRTC Problem -枫选" class="lazyload fit-cover radius8">

OpenAI在推出实时语音和视频功能时，遇到了一个不大不小的基础设施难题：WebRTC。这个为浏览器实时通信设计的技术栈，在面对OpenAI的规模和需求时，暴露出了不少问题。本文分析OpenAI遇到的WebRTC困境，以及这对整个实时AI通信领域意味着什么。

什么是WebRTC

WebRTC（Web Real-Time Communication）是一套支持浏览器和移动应用进行实时音视频通信的开放标准。它被广泛用于视频会议、直播、在线教育等场景。Zoom、Google Meet、Discord等产品的底层通信都依赖WebRTC或其变体。

当OpenAI推出GPT-4o的实时语音功能时，选择了WebRTC作为客户端与服务端之间的实时音频传输方案。这个选择看起来很自然——WebRTC是浏览器原生支持的、成熟的实时通信方案。但在实际落地过程中，问题逐渐暴露。

OpenAI遇到的WebRTC问题

1. 延迟和抖动

AI实时语音对话对延迟的要求比普通视频会议更高。用户说完一句话后，期望AI能在几百毫秒内开始响应。但WebRTC的网络自适应机制（如抖动缓冲区、丢包重传）在某些场景下反而增加了延迟。

2. NAT穿透问题

WebRTC需要通过ICE（Interactive Connectivity Establishment）框架来处理NAT穿透。在复杂的网络环境（如企业防火墙、运营商级NAT）下，连接建立的成功率和速度都不够理想。

3. 服务端扩展

传统的WebRTC架构中，SFU（Selective Forwarding Unit）或MCU（Multipoint Control Unit）负责媒体流的转发和混合。当需要处理海量并发的AI语音会话时，服务端的扩展成本和复杂度急剧上升。

4. 浏览器差异

虽然WebRTC是W3C标准，但不同浏览器的实现细节存在差异。Chrome、Firefox、Safari在编解码器支持、API行为等方面的不同，给跨平台兼容性带来了额外工作。

替代方案探讨

有开发者提出了几种可能的替代方案：

WebSocket + 自定义音频流：绕过WebRTC的复杂性，直接通过WebSocket传输PCM或Opus编码的音频数据。实现简单，但需要自行处理网络自适应。

Media over QUIC (MoQ)：IETF正在标准化的新一代媒体传输协议，基于QUIC协议，目标是替代WebRTC用于大规模实时媒体分发。这也是那篇HN文章的讨论重点。

gRPC Streaming：Google的gRPC框架支持双向流式传输，可以用于音频数据的实时传输，但浏览器端支持有限。

专有协议：像Discord那样，开发针对特定场景优化的专有协议。

对站长和开发者的启示

如果你在开发涉及实时AI语音交互的应用，以下几点建议：

评估实际需求：如果你的应用不需要浏览器端实时音频，WebSocket方案可能更简单可靠。

关注MoQ进展：Media over QUIC是未来方向，但目前标准化和实现都还不成熟。

做好降级方案：即使使用WebRTC，也要准备WebSocket降级方案，确保在WebRTC连接失败时用户仍有基本体验。

测试真实网络环境：在开发环境中的低延迟网络下测试没问题，不代表在用户的4G/WiFi环境下表现良好。

实时AI通信的未来

随着AI语音交互、AI视频通话等功能的普及，实时AI通信基础设施的需求会越来越大。WebRTC虽然是目前最成熟的选择，但确实需要演进才能满足AI场景的特殊需求。

OpenAI遇到的这些问题，其实也是整个行业需要解决的。未来可能会出现专门为AI实时交互优化的通信框架，或者WebRTC本身会针对AI场景进行扩展。

来源：

moq.dev – OpenAI’s WebRTC Problem

分析OpenAI在实时语音功能中遇到的WebRTC基础设施挑战，以及Media over QUIC等替代方案对开发者的影响。

迪滴37天前

0219

Bitwarden暗中涨价200%：密码管理器订阅经济的隐忧-枫选

Bitwarden暗中涨价200%：密码管理器订阅经济的隐忧

Bitwarden悄悄把Premium价格从10美元/年涨到19.80美元/年，Families从12美元/年涨到47.88美元/年，涨幅100%-300%。

迪滴26天前

0279

GitHub确认3800个仓库遭恶意VSCode扩展供应链攻击：开发者安全警钟再次敲响-枫选

GitHub确认3800个仓库遭恶意VSCode扩展供应链攻击：开发者安全警钟再次敲响

2026年5月20日，安全研究机构BleepingComputer报道，GitHub正式确认一起通过恶意VSCode扩展发起的供应链攻击事件，导致约3800个代码仓库遭到未授权访问和数据泄露。这是继此前GitHub内部仓库遭...

迪滴26天前

0279