Subquadratic 创业公司在 LLM 性能上取得突破

简要回答
Subquadratic 研发的 SubQ 模型宣称单次处理文本量提升 12 倍,能耗降低,同时保持与市场领先模型相当的质量。
美国创业公司 Subquadratic 发布新一代语言模型 SubQ,宣称在大语言模型(LLM)领域实现性能突破。该公司称,SubQ 单次处理文本量是 Google DeepMind、OpenAI 及 Anthropic 等同类模型的 12 倍,同时在代码生成等关键任务上保持可比拟的质量。
然而,Subquadratic 的早期声明引发业界广泛质疑。批评者指出其缺乏独立验证,并将其与 Theranos 在医疗科技领域的造假案相提并论。为回应质疑,该公司随后发布了由独立机构 Appen 进行的额外测试结果,部分证实了 SubQ 的性能优势。
Appen 生成式 AI 研究总监 Janine Sinanan-Singh 在评估后表示:「这可能成为行业转折点,因为现有模型普遍存在速度瓶颈与能效问题。」不过,SubQ 目前尚未开放广泛测试,其实际能力仍存疑问。
Subquadratic 联合创始人兼技术总监 Alex Widon 承认,公司本应在发布前提供更充分的独立数据。「未来我们将更严格验证结果再行发布。」他说道。
常见问题
- 什么是 SubQ?它与其他 LLM 有何不同?
- SubQ 是 Subquadratic 推出的新一代语言模型,据称单次处理文本量是现有模型的 12 倍,且速度更快、能耗更低,质量与 Google DeepMind 和 OpenAI 的模型相当。
- 为何 Subquadratic 的声明引发质疑?
- 该公司最初仅提供内部测试数据,缺乏第三方验证,引发业界对其可信度的质疑,类似 Theranos 造假事件。后续独立测试部分证实其部分性能指标。
- SubQ 可应用于哪些场景?
- 该模型适用于处理大规模文本数据,如分析数百份文档或整个代码库,尤其适合对速度与效率要求极高的任务。
分享:
Dzen 订阅: /feed/dzen.xml · RSS: /feed.xml