1/0
大模型竞争愈发激烈:Anthropic推出混合推理模型,可控制模型思考时间
澎湃新闻02-25 17:20:00

2月25日,由亚马逊支持的AI初创公司Anthropic推出首个混合推理模型Claude 3.7 Sonnet。它可以产生近乎即时的反应和对用户可见、可扩展的逐步思考。API用户还可以控制模型思考时间。

Anthropic表示,正如人类使用一个大脑进行快速反应和深度思考一样,推理应该是前沿模型的综合能力,而不是完全独立的模型。这种统一方法可以为用户创造无缝体验。Claude 3.7 Sonnet既是一个普通的大模型,也是一个推理模型,用户可以选择何时让模型在标准模式下回答,何时让模型在回答前思考更长时间。Anthropic联合创始人兼首席科学官贾里德·卡普兰(Jared Kaplan)表示:“我们想要一个连贯的人工智能,它可以帮助我们做任何事情。”

在标准模式下,Claude 3.7 Sonnet是Claude 3.5 Sonnet的升级版。在扩展思维模式下,Claude 3.7 Sonnet在回答问题前会自我反思,数学、物理、指令遵循、编程等任务上的表现得到提高。

在标准模型和扩展思维模式下,Claude 3.7 Sonnet每百万输入token为3美元,每百万输出token为15美元,其中包括思考的token。当通过API使用Claude 3.7 Sonnet时,用户还可以控制思考的预算,在速度和成本上换取质量,例如用户可以要求Claude思考不超过多少个token。

Anthropic表示,扩展思维模式使模型在数学、物理、指令遵循、编程等任务方面获得提升。

Anthropic产品负责人、Instagram的联合创始人迈克·克里格(Mike Krieger)表示,这种混合方式可以简化聊天机器人流程,用户可以使用多种功能,而不需要考虑哪个是最好的选择。

Anthropic在开发推理模型时降低了对数学和计算机科学竞赛问题的优化程度,而是将优化的重点转移到现实世界任务上,这些任务更好地反映企业实际如何使用大模型。

Claude 3.7 Sonnet在编程和前端网络开发方面优化改进,并引入一个用于智能编程的命令行工具Claude Code。Claude Code可以搜索和读取代码、编辑文件、编写和运行测试、提交和推送代码到GitHub,并使用命令行工具,开发者可以直接将大量工程任务委托给Claude Code。

在早期测试中,Claude Code一次性完成了通常需要45分钟以上手动工作的任务,减少了开发时间和开销。Anthropic表示,在接下来的几周里计划根据开发者的使用情况继续改进,增强工具调用的可靠性、增加对长时间运行命令的支持等。

“我们使用Claude Code的目标是更好地理解开发者如何使用Claude编程,为未来的模型改进提供信息。”Anthropic表示,Claude 3.7 Sonnet是该企业迄今最好的编程模型,随着对用户工作和开源项目的深入了解,它可以在GitHub项目中修复bug(漏洞)、开发功能和构建文档。

2月以来,大模型竞争态势愈发激烈。2月18日,特斯拉创始人埃隆·马斯克旗下xAI推出最新大模型Grok 3。Grok 3和轻量化的Grok 3 mini在多个性能上超过或媲美Gemini、DeepSeek和GPT-4o等对手。Grok 3在xAI位于孟菲斯的Colossus超算中心进行训练。xAI透露,这一超算中心的算力已经翻倍,拥有的英伟达GPU数量达20万颗。

2月13日,OpenAI首席执行官山姆·奥特曼(Sam Altman)在社交媒体上表示,下一个将发布的模型是OpenAI最后一个非思维链模型GPT-4.5,也被称为Orion(猎户座)模型。在那之后,OpenAI的最高目标是创建可以使用所有工具的系统来统一o系列模型和GPT系列模型,它能够知道什么时候应该长时间思考,并且通常适用于广泛任务。OpenAI将发布GPT-5,GPT-5将成为一个集成o3模型等OpenAI诸多技术的系统。“我们希望AI ‘只为你工作’,我们意识到我们的模式和产品供应变得多么复杂。我们和你一样讨厌模型选择器,希望回归神奇的统一智能。”

知识产权、免责声明以及媒体合作联系
继续了解
知识产权声明

【知识产权声明】

除本司(指上海东方网股份有限公司)另行声明外,本司网页及客户端产品(以下简称“本网”),包括但不限于东方新闻、翱翔、东方头条等,所涉及的任何资料(包括但不限于文字、图标、图片、照片、音频、视频、图表、色彩组合、版面设计、商标、商号、域名等)的知识产权均属本司和资料提供者所有。未经本司书面许可,任何人不得复制、转载、摘编、修改、链接、镜像或以其他任何方式非法使用东方网的上述内容。对于有上述行为者,本司将保留追究其法律责任的权利。

东方网、东方新闻、翱翔,以上均为本司享有权利之合法商标,未经本司书面授权,任何单位或个人不得使用上述商标,或将上述商标用作网站、媒体名称等。

【免责声明】

1、凡本网注明来源“东方网”或“东方新闻”或带有东方网LOGO、水印的所有内容,包括但不限于文字、图片、音频视频,版权均属本司所有,任何媒体、网站或其他任何形式的法律实体和个人未经本司书面授权均不得转载、链接或以其他方式复制传播。与我司签订有关协议或已经获得本司书面授权许可的媒体、网站或其他任何形式的法律实体和个人,应在授权范围内使用,且必须注明来源“东方网”。其目的在于传递更多信息,并不意味着本司赞同其观点或认可其内容的真实性。如果其他媒体、网站或其他任何形式的法律实体和个人使用,必须保留本司注明的“稿件来源”,并自负全部法律责任。如擅自篡改为“稿件来源:东方网”,本司将依法追究责任。

2、擅自使用东方网名义转载不规范来源的信息、版权不明的资讯,或盗用东方网名义发布信息,设立媒体账号等,本司将依法追究其法律责任。

3、鉴于本网发布主体、发布稿件来源广泛,数量较多,如因作者联系方式不详或其他原因未能及时与著作权拥有者取得联系,或著作权人发现本网转载了其拥有著作权的作品时,请主动来函、来电与本司联系,或与本司授权的中国文字著作权协会联系,提供相关证明材料,我方将及时处理。
中国文字著作权协会联系方式:
联系人:赵洪波 唐亚静
地 址:北京西城区珠市口西大街120号太丰惠中大厦1027-1036室
联系电话:010-65978917
邮 箱:wenzhuxie@126.com

4、本网所有声明以及其修改权、更新权及最终解释权均属本司所有。

【媒体合作】

本司为尊重保护著作权,鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播,促进互联网良性发展,本着平等互惠、资源共享的原则,诚邀各类媒体、网站、单位、个人与本网建立友好的合作关系。
媒体合作、内容转载请联系
联系人:杨老师
联系电话:021-22899781