Anthropic Claude推出第二代，加入以网页访问、支持API、扩大公测

老哥 • 2025年1月12日 17:20 • 达人投稿

AI新创公司Anthropic在5月介绍AI聊天机器人Claude，而短短2个月内，又在本周宣布更新到第2代，提升效能及安全性，加入以公开网页及API存取的界面，也将公测对象推到美、英两国用户。

Anthropic指出，测试第一代Claude的用户反映Claude很好聊、能清楚解释其思路，较不会提供有害回应，记忆力也较长久。而第二代Claude则大幅强化编程、数学及推理能力。例如它在律师考试的多选题得分率76.5%，优于第一代Claude的73%。而在GRE阅读及作文测试中，Claude 2得分高居所有应试者的前10%，而在定量推理则约等同人类应试者中位数得分。

Anthropic说，最新一代AI聊天机器人除了提升效能，也增加输入及输出的长度; 它每次输入最长可接受100，000 tokens，意谓着它能读取数百页的技术文件甚至一本书，一次能撰写更长的文件，包括数千tokens的笔记、信函。

Claude 2也大幅改善写程序的能力。在Python编程测试Codex HumanEval中，Claude 2的得分由前一代的56.0%提高到71.2%。而在以小学数学问题组成的AI测试数据集GSM8k中，最新的AI聊天机器人得分由85.2%提高到88.0%。 Anthropic说已拟定一份Claude 2的能力提升计划，他们会在接下来几个月内逐步部署。

Claude 2安全性也有所提升，这能更有效防止用户叫它产出有害或危险的回应内容。虽然还没有模型能完全免于被操弄、Jailbreak，但Anthropic内部用了多种安全工具及方法、人为检查及红队评估工具来提升其输出的安全性。在其红队评估工具中，Claude 2提供无害响应内容是Claude 1.3版的2倍。

由于安全、功能及效能有所提升，Anthropic宣布Claude 2在美国及英国开放全面公测，他们也计划未来几个月内再扩大测试对象。现在用户可以先注册账号（https://claude.ai/），以自然语言和Claude对谈牛刀小试。

Anthropic也宣布Claude 2支持以API及公开beta网站 claude.ai 访问。目前该公司已和数千家企业测试使用Claude API。其中一家是AI文字生成平台 Jasper 及程式撰写辅助工具Sourcegraph。 Claude也是AWS AI服务Bedrock合作的AI模型之一。