Anthropic Claude推出第二代,加入以网页访问、支持API、扩大公测

AI新创公司Anthropic在5月介绍AI聊天机器人Claude,而短短2个月内,又在本周宣布更新到第2代,提升效能及安全性,加入以公开网页及API存取的界面,也将公测对象推到美、英两国用户。

Anthropic指出,测试第一代Claude的用户反映Claude很好聊、能清楚解释其思路,较不会提供有害回应,记忆力也较长久。 而第二代Claude则大幅强化编程、数学及推理能力。 例如它在律师考试的多选题得分率76.5%,优于第一代Claude的73%。 而在GRE阅读及作文测试中,Claude 2得分高居所有应试者的前10%,而在定量推理则约等同人类应试者中位数得分。

Anthropic说,最新一代AI聊天机器人除了提升效能,也增加输入及输出的长度; 它每次输入最长可接受100,000 tokens,意谓着它能读取数百页的技术文件甚至一本书,一次能撰写更长的文件,包括数千tokens的笔记、信函。

Claude 2也大幅改善写程序的能力。 在Python编程测试Codex HumanEval中,Claude 2的得分由前一代的56.0%提高到71.2%。 而在以小学数学问题组成的AI测试数据集GSM8k中,最新的AI聊天机器人得分由85.2%提高到88.0%。 Anthropic说已拟定一份Claude 2的能力提升计划,他们会在接下来几个月内逐步部署。

Claude 2安全性也有所提升,这能更有效防止用户叫它产出有害或危险的回应内容。 虽然还没有模型能完全免于被操弄、Jailbreak,但Anthropic内部用了多种安全工具及方法、人为检查及红队评估工具来提升其输出的安全性。 在其红队评估工具中,Claude 2提供无害响应内容是Claude 1.3版的2倍。

由于安全、功能及效能有所提升,Anthropic宣布Claude 2在美国及英国开放全面公测,他们也计划未来几个月内再扩大测试对象。 现在用户可以先注册账号(https://claude.ai/),以自然语言和Claude对谈牛刀小试。

Anthropic也宣布Claude 2支持以API及公开beta网站 claude.ai 访问。 目前该公司已和数千家企业测试使用Claude API。 其中一家是AI文字生成平台 Jasper 及程式撰写辅助工具Sourcegraph。 Claude也是AWS AI服务Bedrock合作的AI模型之一。

(0)
老哥老哥

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注