AI 日报

甲骨文宠儿力压GPT-4斩获竞技场首胜,不绑定厂商,不做聊天机器人,Transformer最年轻作者带飞大模型创业新星

  • By 51ITO
  • Apr 12, 2024 - 2 min read



编辑 |诺亚、伊风

出品 | 51CTO技术栈(微信号:blog51cto)

近日在开源模型界,Command R+风头正劲。

在Arena榜单上,Command R+凭借逾13000名支持者的票,一度跃升至第6位,其表现与GPT-4-0314旗鼓相当!在一众对垒GPT-4的开放权重模型中,斩获该榜单有史以来的首胜。

图源:https://twitter.com/lmsysorg/status/17776301337图源:https://twitter.com/lmsysorg/status/17776301337

而Arena榜单,是近日用纯C语言手搓GPT-2的AI大神Andrej Karpathy提过的唯二信任的测试基准之一。

Command R+隶属总部位于多伦多的大模型创业公司Cohere。这家AI新锐的联合创始人兼CEO,正是Transformer最年轻作者Aidan Gomez。我们且来看一看开源模型界当红炸子鸡的幕后故事。

1.Command R+ 横空出世,何以击败GPT-4

Command R+与前代Command R一样,拥有128k令牌上下文窗口,而且又在此基础上全面提高了性能。

首先,提供先进的检索增强生成(RAG)能力。RAG技术结合了基于检索的模型和生成性模型的优势。前者涉及从数据库、文章或网站等大量来源中访问和提取信息,而后者擅长生成连贯且具有上下文意识的文本。通过结合这两个组件,RAG在生成更具信息性和上下文相关性的响应方面脱颖而出。

更值得一提的是,新模型针对高级RAG进行了优化,提高了响应的准确性,并提供了内嵌的源引用,以减少幻觉现象,从而更好地应对业务需求,使企业能够借助AI扩展支持各种业务功能,如财务、人力资源、销售、市场营销和客户支持等。

再者,覆盖10多种语言,支持全球业务运营。其中包括:英语、法语、西班牙语、意大利语、德语、葡萄牙语、日语、韩语、阿拉伯语和中文。

另外,Command R+还配置了多种工具使用功能,用于自动化复杂的业务流程

API接口:附带可以通过Cohere和LangChain API访问的工具使用能力。这有助于自动化复杂的业务工作流程,如更新CRM任务、活动和记录。

多步骤工具使用:Command R+中的一个新特性,使模型能够结合多个工具进行多个步骤以完成复杂任务。Command R+还具有自我纠正的能力,当它尝试使用工具失败时(例如遇到工具的错误或故障),这增强了模型完成任务的可能性,并提高了成功的可能性。

在对话工具使用和单轮次函数调用能力方面,Command R+在关键企业AI基准测试中表现优异,超过了OpenAI的GPT-4 Turbo,以及Anthropic的Claude 3 Sonnet和Mistral Large。

图源:https://txt.cohere.com/command-r-plus-microsoft图源:https://txt.cohere.com/command-r-plus-microsoft

2.Cohere与Oracle,并不是OpenAI和微软的关系

作为一家为企业用户进行服务的公司,Cohere并不想成为巨头的跟班。

尽管Oracle是Cohere的主要投资者,两者的关系十分密切,但他们并不喜欢OpenAI与Microsoft的“相处模式”。Cohere的CEO Gomez表示,Cohere独立于任何云服务提供商,可以在任何云平台上部署其模型,这与仅在Microsoft Azure可以使用的OpenAI不同。   

“我们认为独立性非常重要,因此我们的服务可以在你所知道的每一家云平台上使用——Azure、GCP、OCI、AWS,以及本地部署。你不会被锁定在单一的技术栈或云平台上,”Gomez在2024年达沃斯世界经济论坛的间隙说道。这种独立性给了Cohere开辟更多收入来源的可能。

“我们不会从单一的云服务提供商那里接受巨额的支票,这可能会将我们锁定在一个生态系统或环境中。我们真的在努力保持独立,并为世界建立一些新的东西,”他补充道,间接地对OpenAI进行批评。

该企业的COO Martin Kon也表达了类似的想法,他说模型需要与云无关,这样你就可以在你觉得对你的数据最舒适的地方部署它们,而不会被绑定到特定的云或甚至是本地部署。

不过,Oracle的确是Cohere资金雄厚的金主之一,与该公司在技术方面也有着密切的关系。Cohere在Oracle云基础设施(OCI)上训练和构建其生成性AI模型,该基础设施提供了高性能和低成本的GPU集群技术。这使得Cohere能够加速大型语言模型(LLM)的训练,同时降低成本。同样的,微软Azure云计算平台也在为OpenAI所提供的算力支持。

“与Oracle的关系在计算方面产生了巨大的影响,为我们提供了地球上最好的超级计算机,同时在共同进入市场、共同创造新产品、改造现有产品以及将这项技术带给企业方面也非常重要,”Gomez说道。   

Gomez补充说,“OCI生成性AI服务真正体现了我们的使命,即为企业构建大型语言模型,以一种极度保护他们的数据、完全安全的方式”。

Cohere的生成性AI模型已经集成到Oracle的商业应用中,包括Oracle Fusion Cloud、Oracle NetSuite和Oracle特定行业的应用程序。

当前,Cohere 一直在努力提升自身的盈利水平。去年年底,该公司的年化收入约为 1300 万美元,月收入仅略高于 100 万美元。这一数字被他强大的竞争对手——OpenAI远远地甩在了身后,去年年 12 月OpenAI的营收已突破 20 亿美元大关。

不过,这家初创公司已告知投资者,其销售漏斗上(包括预计在 2024 年底之前完成的潜在合同)的价值超过 3 亿美元,目前尚不清楚甲骨文在其中所占的份额。可以确定的是,随着Cohere的模型在多家云平台上完成部署,他的收入曲线势必会继续攀升。

微软Azure宣布接入Cohere微软Azure宣布接入Cohere

3.OpenAI之下,大模型谋求盈利之路

大模型的元年已过,AI的落地应用浪潮汹涌。傅盛预言,今年千亿大模型过半将会凋零。

在OpenAI的高光之下,或是照猫画虎,或是另辟蹊径,大模型厂商都必须探索出自己的生财之道。

专注于企业服务的Cohere,早早便坚定了To B的决心。Cohere的首席执行官Martin Kon 说:"我们现在没有,将来也不会有一个烧钱的消费者聊天机器人。”

4月11日晚,李彦宏在内部讲话中表达了文心一言为何选择了闭源之路,他提到,“闭源,是有真正的商业模式的,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才,闭源在成本上反而是有优势的,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。”

但以Llama、Mistral AI 和Command R+为代表的其他各种替代方案正在蓬勃发展,并越来越多地被云提供商和企业采用。开源势力亦不可小觑。以Command R+ 为例,其在可扩展市场类别中优于类似模型,定价上也更具竞争力。

Cohere为Command R+设定的100万输入和输出令牌成本分别为3美元和15美元,这一价格颇具竞争力。相较于其他产品,其定价与Claude 3 Sonnet相当;而最新的OpenAI GPT-4 Turbo模型对100万输入令牌收费10美元,对100万输出令牌收费30美元。

随着AI创新领域新竞争者的不断涌入,在当前稳健发展的态势下,相信关于“开源VS闭源”的辩论,也会伴随创新浪潮下探索的每一步,但这不会是“东风压倒西风”的二选一终局,这两种模式必然将在相当长的时期内共生共存,共同为AI产业落地创造价值。

参考链接:

1.https://analyticsindiamag.com/who-needs-openais-gpt-4/

2.https://analyticsindiamag.com/the-secret-superstar-of-llms/

3.https://k.sina.com.cn/article_1654203637_629924f5020011twi.html

想了解更多AIGC的内容,请访问:

51CTO AI.x社区

https://www.51cto.com/aigc/