Meta新的语言模型让科技公司AI竞赛升温

admin 科学技术 2023-02-25 258

摘要:2月25日消息,Meta Platforms Inc (META.O)周五表示,它正在向研究人员发布一种新的大型语言模型,这是一种新的人工智能系统的核心软件,随着大型科技公司争先恐后地进行人工智能军备竞赛将技术整合到他们的产品中并打动投资者。随着微软支持的 OpenAI 的 ChatGPT 的推出,主导 AI 技术领域的公开争夺战于去年年底拉开序幕,...

Meta02.jpg

2月25日消息,Meta Platforms Inc (META.O)周五表示,它正在向研究人员发布一种新的大型语言模型,这是一种新的人工智能系统的核心软件,随着大型科技公司争先恐后地进行人工智能军备竞赛将技术整合到他们的产品中并打动投资者。

随着微软支持的 OpenAI 的 ChatGPT 的推出,主导 AI 技术领域的公开争夺战于去年年底拉开序幕,并促使从 Alphabet Inc (GOOGL.O) 到中国的百度公司(9888.HK) 等科技巨头大肆宣扬自己的产品。

Meta 的 LLaMA 是 Large Language Model Meta AI 的缩写,它将在非商业许可下提供给政府、民间社会和学术界的研究人员和实体,它在博客中说。

大型语言模型挖掘大量文本以总结信息和生成内容。例如,他们可以用可以像人类写的一样阅读的句子来回答问题。

Meta 表示,该模型需要的计算能力比以前的产品“少得多”,它接受了 20 种语言的训练,重点是那些使用拉丁字母和西里尔字母的语言。

DA Davidson 高级软件分析师吉尔·卢里亚表示:“Meta 今天的公告似乎是测试他们的生成 AI 能力的一步,这样他们就可以在未来将它们应用到他们的产品中。”

“生成式 AI 是 AI 的一种新应用,Meta 对此经验较少,但显然对其业务的未来很重要。”

人工智能已成为科技行业投资的亮点,该行业增长放缓已导致大范围裁员和实验性投资减少。

Meta 说 LLaMA 可以胜过检查更多参数或算法考虑的变量的竞争对手。

具体来说,它表示具有 130 亿个参数的 LLaMA 版本可以胜过 GPT-3,GPT-3 是构建 ChatGPT 的模型的最新前身。

它将其 650 亿参数的 LLaMA 模型描述为与谷歌的 Chinchilla70B 和 PaLM-540B 具有“竞争力”,后者甚至比谷歌用来展示其 Bard 聊天驱动搜索的模型还要大。

Meta 发言人将性能归因于模型中大量“更清洁”的数据和增强训练稳定性的“架构改进”。

Meta 去年 5 月发布了大型语言模型 OPT-175B,同样针对研究人员,它构成了其聊天机器人 BlenderBot 新迭代的基础。

它后来推出了一个名为 Galactica 的模型,该模型可以撰写科学文章并解决数学问题,但在它产生听起来很权威的错误反应后迅速撤下了该演示。


相关推荐
关闭

用微信“扫一扫”