Meta 推出先进大型语言模型 ,AI 大战升级下一个 ChatGPT 不远了
发布时间:2023-02-26 21:08:21 【来源:ZAKER新闻】
当地时间 2 月 24 日,Meta 宣布将推出针对研究社区的 "Meta 人工智能大型语言模型 " 系统(Large Language Model Meta AI),简称 "LLaMA"。
同 ChatGPT、New Bing 不同,LLaMA 并不是一个任何人都可以与之对话的产品,也并未接入任何 Meta 应用。更为确切地说,该产品将是一个开源的 " 研究工具 "。
公司 CEO 扎克伯格在社交媒体上表示,LLaMA 旨在帮助研究人员推进研究工作,LLM(大型语言模型)在文本生成、问题回答、书面材料总结,以及自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。
Meta 表示,LLaMA 可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者,正在接受研究人员的申请。
此外,LLaMA 将提供底层代码供用户使用,因此用户可以自行调整模型,并将其用于与研究相关的用例。与之截然不同的是,谷歌旗下的 DeepMind 和 OpenAI 并不公开训练代码。
该公司还表示,LLaMA 作为一个基础模型被设计成多功能的,可以应用于许多不同的用例,而不是为特定任务设计的微调模型。
2、比 GPT3.5 性能更强
根据 Meta 官网介绍,LLaMA 包含 4 个基础模型,参数分别为 70 亿、130 亿、330 亿和 650 亿。其中,LLaMA 65B 和 LLaMA 33B 在 1.4 万亿个 tokens 上训练,而最小的模型 LLaMA 7B 也经过了 1 万亿个 tokens 的训练。
Meta 还提及,LLaMA-13B 对算力的要求 " 低得多 ",可以在单个数据中心级 GPU(Nvidia Tesla V100)上运行。
扎克伯格写道:
"Meta 致力于这种开放的研究模式,我们将向 AI 研究社区提供我们的新模型。"
值得一提的是,去年 5 月,Meta 也曾推出过大型语言模型 OPT-175B。该项目同样也是针对研究人员的,这构成了其聊天机器人 blenterbot 新迭代的基础。后来,该公司还推出了一款名为 " 卡拉狄加 " ( Galactica ) 的模型,但因经常分享偏见和不准确的信息而遭到下架。
据媒体报道,扎克伯格已将人工智能作为公司内部的首要任务,其本人也经常在财报电话会议和采访中谈论它对改进 Meta 产品的重要性。媒体分析称,虽然现在 LLaMA 没有在 Meta 产品中使用,但未来不排除使用的可能。
Meta 推出先进大型语言模型 ,AI 大战升级下一个 ChatGPT 不远了
2月26日讯:ChatGPT 的爆火引爆了 AI 行业,全球科技巨头争相杀入这一领域展开混战。周五,Meta 也宣布推出大型语言模型 LLaMA,加 ...
《AIGC:开启文化元宇宙新纪元》系列研讨会开幕,专家学者深度解析前景与挑战
2月26日讯:文元亮见 "《AIGC:开启文化元宇宙新纪元》系列专题研讨会开幕专场顺利举办。本次系列研讨会由文化元宇宙专委会常务副主任臧 ...
车海战术,华为车 BU 的止损指南
2月26日讯:与赛力斯合作破裂 "、" 距离华为造车还有八个月 "、" 华为与江淮合作造车 " ……近日,关于华为汽车业务的市场传闻甚嚣 ...
活体组织中长出电极,受损神经有望再生
2月26日讯:发表在《科学》杂志上的一项研究表明可将电子设备植入大脑等身体组织而不会造成伤害。研究人员最新开发了一种在活体组织中 ...
天天快讯:刘强东痴迷的“百亿补贴”还适合今天的京东么
2月26日讯:在 2019 年的 618、这个由京东首创的国民购物节期间,拼多多的加入让原本由京东和淘宝主导的电商争夺战变得更加激烈。这 ...
2 吨级 eVTOL 首架机 3 月下线二季度首飞,空中出行创新企业御风未来获加轮融资
2月26日讯:城市空中交通(UAM)是一种新兴的交通出行方式,能有效缓解当前城市交通拥堵和污染等问题,并可与地面、地下交通形成互补和 ...
- Copyright © 2013-2020 All rights reserved
- 联系我们