当地时间周五,脸书母公司meta首席执行官扎克伯格最新推出了“meta人工智能大型语言模型”(large language model meta ai),简称“llama”。
扎克伯格在社交媒体上称,facebook ai research研发的llama是“目前水平最高的”大型语言模型,目标是帮助研究人员推进他们在人工智能领域的工作。
“大型语言模型”可以消化大量的文本数据,并推断文本的单词之间的关系。随着计算能力的进步,以及输入数据集与参数空间的不断扩大,llm的能力也相应提高。
目前,llm已经被证明能高效地执行多种任务,包括文本生成、问题回答、书面材料总结等。扎克伯格称,llm在自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。
值得一提的是,近期大火的chatgpt就是采用llm构建的聊天机器人。chatgpt由gpt3.5提供支持,而gpt3.5是一款基于openai 175b参数基础模型训练的llm,175b是它从训练数据中所学习、沉淀下来的内容。
meta还宣布,将针对学术研究者共享其模型,正在接受研究人员的申请。与之截然不同的是,谷歌旗下的deepmind和openai并不公开训练代码。
根据2021年媒体的一份调查显示,ai专家们通常将deepmind、openai和fair视为该领域的“前三甲”。
去年年底,meta发布了另一款名为galactica的模型,但因经常分享偏见和不准确的信息而遭到下架。