专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
目录
相关文章推荐
优秀网页设计  ·  Deepseek服务器繁忙请稍后再试?这4份 ... ·  19 小时前  
字体设计  ·  Ai绘画正在占领视觉,火爆全球的Deepse ... ·  2 天前  
清单  ·  开工大吉,收下这 6 件转运好物! ·  3 天前  
优秀网页设计  ·  AI工具丨AI头像生成神器,定制专属情人节微 ... ·  3 天前  
51好读  ›  专栏  ›  新智元

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

新智元  · 公众号  ·  · 2024-05-20 15:15

正文



新智元报道

编辑:庸庸 乔杨
【新智元导读】 5月14日 ,开源的大语言模型Falcon 2发布,性能超越Llama 3,消息登上了Hacker News热榜第一。「猎鹰」归来,开源宇宙将会迎来新的霸主吗?
这几天,全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引,与此同时,OpenAI的挑战者们也在同步创造历史。
就在5月14日,阿布扎比先进技术研究委员会(ATRC)下属的技术创新研究所(TII),发布了新一代的Falcon 2模型。

Falcon 2 11B已开启访问,Falcon 2 11B VLM将在5月14日中午12点开放
新一代「猎鹰」(Falcon意为猎鹰)重返竞技场,一经推出,迅速登上了HN热榜第一。
去年Falcon首次推出就技惊四座,以碾压性的优势超越了Llama。
根据Hugging Face排行榜,这次推出的Falcon 2 11B性能再次超越了Llama 3 8B,与领先的Gemma 7B性能相当,平均性得分仅差0.01。
Falcon 2包括两个版本:Falcon 2 11B和Falcon 2 11B VLM。
前者是在 5.5 万亿个token上训练出的大语言模型,后者则在此基础上开发的「视觉到语言」模型。
作为一款开源的大语言模型,Falcon 2不仅具备多语言能力,而且支持多模态,可以将视觉输入无缝转换为文本输出,这种功能是当今大模型市场中的首创。

只需要在用户界面上传一张图片并输入提示,就可以得到一段关于图片的文字描述

多语言+多模态

Falcon 2 11B 具有多语言能力,可以快速响应英语、法语、西班牙语、德语、葡萄牙语和其他各种语言的任务。
Falcon 2 11B VLM 作为视觉语言模型,能够从环境中识别和解释各种视觉信息,因此在医疗、金融、电子商务、教育和法律等领域有广泛的应用场景。
比如用于文档管理、上下文索引等任务,而且其「视觉到语言」的功能还有望在未来为视障人群提供帮助。
此外,Falcon 2只需一个GPU就能高效运行,可以轻易部署在笔记本电脑上。
为了加快推进Falcon商业化的进程,去年11月,ATRC就成立了一家新公司——AI71
基于Falcon模型,AI71已经进军阿联酋的教育、医疗、法律等多个领域,并计划很快拓展到阿联酋以外。Falcon的本次升级,为其商业化进程提供了有力支撑。

坚持开源的Falcon

TII发布的人工智能模型,在全球范围内一直名列前茅,新推出的Falcon 2 11B 模型让TII的地位再次得到稳固。






请到「今天看啥」查看全文