钞能力：阿联酋的Falcon-40B语言模型OpenLLM排名第一、持续霸榜-全球快播

首页 > 头条 > > 内容页

钞能力：阿联酋的Falcon-40B语言模型OpenLLM排名第一、持续霸榜-全球快播

2023-06-13 12:06:20 来源：IT之家

(相关资料图)

IT之家 6 月 13 日消息，众所周知，阿联酋在科技及教育产业方面投入的预算一直不菲，近日，阿联酋科技创新研究所（TII）打造出了 400 亿参数的语言模型 Falcon-40B，在 Hugging Face 的 OpenLLM 排行榜上排名第一，并持续霸榜，赢过此前 LLaMA、StableLM 和 RedPajama 等竞争者。

▲ 图源阿联酋科技创新研究所（TII）

据称，Falcon-40B 使用了 384 颗 GPU 来进行 2 个月的训练、利用将近 5 亿个 Token 训练而成。为提高训练过程的质量，团队还自己组建了一套工作流程来筛选出“最高质量的的资料”供给 AI 模型训练。经多个基准测试，表现比 LLaMA、Vicuna 和 Alpaca 更加出色。

此外，团队还采用了“多重查询注意力”（Multiqery attention）机制，来提高模型的效率。“多重查询注意力”机制即模型可以对每个 Token 进行多个查询，来更好表示同一序列中，不同 token 之间的关系，以在加速模型运算效率的同时，降低模型的复杂性，进而提高模型整体的可维护性。

阿联酋科技创新研究所首席执行官 Ray O. Johnson 博士表示：“2023 年将是人工智能之年。Falcon 模型对我们来说具有里程碑意义，但这仅仅是个开始”。

IT之家注意到，Falcon 模型已经在 huggingface 上开源，目前开源的版本有 Falcon-7B-Instruct 和 Falcon-40B-Instruct 等，IT之家的小伙伴们可以在这里访问。

标签：

钞能力：阿联酋的Falcon-40B语言模型OpenLLM排名第一、持续霸榜-全球快播

钞能力：阿联酋的Falcon-40B语言模型OpenLLM排名第一、持续霸榜-全球快播

闪电深1度 | 着力破解工业高质量发展要素制约，“山东十条”传递何种信号？|世界简讯

苹果15英寸MacBook Air今日开售；改款特斯拉Model 3将配备通风座椅

1至5月常德完成交通固定资产投资34.57亿元

福特想给电车配充电宝，解决不了根本问题

股权证书是啥意思 股权证书范本 每日时讯

天天热资讯！自制面包不够松软原因（自制面包不够松软原因酵母少了吗）

世界热资讯！张江高科：6月12日融资买入2532.78万元，融资融券余额8.28亿元

年内18家公司已触及“1元退市”红线 花式“保壳”难改被“淘汰”命运-世界观天下

祝福歌词图片大全_祝福歌词

天天新消息丨加快推进现代服务业与先进制造业融合发展

上海16区招考机构信息一览表(地址+电话） 每日速递

新尚｜首份“全球高中排行榜”在沪发布-精彩看点

建设银行短信服务费多少钱一个月_建设银行短信服务费-环球热头条

环球快报:小鹏P7i和G9将支持Apple Watch操控 老款P7和P5后期适配后上线

环球观速讯丨绿檀手串的功效与作用及禁忌（绿檀香味对人体有害吗）

中疾控：预计美国前期人偏肺病毒高发疫情对我国影响有限

环球热消息：移动的号码是多少开头_152开头的号码是移动还是联通

2023年中高考生可免费游三亚南山景区|每日热门

精彩看点：科幻影视IP开发繁盛，“95后”创作者成熟时间越来越早丨上影节

全力及时抢修 确保水退电复

焦点讯息：蘑菇瘦肉汤的热量?

当前观察：国外免联考硕士学费一般是多少

世界快讯:实力营业部现身龙虎榜，上海物贸涨停（06-12）

观热点：感受使馆里的“中文热”（采访手记）

重庆路桥（600106）6月12日主力资金净买入462.74万元

全球焦点！离婚案件中一方转移财产的，是否可以申请财产保全？

边疆的泉水清又纯歌谱 边疆的泉水清又纯简谱歌谱

每日时讯!我国大陆首座亿吨LNG接收站诞生

世界今日讯！档案调动需要什么手续和证明_档案调动需要什么手续

特斯拉柏林超级工厂已有约5000名员工 未来几月仍计划大量招人

大雾！湖南18条高速通行受影响 157个收费站临时交通管制

广西柳州螺蛳粉企业全线复工复产 电商主播日夜带货

网传“广西德保县四岁确诊小孩独自去隔离” 为不实信息

广西新增确诊病例连续下降至个位数

特斯拉柏林超级工厂已有约5000名员工 未来几月仍计划大量招人

大雾！湖南18条高速通行受影响 157个收费站临时交通管制

广西柳州螺蛳粉企业全线复工复产 电商主播日夜带货

网传“广西德保县四岁确诊小孩独自去隔离” 为不实信息

广西新增确诊病例连续下降至个位数

诈骗手段翻出新花样 防骗牢记一条：“出钱免谈”

河南禹州各高速路口疫情防控卡点均已撤除

股权证书是啥意思股权证书范本每日时讯

年内18家公司已触及“1元退市”红线花式“保壳”难改被“淘汰”命运-世界观天下

上海16区招考机构信息一览表(地址+电话）每日速递

环球快报:小鹏P7i和G9将支持Apple Watch操控老款P7和P5后期适配后上线

全力及时抢修确保水退电复

边疆的泉水清又纯歌谱边疆的泉水清又纯简谱歌谱

特斯拉柏林超级工厂已有约5000名员工未来几月仍计划大量招人

广西柳州螺蛳粉企业全线复工复产电商主播日夜带货

特斯拉柏林超级工厂已有约5000名员工未来几月仍计划大量招人

广西柳州螺蛳粉企业全线复工复产电商主播日夜带货

诈骗手段翻出新花样防骗牢记一条：“出钱免谈”