首页
分类导航
AI导航
设计导航
视频创作
文章推荐
今日热榜
信息榜
全网热榜
留言板
有偿纠错
在线工具
未登录
登录后即可体验更多功能
登录
注册
找回密码
首页
分类导航
AI导航
设计导航
视频创作
文章推荐
今日热榜
信息榜
全网热榜
留言板
有偿纠错
在线工具
未登录
登录后即可体验更多功能
登录
注册
找回密码
热门
立即入驻
首页
•
商业AI
•
生产效率
•
Transformer-XL
Transformer-XL
3个月前发布
1
0
0
收藏
0
Transformer-XL是一种超越固定长度上下文的注意力语言模型,支持单节点多GPU和多主机TPU训练,取得了最新的最佳结果。
收录时间:
2025-05-30
打开网站
手机查看
商业AI
生产效率
# 注意力机制
# 语言模型
Transformer-XL
打开网站
Transformer-XL是一种超越固定长度上下文的注意力
语言模型
,支持单节点多GPU和多主机TPU训练,取得了最新的最佳结果。
数据统计
相关导航
Google GLaM
GLaM是一种高效的语言模型,通过混合专家的方法,实现了在训练和使用过程中的高效性,具有多任务学习的能力。
GPT-2
GPT-2是一种大规模无监督语言模型,能够生成连贯的段落文本,并在多个语言任务上表现出色。
OPT-175B
Meta AI共享了OPT-175B,这是一个1750亿参数的语言模型,旨在促进对大规模语言模型的研究和改进,提供更多社区参与。
Yandex YaLM
YaLM-100B是一款拥有1000亿参数的预训练语言模型,具备强大的文本生成和处理能力,适用于自然语言处理、机器翻译、对话系统等多个领域。
SayCan by Google
SayCan是一种将语言模型与机器人操作相结合的方法,通过预训练的行为将语言模型与机器人的能力和环境联系起来,实现基于自然语言的复杂任务执行。
Gopher by DeepMind
DeepMind发布了三篇关于语言模型的论文,其中包括对一个2800亿参数的语言模型Gopher的详细研究,以及大型语言模型的伦理和社会风险研究。
WebGPT
WebGPT是一款基于GPT-3的语言模型,通过模拟人类在网页浏览器上搜索答案的方式,提高了回答开放性问题的准确性和可靠性。
AskReddit But AI
AskReddit But AI是一款训练GPT-2模型的工具,通过自动生成有趣的问题,为用户提供了一个全新的互动体验。
暂无评论
您必须登录才能参与评论!
立即登录
暂无评论...
网址
日榜
周榜
月榜
南京市浦口区人民政府
根据上级政府文件精神,结合本区实际,会同有关部门,提出贯彻执行的计划、意见和建议,供领导决策。
东海县人民政府
东海县人民政府的主要职责(一)协助县人民政府领导同志处理日常工作及全县经济调节和社会管理的有关事务;根据有关法律、法规和政策,协助县人民政府领导同志抓好政策指导、组织协调。(二)负责县人民政府会议的会务工
上海志愿者网
遵循“自愿、奉献、团结、互助、进步”的志愿准则;崇尚科学,倡导友爱;通过网站各个窗口传达最新信息动态,提供全面便民服务,成为各个志愿者团体管理体系、宣传公布志愿者活动消息、吸引更多的个人、团体加入志愿者、
火猫直播
火猫直播为您提供超高清,流畅的直播体验和独家赛事直播服务,包括Dota2,英雄联盟LOL,CSGO,王者荣耀等热门游戏直播,及单机游戏,手游,美女直播等。
好奇心日报
好奇心日报_好奇驱动你的世界_Qdaily
V2EX
创意工作者的社区。讨论编程、设计、硬件、游戏等令人激动的话题。
查看完整榜单
热门推荐
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍