首页
分类导航
AI导航
设计导航
视频创作
文章推荐
今日热榜
信息榜
全网热榜
留言板
在线工具
未登录
登录后即可体验更多功能
登录
注册
找回密码
首页
分类导航
AI导航
设计导航
视频创作
文章推荐
今日热榜
信息榜
全网热榜
留言板
在线工具
未登录
登录后即可体验更多功能
登录
注册
找回密码
热门
立即入驻
首页
•
商业AI
•
生产效率
•
Transformer-XL
Transformer-XL
8个月前发布
11
0
0
收藏
0
Transformer-XL是一种超越固定长度上下文的注意力语言模型,支持单节点多GPU和多主机TPU训练,取得了最新的最佳结果。
收录时间:
2025-05-30
打开网站
手机查看
商业AI
生产效率
# 注意力机制
# 语言模型
Transformer-XL
打开网站
Transformer-XL是一种超越固定长度上下文的注意力
语言模型
,支持单节点多GPU和多主机TPU训练,取得了最新的最佳结果。
数据统计
相关导航
GPT-2
GPT-2是一种大规模无监督语言模型,能够生成连贯的段落文本,并在多个语言任务上表现出色。
Gopher by DeepMind
DeepMind发布了三篇关于语言模型的论文,其中包括对一个2800亿参数的语言模型Gopher的详细研究,以及大型语言模型的伦理和社会风险研究。
Yandex YaLM
YaLM-100B是一款拥有1000亿参数的预训练语言模型,具备强大的文本生成和处理能力,适用于自然语言处理、机器翻译、对话系统等多个领域。
Gopher by DeepMind
DeepMind发布了三篇关于语言模型的论文,其中包括对一个2800亿参数的语言模型Gopher的详细研究,以及大型语言模型的伦理和社会风险研究。
SayCan by Google
SayCan是一种将语言模型与机器人操作相结合的方法,通过预训练的行为将语言模型与机器人的能力和环境联系起来,实现基于自然语言的复杂任务执行。
Krasp
KraspAI是一款强大的语言模型测试工具,帮助用户快速比较不同模型的性能,无需编写代码,轻松创建自定义测试套件。
WebGPT
WebGPT是一款基于GPT-3的语言模型,通过模拟人类在网页浏览器上搜索答案的方式,提高了回答开放性问题的准确性和可靠性。
OPT-175B
Meta AI共享了OPT-175B,这是一个1750亿参数的语言模型,旨在促进对大规模语言模型的研究和改进,提供更多社区参与。
暂无评论
您必须登录才能参与评论!
立即登录
暂无评论...
网址
日榜
周榜
月榜
freemake免费视频下载器
Freemake视频下载器是一款免费的在线视频下载工具,可轻松解析和下载网页视频,包括YouTube、Facebook、Vimeo等超过50个网站平台。该工具提供一键解析和下载功能,操作简单方便,且完全免费使用。
蓝徽对联网
蓝徽对联网(www.duilian.com...
MovieBot
MovieBot是一个3D动画定制视频应用程序。它提供一个即时的AI生成的3D动画文本转视频服务。
三目童子
街机游戏合集《三目童子》nes合集游戏在线玩
前程无忧
前程无忧人才网
光大银行
光大银行欢迎您-中国光大银行
查看完整榜单
热门推荐
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍