Transformer-XL

3个月前发布 1 00

Transformer-XL是一种超越固定长度上下文的注意力语言模型,支持单节点多GPU和多主机TPU训练,取得了最新的最佳结果。

收录时间:
2025-05-30
Transformer-XLTransformer-XL

Transformer-XL是一种超越固定长度上下文的注意力语言模型,支持单节点多GPU和多主机TPU训练,取得了最新的最佳结果。

数据统计

相关导航

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...