168导航 - 网址大全
  • 首页
  • 分类导航
    • AI导航
    • 设计导航
    • 视频创作
  • 文章推荐
  • 今日热榜
    • 信息榜
    • 全网热榜
  • 留言板
  • 在线工具
      • 未登录
        登录后即可体验更多功能
    • 首页
    • 分类导航
      • AI导航
      • 设计导航
      • 视频创作
    • 文章推荐
    • 今日热榜
      • 信息榜
      • 全网热榜
    • 留言板
    • 在线工具
    未登录
    登录后即可体验更多功能

    transformers架构

    共 2 篇网址
    排序
    发布更新浏览点赞
    Qwen2.5-Coder-3B-Instruct

    Qwen2.5-Coder-3B-Instruct

    Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该系列模型通过增加训练令牌至5.5万亿,包括源代码、文本代码接地、合成数据等,显著提升了代码生成、推理和修复能力。Qwen2.5-Coder-3B是该系列中的一个模型,拥有3.09B参数,36层,16个注意力头(Q)和2个注意力头(KV),全32,768令牌上下文长度。该模型是目前开源代码LLM中的佼佼者,编码能力与GPT-4o相匹配,为开发者提供了一个强大的代码辅助工具。
    0180
    代码辅助# transformers架构# 代码修复# 代码推理
    Qwen2.5-Coder-14B-Instruct-AWQ

    Qwen2.5-Coder-14B-Instruct-AWQ

    Qwen2.5-Coder是一系列特定于代码的大型语言模型,覆盖了从0.5亿到32亿参数的不同模型大小,以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升,基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码基础、合成数据等。Qwen2.5-Coder-32B是目前最先进的开源代码生成大型语言模型,其编码能力与GPT-4o相匹配。此外,该模型还支持长达128K令牌的长上下文,并采用AWQ 4-bit量化技术,以提高模型的效率和性能。
    070
    代码辅助# AWQ量化# transformers架构# 代码修复
    没有了

    热门网址

    日榜周榜月榜
    none
    没有内容
    查看完整榜单
    168导航 - 网址大全
    168网址导航网记录网站发展历程,追踪网站大事件,提供分类目录及网站收录,包含购物网址大全、教育网址大全、旅游网址大全、地方网址大全、设计网址大全、货源网址大全、行业网址大全、站长网址大全、医疗网址大全、人才网址大全、视频创作网址大全、博客网址大全、新媒体网址大全等;精彩内容尽在168.itotii.com。

    免责申明友情链接itotii公告

    Copyright © 2021 itotii 版权所有 itotii导航网 滇ICP备11006562号

    声明:●本站为网址导航类网站,网站来源于网络,只做学习和交流使用,对其内容不负任何责任。若本站内容无意中侵犯到您的权益,请联系我们,我们会在收到信息后尽快给予处理!更多详见免责声明

    小提示:① 按 Ctrl+D 可收藏本网页,方便下一次快速打开使用。 ② 打开浏览器 '设置' 找到 '启动时' 选项下面的 '打开特定网页或一组网页',就可以把 itotii导航网 设置为首页啦。

      
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍