Awesome-LLM-Post-training

11个月前发布 21 00

Awesome-LLM-Post-training 是一个专注于大型语言模型(LLM)后训练方法的资源库。它提供了关于 LLM 后训练的深入研究,包括教程、调查和指南。该资源库基于论文《LLM Post-Training: A Deep Dive into Reasoning Large Language Models》,旨在帮助研究人员...

收录时间:
2025-05-30
Awesome-LLM-Post-trainingAwesome-LLM-Post-training

Awesome-LLM-Post-training 是一个专注于大型语言模型(LLM)后训练方法的资源库。它提供了关于 LLM 后训练的深入研究,包括教程、调查和指南。该资源库基于论文《LLM Post-Training: A Deep Dive into Reasoning Large Language Models》,旨在帮助研究人员和开发者更好地理解和应用 LLM 后训练技术。该资源库免费开放,适合学术研究和工业应用。

数据统计

相关导航

ChatGPT Foundations for K-12 Educators

ChatGPT Foundations for K-12 Educators

Common Sense Media和OpenAI联合推出的'ChatGPT Foundations for K-12 Educators'是一个免费的在线课程,旨在帮助教师理解和负责任地将人工智能的基础知识融入课堂教学。该课程为期一小时,包含九个课程单元,为教育工作者提供关于人工智能的基本知识,并介绍如何确保学生安全和隐私的方法。课程内容涵盖人工智能基础、数据隐私考量、道德使用指南以及如何将AI融入日常教学工作的想法。
DeepSummary

DeepSummary

DeepSummary是一个专注于提供书籍总结的在线平台,旨在通过简洁高效的方式帮助用户快速获取书籍的核心内容。该平台支持多种书籍类别,包括科学、历史、哲学等,并提供听书和下载功能,方便用户随时随地学习。其主要优点是节省时间、提升知识获取效率,适合忙碌的专业人士和学习者。平台采用付费模式,价格亲民,提供灵活的订阅计划,致力于帮助用户实现个人和职业目标。
Light-R1-14B-DS

Light-R1-14B-DS

Light-R1-14B-DS 是由北京奇虎科技有限公司开发的开源数学模型。该模型基于 DeepSeek-R1-Distill-Qwen-14B 进行强化学习训练,在 AIME24 和 AIME25 数学竞赛基准测试中分别达到了 74.0 和 60.2 的高分,超越了许多 32B 参数量的模型。它在轻量级预算下成功实现了对已经长链推理微调模型的强化学习尝试,为开源社区提供了一个强大的数学模型工具。该模型的开源有助于推动自然语言处理在教育领域的应用,特别是数学问题解决方面,为研究人员和开发者提供了宝贵的研究基础和实践工具。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...