热门

LLaVA++

11个月前发布 14 00

LLaVA++是一个开源项目，旨在通过集成Phi-3和LLaMA-3模型来扩展LLaVA模型的视觉能力。该项目由Mohamed bin Zayed University of AI (MBZUAI)的研究人员开发，通过结合最新的大型语言模型，增强了模型在遵循指令和学术任务导向数据集上的表现。

收录时间：

2025-05-30

打开网站手机查看

销售管理 # 人工智能 # 开源项目 # 机器学习 # 自然语言处理 # 语言模型

LLaVA++

LLaVA++

LLaVA++是一个开源项目，旨在通过集成Phi-3和LLaMA-3模型来扩展LLaVA模型的视觉能力。该项目由Mohamed bin Zayed University of AI (MBZUAI)的研究人员开发，通过结合最新的大型语言模型，增强了模型在遵循指令和学术任务导向数据集上的表现。

数据统计

相关导航

WordPecker App

WordPecker App是一款创新的语言学习工具，旨在通过个性化学习体验帮助用户高效掌握新语言。它结合了Duolingo风格的互动课程和用户自定义的词汇表，支持从书籍、文章或视频中无缝添加单词，并通过LLM生成的课程进行复习。该产品利用最新的AI技术，为用户提供沉浸式学习体验，同时支持多种语言偏好设置，适合不同语言学习者的需求。其开源特性也鼓励社区参与和持续改进。

Engage AI – ChatGPT for Social Media

使用ChatGPT为LinkedIn™编写富有洞察力的评论，提升社交销售效果，节省时间。由OpenAI™提供技术支持。

VastGaussian

VastGaussian是一个3D场景重建的开源项目，它通过使用3D高斯来模拟大型场景的几何和外观信息。这个项目是作者从零开始实现的，可能存在一些错误，但为3D场景重建领域提供了一种新的尝试。项目的主要优点包括对大型数据集的处理能力，以及对原始3DGS项目的改进，使其更易于理解和使用。

Argmax WhisperKit

WhisperKit由Argmax公司推出，是一个基于Whisper项目的推理工具包，它允许在iOS和macOS应用程序中进行语音识别和转录。该项目的目标是收集开发者反馈，并在几周内发布一个稳定的候选版本，以加速设备上推理的生产化。

ADeus

ADeus是一个开源的人工智能可穿戴设备项目，实时记录语音和环境数据，通过手机或电脑应用进行个性化助理服务，支持多种智能功能，用户拥有对数据的完全控制权。

Open-Sora-Plan

Open-Sora-Plan是一个开源项目，旨在复现OpenAI的Sora（T2V模型），并构建关于Video-VQVAE（VideoGPT）+ DiT的知识。项目由北京大学-兔展AIGC联合实验室发起，目前资源有限，希望开源社区能够贡献力量。项目提供了训练代码，并欢迎Pull Request。

avp_teleoperate

这是一个开源项目，用于实现人形机器人Unitree H1_2的遥控操作。它利用了Apple Vision Pro技术，允许用户通过虚拟现实环境来控制机器人。该项目在Ubuntu 20.04和Ubuntu 22.04上进行了测试，并且提供了详细的安装和配置指南。该技术的主要优点包括能够提供沉浸式的遥控体验，并且支持在模拟环境中进行测试，为机器人遥控领域提供了新的解决方案。

Factorio学习环境

Factorio Learning Environment（FLE）是基于《Factorio》游戏构建的新型框架，用于评估大型语言模型（LLMs）在长期规划、程序合成和资源优化方面的能力。随着LLMs逐渐饱和现有基准测试，FLE提供了新的开放式评估方式。它的重要性在于能让研究人员更全面、深入地了解LLMs的优势与不足。主要优点是提供了开放式且难度呈指数级增长的挑战，拥有结构化任务和开放式任务两种评估协议。该项目由Jack Hopkins等人开发，以开源形式发布，免费使用，定位是推动AI研究人员对复杂、开放式领域中智能体能力的研究。

暂无评论

您必须登录才能参与评论！

none

暂无评论...