TableGPT2-7B

TableGPT2-7B

TableGPT2-7B 是由浙江大学开发的大规模解码器模型,专门用于处理数据密集型任务,尤其是表格数据的解读和分析。该模型基于 Qwen2.5 架构,通过持续预训练(CPT)和监督微调(SFT)优化,能够处理复杂的表格查询和商业智能(BI)应用。它支持中文查询,适合需要高效处理结构化数据的企业和研究机构。模型目前免费开源,未来可能会推出更专业的版本。
0140
MNN 大模型 Android App

MNN 大模型 Android App

MNN 大模型 Android App 是阿里巴巴开发的一款基于大语言模型(LLM)的安卓应用。它支持多种模态输入和输出,包括文本生成、图像识别、音频转录等。该应用通过优化推理性能,确保在移动设备上高效运行,同时保护用户数据隐私,所有处理均在本地完成。它支持多种领先的模型提供商,如 Qwen、Gemma、Llama 等,适用于多种场景。
0120
WeClone

WeClone

WeClone 是一个基于微信聊天记录微调大语言模型的项目,主要用于实现高质量的声音克隆和数字分身。它结合了微信语音消息和 0.5B 大模型,允许用户通过聊天机器人与自己的数字分身互动。该技术在数字永生和声音克隆领域具有重要的应用价值,可以让用户在不在场的情况下继续与他人交流。此项目正在快速迭代中,适合对 AI 和语言模型感兴趣的用户,且目前处于免费的开发阶段。
0120
InternVL2-8B-MPO

InternVL2-8B-MPO

InternVL2-8B-MPO是一个多模态大语言模型(MLLM),通过引入混合偏好优化(MPO)过程,增强了模型的多模态推理能力。该模型在数据方面设计了自动化的偏好数据构建管线,并构建了MMPR这一大规模多模态推理偏好数据集。在模型方面,InternVL2-8B-MPO基于InternVL2-8B初始化,并使用MMPR数据集进行微调,展现出更强的多模态推理能力,且幻觉现象更少。该模型在MathVista上取得了67.0%的准确率,超越InternVL2-8B 8.7个点,且表现接近于大10倍的InternVL2-76B。
0120
Baichuan-M1-14B

Baichuan-M1-14B

Baichuan-M1-14B 是由百川智能开发的开源大语言模型,专为医疗场景优化。它基于20万亿token的高质量医疗与通用数据训练,覆盖20多个医疗科室,具备强大的上下文理解和长序列任务表现能力。该模型在医疗领域表现出色,同时在通用任务中也达到了同尺寸模型的效果。其创新的模型结构和训练方法使其在医疗推理、病症判断等复杂任务中表现出色,为医疗领域的人工智能应用提供了强大的支持。
0100
M2RAG

M2RAG

M2RAG是一个用于多模态上下文中的检索增强生成的基准测试代码库。它通过多模态检索文档来回答问题,评估多模态大语言模型(MLLMs)在利用多模态上下文知识方面的能力。该模型在图像描述、多模态问答、事实验证和图像重排等任务上进行了评估,旨在提升模型在多模态上下文学习中的有效性。M2RAG为研究人员提供了一个标准化的测试平台,有助于推动多模态语言模型的发展。
0100
AI读文档【司马阅】

AI读文档【司马阅】

司马阅(SmartRead),是一款AI文档阅读分析工具,基于AI人工智能技术、智能文档技术,快速从复杂文档提取信息。 通过聊天互动形式,精准、灵活地获取关键信息及灵感,极大节省文档阅读和信息检索时间,高效应用于工作、学习场景,如读行业市场报告、产品手册、法律文档、论文文献、电子书等。AI智能革命已经到来,这只是一个开始!
0100
WaveCoder

WaveCoder

WaveCoder是由微软亚洲研究院开发的代码大语言模型,通过指令微调增强代码大语言模型的广泛性和多功能性。它在代码摘要、生成、翻译、修复等多个编程任务上展现出卓越的性能。WaveCoder的创新之处在于其使用的数据合成框架和两阶段指令数据生成策略,确保了数据的高质量和多样性。该模型的开源,为开发者提供了一个强大的编程辅助工具,有助于提高开发效率和代码质量。
090
PresentationGen

PresentationGen

PresentationGen是一个基于SpringBoot框架开发的Web应用程序,它通过集成大语言模型(LLM)来自动化生成PPT文件。该技术通过预处理大量单页模板,并在用户使用时根据需求实时组合,实现快速生成PPTX文件。它支持文本替换,使得生成的演示文稿更加个性化和专业。该产品主要面向需要快速制作演示文稿的用户,如商务人士、教育工作者和设计师,帮助他们节省时间并提高工作效率。
090
Level-Navi Agent-Search

Level-Navi Agent-Search

Level-Navi Agent是一个开源的通用网络搜索代理框架,能够将复杂问题分解并逐步搜索互联网上的信息,直至回答用户问题。它通过提供Web24数据集,覆盖金融、游戏、体育、电影和事件等五大领域,为评估模型在搜索任务上的表现提供了基准。该框架支持零样本和少样本学习,为大语言模型在中文网络搜索代理领域的应用提供了重要参考。
080
awesome-LLM-resourses

awesome-LLM-resourses

awesome-LLM-resourses是一个汇总了全球大语言模型(LLM)资源的平台,提供了从数据获取、微调、推理、评估到实际应用等一系列资源和工具。它的重要性在于为研究人员和开发者提供了一个全面的资源库,以便于他们能够更高效地开发和优化自己的语言模型。该平台由王荣胜维护,持续更新,为LLM领域的发展提供了强有力的支持。
060
Doubao-1.5-pro

Doubao-1.5-pro

Doubao-1.5-pro 是由豆包团队开发的高性能稀疏 MoE(Mixture of Experts)大语言模型。该模型通过训练-推理一体化设计,实现了模型性能与推理性能的极致平衡。它在多个公开评测基准上表现出色,尤其在推理效率和多模态能力方面具有显著优势。该模型适用于需要高效推理和多模态交互的场景,如自然语言处理、图像识别和语音交互等。其技术背景基于稀疏激活的 MoE 架构,通过优化激活参数比例和训练算法,实现了比传统稠密模型更高的性能杠杆。此外,该模型还支持动态调整参数,以适应不同的应用场景和成本需求。
060
Amazon Nova

Amazon Nova

Amazon Nova是亚马逊云科技(AWS)推出的一系列生成式AI基础模型(Foundation Models),可以为用户提供高效、低成本的多模态处理能力。Amazon Nova系列模型包括Amazon Nova 理解模型、Amazon Nova 创意内容生成模型、Amazon Nova Act 智能体。Amazon Nova系列模型支持多种语言,并完美结合准确性、速度与成本效率,适用于各种智能任务。Amazon Nova系列模型目前仅在亚马逊的Bedrock平台上提供早期试用。
040
汉王天地大模型

汉王天地大模型

汉王天地大模型是汉王科技推出的一款专注于人工智能领域的大语言模型,拥有30年的行业积累。它能够实现多轮对话,高效处理任务,并深耕办公、教育、人文等多个垂直细分领域。该模型通过从人类反馈中进行强化学习,不断优化自身智能,提供包括智能校对、自动翻译、法律咨询、绘画生成、文案生成等在内的多样化服务,以赋能法律、人文、办公、教育、医养等行业,提升效率和创意。
040
Polaris

Polaris

Polaris是由Hippocratic AI 开发的一款高度专注于安全、用于医疗保健的大语言模型(LLM)系统,通过星座架构和专业支持代理组合,能够执行多项医疗相关的复杂任务。产品定位于提供与患者长时间、多轮次的语音对话,并提供专业准确的医疗建议。价格方面,按小时计费,每小时9美元。主要功能包括实时多轮语音对话、医疗信息提供和解释、隐私与合规性检查、药物管理和咨询、实验室与生命体征分析、营养建议、病历和政策查询、患者关系建设等。
030
Diabetica

Diabetica

Diabetica是一个专门针对糖尿病治疗和护理而开发的高级语言模型。它通过深度学习和大数据分析,能够提供包括诊断、治疗建议、药物管理、生活方式建议和患者教育在内的多种服务。Diabetica的模型Diabetica-7B和Diabetica-1.5B在多个糖尿病相关任务上展示了卓越的性能,并且提供了一个可复现的框架,使得其他医学领域也能受益于此类AI技术。
030