特征提取

共 4 篇网址

排序

发布更新浏览点赞

InternViT-6B-448px-V2_5

InternViT-6B-448px-V2_5是一个基于InternViT-6B-448px-V1-5的视觉模型，通过使用ViT增量学习与NTP损失（阶段1.5），提升了视觉编码器提取视觉特征的能力，尤其是在大规模网络数据集中代表性不足的领域，如多语言OCR数据和数学图表等。该模型是InternVL 2.5系列的一部分，保留了与前代相同的“ViT-MLP-LLM”模型架构，并集成了新增量预训练的InternViT与各种预训练的LLMs，包括InternLM 2.5和Qwen 2.5，使用随机初始化的MLP投影器。

0190

图像生成 # OCR # 图像识别 # 多模态

jina-clip-v2

jina-clip-v2是由Jina AI开发的多语言多模态嵌入模型，支持89种语言的图像检索，能够处理512x512分辨率的图像，提供从64到1024不同维度的输出，以适应不同的存储和处理需求。该模型结合了强大的文本编码器Jina-XLM-RoBERTa和视觉编码器EVA02-L14，通过联合训练创建了对齐的图像和文本表示。jina-clip-v2在多模态搜索和检索方面提供了更准确、更易用的能力，特别是在打破语言障碍、提供跨模态理解和检索方面表现出色。

0180

文案写作 # 图像检索 # 多模态 # 多语言

zeroscope_v2_XL

管道标签不在官方列表中

0140

AIGC影视平台 AI视频模型 # 句子相似性 # 可视化问题解答 # 图像分割

Kats

Kats是由Facebook基础设施数据科学团队开发的一个时间序列分析工具包，旨在为数据科学和工程工作提供一站式解决方案。它支持从理解关键统计数据和特征、检测回归和异常，到预测未来趋势等多种功能。Kats的主要优点包括其轻量级、易于使用和可扩展性，适用于各种行业和领域的数据分析师和工程师。

090

数据分析 # 异常检测 # 数据分析 # 时间序列