OCR

排序

发布更新浏览点赞

印象笔记

工作必备效率应用

014.7K0

CatOCR: 易飞文字识别

CatOCR: 易飞文字识别 , 免费在线图片转文字

011.5K0

在线工具浙江省-网址网站大全 # OCR # pdf # 文字工具

意表

意表是一款功能强大的OCR（光学字符识别）截图识别表格工具，适用于网页、图片、PDF和视频中的表格识别。它可以将识别结果保存到系统剪贴板，并一键粘贴到Word或Excel中，极大提高了用户在处理财税、金融文档等场景下的工作效率。

0710

AI办公工具 # AI # AutoDoc # Foundry

Extractous

Extractous是一个用Rust编写的非结构化数据提取工具，提供多语言绑定。它专注于从各种文件类型（如PDF、Word、HTML等）中提取内容和元数据，并且性能优异，内存占用低。Extractous通过原生代码执行实现快速处理速度和低内存使用，支持多种文件格式，并集成了Apache Tika和tesseract-ocr技术，使其能够处理广泛的文件类型并进行OCR识别。该工具的开源性质和Apache 2.0许可使其可以免费用于商业用途，适合需要处理大量文档数据的企业和开发者。

0350

办公助手 # data-pipelines # docx # etl

Electronic-Component-Sorter

Vanguard-s/Electronic-Component-Sorter是一个利用机器学习和人工智能自动化识别和分类电子元件的项目。该项目通过深度学习模型，能够将电子元件分为电阻、电容、LED、晶体管等七大类，并通过OCR技术进一步获取元件的详细信息。它的重要性在于减少人工分类错误，提高效率，确保安全性，并帮助视觉障碍人士更便捷地识别电子元件。

0320

图像生成 # AI # OCR # 图像识别

PDF 文本识别

通过OCR识别文本，并创建可搜索的PDF文件。

0320

OCR识别办公导航 # OCR

TurboLens

TurboLens是一个集OCR、计算机视觉和生成式AI于一体的全功能平台，它能够自动化地从非结构化图像中快速生成洞见，简化工作流程。产品背景信息显示，TurboLens旨在通过其创新的OCR技术和AI驱动的翻译及分析套件，从印刷和手写文档中提取定制化的洞见。此外，TurboLens还提供了数学公式和表格识别功能，将图像转换为可操作的数据，并将数学公式翻译成LaTeX格式，表格转换为Excel格式。产品价格方面，TurboLens提供免费和付费两种计划，满足不同用户的需求。

0290

智能翻译 # OCR # 图像识别 # 文档处理

Free OCR

文本识别

0290

OCR识别 # OCR # OCR API # OCR SDK

InternViT-6B-448px-V2_5

InternViT-6B-448px-V2_5是一个基于InternViT-6B-448px-V1-5的视觉模型，通过使用ViT增量学习与NTP损失（阶段1.5），提升了视觉编码器提取视觉特征的能力，尤其是在大规模网络数据集中代表性不足的领域，如多语言OCR数据和数学图表等。该模型是InternVL 2.5系列的一部分，保留了与前代相同的“ViT-MLP-LLM”模型架构，并集成了新增量预训练的InternViT与各种预训练的LLMs，包括InternLM 2.5和Qwen 2.5，使用随机初始化的MLP投影器。

0280

图像生成 # OCR # 图像识别 # 多模态

意表

打赏赞微海报分享

0280

办公办公软件 # AI # AutoDoc # Foundry

印象笔记

打赏赞微海报分享

0280

云笔记云笔记导航 # evernote # markdown # Markdown在线编辑器

印刷体识别

印刷文字，智能捕获！印刷体识别工具，让图片中的文字转化为可编辑格式变得轻而易举。精确识别，无论字体大小或风格，确保信息无缝转录。快速、高效，为您节省宝贵时间。

0270

印刷体识别在线工具 # OCR # 印刷体 # 工具

i2PDF

i2PDF提供无限次使用的免费在线PDF编辑和处理工具，无需注册，包括PDF编辑、裁剪、翻译、扫描、OCR、对比度增强等功能，满足各种PDF处理需求。

0260

实用工具格式转换 # i2PDF # jpg # OCR

Ollama OCR for web

ollama-ocr是一个基于ollama的光学字符识别（OCR）模型，能够从图像中提取文本。它利用先进的视觉语言模型，如LLaVA、Llama 3.2 Vision和MiniCPM-V 2.6，提供高精度的文本识别。该模型对于需要从图片中获取文本信息的场景非常有用，如文档扫描、图像内容分析等。它开源免费，易于集成到各种项目中。

0260

文案写作 # OCR # 图像识别 # 开源

i2IMG

i2IMG提供一系列免费的在线图像处理工具，包括AI图像生成、图像恢复、翻译、对象移除、背景去除等，无需注册，100%免费。

0260

图片处理图片编辑 # AI图像生成 # compress # extract

PearOCR – 完全免费的图片文字识别提取工具

PearOCR 是一款完全免费的图片文字识别提取工具，用于把图像上的文字识别出来（OCR），以便于复制，二次修改，检索等操作。

0250

# OCR # OCR文字识别工具 # PearOCR

OCRspace

免费在线 OCR - 将图像和 PDF 转换为文本

0240

OCR识别办公导航 # OCR # OCR API # OCR SDK

Image/Manga Translator

该项目可以将漫画/图片中的文字进行翻译,主要功能包括文本检测、光学字符识别(OCR)、机器翻译和图像修补。它支持多种语言如日语、中文、英语和韩语等,可实现近乎完美的翻译效果。该项目主要面向漫画爱好者和图像处理工作者,可以方便地阅读外语漫画或进行图像的多语言处理。此外,它还提供Web服务、在线演示和命令行工具等多种使用方式,具有良好的可用性。该项目代码开源,欢迎大家一起完善和贡献。

0240

智能翻译 # OCR # 图像修补 # 图像翻译

PDFlux

PDFlux是一个强大的PDF数据提取神器，全面支持PDF和扫描件等格式。具有强大的文档结构识别功能，能够准确地识别PDF中的段落、表格、图像等元素，提高工作效率

0240

AI办公工具 # AI # AutoDoc # Foundry

提取文字

这款产品是一款专业的照片提取文字软件，可以将任何类型的照片(包括证件照、风景照、人物照等)中的文本进行提取并保存到电脑中。它提供了多种提取模式和算法，可以准确识别照片中的文字。使得照片提取文字更加快捷、方便、灵活

0230

在线工具提取文字 # OCR # 以图识字 # 图片

pdf-extract-api

pdf-extract-api是一个使用现代OCR技术和Ollama支持的模型将任何文档或图片转换为结构化的JSON或Markdown文本的API。它使用FastAPI构建，并使用Celery进行异步任务处理，Redis用于缓存OCR结果。该API无需云或外部依赖，所有处理都在本地开发或服务器环境中完成，确保数据安全。它支持PDF到Markdown的高精度转换，包括表格数据、数字或数学公式，并且可以使用Ollama支持的模型进行PDF到JSON的转换。此外，该API还支持LLM改进OCR结果，去除PDF中的个人身份信息（PII），以及分布式队列处理和缓存。

0220

办公助手 # anonymization # API # extract

OCR图片转文字

免费OCR在线图片转换成文字，在线图片识别文字

0220

在线工具转换工具 # OCR # 图片提取文字 # 图片转文字

Aya Vision 32B

Aya Vision 32B 是由 Cohere For AI 开发的先进视觉语言模型，拥有 320 亿参数，支持 23 种语言，包括英语、中文、阿拉伯语等。该模型结合了最新的多语言语言模型 Aya Expanse 32B 和 SigLIP2 视觉编码器，通过多模态适配器实现视觉与语言理解的结合。它在视觉语言领域表现出色，能够处理复杂的图像与文本任务，如 OCR、图像描述、视觉推理等。该模型的发布旨在推动多模态研究的普及，其开源权重为全球研究人员提供了强大的工具。该模型遵循 CC-BY-NC 许可证，并需遵守 Cohere For AI 的合理使用政策。

0210

图像生成 # OCR # 图像描述 # 多语言

印象笔记

作为你的第二大脑，记录就用印象笔记。印象笔记可以帮助你高效工作、学习与生活。支持无缝多端同步，快速保存微信、微博、网页等内容，一站式完成信息的收集备份、高效记录、分享和永久保存。

0210

P2-知识笔记 # evernote # markdown # Markdown在线编辑器

LlamaOCR

LlamaOCR.com是一个基于OCR技术的在线服务，它能够将上传的图像文件转换成结构化的Markdown格式文档。这项技术的重要性在于它极大地提高了文档转换的效率和准确性，尤其是在处理大量文本资料时。LlamaOCR.com由'Together AI'提供支持，并且与'Nutlope/llama-ocr'的GitHub仓库相关联，显示了其开源和社区支持的背景。产品的主要优点包括易用性、高效率和准确性。

0200

图像生成 # markdown # OCR # 图像识别

StructiFi翻译站点

StructiFi: 用精确和可靠的方式构建文档数据。即将将您的图像、PDF、Word文档转换为组织良好、结构化的数据格式，如Json、表格、Markdown，并准备好进行分析和洞察。

0200

AI文档提取 # AIConversion # aipdf # AI文档提取

LedgerBox翻译站点

LedgerBox: 一款安全可信的银行对账单转换为Excel和CSV文件的工具。

0200

AI会计助手 # AI # AI产品描述生成器 # AI会计助手

2345PDF转换器

打赏赞微海报分享

0200

学习工具青少年导航 # 2345 # 2345PDF转换器 # OCR

PearOCR – 完全免费的图片文字识别提取工具

PearOCR 是一款完全免费的图片文字识别提取工具，用于把图像上的文字识别出来（OCR），以便于复制，二次修改，检索等操作。

0200

# OCR # OCR文字识别工具 # PearOCR

闪电OCR图片文字识别

闪电OCR图片文字识别软件是一款高效、精准、易用的OCR（光学字符识别）工具，具有图片转文字、图片转Word、票证文字提取、PDF识别、图片表格识别，可以将图片或PDF等文件中的文字快速、准确地识别并转化为可编辑的文本，高效精准识别提取图片中的文字，批量操作方便快捷

0200

# OCR # OCR图片文字识别 # OCR图片文字识别软件

秘塔翻译

秘塔翻译是一款专业的AI法律翻译工具，专为法律行业人士打造。其严谨的语法、专业的用语、连贯的语意，以及支持术语库和各类格式文本的特点，使得它能够迅速提供翻译结果，致力于运用人工智能技术为法律人打造得心应手的生产工具，大幅提升法律行业工作效率，让法律人享受科技的便利。同时，它还支持多人在线协作编辑，以及多重加密手段保障数据安全。

0200

AI办公工具 # OCR # 人工智能 # 人工智能翻译

kreuzberg

Kreuzberg是一个现代Python库，专注于从各种文档中提取文本。它通过简洁的API和本地处理能力，为用户提供高效的文本提取解决方案。该库支持多种文件格式，包括PDF、图像、办公文档等，无需复杂的配置或外部API调用。它采用异步接口设计，提高了处理效率，同时保持了轻量级的资源占用。Kreuzberg适用于需要本地化文本提取的场景，如RAG应用等，其主要优点是简单易用、资源高效且功能强大。

0190

文案写作 # OCR # PDF处理 # Python库

EdgeOne Pages Functions AI OCR

EdgeOne Pages Functions：AI OCR是一款基于人工智能技术的图像文字识别服务，它能够将图片中的文字内容转换为可编辑的文本格式。这项技术的重要性在于它极大地提高了文字录入的效率，减少了人工输入的错误率，并且能够处理多种语言的文字识别。产品背景信息显示，EdgeOne提供了一个免费的部署平台，拥有即时全球CDN覆盖，这使得AI OCR服务可以快速、稳定地服务于全球用户。价格方面，用户可以免费部署体验，具体定价策略未在页面中明确说明。

0190

图像生成 # AI # OCR # 图像处理

Amazon Textract

Amazon Textract是一种OCR软件和数据提取工具，可以自动从扫描的PDF文档、表单和表格中提取文本、手写和数据，提高工作效率和准确性。

0190

其它AI工具科研助手 # OCR # 数据提取

swift-ocr-llm-powered-pdf-to-markdown

这是一个开源的OCR API，利用OpenAI强大的语言模型和优化的性能技术（如并行处理和批处理）来实现从复杂PDF文档中提取高质量文本。非常适合寻求高效文档数字化和数据提取解决方案的企业。

0190

办公助手 # GPT-4 # markdown # OCR

Tesseract

Tesseract OCR是一款强大的光学字符识别引擎，具有高准确性和多语言支持，适用于各种应用场景，包括文档转换、图像识别和数据采集等。

0190

商业AI 生产效率 # OCR # 文字识别

话袋AI笔记【需安装】

话袋致力于让记录变得简单，让生活更加精彩。多端同步技术让信息随时随地触手可及，无论是微信对话、语音备忘录、文本资料、视频剪辑还是重要文档，话袋都能帮您快速保存和整理，成为您身边的智能信息管理伙伴

0190

AI更多人工智能引擎 # AI笔记 # evernote # huadai

极度PDF

打赏赞微海报分享

0190

在线工具效率办公 # OCR # pdf转odf，pdf转word # 公式PDF

云从科技从容大模型

从容大模型是云从科技自主研发的一种基于语言模型的人工智能系统，该系统可以根据给定的文本或语音数据进行学习和分析，并输出相关的答案或建议，能够深度理解自然语言的含义和语义规则，具有高度智能化及自适应性。

0180

AI大模型 # AI # AIGC # AI大模型

Excerptor

Excerptor是一个专门设计来从实体书籍中提取划线或手写标记文本的工具。它通过图像处理和光学字符识别技术，将书籍中的标记文本转换为数字格式，方便用户编辑和保存。这项技术的重要性在于它能够帮助用户快速从大量书籍中提取关键信息，提高研究和学习的效率。Excerptor以其高效、准确的文本识别能力和用户友好的操作界面，满足了学术研究、教育和个人学习等不同领域的需求。目前，Excerptor是免费提供给用户的，它的开发和维护由开源社区负责。

0180

文案写作 # OCR # 书籍扫描 # 信息提取

识别表格（意表）

截屏OCR小工具，提取文字/各类表格/财务报表/银行流水

0180

AI办公工具 AI效率提升 # OCR

Computer Vision

Azure AI Vision with OCR and AI是一种基于Microsoft Azure的计算机视觉开发工具，可以通过OCR、目标检测和图像分析等功能，加速对图像和视频内容的开发和分析，从中获取有价值的信息。

0180

商业AI 生产效率 # OCR # 计算机视觉

Digitise.AI

Digitise.ai的OCR智能文档处理解决方案通过高度训练的机器学习算法，能够自动从复杂的非结构化文档中提取数据，保证准确性。节省时间和成本，提高工作效率。

0180

图像AI 设计助理 # OCR # 智能文档处理

PearOCR免费OCR

完全免费无限制的文字识别网站，从图片中识别出可复制的文字并导出！

0170

在线工具效率工具 # OCR # 图片转文字 # 复制图片文字

Microsoft Face API

Azure AI Vision with OCR and AI是微软Azure提供的一项人工智能服务，通过OCR和AI技术，帮助用户从图像和视频内容中提取洞察力，实现自动化的文本识别和图像分析。

0170

AI记忆助手其它AI工具 # OCR # 计算机视觉

ViTLP

ViTLP是一个视觉引导的生成文本布局预训练模型，旨在提高文档智能处理的效率和准确性。该模型结合了OCR文本定位和识别功能，能够在文档图像上进行快速准确的文本检测和识别。ViTLP模型的预训练版本ViTLP-medium（380M参数）在计算资源和预训练数据集规模的限制下，提供了一个平衡的解决方案，既保证了模型的性能，又优化了推理速度和内存使用。ViTLP的推理速度在Nvidia 4090上处理一页文档图像通常在5到10秒内，与大多数OCR引擎相比具有竞争力。

0170

文案写作 # OCR # 文本检测 # 文本识别

PDF翻译工具翻译站点

PDF翻译工具: PDF翻译工具是一个强大的在线工具，允许用户将他们的文件翻译成100多种语言，同时保留格式和布局。它简化了翻译PDF文件的过程，使用户更快速、更方便地在不同语言之间进行沟通和理解信息。

0170

AI文档提取 # AI # AI文档提取 # editor

护照识别

全球通行，一扫即知！护照识别工具，专业支持中国大陆及港澳台地区，乃至全球各国护照个人资料页的精准识别。多字段检测，快速获取关键信息，让边境通关、信息录入变得轻松高效。安全出行，从智能开始。

0170

在线工具护照识别 # OCR # 工具 # 扫描

印象笔记

印象笔记可以帮助你高效工作、学习与生活。支持无缝多端同步，快速保存微信、微博、网页等内容，一站式完成信息的收集备份、高效记录、分享和永久保存。

0170

协作办公 # evernote # markdown # Markdown在线编辑器

Nanonets官网

Nanonets提供一种智能化OCR解决方案，能够自动化处理大量文件，减少时间和成本，并且准确率高。

0160

AI无代码编程 AI编程开发 # AIGC开发平台 # AI低(无)代码编程 # OCR

Versatile-OCR-Program

该产品是一个专门设计的 OCR 系统，旨在从复杂的教育材料中提取结构化数据，支持多语言文本、数学公式、表格和图表，能够生成适用于机器学习训练的高质量数据集。该系统利用多种技术和 API，能够提供高精度的提取结果，适合学术研究和教育工作者使用。

0150

数据分析 # OCR # 图表识别 # 多语言

PDF-Extract-Kit

PDF-Extract-Kit是一个专门用于提取PDF文件中高质量内容的工具包。它通过多个组件实现对PDF文档的深度解析，包括版面检测、公式检测、公式识别和光学字符识别（OCR）。该工具包使用先进的模型如LayoutLMv3、YOLOv8、UniMERNet和PaddleOCR，以适应各种类型的PDF文档，并在版面和公式检测方面具有高精度。它还特别针对扫描模糊或带有水印的文档进行了优化，以确保在复杂情况下也能提供准确的提取结果。

0140

办公助手 # OCR # PDF提取 # 公式识别

GrabText翻译站点

GrabText: 从手写文字或照片中提取文字

0140

手写识别 # AI图像扫描 # ai图像识别 # freeonlineOCR

Nanonets Automated Accounting

Nanonets是一款智能OCR工具，可与ERP、会计软件和文件存储服务集成，自动化数据收集、导出、存储和簿记。

0130

其它AI工具资源 # OCR # 免费 # 数据解析

OCR Markdown

OCR Markdown 是一款工具，能将扫描的图像和 PDF 文件转换为可编辑的 Markdown 文本。它比其他 OCR 服务更便宜，注重隐私，文档存储安全

0120

创作工具格式转换 # markdown # OCR # OCR Markdown

没有了

印象笔记

CatOCR: 易飞文字识别

意表

Extractous

Electronic-Component-Sorter

PDF 文本识别

TurboLens

Free OCR

InternViT-6B-448px-V2_5

意表

印象笔记

印刷体识别

i2PDF

Ollama OCR for web

i2IMG

PearOCR – 完全免费的图片文字识别提取工具

OCRspace

Image/Manga Translator

PDFlux

提取文字

pdf-extract-api

OCR图片转文字

Aya Vision 32B

印象笔记

LlamaOCR

StructiFi翻译站点

LedgerBox翻译站点

2345PDF转换器

PearOCR – 完全免费的图片文字识别提取工具

闪电OCR图片文字识别

秘塔翻译

kreuzberg

EdgeOne Pages Functions AI OCR

Amazon Textract

swift-ocr-llm-powered-pdf-to-markdown

Tesseract

话袋AI笔记【需安装】

极度PDF

云从科技从容大模型

Excerptor

识别表格（意表）

Computer Vision

Digitise.AI

PearOCR免费OCR

Microsoft Face API

ViTLP

PDF翻译工具翻译站点

护照识别

印象笔记

Nanonets官网

Versatile-OCR-Program

PDF-Extract-Kit

GrabText翻译站点

Nanonets Automated Accounting

OCR Markdown

热门网址