热门

Extractous

12个月前发布 34 00

Extractous是一个用Rust编写的非结构化数据提取工具，提供多语言绑定。它专注于从各种文件类型（如PDF、Word、HTML等）中提取内容和元数据，并且性能优异，内存占用低。Extractous通过原生代码执行实现快速处理速度和低内存使用，支持多种文件格式，并集成了Apache Tika和tesseract-ocr技术，使其能够处...

收录时间：

2025-06-02

打开网站手机查看

办公助手 # data-pipelines # docx # etl # etl-pipelines # extraction # LLM # machine learning # natural language processing # NLP # OCR # pdf # pdf-parser # RAG # Rust # tika # unstructured # unstructured data

Extractous

Extractous

Extractous是一个用Rust编写的非结构化数据提取工具，提供多语言绑定。它专注于从各种文件类型（如PDF、Word、HTML等）中提取内容和元数据，并且性能优异，内存占用低。Extractous通过原生代码执行实现快速处理速度和低内存使用，支持多种文件格式，并集成了Apache Tika和tesseract-ocr技术，使其能够处理广泛的文件类型并进行OCR识别。该工具的开源性质和Apache 2.0许可使其可以免费用于商业用途，适合需要处理大量文档数据的企业和开发者。

数据统计

相关导航

Practici

Practici可以将PDF转化为测试题，帮助学生更高效地学习和练习。通过提供个性化的互动测试题和强大的人工智能技术，Practici为学生和教师提供了简化的学习体验。这个平台提供了轻松转化PDF为测试题、多种题型、个性化的测试题以满足学习需求、提升理解力的练习功能。Practici的目标是让学习更简单、更高效。

TableX

TableX是一款能够从PDF或图片中提取表格数据的工具。用户可通过上传文件或拖放文件进行操作，数据处理过程安全可靠。提取完成后，用户可下载提取的数据并以Excel格式保存。产品定位于提高数据提取效率和准确性的生产力工具。

AnyToSpeech

AnyToSpeech是一款简洁易用的文字转语音解决方案，支持将文本、PDF、文档、扫描件和图片转换为语音。用户可以免费使用500个字符，超出部分需登录使用。该产品还提供文档、网址、扫描件或图片转语音的功能，并支持生成AI语音、教育、YouTube视频内容创作、文章转音频、有声书、PDF文档朗读、新闻摘要、播客制作等多种应用场景。用户可根据需求选择不同的价格套餐，提供一次性购买和包月订阅两种付费方式，并且产品还提供免费试用、退款政策和随时取消订阅等服务。

pdf-extract-api

pdf-extract-api是一个使用现代OCR技术和Ollama支持的模型将任何文档或图片转换为结构化的JSON或Markdown文本的API。它使用FastAPI构建，并使用Celery进行异步任务处理，Redis用于缓存OCR结果。该API无需云或外部依赖，所有处理都在本地开发或服务器环境中完成，确保数据安全。它支持PDF到Markdown的高精度转换，包括表格数据、数字或数学公式，并且可以使用Ollama支持的模型进行PDF到JSON的转换。此外，该API还支持LLM改进OCR结果，去除PDF中的个人身份信息（PII），以及分布式队列处理和缓存。

PDFchatai

PDFchatai是一款利用人工智能技术的应用程序，它允许用户通过聊天的方式与PDF文档进行互动，从而快速提取信息、总结内容并从文档中获得答案。该产品以其易用性、安全性和创新性脱颖而出，提供本地数据存储以保护用户隐私，同时拥有直观的用户界面和强大的社区支持。

PDF.MD

PDF.MD是一款可以与任何PDF文件进行聊天的应用程序。您只需上传文件，即可立即开始提问。通过PDF.MD，您可以节省时间和精力，快速获取特定信息、摘要和数据提取。我们有免费和付费的计划可供选择。

Export GPT – Export your chats with GPTs

这是一个可以将你与预训练模型GPT的聊天记录导出为可分享的PDF文件的插件。你可以使用它将聊天记录保存下来或与他人分享。

Summary With AI

Summary With AI是一款基于人工智能的摘要工具，能够帮助用户快速、准确地对大型PDF文件进行摘要。其优势在于高质量的摘要输出、快速的处理速度以及对各类信息密集型PDF文件的处理能力。用户可根据需要选择不同的信用额度，无需长期订阅，灵活方便。定价灵活，根据需求购买相应的信用额度。

暂无评论

您必须登录才能参与评论！

none

暂无评论...