Markdown转换

共 3 篇网址

排序

发布更新浏览点赞

vision-parse

vision-parse是一个利用视觉语言模型（Vision LLMs）将PDF文档解析为格式化良好的Markdown内容的工具。它支持多种模型，包括OpenAI、LLama和Gemini等，能够智能识别和提取文本及表格，并保持文档的层级结构、样式和缩进。该工具的主要优点包括高精度的内容提取、格式保持、支持多模型以及本地模型托管，适用于需要高效文档处理的用户。

0210

办公助手 # Markdown转换 # PDF解析 # 文档处理

E2M

E2M是一个Python库，能够解析并转换多种文件类型到Markdown格式。它采用了解析器-转换器架构，支持包括doc、docx、epub、html、htm、url、pdf、ppt、pptx、mp3和m4a等多种文件格式的转换。E2M项目的最终目标是为检索增强生成(RAG)和模型训练或微调提供高质量的数据。

090

数据分析 # Markdown转换 # RAG # 数据清洗

gptpdf

gptpdf是一个利用大型视觉语言模型（如GPT-4o）将PDF文件解析为Markdown格式的工具。它通过PyMuPDF库识别非文本区域，并使用OpenAI API进行内容解析，几乎可以完美地处理排版、数学公式、表格、图片和图表等。平均成本为每页0.013美元，具有高效和低成本的特点。

070

办公助手 # Markdown转换 # openai api # PDF解析