MinerU:开源高质量数据提取工具 支持PDF/网页/多格式电子书提取
00 分钟
2024-8-23
2024-8-23
type
status
date
slug
tags
category
summary
icon
password
sourceUrl
Property
Created time
Aug 23, 2024 01:17 AM

MinerU是什么

MinerU是一款由上海人工智能实验室OpenDataLab团队开发的开源高质量数据提取工具,专注于从复杂PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式和表格的多模态PDF转化为Markdown格式(如markdown、json),且具备高精度解析工具链,支持多种输入模型,支持自动识别乱码、转换公式为LaTex、保留文档结构,支持176种语言的准确识别,适用于学术、财务、法律等领域,兼容Windows/Linux/Mac平台。
notion image
notion image

MinerU如何使用/官网

上一篇
专业的搜题找答案平台 – 简搜题
下一篇
男同学强身健体食补秘方

评论
Loading...