Ubuntu 22.04 LTS 安装MinerU

1. 检测是否已安装nvidia驱动

nvidia-smi

如果看到类似如下的信息,说明已经安装了nvidia驱动,可以跳过步骤2

Note

CUDA Version 显示的版本号应 >= 12.1,如显示的版本号小于12.1,请升级驱动

2. 安装驱动

如没有驱动,则通过如下命令

sudo apt-get update
sudo apt-get install nvidia-driver-545

安装专有驱动,安装完成后,重启电脑

reboot

3. 安装anacoda

如果已安装conda,可以跳过本步骤

wget -U NoSuchBrowser/1.0 https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2024.06-1-Linux-x86_64.sh
bash Anaconda3-2024.06-1-Linux-x86_64.sh

最后一步输入yes,关闭终端重新打开

4. 使用conda 创建环境

需指定python版本为3.10

conda create -n MinerU python=3.10
conda activate MinerU

5. 安装应用

pip install -U magic-pdf[full] --extra-index-url https://wheels.myhloli.com -i https://mirrors.aliyun.com/pypi/simple

Important

下载完成后,务必通过以下命令确认magic-pdf的版本是否正确

magic-pdf --version

如果版本号小于0.7.0,请到issue中向我们反馈

6. 下载模型

详细参考 如何下载模型文件

7. 了解配置文件存放的位置

完成6.下载模型步骤后,脚本会自动生成用户目录下的magic-pdf.json文件,并自动配置默认模型路径。 您可在【用户目录】下找到magic-pdf.json文件。

linux用户目录为 /root

8. 第一次运行

从仓库中下载样本文件,并测试

wget https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/demo/small_ocr.pdf
magic-pdf -p small_ocr.pdf -o ./output

9. 测试CUDA加速

如果您的显卡显存大于等于 8GB ,可以进行以下流程,测试CUDA解析加速效果

1.修改【用户目录】中配置文件magic-pdf.json中"device-mode"的值

{
  "device-mode":"cuda"
}

2.运行以下命令测试cuda加速效果

magic-pdf -p small_ocr.pdf -o ./output

CUDA加速是否生效可以根据log中输出的各个阶段cost耗时来简单判断,通常情况下,layout detection cost 和 mfr time 应提速10倍以上。

10. 为ocr开启cuda加速

1.下载paddlepaddle-gpu, 安装完成后会自动开启ocr加速

python -m pip install paddlepaddle-gpu==3.0.0b1 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/

2.运行以下命令测试ocr加速效果

magic-pdf -p small_ocr.pdf -o ./output

Tip

CUDA加速是否生效可以根据log中输出的各个阶段cost耗时来简单判断,通常情况下,ocr cost应提速10倍以上。

### minerU 的本地部署指南 #### 准备工作 在进行 minerU 的本地部署之前,需确保满足以下条件: - 安装有支持的操作系统(通常为 Linux 或 macOS),并配置好必要的开发环境工具链[^1]。 - 需要安装 Docker 和 Docker Compose 工具来简化容器化服务的管理过程[^2]。 #### 环境搭建 为了使 minerU 能够正常运行于本地环境中,建议按照如下方法设置基础架构: 1. **Docker 安装** 如果尚未安装 Docker,请访问官方文档获取适合操作系统的安装脚本或命令。例如,在 Ubuntu 上可以执行以下命令完成安装: ```bash sudo apt-get update && sudo apt-get install docker.io -y ``` 2. **克隆项目仓库** 使用 Git 将 minerU 的源码库拉取到本地机器上。假设远程地址已知,则可通过下述方式实现同步: ```bash git clone https://github.com/mineru-project/mineru.git cd mineru ``` 3. **启动服务** 利用 Docker Compose 文件定义的服务描述信息一键初始化整个应用堆栈结构。具体指令如下所示: ```bash docker-compose up --build -d ``` 此处参数解释:“--build” 表示重新构建镜像;“-d” 后台模式运行容器实例[^3]。 #### 测试验证 当上述步骤完成后,可以通过浏览器打开指定 URL 地址确认界面是否加载成功。默认情况下监听端口可能设定了固定数值比如 `80` 或者自定义范围内的其他值[^4]。 ```python import requests response = requests.get('http://localhost/') if response.status_code == 200: print("MinerU service is running correctly.") else: print(f"Error occurred: {response.text}") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MC数据局

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值