📑 Nano PDF 解析器
文档处理 · 本地萃取 · 视觉解构
轻量化、极速且百分百离线的 PDF 万能抽手。专门为大模型 Token 极限压缩而生的文档解析技能,让 AI 能够在一秒钟内吞下百页商业报告与扫描件。
OpenClaw Team
🚀 快速安装
在您的终端中执行以下命令即可完成安装:
npx clawhub install nano-pdf
📊 数据总览
| ⭐ 收藏点赞 | ☁️ 总计调用 | 👥 当前活跃 | 🎯 稳定版本 |
|---|---|---|---|
| 986 | 45.2w | 5,100 | v2.2.0 |
🎛️ 详解:它是如何运转的?
向大模型里死磕 PDF 原文件往往会遭遇内存炸库和海量的乱码幻觉。此组件作为极速前置过滤网,彻底重组了文档喂食逻辑:
- ⚡ 毫秒级的双轨脱水提取:它会自动判断文档类型。如果是原生数字生成的 PDF,它将使用轻巧的解析流秒速吐出纯净文本;如果是老旧扫描件,它能直接挂载 Tesseract 驱动执行光学字符(OCR)硬破解。
- 🧹 完美的版面与表格还原:大多数低级萃取器会将双列排版的学术论文揉成一团。Nano-PDF 具备卓越的坐标纠偏算法,能够最大程度保留原始段落层级与基础表格矩阵,防止 AI 丢失上下文明理。
- ✂️ 分页懒加载抽样:支持精细化的索引指令。您可以要求模型只提取"第 15 到 20 页"的数据,无需全部导入,避免 Token 瞬间击穿上限。
- 🔐 物理级的数据断网安全:市面上无数的 PDF 工具都要求将涉密合同上传至云端解析。本组件纯 Node 本地生算,不留存任何副本外传,是金融与法务 Agent 的最坚固后盾。
🧭 典型业务场景剖析
💼 场景一:百页财报季的自动拆解与对穿
每到财报公布节点,把数百页的 PDF 年报扔给带有此技能的 AI。它能够接管该文件,迅速定位并提取只包含"财务资产负债表"和"董事会概述"的指定页码片段。接着配合运算逻辑生成一份三分钟速读的 Markdown 总结呈现给金融分析师。
📜 场景二:海量法务合同的批量风控比对
当法务库涌入一批旧年代的扫描版租赁合同,代理终端可以使用 nano-pdf 的图像 OCR 开源引擎,逐页打通硬解码,再由大模型识别寻找诸如"霸王条款"、"违约金额度不一致"等风险暗雷。
💻 常用命令参考
安装完成后,您不仅可以通过对话让 AI 自主调用,还可以在 CLI 侧手动发起操作:
最基础指令——直接把 PDF 全本榨取为高密度的纯文本并终端输出:
clawhub execute nano-pdf file="./report_2026.pdf"
精细化外科手术——只提取 10 到 15 页的核心内容:
clawhub execute nano-pdf file="./contract_scan.pdf" \
start_page=10 end_page=15
对于无法框选的图像版、扫描版 PDF 开启外骨骼 OCR 暴力识别:
clawhub execute nano-pdf file="./old_receipts.pdf" \
use_ocr=true language="eng+chi_sim"
🛡️ 环境要求与性能门槛
- 💻 绝对纯净的离线算力:普通的文本抽离仅需 Node.js 基础依赖即可毫秒跑通。
- 🔧 OCR 外置引擎要求:如果您的业务高度依赖扫描版硬解,您必须在宿主机操作系统(Ubuntu/macOS)上提前通过包管理器(如
brew install tesseract)预装 Tesseract 本体。
© 2026 OpenClaw. All rights reserved.
