📑 Nano PDF 解析器

文档处理 · 本地萃取 · 视觉解构

轻量化、极速且百分百离线的 PDF 万能抽手。专门为大模型 Token 极限压缩而生的文档解析技能，让 AI 能够在一秒钟内吞下百页商业报告与扫描件。

OpenClaw Team

🚀 快速安装

在您的终端中执行以下命令即可完成安装：

npx clawhub install nano-pdf

⭐ 收藏点赞	☁️ 总计调用	👥 当前活跃	🎯 稳定版本
986	45.2w	5,100	v2.2.0

向大模型里死磕 PDF 原文件往往会遭遇内存炸库和海量的乱码幻觉。此组件作为极速前置过滤网，彻底重组了文档喂食逻辑：

⚡ 毫秒级的双轨脱水提取：它会自动判断文档类型。如果是原生数字生成的 PDF，它将使用轻巧的解析流秒速吐出纯净文本；如果是老旧扫描件，它能直接挂载 Tesseract 驱动执行光学字符（OCR）硬破解。
🧹 完美的版面与表格还原：大多数低级萃取器会将双列排版的学术论文揉成一团。Nano-PDF 具备卓越的坐标纠偏算法，能够最大程度保留原始段落层级与基础表格矩阵，防止 AI 丢失上下文明理。
✂️ 分页懒加载抽样：支持精细化的索引指令。您可以要求模型只提取"第 15 到 20 页"的数据，无需全部导入，避免 Token 瞬间击穿上限。
🔐 物理级的数据断网安全：市面上无数的 PDF 工具都要求将涉密合同上传至云端解析。本组件纯 Node 本地生算，不留存任何副本外传，是金融与法务 Agent 的最坚固后盾。

每到财报公布节点，把数百页的 PDF 年报扔给带有此技能的 AI。它能够接管该文件，迅速定位并提取只包含"财务资产负债表"和"董事会概述"的指定页码片段。接着配合运算逻辑生成一份三分钟速读的 Markdown 总结呈现给金融分析师。

当法务库涌入一批旧年代的扫描版租赁合同，代理终端可以使用 nano-pdf 的图像 OCR 开源引擎，逐页打通硬解码，再由大模型识别寻找诸如"霸王条款"、"违约金额度不一致"等风险暗雷。

安装完成后，您不仅可以通过对话让 AI 自主调用，还可以在 CLI 侧手动发起操作：

最基础指令——直接把 PDF 全本榨取为高密度的纯文本并终端输出：

clawhub execute nano-pdf file="./report_2026.pdf"

精细化外科手术——只提取 10 到 15 页的核心内容：

clawhub execute nano-pdf file="./contract_scan.pdf" \
  start_page=10 end_page=15

对于无法框选的图像版、扫描版 PDF 开启外骨骼 OCR 暴力识别：

clawhub execute nano-pdf file="./old_receipts.pdf" \
  use_ocr=true language="eng+chi_sim"

💻 绝对纯净的离线算力：普通的文本抽离仅需 Node.js 基础依赖即可毫秒跑通。
🔧 OCR 外置引擎要求：如果您的业务高度依赖扫描版硬解，您必须在宿主机操作系统（Ubuntu/macOS）上提前通过包管理器（如 brew install tesseract）预装 Tesseract 本体。