产品详细介绍

Parseur 是一款专注于“从非结构化文档中自动提取结构化数据”的 AI 数据提取软件,适用于邮件、PDF、扫描件、发票、订单、报告等多种文档场景。通过结合 AI 智能解析与模板规则,Parseur 帮助用户在无需手工复制粘贴的前提下,将文档内容自动转化为可用于系统对接和业务分析的标准化数据。

Parseur 的核心能力包括:

  1. AI 智能数据提取

    • 利用人工智能自动理解文档内容结构,从文本中识别关键信息字段(如姓名、地址、金额、订单号等)。
    • 适用于格式多变、来源多样的文档,减少为每种格式单独建模的工作量。
  2. 模板驱动的数据提取

    • 支持为特定类型的邮件或文档创建自定义模板,通过可视化方式标记需要提取的字段。
    • 一旦模板建立,后续同类文档将自动按模板解析,保证数据字段稳定、可控。
  3. OCR 光学字符识别

    • 内置快速且准确的 OCR 引擎,可从扫描 PDF、图片等非文本文件中识别文字。
    • 适合处理纸质文件扫描件、拍照件等传统难以自动化的资料。
  4. 区域(Zonal)与动态 OCR

    • Zonal OCR:可针对文档中固定区域进行识别,将该区域内容转换为结构化数据,适合版式相对固定的表单、票据等。
    • 动态 OCR:支持提取位置会移动或字段长度变化的内容,适应布局不完全固定的文档场景。
  5. 文档提取 API 与集成能力

    • 提供完善的文档提取 API,方便开发者将 Parseur 集成进自有系统或业务流程中。
    • 通过内置集成与自动化平台连接,可将解析后的数据发送到数以千计的应用,如 CRM、ERP、表格、数据库、工单系统、营销自动化工具等。
  6. 自动化工作流与扩展性

    • 支持根据文档来源、类型或内容自动路由到不同解析规则和输出目的地。
    • 采用按使用量付费模式,提供免费起步方案,适合从个人、小团队到企业级用户逐步扩展使用规模。

Parseur 的目标是让企业和团队摆脱重复的手工录入和复制粘贴工作,通过自动化数据提取与分发,提升运营效率,降低出错率,并加快数据流转速度。

简单使用教程

以下是使用 Parseur 搭建基础数据提取流程的简明步骤:

  1. 注册并创建邮箱/收件箱

    • 在 Parseur 官网注册账号,登录后创建一个新的“收件箱”(Inbox),用于接收需要解析的邮件或文档。
    • 每个收件箱可对应一种或多种文档类型,便于分类管理。
  2. 导入或转发文档

    • 将需要解析的邮件直接转发到 Parseur 为该收件箱生成的专用邮箱地址,或在界面中上传 PDF、图片等文件。
    • 也可以通过 API 或集成工具,将系统中的文档自动推送到 Parseur。
  3. 创建解析模板或启用 AI 提取

    • 模板方式: 1)在收件箱中选择一封代表性文档作为样本; 2)进入模板编辑界面,用鼠标选中需要提取的内容(如姓名、金额、日期等),并为每个选区命名字段; 3)保存模板后,Parseur 会自动将该模板应用于后续同类文档。
    • AI 方式:
      • 启用 AI 数据提取功能,让系统自动识别并提取常见字段,适合格式多变或初期快速试用。
  4. 配置 OCR(如需)

    • 若处理的是扫描 PDF 或图片文件,在收件箱设置中开启 OCR 功能。
    • 对于版式较固定的表单,可使用 Zonal OCR 指定识别区域;对于布局不固定的文档,可启用动态 OCR 提取关键字段。
  5. 设置数据输出与集成

    • 在“集成”或“导出”设置中,选择数据要发送到的目标应用,例如:
      • 在线表格(如 Google Sheets)、数据库、CRM、ERP、工单系统等;
      • 或通过 Webhook/API 推送到自建系统。
    • 配置字段映射,将 Parseur 中的字段对应到目标系统中的字段名称。
  6. 测试与优化

    • 使用几份真实文档进行测试,检查提取结果是否准确、字段是否完整。
    • 如有偏差,可微调模板标记、字段命名或 OCR 区域设置,必要时增加多个模板以覆盖不同格式。
  7. 上线自动化流程

    • 测试无误后,将业务系统或邮箱的相关文档流量正式接入 Parseur。
    • 后续文档将自动被解析并推送到指定应用,实现端到端的数据自动化处理。

通过以上步骤,即可快速搭建一个从邮件与文档到业务系统的自动化数据提取与分发流程,大幅减少人工录入和数据整理工作。