产品详细介绍

Knowledge Exploration 项目是微软研究院在认知计算与搜索领域的一项研究成果,其核心是 Knowledge Exploration API。该 API 旨在帮助开发者在结构化数据之上,快速构建支持自然语言查询的交互式搜索与探索体验。

传统的结构化数据检索通常依赖复杂的查询语法(如 SQL、OData 或自定义过滤表达式),对终端用户并不友好。Knowledge Exploration API 的目标,是让用户可以直接用自然语言来表达需求,由系统自动完成从自然语言到结构化查询的转换,并返回可用于展示和可视化的结果。

根据页面信息,Knowledge Exploration API 主要具备以下能力:

  1. 自然语言到结构化查询的解释

    • 将用户的自然语言查询自动解析为结构化查询表达式(如过滤条件、排序规则、字段选择等)。
    • 支持在已有的结构化数据模式(schema)之上工作,可根据字段、属性和关系进行智能映射。
    • 降低用户学习成本,让用户无需了解底层数据结构即可进行复杂检索。
  2. 降低用户操作成本,帮助发现丰富功能

    • 通过自然语言交互,引导用户逐步发现数据源中可用的字段、筛选条件和高级功能。
    • 可结合提示、自动补全或交互式问答,减少用户在界面上的点击和配置操作。
    • 适用于需要“探索式搜索”的场景,如学术搜索、产品搜索、知识库查询等。
  3. 高效检索匹配对象的详细信息

    • 在解析出结构化查询后,API 能够高效检索与查询条件匹配的对象(如文档、产品、实体等)。
    • 支持返回对象的详细属性信息,便于在前端进行富展示(如卡片、详情页、对比视图等)。
  4. 支持丰富可视化与交互式分面体验

    • 通过结构化的查询结果和聚合信息,前端可以构建分面导航(faceted search),例如按类别、价格区间、时间、标签等进行多维筛选。
    • 适合构建交互式仪表盘、探索式数据分析界面和知识图谱浏览界面。
    • 用户可以在自然语言查询与可视化筛选之间自由切换,形成闭环的探索体验。
  5. 典型应用场景示例

    • 电商与产品搜索:用户输入“5000 元以内的轻薄笔记本,适合办公”,系统自动解析为价格、品类、用途等结构化条件。
    • 学术与知识检索:用户输入“近五年关于深度学习在医疗影像上的论文”,解析为时间范围、主题领域和应用场景等过滤条件。
    • 企业内部知识库:员工输入“最近的销售报告和季度总结”,系统将自然语言映射到文档类型、时间、部门等字段。
    • 数据分析入口:业务人员用自然语言提出问题,如“上季度北美地区的销售增长情况”,由系统转换为对应的数据查询和可视化视图。

总体而言,Knowledge Exploration API 是面向“结构化数据 + 自然语言交互”的中间层技术,帮助开发者在不改变数据存储方式的前提下,为用户提供更自然、更智能的搜索与探索体验。

简单使用教程

以下为基于页面信息整理的简明使用思路,具体接口细节需参考官方 Documentation 与 SDK:

  1. 准备结构化数据与模式(schema)

    • 将业务数据整理为结构化形式(如表格、JSON、数据库记录等),并明确每个字段的含义与类型(数值、文本、时间、枚举等)。
    • 定义数据模式(schema),包括:字段名称、数据类型、可选值范围、字段之间的关系等。
    • 确保数据模式能够覆盖用户可能在自然语言中提到的关键属性(如价格、时间、地点、类别等)。
  2. 在 Knowledge Exploration API 中配置数据模型

    • 使用官方提供的配置工具或 SDK,将数据模式上传或注册到 Knowledge Exploration API。
    • 为关键字段配置语义信息和同义词(例如“价格”“价位”“多少钱”映射到同一字段),以提升自然语言解析效果。
    • 根据业务需要,设置哪些字段可用于过滤、排序、聚合和展示。
  3. 接入自然语言查询接口

    • 在应用前端(Web、移动端或桌面应用)中提供一个自然语言输入框,供用户输入查询语句。
    • 将用户输入的自然语言文本通过后端服务转发给 Knowledge Exploration API 的解析端点。
    • API 返回解析后的结构化查询表达式(例如:过滤条件、排序规则、分页信息等)。
  4. 执行结构化查询并获取结果

    • 后端根据 API 返回的结构化查询表达式,在实际的数据源(数据库、搜索引擎索引等)上执行查询。
    • 获取匹配对象的列表及其详细属性信息。
    • 可在此阶段进行二次处理,如结果排序优化、打分、去重或补充额外字段。
  5. 构建交互式搜索与分面体验

    • 在前端展示查询结果列表,并根据返回的结构化信息构建分面筛选(如按类别、价格区间、时间段等)。
    • 用户可以继续通过自然语言细化查询,例如“只看最近三个月的”或“按价格从低到高排序”。
    • 将新的自然语言输入再次发送给 API,叠加或替换现有的结构化查询条件,实现连续的探索式搜索。
  6. 迭代优化与监控

    • 通过日志分析用户的自然语言查询,识别常见表达方式和解析失败的案例。
    • 不断完善数据模式、同义词配置和字段语义映射,以提升解析准确率。
    • 根据业务反馈,扩展支持的查询类型和可视化方式(如图表、地图、时间轴等)。

通过以上步骤,开发者可以利用 Knowledge Exploration API 将现有的结构化数据能力升级为自然语言驱动的智能搜索与探索系统,为用户提供更直观、更高效的交互体验。