产品详细介绍
Skyflow 是一款面向现代云原生与 AI 场景的数据隐私金库(Data Privacy Vault),专门用于保护 PII(个人身份信息)、PCI(支付卡信息)、PHI(受保护健康信息)等高度敏感数据。通过零信任架构、全生命周期加密和细粒度访问控制,Skyflow 帮助企业在全球范围内安全地收集、存储、使用和共享敏感数据。
- 零信任数据隐私金库架构
- 将敏感数据从业务系统中“隔离”出来,集中存放在专用隐私金库中,而业务系统只与代币化数据或受控接口交互。
- 通过统一的策略引擎,对不同系统、用户、角色和地域实施一致的数据访问与治理策略。
- 减少敏感数据在各系统间的复制和扩散,从根源降低数据泄露和滥用风险。
- 全栈加密与精细化访问控制
- 数据在静态存储、网络传输以及内存处理中均保持加密状态,最大限度降低攻击面。
- 支持字段级、记录级的访问控制,可按角色、部门、国家/地区、业务场景等维度配置权限。
- 提供可审计的访问日志与操作记录,便于安全审计与合规检查。
- 多态加密:兼顾隐私保护与数据可用性
- Skyflow 的多态加密(Polymorphic Encryption)允许对同一数据以不同“视图”呈现:
- 对开发与测试环境:可返回脱敏或伪造数据;
- 对数据科学与分析团队:可返回可聚合、可统计但不可反识别的加密数据;
- 对客服或风控团队:在合规前提下返回部分明文或掩码数据。
- 在保护隐私的同时,仍然支持数据分析、建模、报表和运营决策,不牺牲业务团队的数据可用性。
- 支付数据与合规卸载
- 支持将所有 PCI 支付卡数据从企业自有环境中迁移到 Skyflow 金库中,企业系统只处理代币或引用。
- 通过集中化的支付数据管理,替代多种分散的点状安全方案,简化架构、降低维护成本。
- 帮助企业显著降低 PCI DSS 等合规压力,加快审计流程,同时提升支付风控与反欺诈能力。
- 面向 AI 与 LLM 的敏感数据保护
- 在大模型(LLM)数据采集、训练、微调和推理阶段,自动识别并脱敏或删除 PII、IP(知识产权)等敏感信息。
- 防止敏感数据被无意间写入训练集或通过模型输出泄露,降低“数据泄漏型提示注入”等新型 AI 风险。
- 支持与主流数据平台(如 Databricks、BigQuery 等)集成,为数据科学与 AI 团队提供安全的数据访问通道。
- 快速落地与可扩展性
- 通过标准化 API、SDK 和预构建集成,企业可以在数小时内完成接入,而非自建方案常见的数月周期。
- 减少自建隐私基础设施所需的工程人力和长期维护成本,让团队专注于核心业务与产品创新。
简单使用教程
以下为一个从零开始接入 Skyflow 的简明流程示例,帮助你快速理解如何在现有技术栈中使用该产品。
步骤一:规划敏感数据与使用场景
- 梳理业务中涉及的敏感数据类型:
- PII:姓名、身份证号、手机号、邮箱、地址等;
- PCI:银行卡号、CVV、有效期等支付信息;
- PHI:就诊记录、处方信息、健康数据等。
- 明确这些数据在系统中的流转路径:采集、存储、分析、展示、对外共享等。
- 确定需要优先接入 Skyflow 的系统和场景,例如:支付模块、用户资料中心、数据分析平台、AI/LLM 数据管道等。
步骤二:创建 Skyflow 账户与金库
- 在 Skyflow 官网注册企业账户,完成基础信息配置和团队成员邀请。
- 在控制台中创建一个或多个数据金库(Vault),按业务域或合规要求进行划分,例如:
- customer_vault:客户身份与联系信息;
- payment_vault:支付卡与交易相关信息;
- health_vault:医疗与健康数据。
- 为每个金库定义数据模型:字段名称、类型、是否敏感、加密与脱敏策略等。
步骤三:配置访问策略与权限
- 在 Skyflow 控制台中创建角色(如:数据科学家、客服、财务、开发、审计员等)。
- 为不同角色配置字段级访问权限:
- 是否可读取明文、掩码数据或仅可统计;
- 是否允许写入、更新或删除;
- 是否限制特定国家/地区或 IP 范围访问。
- 启用审计日志,确保所有访问和操作都有可追踪记录,满足合规与安全审计需求。
步骤四:通过 API/SDK 接入业务系统
- 在 Skyflow 控制台生成 API 密钥或配置 OAuth/服务账号等安全认证方式。
- 在后端服务中集成 Skyflow 提供的 SDK 或直接调用 REST API:
- 将原本写入数据库的敏感字段改为写入 Skyflow 金库;
- 系统中仅保存 Skyflow 返回的代币或引用 ID。
- 在读取数据时,根据调用方角色和策略,从 Skyflow 获取相应“视图”的数据(明文、掩码或聚合结果)。
步骤五:集成数据分析与 AI/LLM 流水线
- 对接 Databricks、BigQuery 等数据平台:
- 在数据导入前,通过 Skyflow 对敏感字段进行加密或脱敏;
- 在分析任务中使用可计算的加密数据,避免直接暴露原始 PII/PCI/PHI。
- 在 LLM 相关流程中使用 Skyflow:
- 训练/微调前:对训练语料进行敏感信息识别与脱敏;
- 推理阶段:对用户输入进行实时检测与过滤,防止敏感数据进入模型;
- 对模型输出进行审查,避免泄露内部机密或个人隐私。
步骤六:持续监控与优化
- 定期查看 Skyflow 提供的访问日志和安全报告,识别异常访问或潜在风险。
- 根据业务变化和法规更新(如 GDPR、CCPA、HIPAA 等),调整数据模型和访问策略。
- 随着业务扩展,将更多系统和团队纳入 Skyflow 的统一数据隐私治理框架中。




