MOSS 是一个集大模型推理、智能体交互和 API 服务于一体的在线平台,支持多种中文大模型与工具集成,帮助开发者和团队快速构建、测试和部署 AI 应用。
产品详细介绍
MOSS 平台主要围绕“大模型 + 智能体 + API 服务”三大能力展开,提供从在线体验到程序化调用的一站式解决方案:
- 多模型支持与统一入口
- 提供多种中文大模型接入能力(如对话模型、代码模型等)
- 通过统一的 Web 界面与统一 API 入口进行管理和调用
- 支持按模型区分不同能力场景,如问答、创作、代码辅助等
- 在线对话与智能体交互
- 在浏览器中即可与模型进行多轮对话
- 支持设置系统提示词,定制模型角色与行为
- 适合用作知识问答助手、写作助手、代码助手等智能体原型
- API 调用与应用集成
- 提供标准化 HTTP/RESTful API 接口
- 支持在后端服务、Web 前端、小程序、桌面应用中集成调用
- 通过密钥或 Token 进行鉴权,方便接入现有业务系统
- 推理服务与性能优化
- 后端对大模型推理进行统一调度和资源管理
- 支持流式输出,降低响应延迟,提升交互体验
- 适合高并发场景下的问答、生成式内容服务
- 开发者友好与生态扩展
- 提供示例代码与调用模板,降低接入门槛
- 支持与现有 NLP / AI 框架集成(如 fastNLP 等)
- 便于在科研、教学、企业内部工具中快速落地
简单使用教程
以下为基于典型大模型平台的通用使用流程,具体以 MOSS 实际页面为准:
- 访问与注册登录
- 打开浏览器访问:
https://moss.fastnlp.top - 如平台要求登录,按页面提示完成注册或使用已有账号登录
- 在线体验对话功能
- 登录后进入主界面,通常会有一个对话窗口或“开始对话”入口
- 在输入框中输入你的问题或指令,例如:
- “帮我写一段产品介绍”
- “解释一下 Transformer 模型的原理”
- 点击发送后,等待模型返回回答,可继续多轮追问
- 配置模型与参数(如页面提供)
- 在对话或设置区域选择具体模型(如通用模型、代码模型等)
- 可根据需要调整:
- 温度(temperature):控制回答的随机性
- 最大生成长度:控制输出字数
- 系统提示词:设定模型的角色和语气
- 获取 API Key(如支持)
- 在“个人中心”或“开发者中心”中找到 API 或密钥管理入口
- 创建或查看你的 API Key,并妥善保存
- 注意:不要在前端公开代码或公共仓库中暴露密钥
- 通过 API 调用模型(示例流程)
- 在你的后端或脚本中,使用 HTTP 请求调用 MOSS 提供的接口
- 一般步骤:
1)在请求头中加入认证信息(如Authorization: Bearer <API_KEY>)
2)在请求体中指定模型名称、输入内容和参数
3)发送请求并解析返回的 JSON 结果 - 可根据平台文档提供的示例代码(如 Python、JavaScript 等)快速接入
- 集成到业务场景
- 将 MOSS 的对话或生成能力嵌入到:
- 客服机器人、知识问答系统
- 文案生成、报告生成工具
- 代码辅助、教学辅助平台
- 根据业务需求,对输入提示词进行模板化设计,以获得更稳定的输出
FAQ 常见问题
1. MOSS 需要付费吗?
具体收费模式需以官网或平台公告为准。部分功能可能提供免费额度或测试配额,超出后按调用量计费。
2. 如何选择合适的模型?
- 一般问答、写作:选择通用对话模型
- 技术解释、代码生成:选择偏向代码或技术的模型(如有)
- 需要更稳定严谨输出时,可降低温度并限制生成长度
3. API Key 丢失怎么办?
- 立即登录平台,在“密钥管理”中吊销旧 Key
- 重新生成新的 Key,并更新到你的应用配置中
4. 可以接入自己的业务数据吗?
- 通常可以通过在提示词中加入业务背景、示例数据的方式进行“轻量定制”
- 如平台支持知识库或向量检索,可将业务文档接入,实现更精准的问答
5. MOSS 适合哪些人使用?
- 需要快速验证想法的开发者与研究者
- 希望在产品中集成对话、问答、生成能力的企业团队
- 教学、科研场景下需要中文大模型支持的老师与学生




