内置 AI 对话
Beta 功能
内置 AI 对话仍在开发中。下面描述的能力以 v0.2.0 版本为目标,部分细节可能在发布前调整。
它要解决的问题
不是所有用户都装了 Claude Code / Cursor。但他们仍可能需要"让 AI 帮忙跑一次本机能力"。
内置 AI 对话页让 Sigil 自己也能当一个最小可用的 MCP 客户端——你在 Sigil 内对话,AI 直接调用本机能力。
它不是
- 不是 一个完整的 AI IDE(不能写代码、不能 PR review)
- 不是 Claude Code / Cursor 的替代品(它们更专业)
- 不是 给 Anthropic / OpenAI 的代理服务(你用的是自己的 API Key)
定位:轻量的本机 AI 对话 + 能力调用窗口,适合"我就想随手让 AI 查个东西"的场景。
模型来源
支持接入:
| 厂商 | 接入方式 | 凭据类型 |
|---|---|---|
| OpenAI | OpenAI 兼容 API | http_api |
| Anthropic | Anthropic Messages API | http_api |
| 本地模型 | OpenAI 兼容(Ollama / LM Studio) | http_api |
| 其他 OpenAI 兼容 | DeepSeek / Moonshot / 智谱 / ... | http_api |
你用的是自己的 API Key——Sigil 不代付费、不中转、不缓存对话到任何服务器。
API Key 录入金库后,Chat 页直接引用,明文不出本机。
对话与能力调用
用户:查一下 prod 库今天的注册量
↓
Sigil Chat: 检测到需要查询数据库
→ 调用 db_query(SELECT count(*) FROM users WHERE ...)
→ 注入 prod-db-readonly 凭据
→ 返回脱敏结果给 LLM
→ LLM 组织成自然语言
↓
LLM 回复:今天注册了 1,234 人,比昨天 +12%整个流程:
- API Key、数据库密码、查询结果 都不离开本机
- 只有"用户的问题文本 + 脱敏后的结果摘要"被送给 LLM(这是 LLM 工作所必需的)
会话管理
| 功能 | 说明 |
|---|---|
| 多会话 | 类似浏览器多 tab |
| 会话归档 | 完结的会话可归档(仍可全文检索) |
| 模型切换 | 同一会话内可切模型,token 记账分开 |
| 导出 | Markdown / JSON 两种格式 |
| 删除 | 不可逆,二次确认 |
所有会话存在本机 SQLite,不上传。
能力关联
每个会话可以选择默认能力集:
- 全部能力 —— 适合"我也不知道要做啥,先聊聊"
- 仅只读 —— 适合"看一眼情况就行"
- 自定义 —— 勾选具体能力
会话期间也可以让 AI 临时申请新能力——会触发一次类似 __temp_grant__ 的轻量授权流程,需用户在 Sigil 弹窗确认。
与外部 MCP 客户端的区别
| 外部客户端(Claude Code 等) | Sigil 内置 Chat | |
|---|---|---|
| 模型推理 | 客户端自己处理 | Sigil 通过 HTTP 调外部模型 |
| 工具调用 | 通过 MCP HTTP | 内部直接调(不经过 MCP 网络层) |
| 安全模型 | 完全一致 | 完全一致(同一套 Vault / 同一套审计) |
| UI 复杂度 | 高(IDE 级) | 低(聊天框 + 能力面板) |
| 适合场景 | 编程协作 | 简单查询、临时任务 |
关于"内置不内嵌模型"
Sigil 不在应用里塞模型权重。理由:
- 模型几 GB 起步,会让安装包失控
- 本地模型质量目前不如云端 SOTA
- 用户对模型有强偏好(GPT-4 vs Claude vs Gemini),强行选一个会得罪人
我们的选择:做最薄的 OpenAI 兼容客户端,让你接任何想接的服务。
隐私边界
发送给 LLM 厂商的内容:
- ✅ 你输入的问题文本
- ✅ Sigil 暴露的能力描述("工具列表",无凭据明文)
- ✅ 能力执行后的脱敏结果摘要
- ❌ 不发:凭据明文、完整审计、其他凭据元数据
LLM 厂商的隐私策略由你自己评估(OpenAI / Anthropic 都有公开的 API 数据使用策略)。Sigil 在 LLM 厂商那一侧无控制权——这是务实的边界。
下一步
- 看安全模型:安全总览 →
- 看怎么和外部客户端协作:MCP Server →
- 看路线图里 Chat 的后续:路线图 →
