Skip to content

虾饺是什么

虾饺 IM(Xiajiao)是一个开源的 AI Agent 团队协作平台

用一句话概括:像管微信群一样管理你的 AI Agent。

你可以创建群组,拉入多个 Agent(小说家、编辑、翻译官、代码助手……),用 @mention 跟它们对话。Agent 之间也能互相协作、互相接力,就像一个真正的工作团队。

虾饺 IM 界面

30 秒了解虾饺

虾饺协作流演示

真实对话截图

Agent 对话演示

虾饺管家 Agent 的真实对话:自动调用工具查询系统状态、展示 Channel 连接信息,并以结构化表格呈现。

和其他平台有什么不同?

大多数 AI 平台的定位是 AI 应用开发平台——帮你构建面向用户的 AI 应用。

虾饺的定位是 AI Agent 团队协作平台——把 Agent 当同事,不当工具。

设计哲学对比

虾饺Dify / FastGPTCoze
核心概念Agent 是"同事"Agent 是"应用"Agent 是"Bot"
交互方式IM 群聊工作流画布Bot 配置界面
Agent 关系平等协作,可互相 @mention预设 DAG 管线独立运行
用户定位给自己用给终端用户用给终端用户用

技术架构对比

虾饺DifyFastGPTCoze
语言JavaScriptPythonTypeScript闭源
npm 依赖6 个N/A100+N/A
外部依赖0 个PostgreSQL + Redis + SandboxMongoDB + PG + OneAPI云服务
启动命令npm startdocker compose updocker compose upSaaS
安装方式npm install(6 个包)Docker 多服务Docker 多服务无需安装
数据私有✅ 完全本地✅ 自托管✅ 自托管❌ 云端

不是竞争,是互补

Dify / FastGPT 适合构建面向客户的 AI 应用。虾饺适合个人/团队日常使用的 AI 协作空间。场景不同,选择不同。

核心能力

能力说明详情
🤖 多 Agent 群聊群组 + @mention 路由 + Agent 间对话详情
🔧 Tool Calling7 个内置工具(搜索、记忆、RAG、跨 Agent 调用等)详情
🧠 持久记忆三分类记忆(语义 / 情景 / 程序性),embedding 去重详情
📚 RAG 知识库BM25 + 向量混合检索 + RRF + LLM 重排序详情
🔗 协作流协作链 + 可视化面板 + 人工干预详情
🔌 多模型OpenAI / Claude / 通义 / DeepSeek / Ollama 等详情

文生图(AI 配图)

小说家等 Agent 可在群聊中根据文案生成配图;协作链面板与聊天区中的插图同屏展示,直观体现「文生图」能力。

协作链与夏夜星空 AI 插画——星空、萤火、月色与竹席人物

使用场景

场景 1:AI 写作团队

创建群组,拉入小说家、编辑、翻译官。配好协作链后,你说一句"写一首诗",三个 Agent 自动接力:

小说家创作 → 编辑润色 → 翻译官英译

全程可视化面板实时显示进度。你可以中途暂停、编辑、重新触发。

场景 2:私人知识助理

把技术文档、学习笔记上传到 RAG 知识库。Agent 自动索引,之后问它问题,它基于你的文档回答——不瞎编。

适合:技术团队内部知识管理、个人学习笔记检索、产品文档问答。

场景 3:多模型对比

给不同 Agent 分配不同模型:代码助手用 Claude(擅长代码),翻译官用 GPT-4o(擅长多语言),日常助理用通义千问(便宜够用)。在群里同时 @它们,对比回答质量。

场景 4:自动化运维

用虾饺管家配置定时任务:每天早上 9 点搜索新闻并发送摘要,每周一生成周报模板,每月检查系统状态。

场景 5:代码开发助理

代码助手 + RAG 知识库。把项目文档、API 规范上传到知识库,代码助手基于你的项目规范写代码,不是通用的网上抄来的代码。

一对一私聊

在通讯录中点开某个 Agent,即可与其单独对话,无需创建群组,适合日常问答与代码生成。

代码助手一对一对话

代码助手实际对话 — Agent 分析思路后输出可运行代码

SOUL.md:用 Markdown 定义 Agent 人格

每个 Agent 有一个 SOUL.md 文件,用 Markdown 写"岗位说明书":

markdown
# 翻译官

你是一位精通中英双语的翻译专家。

## 工作原则
- 信、达、雅:忠实原意,表达通顺,语言优美
- 直接输出译文,不做逐句对照分析
- 遇到专业术语保留原文并附注中文

## 禁止事项
- 不翻译代码块中的内容
- 不要主动 @其他 Agent

为什么用 Markdown?

优势说明
简单用文本编辑器就能修改,不需要学习复杂的 UI
版本控制Git diff 一眼看出改了什么
可分享分享一个 .md 文件就能克隆一个 Agent 人格
可迁移不依赖任何平台格式,纯文本永远可读
表达力Markdown 支持标题、列表、表格、代码块——足以表达复杂的角色设定

谁适合用?

用户群使用方式
独立开发者想要一支 AI 团队,但不想折腾 DevOps
AI 爱好者体验多 Agent 协作,探索 SOUL.md 人格设定
小团队零供应商锁定的自托管 AI 工作空间
研究者原型验证 Agent 间通信、记忆系统、RAG 管线
内容创作者AI 写作团队,协作链自动化内容生产
学生学习 AI Agent 原理,代码简洁可读

技术概览

技术说明
运行时Node.js 22+原生 node:sqlite,无需外部数据库
HTTPnode:http零框架,标准库直接用
WebSocketws实时消息推送
数据库SQLiteWAL + FTS5,支持并发读和全文搜索
前端Vanilla JS + CSS零构建,修改即生效
npm 依赖6 个每个都有不可替代的理由
测试53 个单元测试node:test 标准库测试框架

设计哲学:每个依赖都是负债,不是资产。能用标准库的,绝不引入第三方包。

一条消息背后发生了什么

当你在虾饺中发送 @代码助手 写一个登录接口,背后经历了 14 个步骤:

1. 消息存入 SQLite
2. WebSocket 广播给所有在线客户端
3. 解析 @mention → 目标: 代码助手
4. 加载代码助手的 SOUL.md
5. 检索代码助手的持久记忆("用户偏好 Python,公司用阿里云")
6. 注入记忆到 System Prompt
7. 组装完整上下文发给 LLM API(流式模式)
8. LLM 决定调用 web_search 工具
9. 执行搜索 → 结果回注上下文
10. LLM 继续生成代码
11. 逐 token 通过 WebSocket 推送到浏览器
12. 完整回复存入 SQLite
13. 代码助手主动 memory_write("用户需要登录接口")
14. 如果有协作链 → 触发下一个 Agent

整个过程对用户完全透明——Tool Calling 的每一步都在聊天界面实时显示。

不适合什么场景?

虾饺不是万能的,这些场景建议用其他平台:

场景推荐原因
构建面向客户的 AI 应用Dify工作流 + API 发布 + 多租户
不想自托管Coze / ChatGPT TeamSaaS 免运维
需要 100+ 插件Coze丰富的插件生态
大规模并发自建微服务SQLite 单进程限制

详细对比见 平台对比

6 个依赖,凭什么够用?

很多人看到"6 个 npm 依赖"会质疑。以下是每个依赖的必要性分析:

作用为什么不能去掉替代方案
wsWebSocket 服务端Node.js 标准库没有 WebSocket 服务端实现无合适替代
formidable文件上传解析multipart/form-data 的 boundary 分割和流式解析,标准库不提供手写解析器
node-cron定时任务调度Cron 表达式解析,标准库不支持setInterval(但无法表达复杂周期)
pdf-parsePDF 文本提取RAG 知识库需要从 PDF 提取文字不支持 PDF 上传
@larksuiteoapi/node-sdk飞书连接器飞书 WebSocket 长连接协议是私有的无法替代
@modelcontextprotocol/sdkMCP 协议JSON-RPC + 能力协商,手写容易不兼容手写(风险高)

那"正常"项目需要多少依赖?

项目npm 依赖数说明
虾饺6标准库优先
Express hello world30+框架本身就带一堆
Next.js 空项目200+React + 构建工具链
Dify 前端300+完整企业级

不是说依赖多就不好。只是对于虾饺这种"给自己用"的工具,能用标准库就用标准库——少一个依赖就少一个供应链攻击面,少一个升级要跟进的包。

名字的含义

虾饺取名自广式点心——小巧精致,内料丰富。薄如蝉翼的外皮包裹着鲜嫩的虾仁。

最少的依赖,最全的能力。这就是虾饺的理念。

Roadmap

状态特性
✅ 已完成多 Agent 群聊、Tool Calling、持久记忆、RAG、协作流、RBAC
🚧 进行中工作流引擎、Agent 间协商
📋 计划中MCP 工具市场、语音输入、移动端适配
🤔 探索中Agent 自主学习、多租户支持

下一步

你想...看这里
立刻试试快速开始 — 3 步跑起来
配置模型模型配置大全 — 8 个 Provider 详细教程
学 Agent 设计SOUL.md 写作指南 — 写出好的 Agent 人格
复制 Agent 模板SOUL.md 模板库 — 20 个模板
照搬方案实战案例 — 12 个 Agent 团队配置
了解技术架构设计 — 代码结构和数据流
对比平台平台对比 — vs Dify/Coze/FastGPT
确认安全安全与隐私 — 数据主权详解

基于 MIT 协议开源 · GitHub · 社区