可视化工作流/节点类型总览
5.3 节点类型总览
在 Pop 的可视化工作流中,每一个节点(Node)都是一个可复用的功能模块:
- 有清晰的 输入端口(Inputs) 与 输出端口(Outputs)
- 有对应的 执行器(Executor) 在 Runtime 中负责实际逻辑
- 有在 UI 中展示的 名称、图标、分组与描述(来自
workflow.json和节点meta)
本节不会展开每个参数字段,而是从“按类别理解能力边界”的角度,帮你建立对整套节点体系的整体认知。后续如果你需要对某个节点做深度使用,可以在单独的节点说明文档中查阅详细配置。
下表给出一个整体鸟瞰:
| 节点大类 | 典型节点示例 | 主要用途 |
|---|---|---|
| 输入 / 输出 | entry、form、text-input、chat-input、sink |
工作流入口、接收用户输入与最终输出 |
| AI 与提示词 | llm、history-context、prompt、kb、image |
调用大模型、构建 Prompt、知识库检索 |
| 控制流与逻辑 | conditional、loop、merge、timer、terminate |
流程分支、循环、并发与结束控制 |
| 数据与存储 | dictionary、list、global-params、database、redis |
管理内存数据结构与外部数据库 |
| 文档与文件 | file-read、file-write、directory、pdf、powerpoint、excel |
读写文件、生成文档、批处理 |
| 展示与可视化 | result-view、table-view、chart、metric-card、web-view、doc-view |
对结果进行表格、图表、网页、文档展示 |
| 工具与通用 Utility | http-request、resource-browser、hash、time、random、qrcode、script-exec |
调用网络 / 本地工具、数据加工 |
| 模块与 MCP | module、group、api-resource、mcp |
复用子工作流、集成外部工具与资源 |
提示:名称与描述与
src/locales/zh-Hans/workflow.json中nodes.*配置保持一致,实际可用节点以node-registry.ts中NodeRegistry为准。
一、输入 / 输出节点(IO 类)
这类节点负责 接收输入、触发流程与输出结果,通常位于工作流的最上游或最下游。
1. entry — 入口节点
- 说明:工作流的起始点,用于触发整个流程。
- 典型用途:
- 在“运行工作流”或“发布为应用”时,汇总来自表单、聊天输入、外部调用的参数。
- 统一管理一次执行所需的上下文(文本、文件、会话信息等)。
- 特性:
- 支持可选输入(文本、文件、聊天等)。
- UI 中会展示状态(准备就绪 / 运行中 / 百分比进度等)。
2. form — 参数表单
- 说明:创建与管理工作流的参数表单。
- 典型用途:
- 为应用化的工作流定义输入界面,如:时间范围、文件选择、配置选项等。
- 与
entry配合,让工作流变成“有表单入口的小应用”。
3. text-input — 文本输入
- 说明:单独接受一段文本作为输入,可在执行时手动输入或从上游传递。
- 典型用途:
- 临时测试某段 Prompt 或示例文本。
- 与
llm/transformer配合做快速预处理。
4. chat-input 与 chat-output
chat-input说明:接收多轮对话消息输入。chat-output说明:将上游数据转换为聊天消息展示到执行面板中。- 典型用途:
- 构建自定义对话机器人工作流(前面是
chat-input,中间是逻辑与 AI,最后输出交给chat-output)。 - 结合
history-context节点,实现带上下文的多轮对话。
- 构建自定义对话机器人工作流(前面是
5. record-input — 录制输入
- 说明:录制音频、视频或音视频,支持预览、截图、多种输出格式。
- 典型用途:
- 语音转文字流程(录音 → 语音识别 → 文本分析)。
- 视频抽帧、生成摘要等工作流的入口。
6. sink / result-view — 结果接收与展示
sink:更偏“数据落地”,比如存到数据库、文件、日志等。result-view:更偏“界面展示”,在执行面板中预览最终结果。
常见用法:
entry → 处理节点 → result-view
entry → 处理节点 → sink(写数据库 / 文件)
二、AI 与提示词相关节点
这类节点是 Pop AI 能力的核心,用于调用模型、构造提示词、融合历史消息和知识库。
1. llm — AI 模型
- 说明:通用大模型调用节点,支持多厂商 / 多模型(如 OpenAI、DeepSeek、本地模型等)。
- 关键配置:模型、系统提示词、用户提示词、温度、最大 Tokens、MCP 工具等。
- 典型用途:
- 问答、总结、改写、翻译、代码生成等通用任务。
- 结合知识库与工具,完成复杂 Agent 级任务。
2. prompt — 提示词节点
- 说明:用于构建和管理 AI 提示词模板,可插入变量、上下文数据。
- 典型用途:
- 把复杂 Prompt 固化为节点,统一复用。
- 与
llm配合,将结构化数据渲染为清晰文本提示。
3. history-context — 历史消息
- 说明:从执行日志中提取历史对话上下文,支持多种输出格式和智能截断。
- 典型用途:
- 多轮对话中,为
llm提供最近若干轮消息。 - 将“系统 Prompt + 历史对话 + 当前问题”拼成一个完整上下文。
- 多轮对话中,为
4. kb — 知识库节点
- 说明:从 Pop 知识库中检索内容,统一读取 Solr / 向量检索的结果。
- 典型用途:
- RAG 问答:
entry → kb → llm → chat-output。 - 批量文档处理:检索文档片段后进行总结、分类、抽取字段等。
- RAG 问答:
5. 图像 / 视频生成:image、video
image:图像生成器,用 AI 生成图片。video:视频生成器,支持文本生成视频、图片生成视频等。- 典型用途:
- 生成插图、封面、产品示意图。
- 为营销、演示、创意视频生成素材。
三、控制流与逻辑节点
用于控制执行顺序、分支、循环、合并、定时与终止等,是“像写程序一样”构造逻辑的基础。
1. conditional — 条件分支
- 说明:根据条件表达式或规则执行不同的分支逻辑。
- 能力亮点:
- 支持单一表达式模式(如
data.score > 80)。 - 支持多规则多分支(IF1 / IF2 / ELSE)。
- 支持单一表达式模式(如
2. loop — 循环
- 说明:对列表 / 字典 / JSON 数组等数据进行遍历,为每一项执行指定子流程。
- 典型用途:
- 对一组文件逐个处理。
- 对一批用户记录逐个发送邮件 / 生成报告。
3. merge — 合并
- 说明:将多个分支的执行结果合并为一个输出。
- 支持策略:数组拼接、对象合并、文本拼接、自定义函数等。
4. timer — 定时器
- 说明:支持延时、定时和重复执行。
- 典型用途:
- 延迟执行后续流程。
- 周期性执行某些同步或检查任务(未来结合调度使用)。
5. terminate — 终止节点
- 说明:显式结束工作流执行。
- 典型用途:
- 条件不满足时提前退出。
- 人工审核失败后停止后续自动处理。
四、数据与存储节点
这类节点管理工作流内部数据结构与外部持久化存储,包括字典/列表、数据库、Redis 等。
1. dictionary 与 list
dictionary:键值对结构,适合构建配置对象、聚合字段。list:数组结构,适合收集一组结果、流水线式处理数据。
典型用途:
- 聚合多个节点输出为一个对象,用于后续统一传给
llm或存储。 - 收集循环中的中间结果,最终统一展示或写入文件。
2. global-params — 全局参数
- 说明:定义工作流的全局变量和参数,可被多个节点访问。
- 用途:
- 存储 API Key、环境配置、默认参数等。
- 在
transformer/llm/script-exec中复用同一组配置。
3. database — 数据库工具箱
- 说明:支持 SQLite / MySQL / PostgreSQL 等数据库的查询、更新、事务操作。
- 典型用途:
- 从业务数据库加载数据 → 交给 AI 分析。
- 将 AI 结果 / 统计结果写回数据库。
4. redis — Redis 缓存
- 说明:操作 Redis 中的字符串、哈希、列表、集合等类型。
- 典型用途:
- 存储会话状态或中间计算结果。
- 做限流、去重、简单计数等。
五、文档与文件节点
用于读写本地 / 远程文件、生成 PDF / PPT / Word / Excel 等文档,以及批量处理 PDF / 图片。
1. 文件基础操作:file-read、file-write、directory、resource-browser
file-read:读取文件内容,支持文本/JSON/二进制。file-write:写入数据到指定路径,可选择覆盖 / 追加。directory:列出、创建或删除目录。resource-browser:在桌面客户端中浏览本地文件系统、筛选并选择文件/目录。
2. 文档生成:pdf、powerpoint、word、excel
pdf:将文本、Markdown、HTML 等内容生成为 PDF 文件。powerpoint:生成 PowerPoint 演示文稿(报告、方案、汇报 Slides 等)。word:生成 Word 文档(合同模版、说明书、报告正文等)。excel:生成 Excel 工作簿(表格数据、统计报表等)。
3. 工具箱类:pdf-toolbox、image-toolbox
pdf-toolbox:合并、拆分 PDF,提取文本,PDF 转 EPUB 等。image-toolbox:图片的缩放、裁剪、旋转、格式转换、压缩、水印等。
这些节点非常适合构建:
- 自动报告生成工作流(数据 → AI 文案 → PPT / PDF)
- 文档批处理工作流(批量切分 PDF、抽取内容、送入知识库)
六、展示与可视化节点
这类节点主要用于 把数据结果“好看地展示出来”,在 Pop 的布局管理器中也会经常搭配使用。
1. 通用展示:result-view、table-view
result-view:以统一样式展示工作流输出的 JSON / 文本结果。table-view:以表格形式展示数据,支持排序、过滤、分页等。
2. 图表与指标:chart、metric-card
chart:生成图表可视化(折线图、柱状图等),通常搭配数值型数据使用。metric-card:指标概览卡片,适合展示“总访问量”“转化率”这类核心 KPI。
3. 文档与网页视图:doc-view、web-view、image-view、video-view
doc-view:在 Pop 中阅读 PDF、EPUB、DOCX 等文档。web-view:渲染 HTML 字符串或远程网页内容。image-view/video-view:展示图片 / 视频,支持缩放、拖拽/播放控制。
4. canvas 画布与 qrcode
canvas:高性能绘图画布,用于手绘 / 标注 / AI 绘图指令等场景。qrcode:将文本或链接编码为二维码,可用于登录、分享、下载链接等。
七、工具与 Utility 节点
这些节点是“工具箱角色”,为数据转换、网络请求、加解密、时间等提供基础能力。
1. http-request
- 发送 HTTP 请求,支持 URL、方法、Headers、Body、超时、认证等配置。
- 常用于:
- 调用外部 REST API。
- 将工作流变成“胶水层”,串联多个外部系统。
2. 常见数据工具:hash、base64、random、time、uuid
hash:生成 MD5 / SHA 系列哈希,用于校验或签名。base64:对文本进行 Base64 编码/解码。random:生成随机数 / 字符串 / 随机选项。time:获取当前时间、格式化时间、时区转换、时间计算。uuid:生成唯一标识符(UUID)。
3. 高级工具:script-exec
- 说明:在桌面环境中执行本机命令或脚本,支持内联脚本或脚本文件。
- 用途:
- 与现有脚本体系集成(如 Python / Shell / PowerShell)。
- 实现极端自定义的能力(注意安全与权限控制)。
4. 搜索与通知:search、mailer
search:从互联网上搜索特定内容(具体实现视配置而定)。mailer:通过 SMTP 发送邮件通知/告警,可配置主题、收件人、模板变量、附件等。
八、模块、MCP 与高级集成节点
这类节点主要用于 复用、组合与连接外部能力。
1. module 与 group
module:将一个子工作流封装成模块,对外暴露输入/输出,便于复用。group:对一批节点做视觉分组,支持整体移动、折叠/展开,便于整理复杂画布。
典型用法:
- 把“生成日报”的一套流程封装为
module。 - 在复杂画布中,将“数据准备”“AI 处理”“可视化输出”分别用
group包起来。
2. api-resource
- 说明:API 资源管理器,可基于 REST / OpenAPI / GraphQL 生成动态表格与表单。
- 用途:
- 快速为某个 REST API 创建管理界面 + 工作流集成。
- 结合工作流,实现“点一点就能调外部接口并进一步处理”的低代码体验。
3. mcp(MCP 工具)
- 说明:集成 Model Context Protocol 工具,让模型可以调用外部命令 / 服务 / 本地工具。
- 用途:
- 给 LLM 配备更多“动作”,比如读写文件、查数据库、访问私有 API 等。
- 配合
llm节点的 Tools 面板,可让一个节点具备“多工具 Agent”能力。
✅ 小结
在 Pop 的工作流体系中:
- I/O 节点 决定“从哪里来、到哪里去”;
- AI / 提示词节点 决定“如何思考、如何表达”;
- 控制流节点 决定“按什么顺序、在什么条件下执行”;
- 数据 / 存储节点 管数据;
- 文档 / 文件节点 管内容资产;
- 展示 / 可视化节点 管结果呈现;
- 工具 / MCP / 模块节点 则负责“接上整个世界”。
你可以先熟悉常用节点(入口、LLM、知识库、HTTP、文件读写、结果视图),然后再逐步尝试引入条件、循环、模块化与布局,构建属于自己的复杂自动化工程。