5.3 节点类型总览

在 Pop 的可视化工作流中，每一个节点（Node）都是一个可复用的功能模块：

有清晰的 输入端口（Inputs） 与 输出端口（Outputs）
有对应的 执行器（Executor） 在 Runtime 中负责实际逻辑
有在 UI 中展示的 名称、图标、分组与描述（来自 workflow.json 和节点 meta）

本节不会展开每个参数字段，而是从“按类别理解能力边界”的角度，帮你建立对整套节点体系的整体认知。后续如果你需要对某个节点做深度使用，可以在单独的节点说明文档中查阅详细配置。

下表给出一个整体鸟瞰：

节点大类	典型节点示例	主要用途
输入 / 输出	`entry`、`form`、`text-input`、`chat-input`、`sink`	工作流入口、接收用户输入与最终输出
AI 与提示词	`llm`、`history-context`、`prompt`、`kb`、`image`	调用大模型、构建 Prompt、知识库检索
控制流与逻辑	`conditional`、`loop`、`merge`、`timer`、`terminate`	流程分支、循环、并发与结束控制
数据与存储	`dictionary`、`list`、`global-params`、`database`、`redis`	管理内存数据结构与外部数据库
文档与文件	`file-read`、`file-write`、`directory`、`pdf`、`powerpoint`、`excel`	读写文件、生成文档、批处理
展示与可视化	`result-view`、`table-view`、`chart`、`metric-card`、`web-view`、`doc-view`	对结果进行表格、图表、网页、文档展示
工具与通用 Utility	`http-request`、`resource-browser`、`hash`、`time`、`random`、`qrcode`、`script-exec`	调用网络 / 本地工具、数据加工
模块与 MCP	`module`、`group`、`api-resource`、`mcp`	复用子工作流、集成外部工具与资源

提示：名称与描述与 src/locales/zh-Hans/workflow.json 中 nodes.* 配置保持一致，实际可用节点以 node-registry.ts 中 NodeRegistry 为准。

一、输入 / 输出节点（IO 类）

这类节点负责 接收输入、触发流程与输出结果，通常位于工作流的最上游或最下游。

1. `entry` — 入口节点

说明：工作流的起始点，用于触发整个流程。
典型用途：
- 在“运行工作流”或“发布为应用”时，汇总来自表单、聊天输入、外部调用的参数。
- 统一管理一次执行所需的上下文（文本、文件、会话信息等）。
特性：
- 支持可选输入（文本、文件、聊天等）。
- UI 中会展示状态（准备就绪 / 运行中 / 百分比进度等）。

2. `form` — 参数表单

说明：创建与管理工作流的参数表单。
典型用途：
- 为应用化的工作流定义输入界面，如：时间范围、文件选择、配置选项等。
- 与 entry 配合，让工作流变成“有表单入口的小应用”。

3. `text-input` — 文本输入

说明：单独接受一段文本作为输入，可在执行时手动输入或从上游传递。
典型用途：
- 临时测试某段 Prompt 或示例文本。
- 与 llm / transformer 配合做快速预处理。

4. `chat-input` 与 `chat-output`

chat-input 说明：接收多轮对话消息输入。
chat-output 说明：将上游数据转换为聊天消息展示到执行面板中。
典型用途：
- 构建自定义对话机器人工作流（前面是 chat-input，中间是逻辑与 AI，最后输出交给 chat-output）。
- 结合 history-context 节点，实现带上下文的多轮对话。

5. `record-input` — 录制输入

说明：录制音频、视频或音视频，支持预览、截图、多种输出格式。
典型用途：
- 语音转文字流程（录音 → 语音识别 → 文本分析）。
- 视频抽帧、生成摘要等工作流的入口。

6. `sink` / `result-view` — 结果接收与展示

sink：更偏“数据落地”，比如存到数据库、文件、日志等。
result-view：更偏“界面展示”，在执行面板中预览最终结果。

常见用法：

entry → 处理节点 → result-view
entry → 处理节点 → sink（写数据库 / 文件）

二、AI 与提示词相关节点

这类节点是 Pop AI 能力的核心，用于调用模型、构造提示词、融合历史消息和知识库。

1. `llm` — AI 模型

说明：通用大模型调用节点，支持多厂商 / 多模型（如 OpenAI、DeepSeek、本地模型等）。
关键配置：模型、系统提示词、用户提示词、温度、最大 Tokens、MCP 工具等。
典型用途：
- 问答、总结、改写、翻译、代码生成等通用任务。
- 结合知识库与工具，完成复杂 Agent 级任务。

2. `prompt` — 提示词节点

说明：用于构建和管理 AI 提示词模板，可插入变量、上下文数据。
典型用途：
- 把复杂 Prompt 固化为节点，统一复用。
- 与 llm 配合，将结构化数据渲染为清晰文本提示。

3. `history-context` — 历史消息

说明：从执行日志中提取历史对话上下文，支持多种输出格式和智能截断。
典型用途：
- 多轮对话中，为 llm 提供最近若干轮消息。
- 将“系统 Prompt + 历史对话 + 当前问题”拼成一个完整上下文。

4. `kb` — 知识库节点

说明：从 Pop 知识库中检索内容，统一读取 Solr / 向量检索的结果。
典型用途：
- RAG 问答：entry → kb → llm → chat-output。
- 批量文档处理：检索文档片段后进行总结、分类、抽取字段等。

5. 图像 / 视频生成：`image`、`video`

image：图像生成器，用 AI 生成图片。
video：视频生成器，支持文本生成视频、图片生成视频等。
典型用途：
- 生成插图、封面、产品示意图。
- 为营销、演示、创意视频生成素材。

三、控制流与逻辑节点

用于控制执行顺序、分支、循环、合并、定时与终止等，是“像写程序一样”构造逻辑的基础。

1. `conditional` — 条件分支

说明：根据条件表达式或规则执行不同的分支逻辑。
能力亮点：
- 支持单一表达式模式（如 data.score > 80）。
- 支持多规则多分支（IF1 / IF2 / ELSE）。

2. `loop` — 循环

说明：对列表 / 字典 / JSON 数组等数据进行遍历，为每一项执行指定子流程。
典型用途：
- 对一组文件逐个处理。
- 对一批用户记录逐个发送邮件 / 生成报告。

3. `merge` — 合并

说明：将多个分支的执行结果合并为一个输出。
支持策略：数组拼接、对象合并、文本拼接、自定义函数等。

4. `timer` — 定时器

说明：支持延时、定时和重复执行。
典型用途：
- 延迟执行后续流程。
- 周期性执行某些同步或检查任务（未来结合调度使用）。

5. `terminate` — 终止节点

说明：显式结束工作流执行。
典型用途：
- 条件不满足时提前退出。
- 人工审核失败后停止后续自动处理。

四、数据与存储节点

这类节点管理工作流内部数据结构与外部持久化存储，包括字典/列表、数据库、Redis 等。

1. `dictionary` 与 `list`

dictionary：键值对结构，适合构建配置对象、聚合字段。
list：数组结构，适合收集一组结果、流水线式处理数据。

典型用途：

聚合多个节点输出为一个对象，用于后续统一传给 llm 或存储。
收集循环中的中间结果，最终统一展示或写入文件。

2. `global-params` — 全局参数

说明：定义工作流的全局变量和参数，可被多个节点访问。
用途：
- 存储 API Key、环境配置、默认参数等。
- 在 transformer / llm / script-exec 中复用同一组配置。

3. `database` — 数据库工具箱

说明：支持 SQLite / MySQL / PostgreSQL 等数据库的查询、更新、事务操作。
典型用途：
- 从业务数据库加载数据 → 交给 AI 分析。
- 将 AI 结果 / 统计结果写回数据库。

4. `redis` — Redis 缓存

说明：操作 Redis 中的字符串、哈希、列表、集合等类型。
典型用途：
- 存储会话状态或中间计算结果。
- 做限流、去重、简单计数等。

五、文档与文件节点

用于读写本地 / 远程文件、生成 PDF / PPT / Word / Excel 等文档，以及批量处理 PDF / 图片。

1. 文件基础操作：`file-read`、`file-write`、`directory`、`resource-browser`

file-read：读取文件内容，支持文本/JSON/二进制。
file-write：写入数据到指定路径，可选择覆盖 / 追加。
directory：列出、创建或删除目录。
resource-browser：在桌面客户端中浏览本地文件系统、筛选并选择文件/目录。

2. 文档生成：`pdf`、`powerpoint`、`word`、`excel`

pdf：将文本、Markdown、HTML 等内容生成为 PDF 文件。
powerpoint：生成 PowerPoint 演示文稿（报告、方案、汇报 Slides 等）。
word：生成 Word 文档（合同模版、说明书、报告正文等）。
excel：生成 Excel 工作簿（表格数据、统计报表等）。

3. 工具箱类：`pdf-toolbox`、`image-toolbox`

pdf-toolbox：合并、拆分 PDF，提取文本，PDF 转 EPUB 等。
image-toolbox：图片的缩放、裁剪、旋转、格式转换、压缩、水印等。

这些节点非常适合构建：

自动报告生成工作流（数据 → AI 文案 → PPT / PDF）
文档批处理工作流（批量切分 PDF、抽取内容、送入知识库）

六、展示与可视化节点

这类节点主要用于 把数据结果“好看地展示出来”，在 Pop 的布局管理器中也会经常搭配使用。

1. 通用展示：`result-view`、`table-view`

result-view：以统一样式展示工作流输出的 JSON / 文本结果。
table-view：以表格形式展示数据，支持排序、过滤、分页等。

2. 图表与指标：`chart`、`metric-card`

chart：生成图表可视化（折线图、柱状图等），通常搭配数值型数据使用。
metric-card：指标概览卡片，适合展示“总访问量”“转化率”这类核心 KPI。

3. 文档与网页视图：`doc-view`、`web-view`、`image-view`、`video-view`

doc-view：在 Pop 中阅读 PDF、EPUB、DOCX 等文档。
web-view：渲染 HTML 字符串或远程网页内容。
image-view / video-view：展示图片 / 视频，支持缩放、拖拽/播放控制。

4. `canvas` 画布与 `qrcode`

canvas：高性能绘图画布，用于手绘 / 标注 / AI 绘图指令等场景。
qrcode：将文本或链接编码为二维码，可用于登录、分享、下载链接等。

七、工具与 Utility 节点

这些节点是“工具箱角色”，为数据转换、网络请求、加解密、时间等提供基础能力。

1. `http-request`

发送 HTTP 请求，支持 URL、方法、Headers、Body、超时、认证等配置。
常用于：
- 调用外部 REST API。
- 将工作流变成“胶水层”，串联多个外部系统。

2. 常见数据工具：`hash`、`base64`、`random`、`time`、`uuid`

hash：生成 MD5 / SHA 系列哈希，用于校验或签名。
base64：对文本进行 Base64 编码/解码。
random：生成随机数 / 字符串 / 随机选项。
time：获取当前时间、格式化时间、时区转换、时间计算。
uuid：生成唯一标识符（UUID）。

3. 高级工具：`script-exec`

说明：在桌面环境中执行本机命令或脚本，支持内联脚本或脚本文件。
用途：
- 与现有脚本体系集成（如 Python / Shell / PowerShell）。
- 实现极端自定义的能力（注意安全与权限控制）。

4. 搜索与通知：`search`、`mailer`

search：从互联网上搜索特定内容（具体实现视配置而定）。
mailer：通过 SMTP 发送邮件通知/告警，可配置主题、收件人、模板变量、附件等。

八、模块、MCP 与高级集成节点

这类节点主要用于 复用、组合与连接外部能力。

1. `module` 与 `group`

module：将一个子工作流封装成模块，对外暴露输入/输出，便于复用。
group：对一批节点做视觉分组，支持整体移动、折叠/展开，便于整理复杂画布。

典型用法：

把“生成日报”的一套流程封装为 module。
在复杂画布中，将“数据准备”“AI 处理”“可视化输出”分别用 group 包起来。

2. `api-resource`

说明：API 资源管理器，可基于 REST / OpenAPI / GraphQL 生成动态表格与表单。
用途：
- 快速为某个 REST API 创建管理界面 + 工作流集成。
- 结合工作流，实现“点一点就能调外部接口并进一步处理”的低代码体验。

3. `mcp`（MCP 工具）

说明：集成 Model Context Protocol 工具，让模型可以调用外部命令 / 服务 / 本地工具。
用途：
- 给 LLM 配备更多“动作”，比如读写文件、查数据库、访问私有 API 等。
- 配合 llm 节点的 Tools 面板，可让一个节点具备“多工具 Agent”能力。

✅ 小结

在 Pop 的工作流体系中：

I/O 节点 决定“从哪里来、到哪里去”；
AI / 提示词节点 决定“如何思考、如何表达”；
控制流节点 决定“按什么顺序、在什么条件下执行”；
数据 / 存储节点 管数据；
文档 / 文件节点 管内容资产；
展示 / 可视化节点 管结果呈现；
工具 / MCP / 模块节点 则负责“接上整个世界”。

你可以先熟悉常用节点（入口、LLM、知识库、HTTP、文件读写、结果视图），然后再逐步尝试引入条件、循环、模块化与布局，构建属于自己的复杂自动化工程。

5.3 节点类型总览

一、输入 / 输出节点（IO 类）

1. entry — 入口节点

2. form — 参数表单

3. text-input — 文本输入

4. chat-input 与 chat-output

5. record-input — 录制输入

6. sink / result-view — 结果接收与展示

二、AI 与提示词相关节点

1. llm — AI 模型

2. prompt — 提示词节点

3. history-context — 历史消息

4. kb — 知识库节点

5. 图像 / 视频生成：image、video

三、控制流与逻辑节点

1. conditional — 条件分支

2. loop — 循环

3. merge — 合并

4. timer — 定时器

5. terminate — 终止节点

四、数据与存储节点

1. dictionary 与 list

2. global-params — 全局参数

3. database — 数据库工具箱

4. redis — Redis 缓存