2025 年构建可靠智能体的 10 个优选实践

在 UiPath,我们长期秉持智能体思维,我们不仅构建演示原型,更打造能够实际交付、扩展并经受真实企业环境考验的智能体。

如果您曾将大语言模型投入生产环境,就会明白:问题往往不在提示词本身,而在其周边环节——错误处理、上下文管理、工具协议、可追溯性等。正因如此,我们在 Studio 中设计了 UiPath Agent Builder 智能体构建器,旨在为您提供所需的控制力与可观测性,使 AI 智能体能像真正的软件组件一样可靠运行。

025

以下是我们在大规模构建、测试和交付智能体自动化过程中积累的经验总结。这些智能体构建优选实践将帮助您从“勉强可用”提升到“在生产环境稳定运行,无需深夜告警”的水平。

1. 设计具备故障安全(fail-safe)能力的智能体

在自动化流程中审慎集成智能体

除非有充分理由,否则应避免将智能体直接嵌入 REFramework。智能体会引入需仔细管理的变量。建议使用 UiPath Maestro 以获得更佳的可视性与控制力。

避免为智能体设置重试机制

智能体输出具有非确定性,重试无法保证改善结果。应在智能体或工具内部实现错误捕获与处理。

采用模块化专业智能体组合

通过组合多个智能体与机器人构建复杂工作流,避免打造“全能型”智能体。这样便于可控扩展、简化调试并支持灵活复用。

对确定性任务使用工具

在适用场景下,调用成熟的 UiPath 自动化流程或 API 作为工具,而非让智能体直接执行操作,以降低风险、提高可预测性与安全性。

明确智能体目标与可衡量成果

在设计阶段就定义清晰的目标、性能指标与成功标准。智能体应在可量化的边界内运行。

2. 正确配置上下文

构建企业上下文索引

为智能体所依赖的结构化数据源、知识库及文档建立索引。完善的规划与上下文设置是可靠执行的关键。选择恰当的搜索策略:语义搜索擅长处理非结构化文本的含义匹配,结构化搜索则能从既定模式中精准检索数据。DeepRAG 融合两者,实现对大规模、复杂或混合数据源的深度推理。

选择合适的模型

UiPath Agent Builder 智能体构建器支持多种模型,请根据实际用例选择合适的模型。评估时建议使用与智能体不同的模型,以避免偏差。

保持工具定义的清晰性

工具名称应简洁具描述性,使用小写字母与数字,避免空格及特殊字符。名称需与提示词中的引用完全一致。

3. 将所有能力视作工具

将外部能力封装为工具

工具应具备严格的输入/输出协议与明确的成功标准。尽可能将 UiPath 自动化流程复用为工具。

采用模式驱动的提示词

保持工具提示词的简洁与结构化。验证输出格式,并显式处理空值或空结果。

为工具建立文档与版本管理

为每个工具维护清晰的版本控制与评估历史,将评估运行与特定版本关联。

构建工具以提升确定性任务可靠性

大语言模型在处理数学运算、日期比较等方面存在局限。为避免相关问题,应构建工具来执行复杂操作。

4. 像编写产品规格书一样设计提示词

迭代设计与测试

提示词工程是一个迭代过程。使用 UiPath Agent Builder 智能体构建器构建适当的评估集,并在开发过程中持续测试与优化系统提示词和任务指令。

系统提示词应明确定义

系统提示词应明确智能体的角色与身份、指令、目标与上下文、成功指标、防护栏与约束。

采用结构化多步推理

对复杂工作流融入思维链式推理。明确定义任务分解、推理方法及输出格式。

详细描述期望结果

在 UiPath Data Manager 中正确定义输出参数的模式,提供示例也将有助于理解。

描述应执行的操作而非禁止操作

例如,使用“避免询问个人信息,转而引导用户至…”比“不要询问个人信息”更有效。

尝试不同提示词实现同一任务

不同的模型有不同的隐含行为,有时需要针对性的指令。

利用评估集优化提示词

结合提示词优化工具进行模型与提示词的实验。

使用 Markdown 语言

Markdown 语言可以强调提示中的关键部分,例如:**关键:**

避免在提示词中直接引用输入参数的值

如 `{{input}}`,因为其在运行时会被实际值替换。

5. 面向真实场景进行评估

构建健壮的评估数据集

应为每个智能体准备至少 30 个评估案例,模拟可能阻塞运行的场景。涵盖成功案例、边缘案例及失败场景。

评估广度与深度

覆盖多个维度——结果准确性、推理过程、可追溯性、适应性及工具使用成功率。

端到端测试

在完整的自动化上下文中评估智能体,而非孤立测试。检验集成、通信、恢复及失败模式。

善用追踪功能

定期查看追踪日志,检查智能体的推理循环、决策及工具使用情况。识别错误、低效及意外行为。

指标与治理

跟踪健康分数与回归指标,设定发布门槛。

6. 内置安全、治理与合规性

通过 UiPath Orchestrator 或 UiPath Maestro 运行智能体

将智能体作为流程部署,以继承生命周期管理、审计与治理功能。

利用 UiPath AI Trust Layer 信任层

应用按组分权、个人信息脱敏、审计日志、限流及使用控制。

保持人在回环(Human-in-the-Loop)

对高风险决策设置人工审核环节。这些交互可丰富智能体记忆,提升后续表现。

设置防护栏

制定并执行关于可接受行为及问题升级的规则。

7. 有目的的版本管理与发布控制

全面版本化

对提示词、工具、数据集及评估保持清晰的版本控制。

设定生产发布门槛

仅在评估通过且发布计划最终确定后,才将智能体部署至生产环境。

将评估与版本标签关联

确保从设计到部署的全链路可追溯性。

8. 设计建立信任的对话

设定清晰预期

说明智能体的能力与限制。提供透明的工具操作及明确的人工/机器人升级路径。

确认不可逆操作

使用确定性确认,例如“我将创建包含 Y 字段的 X,是否继续?”

设计透明化

在适当时机展示上下文或推理片段,以建立信任。

9. 平衡成本、性能与质量

优化模型使用

根据任务选择合适规模的模型。

限制 Token 消耗

聚焦检索内容,总结长上下文,缓存稳定响应。

分批与分层操作

将低风险调用进行批量处理,仅在必要时才升级至高能力模型。

10. 借助追踪、记忆与人工反馈持续改进

追踪与学习

利用 Agent Builder 智能体构建器中的追踪与评估功能迭代提升可靠性。通过智能体记忆使其从人工解决的升级中学习。

建立人工反馈回路

将升级处理、评估反馈及运行日志反馈至设计更新与智能体记忆。

渐进式扩展

在小规模验证稳定性与性能后,再逐步扩展智能体能力。

FAQ: 智能体构建器与 AI 智能体

什么是智能体构建器?

智能体构建器是一种开发环境,用于设计、配置和部署能在企业环境中安全可靠地进行推理、决策和行动的 AI 智能体。

为何选择 UiPath Agent Builder 智能体构建器而非通用 LLM 智能体工具?

UiPath Studio 中的 Agent Builder 智能体构建器专为生产环境设计,它结合了评分与由评估驱动的开发方法,确保结果可用于企业级部署,并能与现有业务系统无缝集成。您可通过低代码、用户友好的界面调用完整工具集,并依托更广泛的 UiPath 平台轻松扩展,实现端到端自动化。

如何在生产前评估 AI 智能体?

使用评估数据集、追踪日志和回归指标来验证准确性、工具使用成功率和安全性。UiPath 的评估与追踪功能使这一过程简单且可重复。

智能体能随时间改进吗?

可以。智能体记忆与升级反馈回路能帮助智能体从人工干预中学习,并安全地持续演进。

1.本内容作为作者独立观点,不代表RPA学习天地立场,RPA学习天地仅提供信息存储空间服务。

2.如果对本稿件有异议或投诉,请联系客服微信号。