ChatGPT后的下一出好戏,剑指智能体:AI Agent拉开超自动化智能体时代帷幕

近日,实在智能2023 “实力派数智先锋访谈节”正式开播,即刻吸引近万位实在朋友在线观看。第一期,AI届的三位“老朋友”联袂同台。

实在智能创始人、CEO孙林君、王吉伟频道创始人、AIGC&超自动化分析师王吉伟以及今年火爆全球的新朋友大模型。

一场关于AI话题的”锵锵三人行”,他们带来了“大模型行业洞察”、“AI Agent最新动态解析”、“大模型+的行业应用探讨”等话题,涵盖了AI大模型前沿内容和国内最新实践经验,给观众们带来独特的启发。

ChatGPT后的下一出好戏,剑指智能体:AI Agent拉开超自动化智能体时代帷幕

01

一场关于:“大模型+行业”、“AI Agent”的锵锵三人行”

作为实在智能的重要伙伴,王吉伟一直关注着行业数字化转型发展,其栏目“王吉伟频道”也在不断为读者普及最新数字化技术,助力大家了解数字化技术并应用起来,实现提质增效。

实在智能是国内AI准独角兽企业,率先在业界首发了产品级AI Agent,TARS-RPA-Agent,将其打造成为一个有大脑眼睛和手脚的能够自主拆解任务、感知当前环境、执行并且反馈和记忆历史经验的IPA全新模式和超自动化智能体。

从王吉伟的角度来看,实在智能是时刻走在技术前沿阵地的人工智能公司。过往的交流中可以看到实在智能具有很强的研发能力,总能在这个前沿科技流行的时代下,如在去年推出RPA的进阶版IPA模式的RPA,今年又率先推出了这个塔斯大模型和基于塔斯的TARS-RPA-Agent,就能在很短时间内就能推出相应的产品服务。

大模型全称大规模语言模型(Large Language Model,LLM),“大”在“大语言模型”是指模型的参数量非常大,可以让这些模型能够捕捉到他们所训练的数据中更复杂的模式,从而使他们能够生成更准确的。

模型在大规模数据集上完成了预训练后无需或仅需要少量数据的微调,就能直接支撑各类应用,AIGC时代到来,只要愿意体验,我们都能感受到大语言模型的强大之处(自动生成图片、内容、视频等),目前,国内百度、阿里、腾讯、华为、实在智能等公司拥有AI大模型,这也让企业和个人都有机会加入到商业化的赛道中去。

02

企业和个人怎么用大模型实现价值最大化?

孙林君总结了八个字——“模型可用,成本可控。”

随着大众对ChatGPT的深入了解,大模型成为了关注和研究的焦点,AI Agent(人工智能助理)被公认为大语言模型落地的有效方式之一。

它是一种能够感知环境、进行决策和执行动作的智能实体,通常基于机器学习和人工智能技术,具备自主性和自适应性,在特定任务或领域中能够自主地进行学习和改进。

简单来说,AI Agent基于LLM驱动Agent,实现对通用问题的自动化处理,具备独立的思考和认知功能、拥有记忆,能进行思考、逻辑推断和自我反思,可以阅读和在线学习,擅长利用适当的工具处理问题,还能策划并根据实际情况调整任务的优先级,为LLM提供了行动能力,真正释放了LLM的潜能,为TO B和TO C企业带来巨大变革。

但AI智能体的落地并非易事。大模型怎么能够把这个任务拆解的非常合理?怎么能够在拆解任务过程中控制拆解质量?推理能力是否够用等等……这些都是要考虑和解决的问题。

反过来看,大模型并不是一个产品,而是产品里的一部分,更多时候并不是直接以一个产品的模式生成内容,这需要我们的产品级工具去精确完成任务,这就是挑战所在。

在执行任务时,人类会随时关注进度,并通过不断的「执行-反馈-修正」来确保任务的正常进行。

对于Agent来说,同样需要保证每一步操作的正确性,不会因为领会错了意图,或者前一步操作失误,而导致当前步骤点错按钮、输错账号或者发错邮件。

实在智能把TARS大模型作为技术底座,结合产品能力做进一步的升级,打造TARS-RPA-Agent、ChatIDP等产品级的工具,真正为用户解决问题。而实在的塔斯大语言模型是垂直类大模型,其通用能力是具备的,同时还具备足够强的泛化能力。而垂直大语言模型可以确保在特定领域上做的精度更高。而对于企业而言,用相对比较小的这个部署成本可以成功完成大语言模型的TOB端的部署,就可以发挥相对比较大的价值。故而要实现大模型价值的最大化,实在总结出的最优操作就是确保“模型可用,成本可控”。

ChatGPT后的下一出好戏,剑指智能体:AI Agent拉开超自动化智能体时代帷幕

与RPA结合后,Agent就是一个“AI助理”,用户不需要部署就能方便使用。在搭建RPA流程的时候,通过你说的任务指令,该智能体就能反馈流程创建的执行计划,还可以通过多轮对话修改,以创建更复杂的流程,帮助用户一点点探索流程生成。最后“AI助理”就会进入IPA模式按计划的详情步骤开始执行,实现“你说,PC做”,大幅提升工作效率。

IDP文档审阅也是同样的道理。有了大模型加持后,Chat-IDP就能自己读懂文档内容,文字工作者能从长篇累赘的案牍中解放出来,用对话的方式审阅文档,沉浸式高效地处理业务问题,这样一来,无论是从解决问题的效率,还是客户所付出的成本性价比来看,都是受益的。实在智能RPA,赞 56

在C端,它可以成为我们的智能助理,在我们的流程性、事务性、常规性的这个工作当中发挥价值;在B端上,AI Agent是数字员工新阶段的具体形态,落地到客户业务场景当中,能在很多领域都可以发挥作用,辅助员工更高效地完成工作,协助行业专家做一些更深入的思考,人工智能的真正的价值也在Agent上逐步显现出来。

03

基于大模型的TARS-RPA-Agent数字员工 VS Auto-GPT类AI智能体和直接接入ChatGPT的智能助手

为了搞明白这款产品,王吉伟频道在实在智能Agent发布会后做了专访,并率先体验Agent产品。

王吉伟表示,TARS-RPA-Agent首先是一个产品级别的东西。比方说大模型它来生成流程可能会出错,这个是不可避免的,因为它毕竟是个生成式模型,有多样性要求,也是一个概率性质的。

那么当大模型出错时,Agent产品允不允许人机协同?能不能够接受打断?能不能够多种模式下面都能构建这个流程?这些就是要从产品级别去解决的问题。

第二个不同点在于,应用的技术组合上面会有差别,TARS-RPA-Agent是结合多种AI能力形成的,本质上是因为RPA要操作的对象,就是要把对象识别出来,并且要把参数配置进去,而这个操作还需要结合计算机视觉(CV)来去做,才能更好地处理一些高级任务。

(点击下方图片:王吉伟专题报道丨实在智能TARS-RPA-Agent,业界首发的产品级大模型Agent有何非凡之处?)

孙林君则回顾到,实在智能RPA的每一次重磅的迭代升级,都体现出对人工智能技术对RPA流程构建的颠覆性变化。

实在IPA模式基于自研AI技术,智能屏幕语义理解技术(ISSUT),将计算机视觉和RPA能力整合到一起,RPA的流程构建方式就从传统的“拖拉拽”模式,来到了直接“点选用”新体验,这是一种很大的变革(实在IPA模式的NPS值已超过0.73,传统模式下的RPA最高做到0.35左右)。

在实在IPA模式下,再结合大语言模型技术,现在我们可以更多通过自然语言,就能让Agent帮我们拆解任务,完成任务。

所以从这个视角上,实在智能更关注的是流程构建的方式的易用性,将流程构建的难度降低,学习和部署成本变得更低,这个本领只通过集成ChatGPT是做不到的。

当我们的数据飞轮建立起来以后,整个这个产品还会随着每次迭代会逐步的增强,在流程构建的成本上、用户使用体验上会更具优势。

在这个与AI共舞的时代,大模型的商业化应用日趋成熟,作为职场人的我们何去何从?作为第一期的收尾,王吉伟和孙林君给我们带来了他们“E型人”观点:在接受AI的同时,更要怀揣学习能力、应变能力,积极主动性和敬业心态,积极拥抱这个AI时代,多学一些相关技能,学会用AI增强自己学习和接触与所在岗位业务场景,提升自己的业务能力。要相信,技术永远都是给人使用的,科技服务于人。

一直以来,实在智能都在思考数字员工的最终形态,期望用最合适的呈现方式和技术手段让人工智能真正的为人人所用,把人工智能技术踏踏实实落地,打造人手一个智能助理。所以我们不必畏惧AI,人的能力是最重要的,在人和AI的相辅相成共同作用下,人机协同才是我们见证的发展趋势。

声明:
1.本内容作为作者独立观点,不代表RPA学习天地立场,RPA学习天地仅提供信息存储空间服务。
2.未经允许不得转载,如需转载和授权,请联系工作客服微信号。
3.如果对本稿件有异议或投诉,请联系邮箱或工作客服微信号。
作者:RPA学习天地,如若转载,请注明出处:https://www.rpa-learning.com/rpa-learning/7929

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注