新浪云服务器做网站余姚做网站

张小明 2026/1/12 11:09:30
新浪云服务器做网站,余姚做网站,高端品牌粉碎机,定制衣柜多少钱一平方简介 文章基于麦肯锡报告#xff0c;结合实践经验#xff0c;提出智能体落地的六大关键经验#xff1a;关注工作流程而非技术本身#xff1b;根据任务特性选择合适工具#xff1b;重视评估与信任建设#xff1b;建立完善的监控验证机制#xff1b;打造可复用智能体平台…简介文章基于麦肯锡报告结合实践经验提出智能体落地的六大关键经验关注工作流程而非技术本身根据任务特性选择合适工具重视评估与信任建设建立完善的监控验证机制打造可复用智能体平台设计人机协作模式。强调智能体成功是系统性工程需要流程变革、人机协作与组织变革将技术转化为实际业务价值。正文“麦肯锡报告和实战经验的结合之作**”**麦肯锡报告解读《One year of agentic AI: Six lessons from the people doing the work》报告我帮你们看过了我将报告核心洞察与我的亲身实践相融合整理了6000字干货。无论您是正在规划首个Agent智能体项目的决策者还是身处一线的AI产品经理或开发者希望这些内容为您拨开迷雾指引方向。内容与麦肯锡报告中的六大经验教训相结合无论是你否在开发Agent都值得一看。一与智能体无关、与工作流程有关我们希望落地的智能体通常有这样的一个定义智能体是一种基于生成式人工智能基础模型的系统能够在现实世界中行动并执行多步骤流程。智能体可以自动化执行复杂任务而这些任务通常需要运用自然语言处理且原本需要人类执行和处理。让智能体代替人工这就是我们追求的结果。而在追求这个结果的过程中我们更应该关注的是流程的变革而不是智能体的落地。再说一遍不要着急落地智能体流程不够完善的情况下大概率会得到一个智障而不是一个智能体。真正实现业务价值的关键是变革工作流。错误思路做个Agent实现企业当前的业务工作流程。正确思路围绕Agent把企业业务工作流程重新设计。我们需重新设计涵盖人、流程、技术的完整工作流先梳理流程、识别用户痛点并设计智能体与人类的反馈协同机制。例如保险行业可通过规则系统、分析型 AI、生成式 AI 与智能体的组合重构理赔等复杂工作流。在重新设计工作流程时一个重要起点是绘制流程图并识别用户的痛点。这一步在设计智能体系统时至关重要这类系统能够减少不必要的工作让智能体和人类得以协作更高效、更有效地实现业务目标。这种协作可以通过学习循环和反馈机制来实现从而构建一个完善的Agent。在Agent的众多落地应用技术中能让团队在恰当的节点使用合适的技术这在对复杂、多步骤的工作流程进行重新设计时尤为重要。如何设计提示词工程大量提示词的组合、联动、迭代要如何设计工具列表function call 和 提示词如何结合RAG系统如何在Agent中落地应用在哪些节点是否需要和function call结合使用workflow应该如何设计微调是否有必要加入要如何抉择等等内容在恰当的节点使用合适的技术我们的Agent才能达到我们的预期效果。画三个重点来说明一下Agent流程设计对于AI产品经理的重要性对于AI产品经理来说“这个需求我就要怎么实现我不管”的年代彻底过去了。AI产品你必须要告知开发明确的流程实现否则你什么都得不到。AI产品经理要对AI产品的结果负责在整个流程中的任意一个节点出现问题都会导致输出结果差异巨大。所以清晰的指导智能体中每一个步骤的执行逻辑更有助于对结果进行优化。由于延续了大模型的特性AI产品也具有一定的不可解释性对于错误的结果我们修正Agent流程通常都是我们最后的手段。二智能体并非总能解决问题智能体的选择与协作认真思考高方差结果不稳定、不统一、低标准化的任务和低方差、高标准化的任务哪一类任务更适合用Agent来代替人工。我在做1V1培训的时候AI产品的需求挖掘环节一定要再三强调的一句话当需求能用AI且只能用AI完成时才是一个AI的需求这里有两个重点能用AI 和 只能用AI例如把固定格式的文案转换成JSON格式的信息。这就是一个能用AI但不是只能用AI的需求这就不是一个AI需求把用户随机输入的query进行分类然后按照不同类型转换成JSON格式的信息。这就是一个真正的AI需求当一个任务足够标准化的时候我们应该更倾向于用固定的程序来执行既保证准确性又可以保证执行速度。所以我们需根据任务特性选择工具避免盲目使用智能体。低方差、高标准化的任务适合规则式自动化高方差、低标准化的任务更适配智能体。此外真正的生产环境中任务通常不是非黑即白的并不是要么有智能体要么没有智能体的。智能体的两层作用帮助我们完成特定任务、帮助我们更好的开展工作。千万不要忽略协作的重要性有些任务如果单纯的用程序实现可能会耗费很多人力和时间成本。有些任务无法完全使用程序实现需要结合一小部分的大模型能力。在决策时需明确任务的标准化程度考虑更简单的自动化方案如 LLM 提示词而非陷入 “非智能体即无智能体” 的二元思维。三杜绝 “AI 糟粕”重视评估与信任很多智能体在演示中表现亮眼但实际使用中输出质量低即 “AI 糟粕”导致用户信任流失。是的相信大家一定见过非常多了了推广软文看了觉得这可太NB了等体验完就发现不过又是一个垃圾桶里的东西罢了。麦肯锡报告表示AI产品需要有持续的测试、监督才能确保效果保证不断进步需像培养员工一样培育智能体明确其 “岗位职责”通过细化的评估标准如任务成功率、检索准确率、幻觉率持续优化专家需全程参与测试避免 “一上线就不管”。以下是在决定为不同任务使用哪种人工智能工具时的指南如果任务是基于规则且重复性的并且有结构化输入例如数据录入请使用基于规则的自动化。如果输入是非结构化的例如冗长的文档但任务仍然是抽取式或生成式的请使用生成式人工智能、自然语言处理或预测分析。如果任务涉及根据过往数据进行分类或预测请使用预测分析或生成式人工智能。如果输出需要综合、判断或创造性解读请使用生成式人工智能。如果任务涉及多步骤决策并且存在大量输入和上下文高度可变的情况请使用AI智能体。以下是一些用于评估智能体性能的典型评估方法任务成功率端到端。任务成功率衡量的是无需升级处理或人工干预即可正确完成的工作流所占的百分比这反映了实际应用价值。F1分数/精确率和召回率。该指标平衡了假阳性和假阴性使其在分类、提取以及具有明确可衡量结果即是或否的决策准确性任务中非常有用。检索准确性。检索准确性是指检索到的正确文档、事实或证据相对于基准数据集的百分比这对于检索增强型工作流程至关重要。语义相似度。语义相似度是通过生成输出与参考输出之间基于嵌入的余弦相似度来衡量的它捕捉的是超越精确词语匹配的意义对齐。将大语言模型LLM用作评判者就是根据黄金标准或人类偏好来评估输出结果。这一指标在用于评估清晰度、有用性和推理合理性等主观性判断时具有很好的可扩展性。偏差检测通过混淆矩阵。偏差检测利用混淆矩阵来衡量不同用户群体在结果上的系统性差异这些矩阵能凸显偏差的表现之处例如假阴性对某一群体的影响过大。幻觉率。该指标用于跟踪事实错误或无依据声明的出现频率以确保智能体输出内容的可信度。校准误差置信度与准确度。校准误差用于衡量智能体的置信度分数是否与实际正确性相符这在对风险敏感的工作流程中十分重要。四让追踪和验证每一步都变得简单当企业仅部署少数智能体时人工排查错误尚可应对但随着智能体数量增至数百、数千个仅追踪最终结果的传统方式会让错误定位变得如同 “大海捞针”。因此我们需在工作流中嵌入监控与评估机制实时验证每一步表现。这里我们额外说说如何实现一个AI产品的评估反馈系统。评估反馈系统是AI产品的三个辅助系统之一主要目标是长期持续的监控我们的AI产品。为什么会有这样的一个辅助系统主要原因是AI产品出现问题后具有非常强的隐蔽性。例如现在线上跑着我们调试好的客服机器人但是假设当前时间我们的机器人出问题了它在跟我们的用户闲聊、扯淡但是就是不回答它应该回答的问题。我们的客服是否还在正常回复问题我们的客服是否越权了我们的客服是否泄露隐私信息了等等…如果没有反馈我们就无法知道是否发生了这样的事情。就像传统的产品404了、502了、程序崩溃了这些都有监控系统随时通知我们AI对话也需要有监控系统。维度细分指标/场景具体说明/工具/指标准确性明确的答案测试数据集的query与answer直接比对非明确答案测试数据集的query、参考文案、打分体系使用BLEU词汇匹配度、ROUGE摘要质量评估响应时间首包响应时间大模型最终回复的模型影响用户体验平均响应时长宏观把控响应效率报警逻辑一段时间内出现的百分比累计出现次数如5分钟内出现了50%/80次执行节点信息错误原因分析保留每个节点的执行信息分为大模型原因错误码、提示词、程序原因json格式兼容、环境原因502消耗调用次数成功次数、失败次数RPM每分钟请求数体现单位时间请求负载TPM每分钟Token数衡量文本处理吞吐量tokens文本处理的基础单元消耗数量关联成本与性能五优先打造可复用智能体为单个任务单独开发智能体会造成冗余浪费应聚焦可复用性。识别重复出现的任务构建集中化的资源平台含验证服务、可复用代码、训练材料等让智能体组件能跨工作流使用可减少 30%-50% 的非必要工作。识别重复性任务是一个很好的起点。企业可以开发能在不同工作流中轻松复用的智能体及智能体组件并让开发者能便捷地使用它们。这包括开发一套集中化的经过验证的服务如大模型可观测性或预先批准的提示词和资产例如应用模式、可复用代码和培训材料这些服务和资产要易于查找和使用。将这些功能整合到一个单一平台中至关重要。根据我们的经验这有助于减少通常所需的30%到50%的非必要工作。哦豁中台再次浮出水面世界果然是个圈还是建议大家利用中台来统一管理大模型、提示词、知识库、function call、智能体、测试、评估、日志、权限等。无论是单部门要开发多智能体、还是多部门要各自开发智能体或者使用大模型。都由中台统一提供大模型的基础能力。提示词的版本迭代测试等操作也完全又提示词工程师在中台完成即可一套做完全公司可用。六人类仍不可或缺角色与规模将改变人类尚有存在的必要。工作流的设计一定要考虑人类加入工作的便捷性随着人工智能智能体的不断增多人类将扮演何种角色这一问题引发了诸多焦虑一方面是对工作安全性的担忧另一方面则是对生产力提升的过高期望。这导致人们对当今许多工作中人类的角色产生了截然不同的看法。智能体无法完全替代人类人类需负责监督模型准确性、处理边缘案例、确保合规等。工作流变革后特定流程的人力规模可能下降但需重新设计人机协作模式比如通过简洁的可视化界面提升交互效率明确人类在关键决策中的最终把控权如律师审核智能体整理的案件核心信息。人机协作设计的一个重要部分是开发简单的可视化用户界面让人们能够轻松与智能体交互。回到最开始我们说过要围绕Agent把企业业务工作流程重新设计。现在要再加上一句话工作流程重新设计时要充分考虑人机协作的必要性和便利性。七、结语Agent的成功绝非仅仅是技术模型的胜利而是一场关于工作流程、人机协作与组织变革的系统性工程。Agent的规模化落地将不再是少数科技巨头的游戏而是每一个致力于智能化转型企业的必修课。 前方的道路已然清晰对于决策者首要任务是为这场变革扫清障碍投资于可复用的平台建设并推动跨部门的流程重塑。对于AI产品经理与开发者需要兼具技术理解与业务洞察成为连接智能世界与真实需求的桥梁用严谨的流程设计和细致的评估体系将Agent的潜力转化为实实在在的业务价值。这场由Agent引领的变革其终点并非一个“无人化”的工厂而是一个人机协同、高效共进的新工作范式。现在正是我们放下对技术的盲目崇拜回归业务本质用智慧和匠心去设计和构建这一新范式的最佳时机。八、在大模型时代我们如何有效的去学习大模型现如今大模型岗位需求越来越大但是相关岗位人才难求薪资持续走高AI运营薪资平均值约18457元AI工程师薪资平均值约37336元大模型算法薪资平均值约39607元。掌握大模型技术你还能拥有更多可能性• 成为一名全栈大模型工程师包括PromptLangChainLoRA等技术开发、运营、产品等方向全栈工程• 能够拥有模型二次训练和微调能力带领大家完成智能对话、文生图等热门应用• 薪资上浮10%-20%覆盖更多高薪岗位这是一个高需求、高待遇的热门方向和领域• 更优质的项目可以为未来创新创业提供基石。可能大家都想学习AI大模型技术也_想通过这项技能真正达到升职加薪就业或是副业的目的但是不知道该如何开始学习因为网上的资料太多太杂乱了如果不能系统的学习就相当于是白学。为了让大家少走弯路少碰壁这里我直接把都打包整理好希望能够真正帮助到大家_。一、AGI大模型系统学习路线很多人学习大模型的时候没有方向东学一点西学一点像只无头苍蝇乱撞下面是我整理好的一套完整的学习路线希望能够帮助到你们学习AI大模型。第一阶段 从大模型系统设计入手讲解大模型的主要方法第二阶段 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用第三阶段 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统第四阶段 大模型知识库应用开发以LangChain框架为例构建物流行业咨询智能问答系统第五阶段 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型第六阶段 以SD多模态大模型为主搭建了文生图小程序案例第七阶段 以大模型平台应用与开发为主通过星火大模型文心大模型等成熟大模型构建大模型行业应用。二、640套AI大模型报告合集这套包含640份报告的合集涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师还是对AI大模型感兴趣的爱好者这套报告合集都将为您提供宝贵的信息和启示。三、AI大模型经典PDF书籍随着人工智能技术的飞速发展AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型如GPT-3、BERT、XLNet等以其强大的语言理解和生成能力正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。四、AI大模型各大场景实战案例结语【一一AGI大模型学习 所有资源获取处无偿领取一一】所有资料 ⚡️ 朋友们如果有需要全套 《LLM大模型入门进阶学习资源包》扫码获取~
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

苏州网站建设制度做网站百度关键排名

Excalidraw集成AI后有多强?输入文字自动生成草图 在一次产品评审会上,团队正讨论一个新功能的交互流程。产品经理口头描述:“用户从首页点击按钮,跳转到授权页面,登录后生成临时凭证,再返回主应用。”传统做…

张小明 2025/12/24 1:00:59 网站建设

wordpress 站点地址 wordpress地址工业和信息化局是干什么的

禅城种植牙哪家强?靠谱机构这样选随着口腔健康意识的提升,种植牙因其媲美真牙的稳固性和舒适度,已成为众多缺牙市民的首选修复方案。然而,面对禅城区内众多的口腔医疗机构,如何甄别技术实力、选择一家真正靠谱的种植牙…

张小明 2025/12/24 1:01:00 网站建设

p2p网站建设方案策划书网站上传图片加水印

PouchDB 同步协议:如何在离线优先应用中实现多端数据最终一致性 大家好,今天我们来深入探讨一个非常实用且重要的技术主题:如何使用 PouchDB 实现多端数据的最终一致性,尤其是在“离线优先”(Offline-First)的应用场景下。 一、什么是“离线优先”?为什么它重要? 在现…

张小明 2025/12/24 1:01:03 网站建设

载带 东莞网站建设做彩票网站犯法不

目录1.摘要2.协作区域搜索建模3.基于学习型狼群算法5.结果展示4.参考文献5.代码获取6.算法辅导应用定制读者交流1.摘要 空地无人集群协同搜索在情报获取与灾害救援等任务中具有重要应用价值,而高效的搜索路径规划是提升整体搜索性能的关键。针对现有研究中空地无人…

张小明 2025/12/24 1:01:01 网站建设

建设文库网站济南网站搜索优化

Windows系统自动化部署革命:WinUtil高效运维实战指南 【免费下载链接】winutil Chris Titus Techs Windows Utility - Install Programs, Tweaks, Fixes, and Updates 项目地址: https://gitcode.com/GitHub_Trending/wi/winutil 在当今快节奏的企业环境中&a…

张小明 2025/12/24 1:01:02 网站建设

360网站推广官网怎么优化杭州 建设网站

InfluxDB时序数据库终极优化指南:从性能瓶颈到高效应用 【免费下载链接】influxdb Scalable datastore for metrics, events, and real-time analytics 项目地址: https://gitcode.com/gh_mirrors/inf/influxdb "我们的监控系统每天处理上亿个数据点&am…

张小明 2025/12/24 1:01:02 网站建设