每个人都应该写好Prompt,构建自己的AI智能体 |AI瞭望塔 (S1E12)

AI新大陆ProCyberDaily2024-3-30 20:45

前言

AI 瞭望塔(AI Watchtower)是我们新开的一个子付费内容组。在航行的时,我会记录与分享关于AI的思考、观察、分析与见解。

1.每周花点时间思考正在做的事情,结合AI还有哪些可能性,或者是否真的用好了现有的大模型(LLM)?

2.昨晚在看吴恩达老师在红杉资本美国的一场分享会的演讲《《吴恩达:AI 智能体工作流引领人工智能新趋势》。即AI智能体的工作流可能被很多人忽略了。他提到一个很重要的观点,如果说智人区分于其他物种的能力是我们善用工具,那么对于 AI 来说,智能体就是它的工具。

吴恩达老师也分享了一个有意思的数据:你使用 GPT 3.5 进行零样本(zero-short)提示,它的正确率是 48%。GPT-4 的表现要好得多,正确率是 67%。但是如果你在 GPT 3.5 的基础上建立一个 AI 智能体的工作流,它甚至能比 GPT-4 做得更好。

意味着,如果我们基于 GPT-4 设计一个 AI 智能体的工作流,甚至可以提前到达 GPT-5 的水平。也就是说,我们不必盯着GPT-5或GPT-6什么时候发布。

3.可能很多人在使用AI时也发现以一种“命令-执行”的线性方式要求LLM输出答案,通常并不那么有效。这类的Prompt其实很常见,通常是以“请给我一篇500字的小红书爆文”的口吻输入,然后LLM输出一串幻觉严重的文章,或者是废话文学。以致很多人可能无法从LLM上解决一些问题,比如具有效果的新闻稿。然后,觉得这个大模型不可用,于是不断寻找和更换所谓可用的大模型。我在ChatGPT刚出来最开始写prompt时也翻过这样的错,其实很正常,人们对现有AI是高期望的,建立一种其能完成任何任务的能力的预设之上。

3.如何调用LLM的能力,像智能体那样工作?吴恩达老师认为,人们可以尝试“设计工作流”的智能体的方式来引导LLM进行多智能体协作。这是一个关键所在,在于人们可能需要摆脱搜索引擎式的机器工作方法:即输入“需求”,立刻要求LLM输出“结果”。回归一种数据库检索的方式,这并不是AI最擅长的地方,如果这样,可能谷歌搜索引擎更加有用和高效。这并不能发挥LLM的能力。

4.吴老师分享他构建AI智能体工作流的方式,总结了四种设计模式:反思、使用工具、规划和多智能体协作

-反思,即在初稿或需求里发现问题,然后进行反复迭代修改,直到达到效果。

-使用工具,即可以用AI调用工具(如插件)去执行任务,比如借助搜索引擎,常见的RAG 的AI产品

-规划,让 AI 自己规划解决问题的路径,去年很火的AutoGPT,则是根据用户的需求,自己规划解决步骤,然后一步一步去实现,包括调取外部的工具。

-多智能体协作:像之前我们分享的世界首个AI软件工程师「Devin」 就是一个多智能体协作的例子。比如你可以让LLM分别扮演CEO或项目总监,产品经理、开发工程师、测试等角色,你只需要告诉 LLM你现在是项目总监角色,开发工程师等,然后它们就会相互协作。

这几种模式,我回想起在写《用poe打造AI团队:Poe上优秀的AI机器人及附上实用AI工具| 《人人都可以有一个AI机器人团队》》的教程时,也采用类似的方法。比如在构建一个AI机器人时,我会先跟AI对话,围绕业务目标,拆解任务和工作流设计.....大家可以回顾一下。我也抽时间重新整理这份教程,更新一下prompt。

5.LLM幻觉依然存在,GPT-4也不像以前那么坚挺(Sam说的,GPT-4现在有点挫)。Prompt则依然是重要的一环,帮助人们构建智能体来撬动LLM的能力。就像吴老师说的,智能体就是AI的工具。

6.红杉资本的分享里提到,GenAI时代,软件替代服务。未来一个AI智能体可以满足不同人从其中获得各个性的服务。同样,人们也可以自己构建属于自己的AI智能体,在一个平台上为自己创建生活、工作的“助手、代理人”。Prompt在LLM和AI Agent、用户之间架起桥梁。

题外话,红杉资本在最近一个采访时谈到​:哪里“硅”含量高,​就去哪里投资。

7.写好Prompt,吴老师已经给了可行性方式,我觉得都可以尝试去写prompt,然后用低成本的ChatGPT 3.5或Kimi等LLM来试验。从解决具体的,一个问题开始,调试和迭代,直到它可以真正给你很好地完成任务。不过,在AI执行任务过程中,可以尝试给多点耐心和时间给它输出,就像给新任经理人的耐心一样。

8.每个人都应写好Prompt,来构建AI智能体。看似一个执行的动作,这也是一个真正理解人(需求)——LLM——智能体之间的协作关系的方式,包括人机对话的思维和方式(你是用一种命令式的呢?还是一种探索式,协作式或引导式等等),尝试过可能更深刻理解AI,也可能打开一个未曾到达过的世界。

9.如果需要,我把此前搭建的AI 机器人(阅读助手、小红书SEO助手、封面插图等AI机器人)重新梳理,包括Prompt的写法和模板....

10.很喜欢吴恩达老师在分享时结尾说的,通向通用人工智能的道路更像是一段旅程,而不是一个目的地,但我认为这种智能体工作流可能帮助我们在这个非常长的旅程上迈出一小步。所以也不必每日抬头追随通往AGI之路。

(原视频:https://www.youtube.com/watch?v=sal78ACtGTc

往期阅读

浅谈Poe从工具到平台 |AI瞭望塔(S1E01)

GPTs在编织OpenAI的供应链网 |AI瞭望塔(S1E02)

GPT在品牌化 |AI瞭望塔(S1E03)

AI 产品需要品牌,因为人在用|AI瞭望塔(S1E04)

Poe获得7500万美金新融资,加速打造AI机器人供应链平台 | AI瞭望塔(S1E05)

AI+硬件是趋势,人可以选不是AI产品的其它最优解|AI瞭望塔(S1E6)

那些赞许你AI产品的声音,可能并不是你的用户|AI瞭望塔(S1E7)

Sora:AI 真正理解和模拟人类世界,应用广泛,不只是视频创作|AI瞭望塔(S1E8)

谷歌的AI产品名字真的很糟糕:混乱的品牌战略|AI瞭望塔(S1E9)

谈谈AI公司和产品的品牌策略 |AI瞭望塔(S1E10)

每个大模型都有自己的信众,每个大模型都有光明的未来|AI瞭望塔(S1E11)