LLM的几种交互合作模式
个人总结的一些和AI合作几种模式,给它们取了些名字代表对LLM的不同用法。
咨询模式
代表:chatGPT、Gemini、Claude 等一众常见 LLM。
这个模式还是挺好理解的,以写代码为例,它们只会给你生成提问所需的代码,并不会帮你做创建项目结构、构建文件、配置环境什么的操作。也就是说, 你和它们之间的交互之间生成的文本不会引发二次交互,你只能手工复制贴贴来搬运使用这些文本。这就是为什么我称呼这种为咨询模式。它就只是顾问,并不动手帮你干活。这种也是最基础的AI模式,是其他模式的基石。
指挥模式
代表:Cursor、Windsurf、Aider、claude code。
从名字就能理解,你只要动动口指挥,把需求发给LLM,让它帮你指挥那些程序干活,并且它操作之后给出决策就好。典型的cursor就是这样,你只要需求给它,它生成代码之后帮助你整理项目结构,更改指定的本地文件。 你和其它程序之间隔着一层LLM,你只要指挥LLM,它叫程序帮你干活,这就是所谓的指挥模式。
助手模式
代表:Google AI Studio
谷歌AI Studio有个功能,可以让你分享屏幕窗口或者摄像头,并通过麦克风通话和它通话,询问一些屏幕上的问题并获得答复。 这样的场景就是, 你和它并肩工作,它就像你身边的助手,所以叫它助手模式。目前,AI Studio 似乎只会通过文本或语音回答问题,不能帮你做具体任务。但我理想中的助手模式是,你在工作时,还能让它帮你执行读写文件、收发邮件等操作。
哨兵模式
目前市面上似乎还没有成熟且实用的商业产品。这种模式是你下达个它一个任务后,AI通过经验库你监督处理这个任务的具体工作,以及由于边界条件导致的异常。就像哨兵一样,你只需给它一个任务,后续任务中产生的所有问题和反馈,模型全自动处理,不需要你的参与。这种模式是AI向高度自动化进化的一个重要模式。
集群模式
顾名思义,与前述哨兵模式类似。在这种模式下,你只需要下达任务,随之而来的是一群AI模型的协同工作。
它们不仅能各自处理任务中的不同部分,还能够相互配合和协调,共同完成更为复杂的工作。这样的模式可以提升任务处理的效率和准确性,让AI们不仅具备单一任务执行能力,还能通过集群合作解决更为复杂的场景。
总结
从最初的简单辅助到未来的完全自动化,AI逐步从“顾问”到“合作伙伴”,再到“执行者”和“监控者”,都是一个随着人力对AI介入的越来越少的过程。目前看我们还处于助手模式的运用中,探索哨兵模式和集群的过程中,直到一步步迈向AGI。