Skip to content

为什么最近所有 AI 产品都在疯狂做 CLI

来源: AI 产品观察
发布时间: 2026-03-30
整理: AiTimes 智能时代


上周把飞书CLI装上后,我跟朋友说了三个字:爽死了。

以前让AI帮我查日程、发消息,要折腾半天——配API、搭代理、改配置。现在直接终端里敲一句「帮我看看明天几点有会」,AI自己调CLI,十分钟搞定。

这不是我一个人的感受。飞书、Google、Stripe、ElevenLabs、网易云音乐……最近几个月,一堆公司都在不约而同地做同一件事:发布CLI工具。

Karpathy 前阵子也在说,他用AI做app,大部分时间不在写代码——是在配API Key、改DNS、填环境变量。他原话是:「给你的服务加个CLI吧,别让开发者去点网页了,直接赋能AI。」

一个2010年代流行的「老古董」,怎么突然又火起来了?

先搞清楚什么是CLI

CLI这词听起来技术,但概念很简单。

你每天用的手机APP、网页应用,都是GUI——图形界面。打开软件,看见按钮和菜单,鼠标点几下,事情做完了。

CLI是另一种方式。打开一个黑色窗口,敲一行命令,按回车,完事。

打个比方:GUI是去餐厅,坐下来翻菜单,指给服务员「我要这个」。CLI是直接对厨房喊一声「宫保鸡丁,少油,多辣」,菜就出来了。

结果一样,但CLI更精准,更容易被自动化——关键就在这里。

AI本质上是「文字进、文字出」的。GUI是给眼睛看的,AI没眼睛。CLI是纯文字的,AI天生就住在命令行的世界里。

想让AI帮你压缩一段视频,不需要让它去戳Premiere的导出按钮。跑一行代码,完事:

人类并没有重新爱上命令行——是AI本来就活在那里。

AI缺的不是智力,是工具

很多人觉得AI应该什么都会。实际上更准确的比喻是:AI像一个非常聪明的新人,学历高、学习快,但上岗需要两样东西——工具和说明书。

给AI装上ffmpeg,它就能处理视频。装上飞书CLI,它就能操作日历和消息。装上Google Workspace CLI,它就能管邮件和云盘。

没装?它只会说:「不好意思,这个我做不了。」

AI的实际能力 = 它能调用的工具 × 它拿到的上下文。

工具好理解。上下文是什么?说白了就是说明书。

ffmpeg这种老牌工具,AI在训练时已经见过无数用法,不用给说明书。但飞书CLI是2026年刚发布的,AI的训练数据里压根没有。你不告诉它这个工具存在,AI就当它不存在。

所以新一代CLI都自带一种叫Skills的文件——本质上就是Markdown格式的说明书,告诉AI这个工具能干什么、怎么调用。

这带来一个有意思的推论:工具越新,AI越依赖显式说明书。训练数据永远追不上工具发布的速度,说明书只会越来越重要。

新一代CLI长什么样

你可能用过git、npm、ffmpeg——这些传统CLI。它们是为人类程序员设计的:输出是花花绿绿的文字,碰到需要选择的时候会弹交互菜单。

对人类来说这很自然。但AI碰到交互式菜单会直接卡住。

新一代CLI从一开始就是给AI设计的,不给人类设计的:

  • 所有参数一次性传入,不弹任何菜单

  • 输出固定是JSON,AI直接解析

  • 自带Skills说明书

  • 支持--dry-run,让AI先预览再执行

  • 支持--help反查,AI可以直接问「你这个工具支持什么参数」

举个例子,飞书CLI装完有200多条命令,覆盖日历、消息、文档、任务、邮箱等11个领域。你说「帮我看看明天有什么安排」,AI调用lark-cli calendar +agenda;你说「通知张三会议改到三点」,AI调用对应命令。整个过程不需要打开飞书App。

Google Workspace CLI更激进,直接暴露成MCP服务,让AI通过标准协议操作Gmail和Calendar。

CLI、MCP、Skills、Plugin——其实是一件事

AI圈一直在吵MCP、Skills、Plugin哪个会赢。

但你仔细看这些新出的CLI工具,会发现它们把这三样全打包了。

Google Workspace CLI = CLI执行层 + 内置MCP服务 + Skills说明书。

飞书CLI、Stripe CLI、ElevenLabs CLI、网易云音乐CLI,全是同一个模式。

一个CLI工具,就是一个完整的AI插件。

而且它比传统Plugin多了几个优势:

不锁平台。Claude Code的插件只能在Claude Code里用。飞书CLI装好后,Claude Code、Cursor、Gemini CLI都能调用,今天接Claude明天换DeepSeek也不怕。CLI不关心调用者是谁,它是模型无关的执行层。

发布自由。Plugin要审核,CLI往npm上一发就上线。而且人也能用,不挂AI也能直接在终端里敲命令,开发者维护动力更足。

能组合。gws gmail +triage | jq '.messages[]',两个工具用管道串起来。Shell管道这个八十年代的设计,在AI时代突然又值钱了。Plugin之间是隔离的,没有标准组合方式。

但也有坑

说了这么多好处,该泼点冷水了。

最大问题是安全。Plugin跑在平台沙箱里,有声明式权限控制。CLI直接执行shell命令,一旦AI能跑gws,理论上就能用这个身份做任何事。目前靠--dry-run和弹窗确认来缓解,但跟平台级权限框架比,差距明显。

还有几个实际的坑:

有些工具的Skills文件太大,塞满AI的上下文窗口。Google Workspace CLI平均1.6KB,精准给AI需要的信息,不贪多。

有些CLI会弹交互式提示,比如? Which environment?,人类觉得正常,AI直接卡死。Stripe CLI后来加了--no-interactive才解决。

有些查询返回的JSON太长,几万字符全灌进上下文,有用的信息反而被淹没。Google Workspace CLI用field masks控制返回字段,这个设计目前很少有人跟进。

这三个问题的根源是一样的:「为AI设计」和「在AI中验证」是两码事。

怎么让AI自己管工具

我做CodePilot的CLI管理功能时,思路经历过一次转变。

一开始是常规做法:写代码检测系统里装了哪些CLI,写UI让用户在界面上管理。

后来突然想明白一件事:产品里已经有AI了,为什么不用AI来管工具?

安装工具时,直接让AI读--help,判断操作系统,处理权限报错,引导认证流程。安装失败?AI能读错误信息自己判断——是缺sudo权限,还是少装了依赖?

注册工具也一样。给AI一个模板,它读完--help自动生成结构化描述:工具能做什么、参数怎么用、典型场景是什么。

别让软件帮用户管理AI的工具——让AI管理自己的工具。

每个工具的安装和配置情况都不一样,用代码穷举永远写不完。但AI擅长处理这种开放式问题。

还差什么

CLI正在成为AI能力扩展的标准接口,但还缺几块拼图。

发现机制几乎是空白。你怎么知道「有个CLI能让AI操作飞书」?目前基本靠口口相传。npm和GitHub最有条件做AI工具的App Store,但它们没这个动力。

认证也麻烦。飞书、Google、Stripe各一套登录,装五个CLI工具要登录五次。普通用户根本扛不住。

安装体验也不友好。npm、brew是给开发者设计的,假设用户看得懂命令行错误信息。当操作者变成AI,「去Stack Overflow查一下」这种解决方案就不好使了。

说白了,行业不缺工具、不缺协议、不缺说明书。缺的是让这三样东西被发现、被安装、被信任的那一层基础设施。

谁做出这个,谁就是AI时代的npm。

总结一下:为什么大家都在做CLI?

因为CLI是目前最高效的AI能力分发方式——一个工具同时包含执行能力、通信协议和使用说明,是完整的AI插件。跨平台,免审核,人和AI都能用。

每多装一个趁手的CLI,你的AI就多一项技能。每减少一分上下文噪音,你的AI就聪明一点。

我们正处在一个混乱的过渡期,旧工具链和新AI范式交织在一起。CLI不是唯一的答案,但确实是最务实的那一个。

推荐一个海外版闲鱼,里面会有各种各样非常实惠的软件产品账号,比如 ChatGPT,Claude,Gemini等等,比官网便宜很多https://www.gamsgo.com/partner/b4FrS输入促销码:NFYWZ ,点击使用还能更便宜。

AI破局内有5万个圈友,不焦虑、不盲从,只是踏踏实实地用AI解决问题、创造价值。

如果你也想成为这样的人,欢迎参加【3天AI实战营】。

朋友圈会分享AI时代前沿信息,搞钱方法,价值干货,欢迎链接~


AiTimes 智能时代 - www.AiTimes.net

Released under the MIT License.