为什么最近所有 AI 产品都在疯狂做 CLI
来源: AI 产品观察
发布时间: 2026-03-30
整理: AiTimes 智能时代
上周把飞书CLI装上后,我跟朋友说了三个字:爽死了。
以前让AI帮我查日程、发消息,要折腾半天——配API、搭代理、改配置。现在直接终端里敲一句「帮我看看明天几点有会」,AI自己调CLI,十分钟搞定。
这不是我一个人的感受。飞书、Google、Stripe、ElevenLabs、网易云音乐……最近几个月,一堆公司都在不约而同地做同一件事:发布CLI工具。
Karpathy 前阵子也在说,他用AI做app,大部分时间不在写代码——是在配API Key、改DNS、填环境变量。他原话是:「给你的服务加个CLI吧,别让开发者去点网页了,直接赋能AI。」
一个2010年代流行的「老古董」,怎么突然又火起来了?
先搞清楚什么是CLI
CLI这词听起来技术,但概念很简单。
你每天用的手机APP、网页应用,都是GUI——图形界面。打开软件,看见按钮和菜单,鼠标点几下,事情做完了。
CLI是另一种方式。打开一个黑色窗口,敲一行命令,按回车,完事。
打个比方:GUI是去餐厅,坐下来翻菜单,指给服务员「我要这个」。CLI是直接对厨房喊一声「宫保鸡丁,少油,多辣」,菜就出来了。
结果一样,但CLI更精准,更容易被自动化——关键就在这里。
AI本质上是「文字进、文字出」的。GUI是给眼睛看的,AI没眼睛。CLI是纯文字的,AI天生就住在命令行的世界里。
想让AI帮你压缩一段视频,不需要让它去戳Premiere的导出按钮。跑一行代码,完事:
人类并没有重新爱上命令行——是AI本来就活在那里。
AI缺的不是智力,是工具
很多人觉得AI应该什么都会。实际上更准确的比喻是:AI像一个非常聪明的新人,学历高、学习快,但上岗需要两样东西——工具和说明书。
给AI装上ffmpeg,它就能处理视频。装上飞书CLI,它就能操作日历和消息。装上Google Workspace CLI,它就能管邮件和云盘。
没装?它只会说:「不好意思,这个我做不了。」
AI的实际能力 = 它能调用的工具 × 它拿到的上下文。
工具好理解。上下文是什么?说白了就是说明书。
ffmpeg这种老牌工具,AI在训练时已经见过无数用法,不用给说明书。但飞书CLI是2026年刚发布的,AI的训练数据里压根没有。你不告诉它这个工具存在,AI就当它不存在。
所以新一代CLI都自带一种叫Skills的文件——本质上就是Markdown格式的说明书,告诉AI这个工具能干什么、怎么调用。
这带来一个有意思的推论:工具越新,AI越依赖显式说明书。训练数据永远追不上工具发布的速度,说明书只会越来越重要。
新一代CLI长什么样
你可能用过git、npm、ffmpeg——这些传统CLI。它们是为人类程序员设计的:输出是花花绿绿的文字,碰到需要选择的时候会弹交互菜单。
对人类来说这很自然。但AI碰到交互式菜单会直接卡住。
新一代CLI从一开始就是给AI设计的,不给人类设计的:
所有参数一次性传入,不弹任何菜单
输出固定是JSON,AI直接解析
自带Skills说明书
支持--dry-run,让AI先预览再执行
支持--help反查,AI可以直接问「你这个工具支持什么参数」
举个例子,飞书CLI装完有200多条命令,覆盖日历、消息、文档、任务、邮箱等11个领域。你说「帮我看看明天有什么安排」,AI调用lark-cli calendar +agenda;你说「通知张三会议改到三点」,AI调用对应命令。整个过程不需要打开飞书App。
Google Workspace CLI更激进,直接暴露成MCP服务,让AI通过标准协议操作Gmail和Calendar。
CLI、MCP、Skills、Plugin——其实是一件事
AI圈一直在吵MCP、Skills、Plugin哪个会赢。
但你仔细看这些新出的CLI工具,会发现它们把这三样全打包了。
Google Workspace CLI = CLI执行层 + 内置MCP服务 + Skills说明书。
飞书CLI、Stripe CLI、ElevenLabs CLI、网易云音乐CLI,全是同一个模式。
一个CLI工具,就是一个完整的AI插件。
而且它比传统Plugin多了几个优势:
不锁平台。Claude Code的插件只能在Claude Code里用。飞书CLI装好后,Claude Code、Cursor、Gemini CLI都能调用,今天接Claude明天换DeepSeek也不怕。CLI不关心调用者是谁,它是模型无关的执行层。
发布自由。Plugin要审核,CLI往npm上一发就上线。而且人也能用,不挂AI也能直接在终端里敲命令,开发者维护动力更足。
能组合。gws gmail +triage | jq '.messages[]',两个工具用管道串起来。Shell管道这个八十年代的设计,在AI时代突然又值钱了。Plugin之间是隔离的,没有标准组合方式。
但也有坑
说了这么多好处,该泼点冷水了。
最大问题是安全。Plugin跑在平台沙箱里,有声明式权限控制。CLI直接执行shell命令,一旦AI能跑gws,理论上就能用这个身份做任何事。目前靠--dry-run和弹窗确认来缓解,但跟平台级权限框架比,差距明显。
还有几个实际的坑:
有些工具的Skills文件太大,塞满AI的上下文窗口。Google Workspace CLI平均1.6KB,精准给AI需要的信息,不贪多。
有些CLI会弹交互式提示,比如? Which environment?,人类觉得正常,AI直接卡死。Stripe CLI后来加了--no-interactive才解决。
有些查询返回的JSON太长,几万字符全灌进上下文,有用的信息反而被淹没。Google Workspace CLI用field masks控制返回字段,这个设计目前很少有人跟进。
这三个问题的根源是一样的:「为AI设计」和「在AI中验证」是两码事。
怎么让AI自己管工具
我做CodePilot的CLI管理功能时,思路经历过一次转变。
一开始是常规做法:写代码检测系统里装了哪些CLI,写UI让用户在界面上管理。
后来突然想明白一件事:产品里已经有AI了,为什么不用AI来管工具?
安装工具时,直接让AI读--help,判断操作系统,处理权限报错,引导认证流程。安装失败?AI能读错误信息自己判断——是缺sudo权限,还是少装了依赖?
注册工具也一样。给AI一个模板,它读完--help自动生成结构化描述:工具能做什么、参数怎么用、典型场景是什么。
别让软件帮用户管理AI的工具——让AI管理自己的工具。
每个工具的安装和配置情况都不一样,用代码穷举永远写不完。但AI擅长处理这种开放式问题。
还差什么
CLI正在成为AI能力扩展的标准接口,但还缺几块拼图。
发现机制几乎是空白。你怎么知道「有个CLI能让AI操作飞书」?目前基本靠口口相传。npm和GitHub最有条件做AI工具的App Store,但它们没这个动力。
认证也麻烦。飞书、Google、Stripe各一套登录,装五个CLI工具要登录五次。普通用户根本扛不住。
安装体验也不友好。npm、brew是给开发者设计的,假设用户看得懂命令行错误信息。当操作者变成AI,「去Stack Overflow查一下」这种解决方案就不好使了。
说白了,行业不缺工具、不缺协议、不缺说明书。缺的是让这三样东西被发现、被安装、被信任的那一层基础设施。
谁做出这个,谁就是AI时代的npm。
总结一下:为什么大家都在做CLI?
因为CLI是目前最高效的AI能力分发方式——一个工具同时包含执行能力、通信协议和使用说明,是完整的AI插件。跨平台,免审核,人和AI都能用。
每多装一个趁手的CLI,你的AI就多一项技能。每减少一分上下文噪音,你的AI就聪明一点。
我们正处在一个混乱的过渡期,旧工具链和新AI范式交织在一起。CLI不是唯一的答案,但确实是最务实的那一个。
推荐一个海外版闲鱼,里面会有各种各样非常实惠的软件产品账号,比如 ChatGPT,Claude,Gemini等等,比官网便宜很多https://www.gamsgo.com/partner/b4FrS输入促销码:NFYWZ ,点击使用还能更便宜。
AI破局内有5万个圈友,不焦虑、不盲从,只是踏踏实实地用AI解决问题、创造价值。
如果你也想成为这样的人,欢迎参加【3天AI实战营】。
朋友圈会分享AI时代前沿信息,搞钱方法,价值干货,欢迎链接~
AiTimes 智能时代 - www.AiTimes.net