Google 全新推出的 Gemini CLI(命令行界面)将强大的 Gemini 模型系列直接带入您的终端。它是一个开源的 AI 代理,旨在让开发者和技术爱好者能够以自然、高效的方式与人工智能互动,从而加速从编码、调试到内容创作和工作流自动化的各种任务。
什么是 Gemini CLI?
Gemini CLI 是一个在您终端中运行的交互式工具,为您提供了与 Gemini 模型的直接连接。您无需在编辑器、浏览器和其他工具之间来回切换,现在可以直接在熟悉的命令行环境中与 Gemini 交流。该 CLI 的突出特点是它能够理解您项目的上下文、访问文件、执行命令,甚至通过模型上下文协议
(Model Context Protocol, MCP)与外部服务进行交互。
核心特性
- 开源: 源代码托管在 GitHub 上,确保了透明度,并为社区贡献和扩展提供了可能。
- 直接访问 Gemini 模型: 在终端中直接利用 Gemini 1.5 Pro 等模型的强大功能。
- 慷慨的免费额度: 使用个人 Google 帐户登录后,用户可以获得大量的免费使用额度。
- 上下文感知: CLI 可以访问您当前的工作目录,从而提供相关且贴合上下文的回答和操作。
- 可扩展性: 通过模型上下文协议 (MCP),可以添加新功能并连接到外部服务,如 GitHub 或图像生成 API。
- 专注于开发者工作流: 它专门设计用于帮助开发者完成编码、调试、编写文档以及与版本控制系统交互等任务。
安装
安装 Gemini CLI 的过程非常简单,只需要 Node.js (v18 或更高版本)。您可以使用以下命令进行安装:
npm install -g @google/gemini-cli
安装完成后,只需使用以下命令即可启动 CLI:
首次运行时,系统会提示您使用您的 Google 帐户登录。
推荐使用示例
Gemini CLI 是一个功能多样的工具。以下是一些推荐的使用示例,涵盖了从基础到高级的各种场景:
编码与项目启动
a) 从零开始创建一个新项目:
在一个空目录中启动,然后向 Gemini 描述您想创建什么。
mkdir my-new-project && cd my-new-project
gemini
> 用 Node.js 和 Express 创建一个简单的 "Hello World" Web 应用。
Gemini 将会创建必要的文件(例如 package.json
, index.js
)并生成代码。然后您可以提出后续问题来扩展项目。
b) 处理现有项目:
导航到您的项目目录并启动 Gemini。CLI 将利用该目录的上下文。
cd my-existing-project
gemini
> 添加一个监听 '/api/users' 的新路由,并以 JSON 格式返回一个用户列表。
代码调试
当您遇到错误时,Gemini 可以帮助您找到原因并提出解决方案。
gemini
> 我的 Python 应用遇到了这个错误: [在此粘贴错误信息]. 这是相关的代码片段: [在此粘贴代码]. 可能是什么原因导致的?
Gemini 将分析代码和错误信息,并为您提供可能的原因及修复建议。
编写代码文档
创建文档是一项重要但常常被忽视的任务。Gemini 可以帮助您快速轻松地生成注释和文档文件。
gemini
> 为下面的 JavaScript 函数生成 JSDoc 格式的文档: [在此粘贴函数代码].
或者为整个项目生成文档:
gemini
> 为这个项目创建一个 README.md 文件。它是一个 [项目的简短描述]。主要使用的技术是 [列出技术栈]。
与 Git 和版本控制交互
您可以使用 Gemini 来简化您的 Git 工作流程。
a) 生成 Commit 消息:
将更改添加到暂存区后:
git diff --staged | gemini
> 为这些更改写一条遵循 Conventional Commits 格式的有意义的 commit 消息。
b) 解释代码变更:
要理解某个特定 commit 中的更改:
git show <commit-hash> | gemini
> 用简单的语言向我解释这些代码变更。
使用模型上下文协议 (MCP) 的高级用例
MCP 允许 Gemini CLI 与外部工具和服务进行交互,这开启了无限的可能性。
a) 与 GitHub 交互 (需要配置):
在配置好 GitHub MCP 服务器后,您可以执行如下任务:
gemini
> 总结一下这个仓库里最近三个开放的 Pull Request。
b) 生成图像 (需要配置):
如果您设置了图像生成 MCP 服务器(例如使用 Imagen):
gemini
> 创建一张未来主义汽车在霓虹灯闪烁的城市中行驶的图片。
通用知识问答与内容创作
Gemini CLI 的用途不仅限于代码。您可以将它用于广泛的内容创作和研究任务。
gemini
> 写一篇关于静态网站生成器优点的简短博客文章。
gemini
> 为一个关于人工智能历史的演讲创建一个大纲。
Gemini CLI 是一个强大的工具,有潜力从根本上改变开发者和高级用户与其系统交互的方式。通过将 AI 无缝集成到命令行中,复杂任务得以简化,生产力得到显著提升。作为一个开源项目,我们可以期待它在未来会拥有一个不断增长的功能和集成生态。