Gemini CLI！100万TOKEN超长上下文远超Claude Code，支持MCP Server扩展，Context7+Task Master轻松开发AI智能体

原文 AI超元域的博客

Google 最近推出了 Gemini CLI，这是一个基于 Gemini 1.5 Pro 模型的开源命令行界面工具，将人工智能直接引入开发者的终端环境。这一创新工具代表了开发者生产力的重大进步，将传统命令行从刚性的命令执行器转变为智能的对话伙伴。

前言#

核心功能与架构

Gemini CLI 的核心是 Gemini 2.5 Pro，这是一个能够处理多达 100 万个令牌上下文窗口的多模态基础模型。这个庞大的上下文窗口允许开发者输入大型代码库、文档和文件树，进行全面的多步骤分析或转换。该工具配备了多个内置功能，包括代码阅读器、命令运行器和内存模块，这些功能可以通过多模态可组合函数（MCPs）进行扩展，这是一个基于 Python 的接口，用于添加自定义行为。

多功能开发助手

虽然 Gemini CLI 在编程方面表现出色，但它被设计为一个多功能的本地实用工具，可用于广泛的任务，从内容生成和问题解决到深度研究和任务管理。该工具允许用户使用自然语言进行提示，消除了输入冗长复杂命令或不断查阅文档的需要。开发者可以通过自然语言命令执行复杂任务，如代码重构、文档生成、执行 shell 命令、运行脚本和编辑文件。

免费访问与使用限制

任何拥有个人 Google 账户的用户都可以免费访问 Gemini 1.5 Pro，限制为每分钟 60 次请求和每天 1000 次请求。这个慷慨的额度确保个人开发者在开发工作中很少遇到使用限制。对于需要更高限制或特定模型的专业开发者，Google 提供与 Google AI Studio 和 Vertex AI 的集成，采用基于使用量的计费方式。

开源与可扩展性

该项目完全开源，采用 Apache 2.0 许可证。这种透明性允许开发者检查代码、了解其功能并验证安全影响。开源特性鼓励社区贡献，包括错误报告、功能建议和代码改进。该工具支持与模型上下文协议（MCP）和捆绑扩展的内置集成，允许开发者为特定工作流定制提示和说明。

开发生态系统集成

Gemini CLI 与 Google 的 AI 编程助手 Gemini Code Assist 共享相同的技术。这种集成在不同的开发环境中提供了一致性，无论是在终端还是在 VS Code 中工作。该工具可以通过 Google 搜索为提示提供基础，获取网页并为模型提供实时的外部上下文。

跨平台兼容性

Gemini CLI 使用 TypeScript 编写，可在所有平台上运行，包括 Windows、macOS 和 Linux。通过 npm 进行安装非常简单，使得开发者无论使用何种操作系统都能轻松访问。

Gemini CLI 代表了开发者工具的范式转变，人工智能成为命令行体验的组成部分，在保持开发者重视的终端效率和可移植性的同时提高了生产力。

1 基础操作#

添加上下文 ：使用 @ 指定文件作为上下文（例如：@src/myFile.ts）来定位特定文件或文件夹
Shell 模式 ：通过! 执行 shell 命令（例如：!npm run start）或使用自然语言（例如：启动服务器）

2 命令列表#

/help - 显示 gemini-cli 的帮助信息
/docs - 在浏览器中打开完整的 Gemini CLI 文档
/clear - 清除屏幕和对话历史
/theme - 更改主题
/auth - 更改认证方法
/editor - 设置外部编辑器偏好
/stats - 检查会话统计信息
/mcp - 列出已配置的 MCP 服务器和工具
/memory - 管理内存。用法：/memory <show refresh add> [用于添加的文本]
/tools - 列出可用的 Gemini CLI 工具
/about - 显示版本信息
/bug - 提交错误报告
/chat - 管理对话历史。用法：/chat <list save resume> [标签]
/quit - 退出命令行界面
/compress - 通过将上下文替换为摘要来压缩上下文
! - shell 命令

3 键盘快捷键#

Enter - 发送消息
Shift+Enter - 换行
Up/Down - 在提示历史中循环
Alt+Left/Right - 在输入中按单词跳转
Esc - 取消操作
Ctrl+C - 退出应用程序

4 MCP Server 配置命令#

mkdir -p ~/.gemini

cd ~/.gemini

nano settings.json

配置文件 (context7 为例)

1
{
2
  "theme": "Default",
3
  "selectedAuthType": "oauth-personal",
4
  "mcpServers": {
5
    "context7": {
6
      "command": "npx",
7
      "args": ["-y", "@upstash/context7-mcp"]
8
    },
9
    "taskmaster-ai": {
10
      "command": "npx",
11
      "args": ["-y", "--package=task-master-ai", "task-master-ai"],
12
      "env": {
13
        "ANTHROPIC_API_KEY": "sk-ant-"
14
        "OPENAI_API_KEY": "sk-proj-"
15
        "GOOGLE_API_KEY": "sk-proj-"
16
      }
17
    }
18
  }

5 GEMINI.md 配置示例#

1
# AutoGen AI智能体开发项目
2

3
## 项目概述
4
使用 AutoGen 0.4 最新版本开发AI智能体，Python 3.11，venv虚拟环境。
5

6
## 环境配置
7

8
### Python环境
9
- Python版本：3.11
10
- 虚拟环境：使用venv
11
- 包管理：pip + requirements.txt
12

13
### 安装步骤
14

15
# 创建虚拟环境
16
python3.11 -m venv .venv
17

18
# 激活环境
19
source .venv/bin/activate  # Linux/Mac
20
# .venv\Scripts\activate   # Windows
21

22
# 安装AutoGen
23
pip install -U "autogen-agentchat" "autogen-ext[openai]"
24

25
## 编程规范
26

27
### 导入约定
28

29
import asyncio
30
from autogen_agentchat.agents import AssistantAgent, UserProxyAgent
31
from autogen_agentchat.teams import RoundRobinGroupChat
32
from autogen_ext.models.openai import OpenAIChatCompletionClient
33

34
### 代码风格
35
- 所有操作使用 async/await（AutoGen 0.4是异步架构）
36
- 使用类型提示
37
- 函数和类添加中文注释
38
- 错误处理要完善
39

40
### 基本模式
41

42
async def main():
43
    # 创建模型客户端
44
    model_client = OpenAIChatCompletionClient(model="gpt-4o")
45

46
    # 创建智能体
47
    agent = AssistantAgent("助手", model_client=model_client)
48

49
    # 运行任务
50
    result = await agent.run(task="你的任务")
51

52
    # 关闭连接
53
    await model_client.close()
54

55
## 项目结构
56

57
项目目录/
58
├── .venv/           # 虚拟环境（不提交到git）
59
├── .env             # 环境变量（不提交到git）
60
├── requirements.txt # 依赖包
61
├── agents/          # 智能体实现
62
├── main.py          # 主程序入口
63
└── GEMINI.md        # 本配置文件
64

65
## 环境变量设置
66

67
# .env 文件
68
OPENAI_API_KEY=你的API密钥
69
MODEL_NAME=gpt-4o
70

71
## 开发要点
72

73
### 智能体类型
74
- **AssistantAgent**: LLM驱动的助手智能体
75
- **CodeExecutorAgent**: 代码执行智能体
76

77
### 团队模式
78
- **RoundRobinGroupChat**: 轮询组聊天
79
- 支持多智能体协作
80

81
### 最佳实践
82
- 先单独测试智能体，再组合成团队
83
- 使用async/await处理所有操作
84
- 正确关闭模型客户端连接
85
- 环境变量管理敏感信息
86
- 虚拟环境不提交到版本控制
87

88
## 文档和资源获取
89

90
### MCP服务器配置
91
始终使用 **context7 MCP server** 搜索AutoGen最新文档和代码规范：
92
- 优先查询AutoGen 0.4官方文档
93
- 获取最新的API参考和最佳实践
94
- 查找代码示例和模式
95
- 验证版本兼容性和新特性
96

97
### 搜索策略
98
当需要AutoGen相关信息时：
99
1. 首先使用context7搜索官方文档
100
2. 重点关注0.4版本的变更和新特性
101
3. 获取异步编程模式的最新示例
102
4. 查找多智能体协作的最佳实践
103

104
## 注意事项
105
- AutoGen 0.4与0.2版本完全不同，使用新的异步架构
106
- AgentChat适合快速原型开发
107
- 需要Python 3.11
108
- 所有示例代码使用中文注释
109
- 遇到问题时优先通过context7搜索最新解决方案

6 Gemini CLI 高级用法指南#

7 安装与认证#

7.1 快速安装#

1
# 直接运行（推荐）
2
npx https://github.com/google-gemini/gemini-cli
3

4
# 或全局安装
5
npm install -g @google/gemini-cli

7.2 高级认证配置#

1
# 使用 API 密钥（适用于企业用户）
2
export GEMINI_API_KEY="your_api_key_here"
3

4
# Google Workspace 账户认证
5
gemini auth --workspace
6

7
# 检查认证状态

8 核心高级功能#

8.1 1. 大型代码库分析#

8.2 项目架构分析#

1
cd your-large-project/
2
gemini
3

4
# 在 Gemini CLI 中执行：
5
> 分析这个项目的整体架构，包括：
6
  - 主要模块和它们的职责
7
  - 数据流向和依赖关系
8
  - 设计模式的使用
9
  - 潜在的架构问题

8.3 跨文件代码重构#

1
> 重构整个项目以支持新的数据库抽象层：
2
  1. 识别所有数据库相关的代码
3
  2. 创建统一的数据访问接口
4
  3. 生成迁移计划和时间表

8.4 技术债务评估#

1
> 评估这个代码库的技术债务：
2
  - 代码重复度分析
3
  - 过时依赖识别
4
  - 性能瓶颈检测
5
  - 安全漏洞扫描

8.5 2. 多模态应用开发#

8.6 从设计稿生成应用#

1
# 上传设计图片后
2
> 基于这个 UI 设计稿创建一个 React 应用：
3
  - 实现像素级完美的 UI 组件
4
  - 添加响应式设计
5
  - 集成状态管理
6
  - 包含基本的交互逻辑

8.7 PDF 文档转代码#

1
> 分析这个 API 规范文档并生成：
2
  - 完整的 TypeScript 接口定义
3
  - API 客户端封装类
4
  - 单元测试用例
5
  - 使用示例和文档

8.8 3. 运营自动化#

8.9 Git 工作流自动化#

1
> 自动化我们的 Git 工作流：
2
  1. 分析最近的提交模式
3
  2. 创建智能的分支命名约定
4
  3. 生成自动化的代码审查清单
5
  4. 设置冲突解决策略

8.10 CI/CD 流程优化#

1
> 优化我们的 CI/CD 流程：
2
  - 分析构建时间瓶颈
3
  - 建议并行化策略
4
  - 创建智能测试选择
5
  - 设计故障恢复机制

9 MCP 服务器集成#

9.1 1. 自定义 MCP 服务器配置#

9.2 数据库操作服务器#

1
{
2
  "servers": {
3
    "database": {
4
      "command": "node",
5
      "args": ["./mcp-servers/database-server.js"],
6
      "env": {
7
        "DB_CONNECTION_STRING": "postgresql://..."
8
      }
9
    }
10
  }
11
}

1
> 通过数据库 MCP 服务器：
2
  - 查询用户行为分析数据
3
  - 生成数据模型优化建议
4
  - 创建自动化数据清理脚本

9.3 媒体生成服务器集成#

1
> 使用 Imagen/Veo 服务器创建：
2
  - 产品演示视频脚本
3
  - 营销素材设计方案
4
  - 用户界面图标集合
5
  - 品牌一致性检查

9.4 2. 企业工具集成#

9.5 Slack 集成自动化#

1
> 创建 Slack 机器人来：
2
  - 自动总结每日站会内容
3
  - 监控生产环境告警
4
  - 生成代码审查通知
5
  - 跟踪项目里程碑进度

9.6 Google Workspace 集成#

1
> 自动化 Google Workspace 工作流：
2
  - 从会议记录生成行动项
3
  - 创建项目状态报告
4
  - 同步日历和项目时间线
5
  - 生成团队绩效分析

10 高级项目管理#

10.1 1. 智能项目分析#

10.2 团队贡献可视化#

1
> 创建展示最近 7 天 git 历史的报告：
2
  - 按功能模块分组提交
3
  - 分析团队成员贡献模式
4
  - 识别协作瓶颈
5
  - 生成工作负载平衡建议

10.3 实时监控仪表板#

1
> 创建全屏监控应用显示：
2
  - GitHub Issues 互动热力图
3
  - 实时构建状态
4
  - 代码质量趋势
5
  - 用户反馈聚合

10.4 2. 文档和流程自动化#

10.5 智能文档生成#

1
> 自动生成项目文档：
2
  - API 参考文档（从代码注释）
3
  - 部署指南（从配置文件）
4
  - 故障排除手册（从日志分析）
5
  - 用户手册（从功能规范）

10.6 合规性检查自动化#

1
> 实施合规性检查流程：
2
  - GDPR 数据处理审计
3
  - 安全漏洞扫描报告
4
  - 代码许可证合规检查
5
  - 访问权限审查

11 高级开发工作流#

11.1 1. 代码质量提升#

11.2 智能代码审查#

1
> 执行深度代码审查：
2
  - 架构一致性检查
3
  - 性能影响分析
4
  - 安全最佳实践验证
5
  - 可维护性评估

11.3 自动化重构建议#

1
> 分析代码并提供重构建议：
2
  - 设计模式优化机会
3
  - 代码重复消除
4
  - 函数复杂度简化
5
  - 依赖关系优化

11.4 2. 技术迁移与升级#

11.5 版本升级策略#

1
> 制定 Python 3.12 升级计划：
2
  1. 兼容性风险评估
3
  2. 依赖库升级路径
4
  3. 测试策略制定
5
  4. 渐进式迁移方案

11.6 框架迁移指导#

1
> 协助从 Flask 迁移到 FastAPI：
2
  - 路由转换策略
3
  - 中间件适配方案
4
  - 数据验证迁移
5
  - 性能优化机会

12 企业级部署配置#

12.1 1. 批量处理与自动化#

12.2 文件处理自动化#

1
> 批量处理项目文件：
2
  - 将所有图片转换为 WebP 格式
3
  - 根据 EXIF 数据重组织照片
4
  - 压缩和优化视频文件
5
  - 生成缩略图和预览

12.3 数据整理自动化#

1
> 智能整理财务文档：
2
  - 按月份分类 PDF 发票
3
  - 提取关键财务数据
4
  - 生成支出分析报告
5
  - 创建税务准备清单

12.4 2. 高级配置管理#

12.5 环境配置优化#

1
# 企业级配置文件
2
export GEMINI_MODEL="gemini-2.5-pro"
3
export GEMINI_TEMPERATURE="0.3"
4
export GEMINI_MAX_TOKENS="8192"
5
export MCP_SERVER_TIMEOUT="30000"

12.6 团队协作配置#

1
# 团队共享配置
2
gemini config set --team \
3
  --project-context="/path/to/project" \
4
  --coding-standards="/path/to/standards.json" \
5
  --review-templates="/path/to/templates"

13 性能优化与监控#

13.1 1. 使用量管理#

1
# 监控 API 使用情况
2
gemini usage --detailed
3
gemini quota --check
4

5
# 优化请求策略
6
gemini config set --batch-size=5 --parallel-requests=3

13.2 2. 本地缓存配置#

1
# 启用智能缓存
2
gemini config set --cache-enabled=true --cache-ttl=3600
3
gemini cache clean --older-than=7d

14 最佳实践建议#

14.1 1. 安全考虑#

使用环境变量管理敏感信息
定期轮换 API 密钥
实施访问权限控制
启用审计日志记录

14.2 2. 性能优化#

合理使用批处理功能
实施智能缓存策略
监控 token 使用效率
优化提示词长度

14.3 3. 团队协作#

建立统一的配置标准
共享常用的提示词模板
实施代码审查流程
定期培训团队成员

通过这些高级用法，Gemini CLI 可以成为企业开发团队的强大生产力工具，显著提升开发效率和代码质量。