50w DAU 目标 · 累计 1 亿 TPM

Eve 项目 · 多云 LLM 算力池

Eve 项目上线前,我主导了 GCP Vertex AI、Azure OpenAI、火山引擎 GPU 三朵云的生产 LLM 服务池准备,目标支撑 50 万日活,累计 1 亿 TPM 并发。

规模快照

75
GCP 账号
60
Azure 部署
250w
单账号 TPM
1 亿
累计 TPM
120
GPU 卡
3
云厂商

三大支柱

GCP Vertex AI — 75 个账号

多 Organization 方案绕开单账号配额限制:跨多个 Cloud Identity Org 创建 75 个账号,零风控、单账号 250w TPM。工具:gcloud CLI + 自研脚本,由 Claude Code 驱动批量身份/项目/配额开通。

GCP Vertex AIMulti-Orggcloud CLIClaude Code

Azure OpenAI — 60 个部署

az CLI 批量拉起 30 个订阅 × (US East 2 + Sweden Central) = 60 个 GPT-5.3 部署。通过区域均衡路由突破单账号并发限制,累计 1 亿 TPM。

Azure OpenAIGPT-5.3US East 2Sweden Centralaz CLI

火山引擎 — 120 台 4090D

上海区域拉起 120 张 RTX 4090D 用于生图;Ansible 统一 NVIDIA Driver + Container Toolkit 安装,一键纳入集群;与火山 AML 打通训练与推理。

VolcengineRTX 4090DAnsibleAML