Runner 部署指南
📘 概述
CSGHUB Runner 是 CSGHub 平台中负责执行模型训练、推理、任务调度等计算任务的核心组件。
通过 Runner,可以实现与主控制端(CSGHUB Server)的通信,并在 Kubernetes 集群中动态创建与销毁用户工作负载。
本 Chart 通过 Helm 提供标准化部署方式,支持灵活配置、外部依赖集成以及自动化资源管理。
⚙️ 环境要求
| 项目 | 说明 |
|---|---|
| Kubernetes 版本 | v1.28+ |
| Helm 版本 | v3.12+ |
| 网络要求 | 集群节点需能访问 CSGHub Server 与外部镜像仓库(如果内部镜像仓库被禁用) |
| 权限要求 | 具备 cluster-admin 或能创建命名空间与 RBAC 资源的权限(部署过程中会自动创建) |
📦 安装步骤
1️⃣ 添加 Helm 仓库
helm repo add csghub https://charts.opencsg.com/csghub
helm repo update
2️⃣ 创建命名空间(可选)
kubectl create namespace csghub
3️⃣ 部署 Runner
以下信息从 CSGHub 主服务处获取:
-
domain这里需要提供一个二级域名用于暴露 runner 服务。
如果提供的域名是
example.com,服务将暴露在runner.example.com