GPU
-
HAMi-scheduler:异构 AI 计算虚拟化中间件
HAMi(前身为 k8s-vGPU-scheduler)是一个面向 Kubernetes 的异构设备管理中间件。它可以管理不同类型的异构设备(如 GPU、NPU、MLU、DCU 等),实现异构设备在 Pod 之间的共享,并基于设备拓扑和调度策略做出更优的调度决策。
2025-07-27 kubernetes k8sGPUhamivgpu -
k8s 调度 NVIDIA GPU 安装部署
Kubernetes 支持 GPU 设备调度配置部署
2022-05-01 kubernetes kubernetesinstallnvidiagpu -
NVIDIA Container Toolkit 介绍
NVIDIA/nvidia-container-toolkit 是 NVIDIA 官方开源的容器工具包(NVIDIA Container Toolkit)仓库。它的核心作用是让容器能够原生且高效地访问和使用宿主机的 NVIDIA GPU 资源,从而非常方便地在容器化环境中运行 GPU 加速的应用程序(如 AI 训练与推理、深度学习、数据科学和高性能计算等)。
-
ROCm
ROCm(Radeon Open Compute platform)是 AMD 推出的一个开源软件栈,旨在为 AMD GPU 提供高性能计算 (HPC) 和人工智能 (AI) 解决方案的开发支持
-
nvidia-smi 使用介绍
nvidia-smi(NVIDIA System Management Interface)是基于NVIDIA Management Library (NVML)的GPU的系统管理接口,主要用于显卡的管理和状态监控。2021-09-12 hardware hardwaregpunvidianvidia-smi -
NVIDIA GPU 介绍
Linux
GPU(Graphics Processing Unit, 图形处理单元)使用相关介绍