# amdtop **Repository Path**: yangecool/amdtop ## Basic Information - **Project Name**: amdtop - **Description**: No description available - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-05-13 - **Last Updated**: 2026-05-13 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # AMDtop 用于监控 LLM (大语言模型) 推理工作负载的工具,支持 AMD 和 NVIDIA GPU。实时监控 Docker 容器、GPU 指标和 vLLM 推理引擎状态。 ## 功能特性 - **Docker 容器监控**:实时获取容器资源使用情况 - **GPU 指标监控**:支持 AMD GPU 和 NVIDIA GPU 指标采集 - **vLLM 推理监控**:监控 vLLM 推理引擎运行状态 - **多模式支持**:支持 top 等多种监控模式 - **日志记录**:完整的日志记录功能 - **信号处理**:支持优雅退出 ## 使用方法 ### 基础用法 ```python from AMD_LLM_Monitor_V20 import LLMMonitor # 创建监控器 (AMD GPU) monitor = LLMMonitor( container_name="your_container", gpu_ids_str="0,1", mode="top" ) # 运行监控 monitor.run() ``` ```python from nvidia_llm_monitorrrr import LLMMonitor # 创建监控器 (NVIDIA GPU) monitor = LLMMonitor( container_name="your_container", gpu_ids_str="0,1", mode="top" ) # 运行监控 monitor.run() ``` ### 参数说明 | 参数 | 说明 | |------|------| | container_name | Docker 容器名称 | | gpu_ids_str | GPU ID 列表,用逗号分隔 | | mode | 监控模式,默认为 "top" | ## 获取指标 监控器可获取以下指标: - **Docker 指标**:容器资源使用情况 - **GPU 指标**:GPU 利用率、内存等 - **vLLM 指标**:推理引擎性能数据 ## 依赖环境 - Python 3.x - Docker - AMD GPU 驱动 或 NVIDIA GPU 驱动 - vLLM (用于 LLM 推理监控) ## 许可证 MIT License