# cutlt **Repository Path**: graviton/cutlt ## Basic Information - **Project Name**: cutlt - **Description**: cuda tile python test - **Primary Language**: Unknown - **License**: AGPL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-05-11 - **Last Updated**: 2026-05-11 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # cuTile Python 演示项目 本项目演示 NVIDIA cuTile Python 的基本用法. cuTile 是基于 CUDA Tile 编程模型的 Python DSL, 让你可以用基于 tile(分块)的抽象来编写 GPU 内核, 而无需手动管理线程. ## 环境要求 - **GPU**: Compute Capability 8.x (Ampere/Ada), 10.x, 11.x 或 12.x (Blackwell) - **驱动**: NVIDIA Driver r580 或更高版本 - **CUDA Toolkit**: 13.1 或更高版本 - **Python**: 3.10 ~ 3.13(暂不支持 3.14) - **包管理**: [uv](https://docs.astral.sh/uv/)(本项目统一使用 uv 管理虚拟环境与依赖) ## 安装 本项目使用 `uv` 管理虚拟环境与包, 无需手动激活 venv 或调用 pip. ```bash # 1. 确保已安装 uv # Windows: powershell -c "irm https://astral.sh/uv/install.ps1 | iex" # Linux/macOS: curl -LsSf https://astral.sh/uv/install.sh | sh # 2. 克隆/进入项目后, 一键同步依赖(自动创建 .venv) uv sync ``` `pyproject.toml` 已声明所需依赖: `cuda-tile`, `cupy-cuda13x`, `numpy`. `uv sync` 会自动解析并安装到项目独立的 `.venv` 中. ## 项目结构 ``` . ├── README.md ├── AGENTS.md # 本项目的 Agent 开发规范 ├── pyproject.toml # 项目配置与依赖(uv 读取) ├── uv.lock # 锁定依赖版本(uv 自动生成) ├── .python-version # 指定 Python 版本(uv 读取) └── examples/ ├── 01_vector_add.py # 向量加法(入门示例) ├── 02_saxpy.py # SAXPY 缩放向量加 ├── 03_matrix_mul.py # 矩阵乘法 └── 04_tile_ops.py # Tile 基本操作 ``` ## 核心概念 cuTile 编程模型的关键抽象: | 概念 | 说明 | | ---------- | --------------------------------------------- | | **Array** | 主要数据结构, 存放在 GPU 显存中 | | **Tile** | 数组的子集(分块), 内核操作的基本单位 | | **Kernel** | 用 `@ct.kernel` 装饰的函数, 在 GPU 上并行执行 | | **Block** | GPU 上的执行单元, tile 操作在各 block 间并行 | 典型 cuTile 内核三步走: 1. **Load** — 从全局显存加载 tile 到 block 2. **Compute** — 在 tile 上执行计算 3. **Store** — 将结果 tile 写回全局显存 ## 快速运行 ```bash # uv run 会自动使用项目 .venv, 无需手动激活 uv run examples/01_vector_add.py uv run examples/02_saxpy.py uv run examples/03_matrix_mul.py uv run examples/04_tile_ops.py ``` ## 官方资源 - [cuTile Python Quickstart](https://docs.nvidia.com/cuda/cutile-python/quickstart.html) - [GitHub: NVIDIA/cutile-python](https://github.com/NVIDIA/cutile-python) - [CUDA Tile 主页](https://developer.nvidia.com/cuda/tile)