Skip to content

Commit

Permalink
Update 09-persistent-matmul.md
Browse files Browse the repository at this point in the history
增加了教程链接
  • Loading branch information
yuudiiii authored Dec 11, 2024
1 parent ca310a1 commit e5f7c5c
Showing 1 changed file with 2 additions and 0 deletions.
2 changes: 2 additions & 0 deletions docs/01-getting-started/tutorials/09-persistent-matmul.md
Original file line number Diff line number Diff line change
Expand Up @@ -2,6 +2,8 @@
title: 持久矩阵乘法 (Persistent Matmul)
---

[<font face="黑体" size=5>在线运行此教程</font>](https://openbayes.com/console/hyperai-tutorials/containers/HMjXImmXZFV)

该脚本展示了使用 Triton 进行矩阵乘法的持久化内核实现 (persistent kernel implementations)。包含多种矩阵乘法方法,例如基础的朴素方法 (naive)、持久化方法 (persistent) 以及基于张量内存加速器(TMA,Tensor Memory Accelerator)的方法。这些内核同时支持半精度浮点数(FP16)和 8 位浮点数(FP8)数据类型,但 FP8 的实现仅在计算能力大于等于 9.0 的 CUDA 设备上可用。

Triton 与 cuBLAS 的具体实现将会在多种各异的配置情形下开展基准测试工作,并通过质子分析器 (proton profiler) 进行评估。使用者可以通过命令行参数灵活指定矩阵的维度和迭代步骤。
Expand Down

0 comments on commit e5f7c5c

Please sign in to comment.