triton_language.atomic_add

triton.language.atomic_add(pointer, val, mask=None, sem=None, scope=None)

在由 pointer 指定的内存位置执行原子加法。

在原子操作前返回保存在 pointer 处的数据。

参数**：**

pointer (Block of dtype=triton.PointerDType) - 要操作的内存位置
val (pointer.dtype.element_ty 的块) - 执行原子操作所需的值
sem (str, 可选) - 指定操作的内存语义。可接受的值包括「acquire」（获取）、「release」（释放）、「acq_rel」（获取释放）和「relaxed」（放松）。如果未提供，则函数默认使用「acq_rel」语义。
scope (str, 可选) - 定义观察原子操作同步效果的线程范围。可接受的值包括「gpu」（默认值）、「cta」（协作线程数组，即线程块）或「sys」（代表「SYSTEM」）。默认值为「gpu」。

这个函数也可作为 tensor 的成员函数调用，使用 x.atomic_add(...) 而不是 atomic_add(x, ...)。