практическое применение ML.

Triton FP8: реализация и автотюнинг GEMM-Attention под RTX 40xx-Blackwell

Привет, Хабр! Я тут на досуге решил разобраться с 8-битными числами с плавающей запятой (FP8) и попробовать написать под них свои GPU‑ядра на Triton

продолжить чтение

Rambler's Top100