Triton FP8: реализация и автотюнинг GEMM-Attention под RTX 40xx-Blackwell
Привет, Хабр! Я тут на досуге решил разобраться с 8-битными числами с плавающей запятой (FP8) и попробовать написать под них свои GPU‑ядра на Triton
Классификация «группировок» и основных операций мышления
«Психология мышления» К. Бюлер и О. Зельц
Привет, Хабр! Я тут на досуге решил разобраться с 8-битными числами с плавающей запятой (FP8) и попробовать написать под них свои GPU‑ядра на Triton