Как устроена языковая модель без перемножения матриц Нейросети любой архитектуры построены на перемножении ма…
Как устроена языковая модель без перемножения матриц Нейросети любой архитектуры построены на перемножении матриц. Например, трансформеры из входного вектора создают (тоже перемножением) три матрицы, Q, K и V, которые затем несколько раз перемножаются на пути к получению выходного вектора. Именно умножение матриц  с его  кубической сложностью (если не прибегать к разного рода ухищрениям) занимает большую часть вычислительных мощностей.Поэт... https://clck.ru/3D2Bbh
Автор: Habr все новости об IT