часть 7 · альтернативные архитектуры · 5 секций · ~40 мин

Нейросети.
Часть 7.

До сих пор мы говорили о трансформере как о единственной архитектуре. Но это не так — у него есть фундаментальное ограничение (квадратичная сложность по длине), и есть несколько новых архитектур которые с этим борются. Ещё — модели которые учатся не из текста, а из видео и действий.



конец части 7

Картина становится богаче. Трансформер — текущий чемпион, но не единственная игра в городе. Mamba, RWKV, MoD — современные направления оптимизации. World models — путь к ИИ который понимает физический мир. Архитектуры будут меняться, но фундамент тот же: представления, обучение, градиент.

← вернуться к части 1