часть 3 · современные модели · 4 секции · ~30 мин

Нейросети.
Часть 3.

Финальная часть. Здесь — как из всего пройденного собирают то о чём пишут в новостях: GPT и трансформеры, RLHF (как ChatGPT научили быть вежливым), Stable Diffusion и генерация картинок, а также практические штуки про реальное обучение — батчи, эпохи, train/val/test.

Если пропустил предыдущие части

Эта часть опирается на embeddings, attention, softmax и оптимизаторы. Если что-то из этого незнакомо — сначала часть 1 и часть 2.



всё

Это конец. 24 секции — от y = w·x до того как генерируются картинки и работает ChatGPT. Каждая большая модель которая выйдет завтра — будет собрана из этих же кубиков, в новой комбинации. Архитектуры будут другими, но фундамент тот же: умножение, сложение, активация, градиент.

← вернуться к части 1