1. Рассуждения о больших языковых моделях

Name: 1. Рассуждения о больших языковых моделях
Duration: 1 h 3 min 50 s

00:16Зимняя школа по искусственному интеллекту 2026: приветствие
06:57Рассуждения о больших языковых моделях: доклад
08:27Большие языковые модели сжимают тексты
13:17Необходимость N миллиардов параметров
15:56В мире уже учат на миллионах GPU
17:05Глобальная задача: получить результат там, где мало данных (поиск новых материалов, лекарств)
24:50GigaEvo: Автоматический поиск алгоритмов
30:31Maestro: рассуждения как программа
35:16Теоретические исследования: Parity-Based Reasoning Chain (Shalev-Shwartz & Shashua, 2025)
42:56Память и длина контекста как ограничитель: ARMT (Rodkin, Kuratov, Bulatov & Burtsev, ICMI, 2024)
45:06Сжатие контекста в 1500 раз (Юрий Куратов)
46:58Восстановление текста за 1 форвард (Мезенцев, 2025)
47:28RLSC: Обучение без учителя, самодистилляция
48:41Новые архитектуры: дискретная диффузия. Модели LLADA
49:11Насколько мало "оптимальное вычислительное ядро"?
52:00Вопросы