1. Рассуждения о больших языковых моделях
КонушинАнтон Сергеевич
ОселедецИван Валерьевич
МоскаленкоАндрей Викторович
ДорнЮрий Владимирович
КоролёвВадим Викторович
ЖемчужниковДмитрий Сергеевич
ШахуроВладислав Игоревич
АнохинПетр Константинович
- 00:16Зимняя школа по искусственному интеллекту 2026: приветствие
- 06:57Рассуждения о больших языковых моделях: доклад
- 08:27Большие языковые модели сжимают тексты
- 13:17Необходимость N миллиардов параметров
- 15:56В мире уже учат на миллионах GPU
- 17:05Глобальная задача: получить результат там, где мало данных (поиск новых материалов, лекарств)
- 24:50GigaEvo: Автоматический поиск алгоритмов
- 30:31Maestro: рассуждения как программа
- 35:16Теоретические исследования: Parity-Based Reasoning Chain (Shalev-Shwartz & Shashua, 2025)
- 42:56Память и длина контекста как ограничитель: ARMT (Rodkin, Kuratov, Bulatov & Burtsev, ICMI, 2024)
- 45:06Сжатие контекста в 1500 раз (Юрий Куратов)
- 46:58Восстановление текста за 1 форвард (Мезенцев, 2025)
- 47:28RLSC: Обучение без учителя, самодистилляция
- 48:41Новые архитектуры: дискретная диффузия. Модели LLADA
- 49:11Насколько мало "оптимальное вычислительное ядро"?
- 52:00Вопросы