1. Рассуждения о больших языковых моделях

  1. 00:16Зимняя школа по искусственному интеллекту 2026: приветствие
  2. 06:57Рассуждения о больших языковых моделях: доклад
  3. 08:27Большие языковые модели сжимают тексты
  4. 13:17Необходимость N миллиардов параметров
  5. 15:56В мире уже учат на миллионах GPU
  6. 17:05Глобальная задача: получить результат там, где мало данных (поиск новых материалов, лекарств)
  7. 24:50GigaEvo: Автоматический поиск алгоритмов
  8. 30:31Maestro: рассуждения как программа
  9. 35:16Теоретические исследования: Parity-Based Reasoning Chain (Shalev-Shwartz & Shashua, 2025)
  10. 42:56Память и длина контекста как ограничитель: ARMT (Rodkin, Kuratov, Bulatov & Burtsev, ICMI, 2024)
  11. 45:06Сжатие контекста в 1500 раз (Юрий Куратов)
  12. 46:58Восстановление текста за 1 форвард (Мезенцев, 2025)
  13. 47:28RLSC: Обучение без учителя, самодистилляция
  14. 48:41Новые архитектуры: дискретная диффузия. Модели LLADA
  15. 49:11Насколько мало "оптимальное вычислительное ядро"?
  16. 52:00Вопросы