Математика в основе ИИ | матрицы, тензоры, deep learning | Podlodka Podcast #436

Published at : 23 Dec 2025

Многие знают, что когда модели обучаются, где-то под капотом перемножаются матрицы и тензоры, и все это связано с дифференцированием. Мы с Денисом Степановым взялись за нелегкую задачу – разобраться, что же именно там происходит!

Полезные ссылки:
— Dive into Deep Learning Aston Zhang, Zachary C. Lipton, Mu Li, Alexander J. Smola (online book with code and formulas) https://d2l.ai/ https://www.amazon.com/s/ref=dp_byline_sr_book_2?ie=UTF8&field-author=Zachary+C.+Lipton&text=Zachary+C.+Lipton&sort=relevancerank&search-alias=books
— Micrograd by Andrej Karpathy https://github.com/karpathy/micrograd
— Andrej Karpathy builds GPT from scratch https://www.youtube.com/watch?v=kCc8FmEb1nY
— Scott Aaronson on LLM Watermarking https://www.youtube.com/watch?v=YzuVet3YkkA
— Annotated history of Modern AI and Deep Learning by Jurgen Schmidhuber https://people.idsia.ch/~juergen/deep-learning-history.html
— Probabilistic Machine Learning: An Introduction Kevin Patrick Murphy https://probml.github.io/pml-book/book1.html
— Probabilistic Machine Learning: Advanced Topics Kevin Patrick Murphy https://probml.github.io/pml-book/book2.html
— Pattern Recognition and Machine Learning Christopher Bishop https://www.microsoft.com/en-us/research/wp-content/uploads/2006/01/Bishop-Pattern-Recognition-and-Machine-Learning-2006.pdf
— Deep Learning: Foundations and Concepts Christopher Bishop, Hugh Bishop https://www.bishopbook.com/
— Deep Learning Ian Goodfellow, Yoshua Bengio, Aaron Courville https://www.deeplearningbook.org/
— Глубокое обучение: Погружение в мир нейронных сетей С. Николенко, А. Кадурин, Е. Архангельская https://www.k0d.cc/storage/books/AI,%20Neural%20Networks/%D0%93%D0%BB%D1%83%D0%B1%D0%BE%D0%BA%D0%BE%D0%B5%20%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5%20(%D0%9D%D0%B8%D0%BA%D0%BE%D0%BB%D0%B5%D0%BD%D0%BA%D0%BE).pdf
— Gonzo-обзоры ML статей Григорий Сапунов, Алексей Тихонов https://t.me/gonzo_ML
— Machine Learning Street Talk podcast https://www.youtube.com/c/machinelearningstreettalk
— Feedforward NNs, Autograd, Backprop (Datalore report, Denis Stepanov) https://datalore.jetbrains.com/report/static/Ht_isxs4iB2.BNIqv-C3WUp/pEpNv2eMVU9tEkPsaboR9y
— Softmax Regression, Adversarial Attacks (Datalore report, Denis Stepanov) https://datalore.jetbrains.com/report/static/Ht_isxs4iB2.BNIqv-C3WUp/cIvd6zX1B5I3kULNiVCEyy
— Dual Numbers, PINN (Datalore report, Denis Stepanov) https://datalore.jetbrains.com/report/static/Ht_isxs4iB2.BNIqv-C3WUp/3oa1BNrPGpQ8uc82tCaz5d


❓ Хочешь обсудить выпуск или задать вопрос эксперту? Вступай в наш Telegram-чат: https://t.me/podlodka
📰 Не любишь чаты, но хочешь оставаться в курсе дел и прокачивать свой IT кругозор? Подписывайся на наш Telegram-канал: там публикуются анонсы новых выпусков, а в комментах идут ценные и горячие обсуждения! 5 тысяч опытных IT-специалистов уже с нами: https://t.me/podlodkanews
👉Предложить себя в подкаст https://forms.gle/NtmaZmeDAa3MHSra7

Тайм-коды:
00:00 О чем выпуск
05:33 Значение понимания ИИ
11:23 Математические основы Deep Learning
44:03 Вероятностные аспекты обучения
51:25 Функции активации
01:01:50 Обучение с учителем и без учителя
01:13:15 Обратное распространение ошибки
01:15:30 Использование Python в тензорных вычислениях
01:18:03 Ватермаркинг в языковых моделях
01:26:13 Что такое гиперпараметры
01:31:45 Применение языковых моделей в математике
01:37:45 Заключение