В этом выпуске разбираемся, что такое векторные базы данных – зачем они понадобились, если есть SQL и текстовый поиск, как устроены под капотом и в чём их ключевое отличие от привычных подходов. Объясняем простыми словами: как данные превращаются в векторы, как по ним происходит быстрый поиск и почему это вообще работает.
В гостях Андрей Васнецов – основатель Qdrant. Вместе обсуждаем, откуда пошёл хайп, что изменилось с приходом LLM, как на практике применяются векторные базы (не только в RAG), какие есть популярные движки и встроенные решения в Postgres и ClickHouse, а также с какими подводными камнями, ограничениями и компромиссами сталкиваются команды при работе.
Полезные ссылки:
— Интервью Осетинской
https://youtu.be/_GwPpxtMcNs— Андрей в подкасте TeamleadTalks
https://youtu.be/agYxjnc8mdU— Главная разработка Андрея
https://github.com/qdrant❓ Хочешь обсудить выпуск или задать вопрос эксперту? Вступай в наш Telegram-чат:
https://t.me/podlodka📰 Не любишь чаты, но хочешь оставаться в курсе дел и прокачивать свой IT кругозор? Подписывайся на наш Telegram-канал: там публикуются анонсы новых выпусков, а в комментах идут ценные и горячие обсуждения! 5 тысяч опытных IT-специалистов уже с нами:
https://t.me/podlodkanews👉Предложить себя в подкаст
https://forms.gle/NtmaZmeDAa3MHSra7Тайм-коды:
00:00 О чем выпуск
03:30 Что такое вектор
05:16 Размерность вектора
10:16 Почему появился векторный поиск
13:32 Архитектура векторных баз
18:29 Мультимодальные модели
21:10 Преобразование картинок в векторы
23:07 Обучение нейросетей
26:51 Ограничения текстового поиска
32:38 Оптимизация в векторном поиске
42:49 Влияние трендов на векторный поиск
47:18 Практическое применение векторного поиска
49:50 Особенности векторных баз для RAG
59:36 Реализация векторных индексов
01:02:04 Отличия векторных и графовых баз данных
01:17:24 Проблемы интерфейсов для векторного поиска
01:21:23 Рекомендации для изучения векторного поиска
01:26:17 Заключение