В ближайший четверг (сегодня) в 16:30 (уже сейчас) состоится доклад Смолина Александра на тему "SPFresh: Incremental In-Place Update for Billion-Scale Vector Search".
Аннотация:
Приближенный поиск ближайших соседей (ANN)) для векторных данных широко используется в различных областях, включая retrieval и рекомендательные системы. По мере постоянного роста объёма данных становится важной поддержка обновлений векторного индекса.
Чтобы снизить затраты на обновление, существующие системы поддерживают второй индекс для обновлений, который объединяется с основным индексом путём полной периодической перестройки всего индекса. Однако этот подход характеризуется повышенными таймингами и неточностями при поиска из-за необходимости работать с двумя индексами. Кроме этого он требует значительных ресурсов и времени для полного перестроения.
Авторы представляют SPFresh -- систему, которая поддерживает обновление векторов in-place. SPFresh обеспечивает низкие тайминги и высокую точность ответов для решений, основанных на полном перестроении, используя всего 1% ram и <10% cpu в пиковом потреблении по сравнению с SOTA в миллиардном векторном индексе с ежедневными обновлениями 1% всех векторов.
Скоро начинаем. Ссылка для подключения: https://yandex.zoom.us/j/92419106876