Сегодня в 16:30 состоится доклад Морозова Алексея на тему Adaptive and Robust Query Execution for Lakehouses at Scale.
Аннотация:
В современных Lakehouse-системах данные часто неструктурированы, статистики устаревают или отсутствуют, а традиционные оптимизаторы запросов выбирают неэффективные планы выполнения. Это приводит к:
- Чрезмерному использованию ресурсов
- Медленным или «падающим» запросам
- Невозможности предсказать поведение системы на сложных данных
В статье предлагается решение с помощью динамической оптимизации запросов на основе полученной статистики во время исполнения. Это позволит заменить нехватку статистики для анализа запроса и динамически перестраивать неоптимальные планы. Отмечается 25 кратное ускорение для некоторых запросов в тестах TPC-DC.