Здравствуйте. Есть таблица ReplicatedMergeTree, условно лог показов. В сутки 100-150 млн строк. Есть задача, добавить колонку с массивом на несколько сотен UInt-значений, чтобы потом делать выборки по элементам массивов:
select count() from Log where day >= '2016-12-01' and day <= '2016-11-23' and has(segments, 135)
Есть большие сомнения по поводу того, что это будет быстро. Есть вариант разложить сегмент на отдельные колонки (будет порядка 2 тысяч колонок).
Посоветуйте, с чего начать пробовать - массив или 2 тысячи колонок? Очевидно, что.с отдельными колонками будет быстрее, но для репликации и самого кликхауса это не будет перебором?