В Метрике мы храним в ClickHouse подготовленные данные. Но эти данные (почти) не содержат потери информации по сравнению с сырыми данными и, наоборот, являются "обогащёнными" - то есть, содержат больше информации, чем сырые данные.
В ClickHouse мы храним данные за всё время, и данные за всё время храним только в ClickHouse.
ClickHouse удобно использовать для долговременного хранения данных, по следующим причинам:
- данные хранятся сравнительно компактно, и поэтому эффективность хранения может быть выше, чем при использовании других решений;
- в отличие от archive storage, подходящего только для "холодных" данных, ClickHouse позволяет выполнять аналитику по данным, быстрые выборки и т. п. в той же системе.
Кроме Метрики, есть применение в нескольких отделах, следующего вида:
- устанавливается несколько серверов с дисковыми полками максимального размера;
- туда записываются все логи некоторого сервиса и хранятся неограниченное время;
- запросов на чтение небольшое количество - по сути, система работает как архивное хранилище;
- система позволяет относительно быстро что-либо выяснить, когда возникают проблемы: корректность каких-то операций, исследовать проблемы со скоростью работы сервиса, находить причины ошибок и т. п.