ClickHouse не тормозит - Популярные вопросы | Страница 1

ClickHouse не тормозит

Вопросов: 1360

Ответов: 9622

Популярные вопросы

user93
7/15/2021, 4:35:09 AM
Ответов: 37
Добрый день, CREATE TABLE xxx

name String, ts UInt4, type Int8 DEFAULT -1, value Int8 DEFAULT -1 ENGINE = ReplacingMergeTreets PRIMARY KEYname ORDER BY name,type SETTINGS index_granularity = 1024; Делаю запрос select name,minvalue from xxx group by name order by name limit 10; почему CH 21.1.10.3 сканирует всю таблицу и отменяет запрос по памяти? Ведь name - это primary key и все данные лежат в одной/соседних гранулах достаточно только прочитать первые несколько гранул и выдать результат

Аноним
7/1/2021, 10:10:44 AM
Ответов: 7
добрый день, подскажите плз привык к реляционным и noSQL базам данных и

не могу понять с индексами все-таки в КХ они по типу btree или нет ? потмоу-что при сортировке есть упоминания что в начало ORDER BY надо ставить то поле которое максимально изменчивое .... но если это работает по btree с поиском остальных полей по которым идет основное отсечение данных будут проблемы .... все-таки чем руководствоваться ? а то в документация я так и не нашел полного объяснения

Makasinov
5/26/2021, 3:57:23 PM
Ответов: 7
Хм, неужели нельзя под ключом колонке ставить ttl? Я конечно индекс потом

навесил, но всё же

agkucherov
3/19/2021, 1:20:31 PM
Ответов: 7
Коллеги, добрый день! FINAL DEDUPLICATE гарантирует мердж нескольких записей в одну

в system.parts в одинаковых партициях? Сори, пока не владею терминами клика, в истории чата не смог найти такого вопроса

Аноним
12/26/2020, 3:51:03 PM
Ответов: 33
Всем привет! Вопрос немного обстрактный, но опыт людям с ходу думаю понятно.

Стоит ли использовать кликхаус как базу для хранения постов для сайтов по типу объявлений с категориями? авито, юла - для примера или проще идти с PG и MySQL?

Аноним
10/1/2020, 11:53:26 AM
Ответов: 31
Всем привет! Какая клиентская библиотека для C# более предпочтительна к использованию?
Аноним
3/13/2021, 4:22:22 PM
Ответов: 7
Подскажите, в официальной доке указано, что из таблиц с движком Join, данные

можно забирать только двумя способами * подставляя в правую часть join условия в запросе * через joinGet функцию Но по факту удаётся делать любые select запросы из неё. Хочу понять в чем профит использования движка в таком случае. Только то что все хранится в Ram?

portmare
2/26/2021, 10:04:55 AM
Ответов: 7
Всем привет! Правильно понимаю, что сделать ALTER из Enum8 в LowCardinality на

1ТБ это плохая идея? Т.е. выход только создавать колонку рядом с новым типом, постепенно наполняя ее старыми данными, или совсем новую таблицу?

Аноним
2/22/2021, 12:29:29 PM
Ответов: 7
Ребят, такая проблема. Кластер на 2 шарда, 2 реплики 4 ноды всего

Есть Кафка табличка, в которой подключено около 20 топиков. Каждый топик через свою матвью пишется в соответвующую табличку. Сегодня в эти таблички перестали пиисаться данные. В кафке растет лаг. Ошибок не сыпет вообще. Но если рестартовать кликхаус — получаю по каждой таблице, в которые идет запись из кафка-таблички такую вот ошибку: Couldn't start replication: Replica appears to be already /clickhouse/tables/0/s_usergeo_state_id/replicas/srv2704 active If you're sure it's not, try again in a minute or remove znode /clickhouse/tables/0/s_usergeo_state_id/replicas/srv2704 manually Пробовал для одной из таблиц удалять is_active из зукипера - результатов не дало. Подскажите, куда дальше можно копать?

mobydi
2/22/2021, 9:04:30 AM
Ответов: 7
Довольно интересный кейс использования кликхауса у Убера. https://eng.uber.com/logging/ Только совершенно не понятно

как они использовали merge и как работает функция. В документации почти ноль. Где можно почитать подробнее?

l_dar
5/6/2021, 6:29:31 AM
Ответов: 30
Подскажите пожалуйста, чет не врублюсь. Может ли у mat. view быть первичный

индекс отличный от order by? Пытаюсь сделать, пишет Primary key must be a prefix of the sorting key, but its length: 5 is greater than the sorting key length: 1 version 20.9.2.20 official build

mezhekov
7/30/2021, 11:17:48 AM
Ответов: 4
Приветствую, подскажите, если в большой таблице изменить тип поля с UInt8 на

UInt16 или UInt32, таблица или партиции лочатся на запись/чтение, таблица реплицируемая и разбита по шардам?

it_haisenberg
7/29/2021, 10:27:05 AM
Ответов: 4
В кх нельзя при dictGet как-то наиборот исхитриться и взять значение id

по какой-то колонке name допустим?

Аноним
7/21/2021, 1:46:10 PM
Ответов: 4
Добрый день хотим расширить КХ на 2 шарда с одного, все таблицы

на ReplicatedReplacingMergeTree какие могут быть подводные камни ? .... возможно что-то надо подготовить к данному процессу ?

Аноним
9/21/2020, 10:49:10 AM
Ответов: 4
а с чего они должны тормозить то от того что нулы останутся

в них нулами?

rjs_45
9/23/2020, 11:20:29 AM
Ответов: 4
Подскажите, а можно ли как-то "допопулейтить" материалку? Создавали через CREATE MAT VIEW

POPULATE AS .... Запрос отпал с сообщением DB::Exception: Too many partitions for single INSERT block more than 100 ....... В итоге материалка есть, но в ней не все данные. И что можно сделать, чтобы не ловить эту ошибку? Ключ партицирования вроде адекватный

Аноним
7/19/2021, 12:45:29 PM
Ответов: 4
Подскажите, пожалуйста, а есть варианты решения ошибки: Memory limit total exceeded: would

use 14.08 GiB attempt to allocate chunk of 338518331 bytes, maximum: 14.08 GiB - кроме увеличения оперативной памяти, выделенной инстансу?

RapidCodeLab
9/25/2020, 9:12:10 AM
Ответов: 4
select date, avgIfcpm, cpm != null from mv_stat_by_date group by date

почему это не работает? и должно ли? местами cpm = null, из за этого avg возвращает тоже null как игнорировать null ?

Аноним
9/25/2020, 1:28:12 PM
Ответов: 4
Привет! Подскажите, какой оптимальный safe-to-retry способ есть для добавления новой партиции? я

сейчас добавляю новые как attach from <tmp_partition>, но это грозит дублями если ретраить В доке не вижу ничего насчет if not exists или чего-то подобного. Только создавать, а в случае фэйла проверять на каждом хосте, не создалось ли или есть способ проще и надежнее?

Аноним
10/6/2020, 8:23:30 AM
Ответов: 4
Всем привет! Задача такая - есть несколько локальных таблиц с категориями и

надо разложить по глобальным таблицам отдельная категория, хочу сделать через MATERIALIZED VIEW. Да вот UNION is not supported for MATERIALIZED VIEW. Куда читать?

Аноним
7/14/2021, 6:31:46 PM
Ответов: 4
Привет. Вопрос про ydb. : Хочу разобраться что значят первые два параметра

в функции `Digest::SipHash? Если это раунды компресии `c и d, то где ключ? Можете подсказать?

malkeshar
4/11/2021, 5:43:37 PM
Ответов: 4
Длинее: Есть таблица с time series graphite. Возникла потребность в получении

налету усредненных данных за 4, 15, 60 секунд. Нашел в документации, что задача решается при помощи мат вью и дополнительных таблиц. Проэкспериментировал, Мат вью + MergeTree решают задачу, в графане графики одинаковые при выборке данных из оригинальной таблицы с аггрегацией налету и при выборе данных из аггрегированной таблицы Вью выглядит так: CREATE MATERIALIZED VIEW graphite_mv_avg15 TO graphite_avg15 AS SELECT Path, avgValue AS Value, Date, Time, toStartOfIntervaltoDateTimeTimestamp, toIntervalSecond15 AS Timestamp FROM carbon_metrics.graphite GROUP BY Path, Date, Time, Timestamp Таблица с аггрегированным представлением: CREATE TABLE graphite_avg15 Path LowCardinalityString CODECZSTD, Value Float64 CODECZSTD, Time UInt32 CODECDelta, LZ4, Date Date CODECZSTD, Timestamp UInt32 CODECDelta, LZ4 ENGINE = MergeTree PARTITION BY toYYYYMMDate ORDER BY Path, Time SETTINGS index_granularity = '8192' Вопрос актуален в том плане, что если AggregatingMergeTree не нужен, то аггрегированные таблицы можно будет сделать на базе ReplicatedMergeTree. Что я упускаю?

Аноним
4/9/2021, 9:05:22 AM
Ответов: 4
Всем привет! Возможно странный вопрос, подскажите пожалуйста, можно ли в CH сделать

что-то типа usert?

abdulgalimov
10/8/2020, 11:08:12 AM
Ответов: 4
Есть таблица в которую записываются действия, с текущей датой. Хочу построить график

который покажет в какое время суток в среднем было больше всего действий. Подскажите какой запрос сделать, чтобы получить данные примерно в таком формате за указанный период времени например неделю, месяц...: Час1=Количество за 1 час Час2=Количество за 2 час ... Час24=Количество за 24 час ?

Аноним
6/5/2021, 3:05:34 PM
Ответов: 23
Как мне сразу в запросе отобрать элементы с bOrder = 1 ?

Select sessionTimestamp, groupArrayeventName as gEventName, arrayExistsx->x='bOrder',gEventName AS bOrder