с этого утра в 6 я испытываю странное поведение графита.
У нас есть две машины, которые собирают дату о полученных вызовах, я строю диаграммы, и я также строю сумму этих двух диаграмм.
Пока диаграммы одиночной машины точны, сумма не работает больше.
Это скриншот graphtite, а также grafana, который показывает, как 4+5=5
(мой учитель математики собирается умереть за это)
Эта неправильная сумма имеет место и для других метрик. И я не понимаю почему.
storage-scheams.conf
# Schema definitions for whisper files. Entries are scanned in order,
# and first match wins.
#
# [name]
# pattern = regex
# retentions = timePerPoint:timeToStore, timePerPoint:timeToStore, ...
[default_1min_for_1day]
pattern = .*
retentions = 60s:1d,1h:7d,1d:1y,7d:5y
storage-aggregations.conf
# Schema definitions for whisper files. Entries are scanned in order,
# and first match wins.
#
# [name]
# pattern = regex
# retentions = timePerPoint:timeToStore, timePerPoint:timeToStore, ...
[time_data]
pattern = ^stats.timers.*
xFilesFactor = 0.5
aggregationMethod = average
[storage_space]
pattern = .postgresql..*
xFilesFactor = 0.1
aggregationMethod = average
[default_1min_for_1day]
pattern = .*
xFilesFactor = 0
aggregationMethod = sum
aggregation-rules.conf
Это может быть причиной, но он работал до 6 утра. Но в любом случае я не вижу stats_count.all
метрики.
stats_counts.all.rest.req (60) = sum stats_counts.srv_*_*.rest.req
stats_counts.all.rest.res (60) = sum stats_counts.srv_*_*.rest.res
Похоже, что две серии не были выровнены по метке времени, поэтому
sum
не могли суммировать точки. Это видно на следующем графике, где выбирается время highliths point в две разные минуты (графики от grafana).Я не знаю, почему это произошло. I resetarted some services (this charts comes from
statsd
for python andbucky
). Возможно, это была ошибка одного из них.Примечание . Теперь это работает, однако, я хотел бы знать, если кто-то знает причину и как я могу ее решить.