ANALYZE и статистика планировщика

Зачем это знать:

  • Планировщик принимает решения на статистике.

  • Неверная статистика ⇒ неверный план ⇒ “почему он делает Seq Scan на огромной таблице”.

Связанные темы:

Планировщик запросов и EXPLAIN

Методы доступа к данным


Что такое статистика

  • Оценки распределения значений по колонкам, кардинальности, селективности условий.

  • Используется для оценки rows/cost в EXPLAIN.


Когда статистика портится

  • Массовые вставки/обновления/удаления.

  • Сильный skew (неравномерность данных).

  • Корреляции между колонками.


Практические действия

  • После больших изменений данных — прогнать ANALYZE (или дождаться autovacuum analyze).

  • Для “сложных” колонок/таблиц может потребоваться тонкая настройка статистики (DBA-уровень), но аналитику важно:

  • уметь распознать проблему по EXPLAIN ANALYZE,
  • понимать, что “данные изменились” ⇒ “план мог стать плохим”.
Последнее обновление