CMU 15-445 Query Optimization

  • query rewrite
    • rule based optimizer
    • 一般に可能なクエリの書き換えを行う
    • selection は可能な限り先に行うと上で扱うデータ量が減る
  • cost based optimizer
    • 実データをもとにクエリプランを考える
    • データの分布を一様分布として扱うと楽だけど実際はそんなことない
    • 統計情報はヒストグラムを使ったりする
    • この頃のシステムだとサンプリングする
    • 一部のページからサマリーテーブルを作っておいて、コストを見積もる