ヒープソート

このプログラムは, 与えられたリスト

をソートしたリストを返す. ヒープの構成は, 子を持つ最後の要素である $A[\lfloor N \rfloor]$ から順に, その要素の子孫からなる 2 分木に対して downheap() を呼び出すことで行われる. 現在選ばれている要素に対し, 子を根とする木がヒープをなすことは数学的帰納法による.

$A[\lfloor N \rfloor + 1]$ 以降は葉なので, それらを根とする木に対しては自動的にヒープ条件がなりたっていることから帰納法の最初のステップが正当であることがわかる.

出来上がったヒープに対して, 根と, その時点における最後尾の要素を入れ換えて, downheap() を呼び出すことで, ヒープ条件を保ちながら要素の個数を一つずつ減らすことができる. さらに, 根はそのヒープの最大要素で, それが順に空いた場所に移されるので, 配列としては, 後ろから大きい順に整列することになる.

問題 13.5

のヒープソートによるソーティング.
http://www.math.kobe-u.ac.jp/~noro/hsdemo.pdf にヒープ構成およびソーティング (retirement and promotion) の経過が示されている.

定理 13.1 ヒープソートの計算量は $O(N \log_2 N)$ である.

問題 13.6 定理を証明せよ. (ヒント :

で考えてよい. 高さ, すなわち頂点から最下段までのレベルの差が

の downheap() 一回にどれだけ比較が必要か考える. あとは, ヒープ構成, 整列それぞれに, どの高さの downheap() が何回必要か数えればよい. )

注意: クイックソートは平均 $O(N \log_2 N)$ , 最悪

のアルゴリズムで, ヒープソートは最悪でも $O(N \log_2 N)$ だが通常はクイックソートが使われる場合が多い. これは, クイックソートに比べてヒープソートが複雑であるため, ほとんどの入力に対してはクイックソートの方が実際には高速なためである. しかし, 前節, 本節で与えたプログラム例がそれぞれ最良とは限らないので, 双方比較してどちらが高速か分からない. 興味がある人は, 同じ例で比較してみたり, あるいはより効率の高い実装を行ってみるとよい.