私は長らくヒープソートというものが理解できなかったのだが、ついに今日、なんとか動くところまで実装できたので紹介しようと思う。
ヒープソートを理解しようと思ったら、実装の前にまずヒープのノードが入れ替わるイメージを理解しておく必要がある。
そこで、こちらの動画を視聴した。
ヒープソート
めっちゃわかりやすい!
ん、理屈は分かったけど、これをいったいどうやって実装すれば。。
ということでもう一本動画を視聴。
[ソート4]ヒープソート(Heap Sort):解説
最初のほう早くて分かりにくいけど、1分10秒あたりから配列を使った実装の詳細の説明に入るのでしっかり視ておく。
さて、ヒープを配列に導入すると、親と子を指すインデックスには次の式が成り立つ。
左の子のインデックス = 親のインデックス×2+1
右の子のインデックス = 左の子のインデックス + 1
これがメインコードに登場するとごちゃっとするので、関数化してしまおう。
Function GetRightChildIndex(parent_index)AsLong GetRightChildIndex = GetLeftChildIndex(parent_index)+1EndFunctionFunction GetLeftChildIndex(parent_index)AsLong GetLeftChildIndex = parent_index *2+1EndFunction
それから、親を左の子と入れ替える処理、親を右の子と入れ替える処理というのも解説に登場したので、これもプロシージャ化する。
Sub SwapParentRightChild(arr, parent_index)Dim tmp: tmp = arr(parent_index) arr(parent_index)= arr(GetRightChildIndex(parent_index)) arr(GetRightChildIndex(parent_index))= tmp EndSubSub SwapParentLeftChild(arr, parent_index)Dim tmp: tmp = arr(parent_index) arr(parent_index)= arr(GetLeftChildIndex(parent_index)) arr(GetLeftChildIndex(parent_index))= tmp EndSub
子より親の方が小さければ、入れ替えるという処理をするが、このとき、両方の子が親より大きい場合、より大きい方を選択するという処理があった。
これ、言い換えると、親・左の子・右の子のうち、一番大きいものと親を入れ替えるということになる。親が一番なら入れ替えは発生しないが、とにかく誰が一番大きいかを判定する関数があると良い。
この関数は、列挙型定数でParent、LeftChild、RightChildのいずれかを返すようにしよう。
ということでまずは列挙型を作成。
Enum Role Parent LeftChild RightChild EndEnum
次にこれを返す関数を作成。
Function WhoIsBiggest(arr, parent_index, tail)As Role Const INIFINITESIMAL AsLong=-2147483648# Dim p: p = arr(parent_index)Dim rc If GetRightChildIndex(parent_index)<= tail Then rc = arr(GetRightChildIndex(parent_index))Else rc = INIFINITESIMAL EndIfDim lc If GetRightChildIndex(parent_index)<= tail Then lc = arr(GetLeftChildIndex(parent_index))Else lc = INIFINITESIMAL EndIfIf p > lc And p > rc Then WhoIsBiggest = Parent ElseIf lc > p And lc > rc Then WhoIsBiggest = LeftChild ElseIf rc > p And rc > lc Then WhoIsBiggest = RightChild EndIfEndFunction
INIFINITESIMALという定数の名前は英語の「無限小」をとったもの。
実際にはただのLong型の最小値である。
子のインデックスがtailを超えてしまう場合、参照エラーになったり確定値を参照してしまう危険がある。
そこでtailを超えた子より、必ず親が大きくなるように、子の値を入れる変数に無限小を代入している。
ここは力技でしのいだ感じ。
さて、あとは確定した最大値を取り除く処理だ。
これは配列の先頭と末尾を入れ替えてしまえば良いので、そのような関数を作る。
ただし毎回末尾と入れ替えてたら確定値まで動かしてしまうことになる。
したがって末尾はUboundではなく、別途変数で管理しよう。
ひとまずはtailという仮引数で末尾を受け取ることにする。
先頭は0で固定なので受け取る必要はない。
Sub SwapHeadTail(arr, tail)Dim tmp: tmp = arr(0) arr(0)= arr(tail) arr(tail)= tmp EndSub
さて、役者は揃った。
あとはメインコードをガリガリ書くだけ。
Sub HeapSortMain()Dim heap(): heap =Array(8,2,7,6,9,1,4,3,5)Dim tail AsLong: tail =UBound(heap)DoDoDim cnt: cnt =0Dim i For i =LBound(heap)To tail SelectCase WhoIsBiggest(heap, i, tail)Case Role.Parent cnt = cnt +1Case Role.LeftChild SwapParentLeftChild heap, i Case Role.RightChild SwapParentRightChild heap, i EndSelectNextLoopWhile cnt <= tail SwapHeadTail heap, tail tail = tail -1LoopWhile tail >0For i =LBound(heap)ToUBound(heap) Debug.Print heap(i)NextEndSub
まずは最も内側のループからみていこう。
For i =LBound(heap)To tail SelectCase WhoIsBiggest(heap, i, tail)Case Role.Parent cnt = cnt +1Case Role.LeftChild SwapParentLeftChild heap, i Case Role.RightChild SwapParentRightChild heap, i EndSelectNext
このループは配列を先頭から末尾(tail)まで流している。
ループの中では誰が一番大きいかを判定するWhoIsBiggestによりSwap処理を行っている。Swapが発生しなければcntが増える仕組みだ。
その外側のDoループでは、cntとtailが一致するまで繰り返しを行っている。cnt=tailということは、一度もSwapされなかったということ。つまり正しいヒープ構造になっているので、これ以上内側のForループを回す必要がなく、一巡目の最大値が確定したということ。
それからSwapHeadTailで最大値と末尾(tail)を入れ替え、tailを一つ減らしている。
これを繰り返すことで最大値がどんどん配列の底にたまっていく。
tailが0になったらループを抜けると、配列は見事昇順に並んでいるというわけだ。
私にとってややこしいのは、ヒープというツリー型の構造を無理やり配列で扱うこと。
そしてそれぞれの計算がメインコードに出てくることで頭が追い付かなくなる。
今回は関数に分割したことで、個人的にはわかりやすくできた。
これを見たみなさんがどう感じるかはまた別の話であるが。。