🍩 🤵 🍟 Schwache Haufen-Sortierung 💃🏿 👨🏻‍🎨 😝

Von den gesamten Zoohaufen ist diese Struktur vielleicht die ungewöhnlichste. Darüber hinaus passt die elegante Einfachheit des Algorithmus durchaus zu seiner erstaunlichen Exzentrizität.

Beim Sortieren mit einem schwachen Heap gibt es immer weniger Vergleiche und Austausche als mit einem normalen Heap. Also ja, ein schwacher Stapel ist stärker als ein gewöhnlicher Stapel.

Dieser Artikel wurde mit Unterstützung von EDISON verfasst.

Wir beschäftigen uns mit der Erstellung eingebetteter Software sowie der Entwicklung von Webanwendungen und Websites .

Wir lieben die Theorie der Algorithmen! ;-);

Schwacher Haufen

Ein regulärer Heap ist ein Sortierbaum, in dem ein Elternteil größer (oder gleich) ist als einer seiner Nachkommen. In einem schwachen Haufen wird diese Anforderung geschwächt - jeder Elternteil ist größer (oder gleich) als jeder Nachkomme nur von seinem rechten Teilbaum. Im linken Teilbaum können die Nachkommen sowohl kleiner als auch größer als die Eltern sein, da haben Sie so viel Glück.

Dieser Ansatz kann die Kosten für die Aufrechterhaltung des Datensatzes in einem Heap-Zustand erheblich reduzieren. Schließlich muss sichergestellt werden, dass das Prinzip „ein Nachkomme ist nicht mehr als ein Elternteil“ nicht für die gesamte Struktur, sondern nur für die Hälfte gilt. Gleichzeitig sortiert ein schwacher Haufen, der kein 100% iger Sortierbaum ist, nicht schlechter als ein gewöhnlicher Haufen und in gewisser Weise sogar noch besser. Hat die halbe Miete geschafft - mutig gehen!

Da die Wurzel des Heaps, auch eine schwache, genau das größte Element benötigt, tut dies die Wurzel des linken Teilbaums nicht.

Minimierung der Anzahl der Vergleiche

Ronald D. Dutton, Spezialist für Algorithmen und Graphentheorie, stellte uns 1993 einen schwachen Haufen vor. Ein konzeptionell schwacher Stapel ist schwieriger zu verstehen (aber diese Schwierigkeit liegt eher nicht in der Komplexität, sondern in der Extravaganz, Sie müssen Ihre Bewusstseinsmuster durch das Knie brechen) als ein gewöhnlicher Stapel, so dass er nicht viel praktische Verteilung erhalten hat. Als Dutton diese Struktur erfand, wollte er nicht nur abstrakte Abstraktionen üben, sondern verfolgte auch ein völlig pragmatisches Ziel.

Es gibt eine theoretische Untergrenze für die Schätzung der Mindestanzahl von Vergleichen (bei den Sortierungen, bei denen diese Vergleiche weit verbreitet sind):

log n ! = n log n - n / ln 2 + O (log n), wobei 1 / ln 2 = 1,4426

Bei der Sortierung nach einem schwachen Haufen wird die Anzahl der Vergleiche minimiert und liegt nahe genug an der Untergrenze.

Dies kann von praktischer Bedeutung sein, wenn Sie Objekte anordnen müssen, deren Vergleich teuer ist, z. B. wenn lange Zeichenfolgen sortiert werden sollen.

Nachkommen jonglieren

"Links" und "Rechts" in einem schwachen Haufen ist ein situatives Phänomen. Ein Teilbaum kann entweder ein linker oder ein rechter Nachkomme für seinen übergeordneten Knoten sein - außerdem kann diese "links / rechts" -Relation für den Teilbaum und den übergeordneten Knoten während des Prozesses wiederholt von einem Wert zum anderen wechseln.

Für den Elternteil anzugeben, wer seinen rechten Sohn hat und wer seine linke Tochter ist, ist nicht einfach, aber sehr einfach. Dazu benötigen Sie eine zusätzliche Bitmap (bestehend aus nur 0/1 Werten) für die Knoten mit Nachkommen.

Erinnern Sie sich daran, wie das i- te übergeordnete Element des Index die Indizes seines linken und rechten Nachkommen in einem herkömmlichen Stapel definiert (Indizes des Arrays gemessen von Null):

Linker Nachkomme 2 × i + 1
Rechter Nachkomme 2 × i + 2

In einem schwachen Haufen haben wir eine Kirsche auf dem Kuchen - eine Wurzel, die nur den richtigen Teilbaum hat, also werden wir diese Formeln für die Nachkommenindizes anpassen, indem wir eine umgekehrte Verschiebung zu 1 Position hinzufügen:

Linker Nachkomme: 2 × i
Rechter Nachkomme: 2 × i + 1

Und schließlich , benötigte zusätzliche Bitmap (nenne es bIT ), wobei für das i- te Element angegeben wurde, ob der Austausch zwischen seinen linken und rechten Teilbäumen stattfindet. Wenn der Wert für ein Element 0 ist, gab es keinen Austausch. Wenn der Wert 1 ist, gehen die linken und rechten Kinder in die entgegengesetzte Reihenfolge. In diesem Fall lauten die Formeln wie folgt:

Linker Nachkomme: 2 × i + BIT [ i ]
Rechter Nachkomme: 2 × i + 1 - BIT [ i ]

So sieht es aus. Elemente, deren Nachkommen sich "umgekehrt" befinden, werden blau hervorgehoben. Die Werte im BIT- Array für sie sind 1.

Sie können dies überprüfen, indem Sie die übergeordneten Werte i und die entsprechende 0/1 aus dem BIT- Array in den Nachkommenformeln einsetzen. Die Indizes der Nachkommen werden nach Bedarf angezeigt.

Wie Sie sehen können, muss die Gruppe von Elementen nirgendwo hin verschoben werden, damit ein Elternteil die linken und rechten Teilbäume im Array selbst vertauschen kann. Es wird nur der 0/1-Wert für das übergeordnete Element im BIT- Array umgeschaltet .

Weiter - eine magische Sitzung mit anschließender Belichtung.

Baue einen schwachen Haufen

Das Vertauschen von Nachkommen nach links und rechts ist das Hauptwerkzeug zum Konvertieren eines Datensatzes aus einem Array in einen schwachen Haufen.

Bei der Bildung des primären schwachen Heaps müssen wir die Elemente des Arrays in umgekehrter Reihenfolge (beginnend mit dem letzten) sortieren und für jeden von ihnen den Zweig des ersten (rechten) übergeordneten Elements finden, für den es der richtige Teilbaum ist.

Wenn das Element der richtige Nachkomme einer Person ist , müssen Sie nicht weit gehen. Das unmittelbare Elternteil ist das, was Sie brauchen:

Wenn das Element der linke Nachkomme einer Person ist , müssen Sie einige Stufen aufsteigen, bevor Sie den gewünschten Großelternteil treffen, für den sich das Element im rechten Teilbaum befindet:

Dann müssen Sie den Nachkommen und den Vorfahren vergleichen, die irgendwo oben gefunden wurden. Und wenn der Nachkomme größer als der Vorfahr ist, muss Folgendes getan werden:

Wenn der Nachkomme seine Nachkommen hat, tauschen Sie seine linken und rechten Teilbäume aus (d. H. Schalten Sie 0/1 im BIT- Array für dieses Element).
Tauschen Sie die Werte des Nachkommenknotens und des Vorläuferknotens aus.

Schauen Sie sich ein bestimmtes Beispiel an. Nehmen wir an, die folgende Situation ist aufgetreten:

Für das Element des Arrays A [6] = 87 wurde der notwendige Vorläufer A [1] = 76 gefunden.
Der Vorläufer A [1] ist kleiner als das Element A [6] (76 <87).
Element A [6] hat linke und rechte Teilbäume (in Grüntönen markiert).
Sie müssen diese Teilbäume austauschen
( dh für Element A [6] im BIT- Array den Wert von 0 auf 1 ändern).
Es ist auch notwendig, die Werte der Elemente A [6] und A [1] auszutauschen .

Nachdem die erforderlichen Aktionen abgeschlossen sind:

Für Element A [6] wurden die linken und rechten Teilbäume ausgetauscht
( dh im BIT- Array für Element A [6] wurde der Wert von 0 in 1 geändert).
Es gab auch einen Werteaustausch zwischen A [6] und A [1].

Wenn Sie das Array vom Ende bis zum Anfang durchlaufen und unterwegs dieses Verfahren für alle Elemente ausführen, erhalten Sie einen schwachen Haufen.

Warum dieser seltsame Mechanismus funktioniert, ist eine Erklärung, die näher am Ende des Artikels liegt.

Analyse eines schwachen Stapels

Ein Heap ist ein Heap, wenn sich das maximale Element im Stammverzeichnis befindet. Mit dieser Tatsache funktionieren alle Heap-Sortierungen auf die gleiche Weise. Die Wurzel (wo sich das Maximum befindet) tauscht Werte mit dem letzten Element des unsortierten Teils des Arrays aus. Infolgedessen nimmt der unsortierte Teil des Arrays ab und der sortierte Teil des Arrays nimmt zu. Nach diesem Austausch ist der Heap kein Heap mehr, da sich das aktuelle maximale Element nicht mehr in seiner Wurzel befindet. Der Heap muss wiederhergestellt werden, dh der resultierende Baum wird wieder zu einem Heap. Suchen Sie ein anderes maximales Element und verschieben Sie es in den Stamm.

Wir wissen, wie man einen normalen binären Heap wiederherstellt - mit Hilfe eines Sichters . Aber wie kann man einen schwachen Haufen wiederherstellen? Gehen Sie dazu wie folgt vor.

Von der Wurzel steigen wir die linken Nachkommen ab (bis zum niedrigsten):

Dann gehen wir die linken Nachkommen wieder hoch und auf dem Weg wird jeder linke Nachkomme mit einem Element in der Heap-Wurzel verglichen. Und wenn der nächste linke Nachkomme größer als die Wurzel ist, machen wir dasselbe wie in der vorherigen Stufe: Beim linken Nachkommen tauschen wir die Teilbäume (falls er einen hat) und ändern die Werte des linken Nachkommen und der Wurzel.

Infolgedessen stellen wir den schwachen Heap wieder her - das maximale Element im verbleibenden Baum wird an seiner Wurzel angezeigt.

Und wieder haben wir dieses mystische Karussell mit Teilbäumen, die sich gegenseitig ersetzen. Was ist das Erfolgsgeheimnis? Warum erhalten wir ein sortiertes Array, wenn beim Austausch von Knoten mit Werten die linken und rechten Nachkommen des unteren Knotens vertauscht werden? Sie werden es nie erraten, obwohl die Antwort in ihrem Genie einfach ist.

Schwache Heap-Sortierung :: Schwache Heap-Sortierung

Also der endgültige Algorithmus:

I. :
- I.1. -.
- I.2. «» .
- I.3. .
- I.4. , :
  - I.4.. ( ⇔ ) , .
  - I.4.. «» .
II. , :
- II.1. .
- II.2. . .
- II.3. , . :
  - II.3.. .
  - II.3.. , .
  - II.3.. , , :
    - II.3.c. 1. Wir tauschen (links ⇔ rechts) Teilbäume mit Nachkommen gegen den Knoten aus, in dem sich der aktuelle linke Nachkomme befindet.
    - II.3.c.2. Wir ändern die Heap-Wurzel und den Knoten mit dem aktuellen linken Kind.
- II.4. An der Wurzel des schwachen Heaps befindet sich wieder das maximale Element für den verbleibenden unsortierten Teil des Arrays. Wir kehren zu Absatz II.1 zurück und wiederholen den Vorgang, bis alle Elemente sortiert sind.

Animation (Array-Indizes in meinen Animationen beginnen mit einem):

C ++ - Code

Am Ende des Abschnitts „Links“ können sich Interessenten mit der Implementierung dieser Sortierung in C ++ vertraut machen. Hier gebe ich nur den Teil an, der den Algorithmus selbst veranschaulicht.

#define GETFLAG(r, x) ((r[(x) >> 3] >> ((x) & 7)) & 1)
#define TOGGLEFLAG(r, x) (r[(x) >> 3] ^= 1 << ((x) & 7))

void WeakHeap::WeakHeapMerge(unsigned char *r, int i, int j) {
  if (wheap[i] < wheap[j]) {//""  ?
    //  ,   
    //( "",   "")
    TOGGLEFLAG(r, j);
    //  ""  
    swap(wheap[i], wheap[j]);
  }
}

void WeakHeap::WeakHeapSort() {
  int n = Size();
  if(n > 1) {
		
    int i, j, x, y, Gparent;
    int s = (n + 7) / 8;
    unsigned char * r = new unsigned char [s];
		
    //  ,    
    // "",   ""
    for(i = 0; i < n / 8; ++i) r[i] = 0;
		
    //   
    for(i = n - 1; i > 0; --i) {
      j = i;
      //    , 
      //   ""  
      while ((j & 1) == GETFLAG(r, j >> 1)) j >>= 1;
      //       ""  
      Gparent = j >> 1;
      //  ,   
      //   ""
      WeakHeapMerge(r, Gparent, i);
    }
		
    //      -->
    //  -->    
    for(i = n - 1; i >= 2; --i) {
      //      
      //       
      swap(wheap[0], wheap[i]);
      x = 1;
      //    "" 
      while((y = 2 * x + GETFLAG(r, x)) < i) x = y;
      //  ""     
      //        
      while(x > 0) {
        WeakHeapMerge(r, 0, x);
        x >>= 1;
      }
    }
    //  -   
    //    
    swap(wheap[0], wheap[1]);
    delete[] r;
  }
}

Mir gefällt besonders, wie der Binärbaum einfach und natürlich mit bitweisen Operationen durchlaufen wird.

Zusätzliche Speicherkomplexität

Es scheint wie O ( n ) - ein zusätzliches Array ist erforderlich, bei dem für Knoten mit Nachkommen (es gibt ungefähr die Hälfte davon im Array) die Reihenfolge der linken / rechten Teilbäume festgelegt ist.

Es gibt jedoch eine Meinung, dass die Sortierkomplexität hier tatsächlich O (1) ist! Für ein Element benötigen wir nur ein zusätzliches Bit (Null / Eins), um die Reihenfolge der Nachkommen anzugeben. Wenn wir zum Beispiel Strings sortieren, ist es durchaus möglich, dieses zusätzliche Bit an das Element selbst anzuhängen.

Eine andere Möglichkeit, O ( n ) in O (1) umzuwandeln, besteht darin, Flags in einer ganzen Zahl zu speichern. Binäre Erweiterung von Zahlen - eine Reihe von Nullen und Einsen, die für die Reihenfolge der Teilbäume aller Elemente des Arrays verantwortlich sind. Das i- te Element des Arrays entspricht dem i- ten Bit der Zahl.

Zeitliche Komplexität

Mit der Zeit ist O ( n log n ) dasselbe wie ein regulärer Heap. Beim Sortieren von Zeilen (insbesondere langen) kann ein schwacher Heap schneller sein als ein normaler Heap. Aber das ist, wenn wir die langen Schlangen sortieren. Wenn wir die Zahlen sortieren, ist Gerüchten zufolge ein gewöhnlicher Haufen schneller zu verwalten.

Volles Sieben

In der Phase der Bildung des anfänglichen schwachen Haufens schlägt die ganz offensichtliche Idee in Analogie zum üblichen Haufen vor, große Elemente so hoch wie möglich anzuheben. Das heißt, wenn wir die Werte des unteren Knotens und seines Vorfahren austauschen, wäre es logisch, die Schritte für den Vorfahren sofort zu wiederholen - um seinen nächsten richtigen Vorfahren für ihn zu finden und zu vergleichen (und wenn es auch notwendig ist, Werte + Austausch von Teilbäumen auszutauschen). Und wenn möglich, heben Sie ein großes Element bis zur Wurzel an. So sieht es in der ersten Stufe aus (die Aktionen in der zweiten Stufe des Algorithmus bleiben unverändert):

Der Zeitkomplexitätswert bleibt gleich.

Binomialstapel

Alles, was bis zu diesem Punkt war, ist eine Täuschung, eine Illusion. Natürlich führen wir dort formal einige Manipulationen mit dem Binärbaum durch, ändern die Knoten mit Werten, ordnen die Teilbäume neu an und so weiter. Der Algorithmus hat jedoch einen doppelten Boden, den wir nun untersuchen werden.

Um diese Art zu verstehen, müssen Sie verstehen, was ein schwacher Haufen wirklich ist.

Wenn wir ein Array nehmen, in dem die Anzahl der Elemente eine Zweierpotenz ist, dann sind der schwache Heap und der Binomialheap, die auf seiner Basis aufgebaut sind, isomorph.

Betrachten Sie nicht die Tatsache, dass ein schwacher Heap binär ist und Binomial nicht. In einem schwachen Haufen unterscheiden sich der linke und der rechte Teilbaum wesentlich. Der rechte Teilbaum ist ein Nachkomme im klassischen Sinne, der linke Teilbaum jedoch eher ein „Bruder“. Obwohl nicht. Der linke Teilbaum ist nicht einmal ein „Bruder“, sondern ein Vektor von „Brüdern“ mit weniger Knoten.

Der schwache Haufen und der Binomialhaufen sind jedoch nicht zu 100% gleich, obwohl sie die engsten Verwandten sind. Der Unterschied ist offensichtlich, wenn Sie ein Array nehmen, dessen Anzahl von Elementen nicht 2 ^{n entspricht} . Die binomiale Zerlegung eines solchen Arrays ergibt eine zusammenhängende Liste mehrerer idealer Heaps (die Anzahl der Knoten in jedem von ihnen ist eine bestimmte Zweierpotenz):

Ein schwacher Haufen ist in diesem Fall ein unvollständiger Binärbaum:

Der Binomialstapel und der schwache Stapel sind Zwillingsbrüder. Die DNA ist dieselbe, obwohl man sie anscheinend nicht erkennen kann.

Geheimer Algorithmus

Angesichts der Tatsache, dass ein schwacher Haufen ein kryptobinomischer Haufen ist, findet das Mischen von Teilbäumen plötzlich eine einfache Erklärung.

Fegen Sie mit einem schwachen Haufen das pseudobinäre Lametta weg und betrachten Sie die tatsächlichen Beziehungen zwischen den Knoten im Binomialhaufenstil. Alles wird klar.

Tatsächlich:

Es gibt keine "Schwäche", es ist ein vollwertiger Sortierbaum (nicht binär), in dem das Prinzip "Jeder Elternteil ist größer als jeder seiner Nachkommen" erreicht und beibehalten wird.
In allen Phasen vergleichen wir die Nachkommen nicht mit ihren Vorfahren, sondern mit ihren unmittelbaren Eltern.
Was wie ein Werteaustausch zwischen einem Nachkommen und einem Vorfahren aussieht + ein Austausch von Teilbäumen in einem Nachkommen - es stellt sich heraus, dass es sich um den Austausch des Verhältnisses selbst (Nachkomme / Elternteil) handelt. Wenn der übergeordnete Knoten wertmäßig kleiner als der Nachkomme ist, wird der übergeordnete Knoten selbst zum Nachkommen und der Nachkomme zum übergeordneten Knoten.

Hier ist eine ehrliche Visualisierung:

In der nächsten Serie

Der nächste Stapel, über den ich sprechen möchte, ist mein Favorit - der kartesische Baum. Dies ist nicht nur ein Haufen, sondern auch ein binärer Suchbaum . Aber dann muss zuerst im nächsten Artikel etwas Interessantes über BST-Bäume geklärt werden. Und erst dann durch den Artikel und über kartesische Gespräche.

Verweise

Schwacher Heap , Binomial-Heap / Binomial-

Heap C ++ Schwache Heap-Implementierung

Ronald D. Dutton: Persönliche Seite , UCF-Website-Profil

Schwache Heaps und Freunde: Neueste Entwicklungen

Die Datenstruktur für schwache Heaps : Varianten und Anwendungen

zur Leistung von WEAK-HEAPSORT

Adaptive Heapsort: Quellcode

Sergey Kopeliovich - Hörsaal - Schwacher Haufen (von 48:32 bis 1:16:06)

Serienartikel:

Excel-Anwendung AlgoLab.xlsm
Sorte austauschen
Einfügungssortierungen
Nach Auswahl sortieren
- Heap Sorts: N-Pyramiden
- Heap Sorts: Leonardo Numbers
- Heap-Sortierung: schwacher Heap
- Bündelsorten: Kartesischer Baum
- Andere Heap-Sortierungen: Spiegelhaufen, Mini-Heap, Sieben von unten nach oben
- Heap Sorts: Jung Heap
Sortierungen zusammenführen
Nach Verteilung sortieren
Hybridsortierung

Die heutige Sortierung wird der AlgoLab-Anwendung von einem schwachen Haufen hinzugefügt, der sie verwendet. Aktualisieren Sie die Excel-Datei mit Makros.

In den Kommentaren zur Zelle mit dem Namen der Sortierung können Sie einige Einstellungen angeben. Wenn Sie siftup = 1 setzen, wird bei der Sortierung in der ersten Stufe die vollständige Überprüfung verwendet (standardmäßig siftup = 0).

Wenn Sie binomial = 1 vorschreiben, ist der Baum ein "binomialer Heap" (standardmäßig binomial = 0, dh nur ein schwacher Heap).

Schwache Haufen-Sortierung