Teil 23: Load Balancing – Last verteilen, Ausfälle vermeiden

Sep. 22, 2025

—

von

Stell dir ein Restaurant vor, in dem es nur einen einzigen Kellner gibt. Sobald mehr Gäste eintreffen, kommt er ins Schwitzen. Bestellungen verzögern sich, das Essen wird kalt, und am Ende sind die Gäste unzufrieden. Würde man dagegen mehrere Kellner einsetzen und die Arbeit sinnvoll aufteilen, würde der Betrieb reibungslos laufen. Genau dieses Prinzip überträgt das Load Balancing in die Welt der Netzwerke und Server.

Load Balancing bedeutet, die Last gleichmäßig auf mehrere Systeme zu verteilen. Dadurch bleiben Dienste auch bei hoher Nachfrage erreichbar, und einzelne Ausfälle führen nicht sofort zum Stillstand.

Warum Load Balancing notwendig ist

Das Internet ist voller Beispiele, warum Lastverteilung so wichtig ist:

Ein Onlineshop startet eine Rabattaktion und wird von tausenden Kunden gleichzeitig besucht.
Ein Streaming-Dienst überträgt ein Fußballfinale und Millionen Menschen greifen zeitgleich auf die Plattform zu.
Eine Firmenanwendung wird von Mitarbeitern auf der ganzen Welt genutzt, oft während Stoßzeiten.

Ohne Load Balancing würden solche Dienste schnell in die Knie gehen. Selbst leistungsstarke Server stoßen irgendwann an ihre Grenzen.

Grundprinzip von Load Balancing

Ein Load Balancer sitzt zwischen den Nutzern und den Servern. Alle Anfragen gehen zuerst an den Load Balancer. Dieser entscheidet dann, an welchen Server die Anfrage weitergeleitet wird.

Man unterscheidet dabei zwei Hauptfunktionen:

Verteilung der Last: Mehrere Server teilen sich die Arbeit.
Fehlertoleranz: Fällt ein Server aus, übernimmt ein anderer.

Aus Sicht des Nutzers wirkt es so, als gäbe es nur einen einzigen Server – in Wahrheit steckt dahinter oft eine ganze Serverfarm.

Arten von Load Balancing

Es gibt verschiedene Methoden, Last zu verteilen.

1. Round Robin

Anfragen werden der Reihe nach an die Server verteilt.
Einfach und fair, aber berücksichtigt nicht die aktuelle Auslastung.

2. Least Connections

Der Server mit den wenigsten aktiven Verbindungen bekommt die nächste Anfrage.
Eignet sich gut für Dienste mit langen Verbindungen.

3. Least Response Time

Der Server mit der schnellsten Antwortzeit wird bevorzugt.
Ideal für heterogene Umgebungen, in denen Server unterschiedlich stark sind.

4. Weighted Load Balancing

Server bekommen ein Gewicht, je nach Leistung.
Stärkere Server erhalten mehr Anfragen, schwächere weniger.

5. IP Hash

Die IP-Adresse des Nutzers entscheidet, welcher Server zuständig ist.
Praktisch, wenn Sitzungsdaten lokal auf einem Server gespeichert sind.

Load Balancing auf verschiedenen Ebenen

Load Balancing kann auf unterschiedlichen Ebenen stattfinden:

DNS-basiert: Mehrere IPs sind unter einer Domain hinterlegt. Nutzer werden per DNS-Antwort auf unterschiedliche Server verteilt. Nachteil: Keine Echtzeit-Kontrolle, wenn ein Server ausfällt.
Transportebene (Layer 4): Entscheidungen basieren auf IP-Adresse und Port. Sehr schnell, aber wenig flexibel.
Anwendungsebene (Layer 7): Der Load Balancer schaut in die Inhalte der Anfragen, z. B. URLs oder Cookies. So kann er gezielt entscheiden.

Beispiel: Ein Layer-7-Balancer könnte alle Bildanfragen an einen speziellen Server schicken, während dynamische Inhalte auf leistungsstärkeren Systemen laufen.

Hardware- vs. Software-Load-Balancer

Es gibt zwei Hauptvarianten:

Hardware-Lösungen: Dedizierte Geräte, oft sehr leistungsfähig und zuverlässig. Sie kommen in großen Rechenzentren zum Einsatz. Beispiele: F5 Big-IP, Citrix ADC.
Software-Lösungen: Flexibel und günstiger, laufen auf Standardservern. Beispiele: HAProxy, Nginx, Apache Traffic Server.

Viele Unternehmen setzen heute auf Software-Lösungen, da sie leichter skalierbar sind und sich in Cloud-Umgebungen besser integrieren lassen.

Health Checks – den Puls der Server prüfen

Ein Load Balancer muss wissen, ob ein Server noch funktioniert. Dafür führt er regelmäßig sogenannte Health Checks durch:

Antwortet der Server auf einfache Pings?
Liefert er die richtige HTTP-Antwort?
Ist die Antwortzeit akzeptabel?

Wenn ein Server nicht mehr reagiert, nimmt der Load Balancer ihn automatisch aus dem Pool. So bleiben Nutzer von Ausfällen verschont.

Load Balancing und Hochverfügbarkeit

Ein einzelner Load Balancer wäre wiederum ein Single Point of Failure. Deshalb setzt man meist zwei oder mehr Load Balancer ein, die sich gegenseitig absichern.

Active-Active: Beide arbeiten gleichzeitig und teilen sich die Last.
Active-Passive: Einer arbeitet, der andere steht als Reserve bereit.

Zusätzlich wird oft ein sogenanntes Failover-Protokoll genutzt (z. B. VRRP), das automatisch den Ausfall erkennt und den Betrieb übernimmt.

Load Balancing in der Cloud

Mit Cloud-Diensten ist Load Balancing noch wichtiger geworden. Anbieter wie Amazon (AWS), Microsoft (Azure) oder Google bieten integrierte Load-Balancer an, die automatisch skalieren.

Beispiel AWS Elastic Load Balancer:

Verteilt Anfragen auf mehrere EC2-Instanzen.
Integriert Health Checks.
Kann automatisch neue Server einbinden, wenn die Last steigt.

Für Unternehmen bedeutet das: Sie müssen sich nicht mehr um die Hardware kümmern, sondern nur noch um die Konfiguration.

Typische Herausforderungen

Auch Load Balancing bringt Herausforderungen mit sich:

Sitzungsmanagement: Manche Anwendungen speichern Sitzungsdaten lokal. Ein Nutzer muss dann immer wieder denselben Server erreichen („Sticky Sessions“).
Kosten: Professionelle Hardware-Load-Balancer sind teuer.
Komplexität: Einrichtung und Wartung erfordern Fachwissen.
Transparenz: Fehlkonfigurationen können zu ungleichmäßiger Verteilung führen.

Deshalb gehört Load Balancing in die Hände erfahrener Administratoren.

Beispiel aus der Praxis

Ein Online-Ticketshop verkauft Eintrittskarten für ein großes Konzert. Zum Verkaufsstart versuchen hunderttausende Fans gleichzeitig, Tickets zu kaufen.

Ohne Load Balancer wäre der Hauptserver sofort überlastet.
Mit Load Balancing werden die Anfragen auf 20 Server verteilt.
Health Checks stellen sicher, dass defekte Server sofort ausgetauscht werden.
Selbst bei enormer Last bleibt der Shop erreichbar – auch wenn manche Nutzer etwas länger warten müssen.

Genau in solchen Szenarien zeigt sich die Stärke des Load Balancing.