- Latenz ist die Zeit zwischen einer Anfrage und der Antwort eines Systems, gemessen in Millisekunden.
- Für Gaming gilt: unter 20 ms ist ideal, über 100 ms merklich störend.
- Ursachen für hohe Latenz sind geografische Distanz, Netzwerk-Hops und Serverauslastung.
- Latenz und Bandbreite sind zwei verschiedene Dinge: Viel Bandbreite hilft bei langer Latenz kaum.
- CDN, Caching und Edge Computing reduzieren Latenz effektiv.
Was bedeutet Latenz?
Latenz beschreibt die Verzögerungszeit zwischen einer Aktion und der darauf folgenden Reaktion in einem System. Du schickst eine Anfrage, das System antwortet. Die Zeit dazwischen ist die Latenz. Gemessen wird sie in Millisekunden (ms).
Das klingt abstrakt, ist aber im Alltag ständig spürbar. Wenn du eine Website öffnest und der erste Inhalt erst nach zwei Sekunden erscheint, erlebst du hohe Latenz. Wenn du online zockst und dein Gegner sieht deine Bewegung scheinbar vor dir, liegt das an unterschiedlicher Latenz zwischen den Spielern.
Im technischen Kontext unterscheidet man verschiedene Arten von Latenz, je nachdem wo die Verzögerung entsteht.
Latenz in verschiedenen Kontexten
Netzwerklatenz (Ping)
Die bekannteste Form ist der Ping-Wert im Netzwerk. Er misst, wie lange ein Datenpaket von deinem Rechner zu einem Server und zurück braucht. Typische Richtwerte:
- unter 20 ms: ausgezeichnet, praktisch nicht wahrnehmbar beim Gaming
- 20-50 ms: gut, für die meisten Anwendungen problemlos
- 50-100 ms: akzeptabel, bei reaktionsschnellen Spielen spürbar
- über 100 ms: hoch, Videocalls und Online-Games leiden merklich
Den Ping-Wert zu einer beliebigen Domain kannst du direkt im Terminal messen: ping google.com gibt dir sofort Auskunft.
API-Latenz bei Webservices
Baust du ein SaaS-Produkt oder eine Web-App, ist API-Latenz entscheidend. Ruft deine Anwendung eine externe API auf, zum Beispiel eine Zahlungs-API oder einen KI-Dienst, addiert sich diese Wartezeit direkt zur Ladezeit deiner App.
Richtwerte für API-Antwortzeiten:
- unter 100 ms: sehr gut
- 100-300 ms: akzeptabel für die meisten Nutzer
- über 500 ms: spürbar, Abbruchrate steigt deutlich
- über 1.000 ms (1 Sekunde): kritisch für Conversion und UX
Cloud-Infrastruktur und Edge Computing
In Cloud-Umgebungen ist Latenz eine der wichtigsten Architekturentscheidungen. Ein Server in Frankfurt hat zur deutschen Zielgruppe eine Latenz von 5-15 ms. Ein Server in den USA hat zur gleichen Zielgruppe oft 80-120 ms. Diese geografische Distanz allein erklärt einen Großteil der Latenzdifferenz.

Latenz vs. Bandbreite vs. Throughput
Diese drei Begriffe werden oft verwechselt, beschreiben aber verschiedene Dinge:
- Latenz: Die Verzögerungszeit, bis eine Antwort ankommt. Analogie: Wie lange du auf den ersten Zug warten musst.
- Bandbreite: Die maximale Datenmenge pro Zeiteinheit (z.B. 100 Mbit/s). Analogie: Wie viele Sitze der Zug hat.
- Throughput: Der tatsächlich erzielte Datendurchsatz unter realen Bedingungen. Analogie: Wie viele Passagiere wirklich eingestiegen sind.
Du kannst mit 1 Gbit/s Internetleitung und gleichzeitig mit 150 ms Latenz unterwegs sein. Viel Bandbreite löst hohe Latenz nicht. Beide Probleme müssen getrennt betrachtet und optimiert werden.
Wie misst man Latenz?
Es gibt verschiedene Werkzeuge je nach Anwendungsfall:
- ping: Basistest der Netzwerklatenz zum Zielserver
- traceroute / tracert: Zeigt alle Hops zwischen dir und dem Ziel, mit der Latenz pro Hop
- Browser-DevTools (Network-Tab): Zeigt Time to First Byte (TTFB) und gesamte Ladezeiten pro Request
- Tools wie Pingdom, GTmetrix, WebPageTest: Messen Websitelatenz aus verschiedenen geografischen Standorten
Für API-Latenz in der Entwicklung empfiehlt sich curl mit dem -w-Flag: curl -o /dev/null -s -w "Zeit: %{time_total}s
" https://deine-api.de/endpoint
Latenz reduzieren: Konkrete Maßnahmen für Startups
Wenn du eine Web-App oder ein SaaS-Produkt betreibst, sind das die wirksamsten Hebel:
- CDN einsetzen: Ein Content Delivery Network wie Cloudflare oder Fastly verteilt statische Inhalte auf Server weltweit. Nutzer laden Bilder, CSS und JavaScript von einem Knoten in ihrer Nähe, nicht aus Frankfurt.
- Caching auf mehreren Ebenen: Browser-Cache, Server-seitiger Cache (Redis, Memcached) und CDN-Cache reduzieren Datenbankabfragen und API-Calls erheblich.
- Edge Computing: Rechenlogik an den Rand des Netzwerks verlagern, nah an die Nutzer. Anbieter wie Cloudflare Workers oder Vercel Edge Functions führen Code in Rechenzentren nahe des Nutzers aus.
- Server-Standort wählen: Deine Hauptzielgruppe in Deutschland? Dann sollte dein Backend in Frankfurt, Amsterdam oder Dublin laufen, nicht in Virginia.
- HTTP/2 und HTTP/3 nutzen: Moderne Protokolle erlauben paralleles Laden mehrerer Ressourcen und reduzieren die Verbindungslatenz.
Google zeigt in seinen Core Web Vitals, dass ein TTFB (Time to First Byte) unter 800 ms als gut gilt. Jede Sekunde zusätzliche Ladezeit kostet im Schnitt 7% Conversion-Rate. Das macht Latenz-Optimierung zu einem wirtschaftlichen Faktor, nicht nur zu einem technischen.
Fazit
Latenz ist die Zeit, die ein System braucht, um auf eine Anfrage zu antworten. Sie ist klein, aber wirkmächtig: Wenige Millisekunden Unterschied entscheiden über Nutzererfahrung, Conversion und SEO-Ranking. Wer eine Web-App betreibt, sollte Latenz genauso ernst nehmen wie Sicherheit oder Code-Qualität. Mit CDN, sinnvollem Caching und dem richtigen Server-Standort lässt sich die Latenz in den meisten Fällen deutlich reduzieren, oft ohne großen Aufwand.
Häufige Fragen zur Latenz
Was ist ein guter Latenz-Wert für Internet-Verbindungen?
Für Webseiten und allgemeines Surfen sind Werte unter 50 ms gut. Für Online-Gaming sollte die Latenz unter 30 ms liegen, idealerweise unter 20 ms. Bei Videokonferenzen sind bis zu 150 ms noch akzeptabel.
Was verursacht hohe Latenz?
Die häufigsten Ursachen sind geografische Distanz zwischen Client und Server, viele Netzwerk-Hops (Zwischenstationen), Serverüberlastung, schlechte Netzwerkkonfiguration und langsame DNS-Auflösung.
Kann ich Latenz mit schnellerem Internet verbessern?
Kaum. Latenz und Bandbreite sind weitgehend unabhängig. Ein 1-Gbit-Anschluss kann trotzdem eine hohe Latenz haben, wenn der Server weit entfernt ist oder das Routing suboptimal ist. Für Latenz-Verbesserung hilft eher ein CDN oder ein Server-Standortwechsel.
Was bedeutet TTFB und wie hängt es mit Latenz zusammen?
TTFB steht für Time to First Byte, also die Zeit bis das erste Datenbyte deiner Website beim Browser ankommt. Dieser Wert ist eine Kombination aus Netzwerklatenz, Server-Verarbeitungszeit und möglichen Warteschlangen. Google bewertet TTFB unter 800 ms als gut.
Welchen Einfluss hat Latenz auf SEO?
Google berücksichtigt Ladezeiten direkt in den Core Web Vitals, einem Rankingfaktor. Hohe Latenz führt zu hohem TTFB und schlechtem LCP (Largest Contentful Paint), was das SEO-Ranking negativ beeinflusst.
