Website

Internet

2.8.2015

Wie kommen die Sachen aus dem Internet auf den Bildschirm meines Computers / Smartphones? Wie funktioniert das?

Nehmen wir mal an
Nehmen wir an, du hast den Browser deines Computers ("Compy") angewiesen, die Website www.neues.de zu öffnen, das heißt, die Homepage (Startseite) von neues.de zu holen und darzustellen. Dein Computer ist mit dem Internet über eine Leitung (DSL) oder Funk (WLAN/UMTS) mit deinem Internet-Provider verbunden. Der bekommt dafür, dass er sich mit deinem Compy unterhält, Geld von dir (im Abo oder prepaid).

Also schickt dein Compy eine Anforderung an den Provider und übergibt ihm die Adresse www.neues.de. Hoppla, der Provider kennt neues.de garnicht (noch nie davon gehört), und muss deshalb anfangen, danach zu suchen.

Das Internet
Nun muss man bedenken, dass das Internet ein riesiges weltumspannendes Netzwerk von Computern und Abermillionen von Websites ist. Wie soll mein Provider ausgerechnet neues.de finden? Zum Glück kennt der Provider die Adresse eines Root-Servers, der wiederum weiß, wer für die Top-Level-Domain .de zuständig ist. Eine Anfrage dort führt zum Domain-Server, der die Domain-Name neues.de ganz genau kennt, denn diese ist die gesuchte Website. Der Computer, der neues.de besitzt, gibt seine IP-Adresse (z.B. 80.245.65.1) an und diese gelangt schließlich zum Provider und von dort zum Client, also zu deinem Compy. So, und erst jetzt nach Erhalt der Zieladresse kann der Datenverkehr mit neues.de beginnen. Der Provider merkt sich vorsichtshalber die IP-Adresse eine Weile lang, denn sonst müsste er bei jedem Seitenaufruf die ganze Sucherei neu starten.

Päckchen verschicken
Übrigens gibt es nie die direkte Verbindung zwischen deinem Compy und dem Server, auf dem neues.de liegt. Das Internet besteht aus einer Vielzahl miteinander verbundener Computernetzwerke. Der Server, auf dem neues.de liegt, kann in Berlin stehen, doch der Zugang erfolgt über eine Reihe anderer Server an den Knoten der Netzwerke, auch über Satellitenverbindungen. So reisen die Fragmente einer angeforderten Webseite auf unterschiedlichen Wegen durch die Welt, bevor sie auf deinem Compy landen und dort zusammengesetzt werden.

Tatsächlich werden Webseiten beim sendenden Server zerlegt und sausen in Päckchen auf recht unterschiedlichen Wegen (Routen) durch die Internet-Netzwerke. Das hat den Vorteil, dass die meisten Päckchen schnell beim Empfänger (dem Browser deines Compys) ankommen und nur wenige, die in einen Stau geraten sind, etwas verzögert sind. So baut sich die neue Webseite schnell auf und die Nachzügler fallen kaum auf.

Javascripts
Jedesmal, wenn du eine neue Webseite aufrufst, z.B. durch Click in ein Navigationsmenü, verschwindet die aktuelle Seite und die angeforderte Seite wird komplett neu geladen (in dein Compy). Oft schickt der Server zusätzliche Informationen und Programmcodes mit, die du nicht siehst. Das ermöglicht es deinem Browser, bestimmte Dinge auf der Webseite zu tun, ohne eine neue Seite zu laden, also auf der aktuell geladenen Seite. In der Regel laufen dabei JavaScripts auf deinem Compy, die mit der aktuellen Seite geladen worden waren. Das erhöht die Reaktionsgeschwindigkeit bei deinen Eingaben. Außerdem können bei mouse-over (der Cursor - Pfeil oder Hand - bewegt sich über ein Eingabefeld oder andere Seitenteile) zusätzliche Informationen eingeblendet werden. Zum Beispiel darüber, wozu das Eingabefeld da ist und was man da eingeben kann und darf.

Man kann, wenn man eine Weile danach sucht, den JavaScript-Interpreter des Browsers ausschalten (deaktivieren). Das lässt die meisten Internetportale (Google-Mail und Konsorten) ziemlich alt aussehen. Sie benötigen nämlich JavaScripts für viele Effekte, z.B. Umschalten von Seiteninhalten ohne die Seite vom Server neu zu holen. Diese Inhalte sind, ohne sie zunächst anzuzeigen im Hintergrund mit der Seite gekommen und werden per JavaScript bei Bedarf dargestellt. Nimmt man der Website JavaScript weg (deaktiviert JavaScript im Browser), dann reagieren viele Teile der Webseite nicht mehr. Deshalb haben die Browser (z.B. Chrome) angefangen, den Zugang zur JavaScript-Deaktivierung sehr gut zu verstecken oder ganz unmöglich zu machen.

Oft sind die JavaScripts im Code der Webseite eingebettet. Dann kann man sie lesen. Alle Browser bieten die Möglichkeit, den html-Code einer Seite zu lesen. So ein Script fängt mit <script> an und hört mit </script> auf. Dazwischen ist Programmcode, der ganz bestimmte Dinge tut.

Internet

Cookies
Neben JavaScript sind Websites zunehmend auf Cookies angewiesen. Die werden auf deinem Compy gespeichert. Sie sind dazu da, bei jedem Laden der Website bestimmte Informationen zum Benutzer oder Benutzerverhalten bereitzustellen. Oft enthalten sie Daten zur Client-spezifischen Steuerung der Webseiten. Ein Beispiel: in der P-Domain kannst du das Hintergrundbild selbst aussuchen über den Menüpunkt "Konfiguration" auf der unteren Navigationszeile. Und dort kann jeder Besucher der P-Domain ein individuelles Bild für sich auswählen. Dieses Bild gilt also nur für einen bestimmten Besucher. Deshalb speichert die Webseite "Konfiguration" diese Auswahl in einem Cookie auf dem Computer des Besuchers, also auf deinem Compy. (Nur wenn "in Cookie speichern" geclickt wurde). Die als nächstes geladene Webseite sieht zuerst im Cookie nach, welches Hintergrundbild zuletzt verwendet wurde und stellt dieses dar. Solange das Cookie auf deinem Compy existiert, wird die P-Domain bei jedem Aufruf mit demselben Hintergrundbild ausgestattet.

Cookies waren früher sehr unbeliebt bei den Websitebesuchern. Heutzutage sind sie kaum mehr ein großes Thema. Viele Websites setzen voraus, dass der Browser des Besuchers Cookies erlaubt. Etliche Websites geben schon beim Start den Hinweis "Durch Benutzung dieser Website stimmen Sie der Verwendung von Cookies zu". Trotzdem kann der Benutzer Cookies verbieten. Um das zu erreichen, muss man ein wenig in den Einstellungen des Browsers suchen. Übrigens haben Cookies eine bestimmte Lebensdauer (meist einige Monate) und werden danach automatisch gelöscht. Man kann sie auch von Hand löschen. Auch dafür muss man sich mit den Browserfunktionen beschäftigen.

Die Sitzung: Session
Um noch einmal das Beispiel "Hintergrundbild" aufzugreifen: wenn die Speicherung der Bildidentität in einem Cookie nicht möglich ist, weil vom Besucher nicht zugelassen, dann speichert der Server selbst die Bildidentität in einer Session-Variablen und übergibt eine Session-ID an den Browser, der diese auf deinem Compy speichert. Freundlicherweise sendet der Browser bei jedem Seitenaufruf auch die Session-ID an den Server, so dass dieser die zuständige Sessionvariable bei sich findet und zur Auswahl des richtigen Hintergrundbildes für die angeforderte Seite verwenden kann. Das funktioniert jedoch nur so lange, wie die Website geöffnet ist. Beim Schließen verschwinden die Sessionvariablen, so dass beim nächsten Besuch der Website wieder das Standard-Hintergrundbild erscheint.

Natürlich kann der ServerComputer Daten in einer Datenbank speichern. Um diese Daten einem Benutzer, d.h. dessen Client-Computer (deinem Compy) zuzuordnen, muss zusätzlich die IP-Adresse deines Compys gespeichert werden. Doch die IP-Adresse kann sich ändern, und dann ist der Kunde verloren.

Sehr vergesslich
Inzwischen ist dir wohl klar, warum Cookies und Sessionvariablen verwendet werden: das Internet hat kein Gedächtnis! Es ist ein "zustandsloses System". Aus den Augen, aus dem Sinn! Jede neu geladene Webseite hat keine Ahnung, was vorher geladen war. Erst durch die Speicherung von Benutzerdaten kann die Website vernünftig funktionieren. Benutzerdaten sind nicht unbedingt dein Name und Adresse usw. sondern meistens deine Aktivitäten, zum Beispiel in einem Shop.

Videos
Was Webseiten interessant macht, sind vor allem Bilder, bewegte Bilder (Filme, Videos) und Soundtracks (Audios). Über lange Zeit musste dein Browser ein Programm wie Adobe Flash benutzen, um Filme abspielen zu können. Jeder kennt die nervige Meldung "Flash ist veraltet", die anstelle eines Films erscheint. Das heißt, ständig muss man Flash Updates herunterladen (dann gibt es Virenwarnungen und man möchte eigentlich nicht updaten. Was nun?). Doch zum Glück wurde das Abspielen von Videos standardisiert und jeder Browser kann heute Filme darstellen ganz ohne Adobe Flash.

Quelle: http://xkcd.com/937/

Just for Fun
Wenn du grob verstanden hast, wie dein Compy und das große Internet zusammenarbeiten, macht es einen Heidenspaß, das Netz auszuspähen. Schnell stellst du fest, dass es alles gibt. Egal was einem NEUES einfällt, das gibt es schon! Aber egal. Einige gute Sachen findet man schon. Zum Beispiel die Äpp "Tornado Guard". Die warnt akustisch vor einem nahenden Tornado. Wie immer gibt es auch User Reviews, das sind Kommentare von Anwendern. Hier sind es vier Kommentare mit Bewertungen:

5 Sterne: Gute Bedienoberfläche! Viele verschiedene Warnmöglichkiten einstellbar.
5 Sterne: Läuft großartig, keine Abstürze.
5 Sterne: Schön dass man mehrere Orte auswählen kann.
1 Stern: Die Äpp hat mich vor dem Tornado nicht gewarnt.

Im Mittel ergibt das 4 Sterne für die Äpp, eine ausgezeichnete Bewertung! Sofort runterladen!


Begriffe:

Browser: ein Programm auf deinem Computer, das Safari oder Chrome oder Firefox, manchmal auch Internet Explorer heißt (es gibt noch viele andere). Dieses Programm ist in der Lage, sich mit dem Computer, der die angeforderte Website besitzt, zu unterhalten (über den Internet-Provider).

Client: ein Computer, der Informationen von einem Server anfordert.

Server: ein Computer, der Informationen an Clients ausliefert und auch von dort entgegennimmt.

Website: eine Ansammlung von Inhalten (Texte, Bilder, Videos, Audios) einer bestimmten Internetadresse, wie z.B. www.neues.de. Weitere Inhalte können vor der Auslieferung einer Webseite an den Client von anderen Servern geholt und eingefügt werden.

Internet-Provider: eine Firma, die Server für den Zugang zum Internet bereitstellt. Über diese Server erfolgt der Transfer von Webseiten zum Client (Kunden). Der Internet-Provider ist in der Lage, sämtliche Internet-Aktivitäten des Kunden zu protokollieren.

Webseite: eine einzelne Webseite ist Bestandteil einer Website. Sie existiert entweder statisch (sieht immer gleich aus) oder wird vor der Auslieferung an den Client per Programm auf dem Server erzeugt (zusammengesetzt) und kann dann unterschiedliche Inhalte haben.

IP-Adresse: ist eine Zahlenkombination wie z.B. 80.245.65.1, die dem Client-Computer vom Internet-Provider zugewiesen wird. Damit kennt der Provider seinen Client unter dieser IP-Adresse. Da der Kunde dem Provider auch namentlich und abrechnungstechnisch bekannt ist, kann der Internetverkehr über diese Client-IP-Adresse einer bestimmten Person oder Institution zugeordnet werden.

Homepage: Startseite einer Website. umgangssprachlich ist damit oft die gesamte Website gemeint.

DSL: = Digital Subscriber Line - eine Breitband-Datenverbindung zwischen Client-Computer und Internet-Provider, in der Regel über Telephonleitungen.

UMTS: = Universal Mobile Telecommmunications System - ein Mobilfunkverfahren zur Datenübertragung bei Internetzugang, Audio- und Videotelephonie, Nachrichtenübertragung.

WLAN: = Wireless Local Area Network - ein lokales Funknetz, in Verbindung mit dem Router eines Computernetzwerks.

Domain-Name: der Name einer Website in Form eines URL (Uniform Resource Locator) wie z.B. http://www.neues.de. Domain-Namen werden von DNS-Servern (Domain-Name-Servern) in eine IP-Adresse übersetzt.

JavaScript: eine Programmiersprache. Gleichzeitig ist ein Script (man denke an Filmscript, eine Sammlung von Regieanweisungen) ein Block von JavaScript-Codezeilen, also ein kleines Programm. Dieses arbeitet mit den geladenen Webseiteninhalten und läuft auf deinem Compy.

html-Code: der Programmcode zur Darstellung einer Webseite. Man kann sich den Code ansehen durch Aktivieren spezieller Browserfunktionen, zu finden wie: Safari/Entwickler/Seitenquelltext einblenden oder Chrome/Anzeigen/Entwickler/Quelltext oder Firefox/Extras/Web-Entwickler/Inspektor. Der Code und damit der gesamte Webseiteninhalt ist auf deinem Compy temporär gespeichert, solange die Seite geladen ist. Die Inhalte können per JavaScript manipuliert werden.

Cookie: ein kleiner Textbrocken, der vom Browser auf deinem Compy gespeichert wird. Der Text enthält Informationen, die beim Seitenwechsel vom Browser selbst, aber auch von Programmen auf dem Server benutzt werden können. Zum Beispiel Login-Daten (Benutzername, Passwort).

Session: = Sitzung - ist der Begriff für den Zustand einer stehenden Vebindung zwischen Client und Server. Es existiert dann beim Client eine Session-ID (Identifikationsnummer, z.B. 6a88f8d497e4250a30e4eefde8a0b648). Während der Sitzung kann der Server anhand der Session-ID Benutzerdaten speichern und verarbeiten, z.B. für die Verwaltung eines Warenkorbs. Auch bei Wechsel zu einer anderen Website läuft die Session der vorigen Website weiter. Erst bei Schließen des Bowsers enden alle Sessions (oder nach einer vom Server festgelegten Zeit).


Nachtrag 16.6.2019

Das Internet ist - wie im Hauptbeitrag beschrieben - ein weltweites Netz von Computern, über das Daten (Nachrichten, Bilder, Filme) von einem Sender zu einem Empfänger geschickt werden. Die Daten werden in Paketen transportiert und folgen keinem festgelegten Pfad, sondern suchen sich den bestmöglichen Weg zum Ziel, wobei das gesamte Netz dafür genutzt wird. Diese Internetarchitektur macht es unmöglich, die Verbreitung von Nachrichten zu unterbinden, sei es durch Stilllegung von Computern oder durch Störungen per Hackerangriffen.

Die Unverletzlichkeit des Internets ist autokratischen Regimen von jeher ein Dorn im Auge. Im Jahr 2010 versuchten einige Staaten, darunter Russland und Syrien, länderspezifische Begrenzungen durchzusetzen. Die UNO sollte dafür sorgen. Daraus wurde nichts.

Seither arbeiten Russland und China an der Kontrolle über das Internet. Während China von Anfang an nur wenige Zugänge in Form von Datenleitungen ins Land zuließ, erfolgte Russlands Anschluss über eine Vielzahl von Verbindungen wie in anderen Ländern auch. Für China ist es daher einfacher, die totale Kontrolle über die Provider im eigenen Land zu übernehmen und geeignete Inhaltsfilter einzubauen.

Die chinesische Strategie geht jedoch weit über die Inhaltskontrolle hinaus. Das Land ist dabei, eine eigene Internet-Infrastruktur aufzubauen, nicht zuletzt über das Seidenstraßenprojekt. Das Ziel ist ein chinesisches Internet, das unabhängig vom World Wide Web agiert und selbstverständlich von Peking aus kontrolliert wird.

Russland geht einen anderen Weg. Dort konzentriert man sich auf die Kontrolle der im russischen Herrschaftsbereich befindlichen DNS-Server. Diese Server finden die Adresse einer angewählten Website. Durch entsprechende Manipulationen werden jetzt falsche Empfängeradressen gesetzt. So können die Russen die Website Google.com nicht mehr erreichen, da sie zu Yandex umgeleitet werden, oder zum russischen sozialen Netzwerk VK (vk.com) statt zu Facebook.

Das freie weltumspannende Internet wird also in Zukunft nicht mehr existieren, nicht nur wegen der Aufsplitterung, sondern weil auch demokratische Staaten zunehmend Druck auf die großen Informationsportale ausüben und diverse Zensurmaßnahmen forcieren.

Ganz einfach funktioniert die Abschottung in Norkorea. Dort führt nur ein Internetkabel ins Land. Die Verbindung kann also einfach unterbrochen werden und das Land versinkt im Dunkel. Selbstverständlich haben die Machthaber ihren eigenen satellitengestützten Internetzugang, damit sie weiterhin twittern können

Quelle:

http://www.bbc.com/future/story/20190514-the-global-internet-is-disintegrating-what-comes-next