Bildbeschreibung: Lexikon-Bild von IT-P.

Deep Web

2 Minuten

Als Deep Web wird der verborgenen Bereich des Internets bezeichnet, der sich der Erfassung durch gängige Suchmaschinen entzieht. Es bildet das unsichtbare Fundament des Netzes – eine riesige Datenwelt, auf die normale Suchanfragen keinen Zugriff haben. Im Gegensatz zum oft damit verwechselten Dark Web, das nur einen kleinen verschlüsselten Teil davon ausmacht, umfasst das Deep Web unzählige Informationen und Dienste, die für den reibungslosen Ablauf moderner digitaler Anwendungen unverzichtbar sind.

Was gehört zum Deep Web?

Das Deep Web umfasst nahezu alles, was nicht frei und direkt über Suchmaschinen zugänglich ist. Es ist eine Mischung aus öffentlich zugänglichen, aber nicht indizierten Daten, und bewusst geschützten Inhalten. Dazu zählen unter anderem:

Passwortgeschützte Bereiche

Private E-Mail-Konten, Online-Banking-Seiten oder Cloud-Speicher – all diese Inhalte sind ausschließlich durch individuelle Login-Daten zugänglich.

Inhalte hinter Paywalls

Viele journalistische Artikel, wissenschaftliche Publikationen und exklusive Inhalte, wie sie auf Streaming-Plattformen oder in Fachdatenbanken zu finden sind, gehören ebenfalls zum Deep Web.

Dynamische Webseiten

Seiten, die erst durch Benutzereingaben wie Suchanfragen oder Formularfelder generiert werden, können von Suchmaschinen nicht erfasst werden.

Datenbanken und Archive

Wissenschaftliche Fachartikel, öffentliche Register oder interne Dokumente von Unternehmen: Sie alle liegen in nicht indizierten Datenbanken.

Inhalte ohne Hyperlinks

Webseiten, die keine Verlinkungen aufweisen oder auf sehr tieferen Hierarchieebenen versteckt sind, bleiben für die Algorithmen der Suchmaschinen unauffindbar.

Wie funktioniert es?

Das Deep Web unterscheidet sich vom sichtbaren Internet durch die Zugangsmechanismen und die Art der Informationsbereitstellung. Der Zugang zu diesen Inhalten ist entweder technisch erschwert oder durch Schutzmechanismen wie Passwörter und Verschlüsselung reglementiert.

Technische Merkmale des Deep Web

Nicht indizierbare Inhalte
Suchmaschinen können nur Seiten erfassen, die über öffentliche Hyperlinks und Metadaten verfügen. Dynamische Webseiten, die erst durch Nutzerinteraktionen generiert werden, sind für Crawler nicht erreichbar.

Spezielle Formate
Komplexe Datenbanken oder Dokumente in proprietären Formaten werden von Suchmaschinen oft nicht interpretiert oder ignoriert.

Zugangsbeschränkungen

  • Authentifizierung: Viele Bereiche des Deep Webs, wie E-Mail-Konten oder Cloud-Dienste, erfordern eine Anmeldung oder ein Passwort.
  • Geografische Sperren: Inhalte, die nur für bestimmte Regionen oder IP-Adressen freigeschaltet sind, gehören ebenfalls zum Deep Web.

Verschlüsselung und Privatsphäre

Ein spezieller Bereich des Deep Web sind die sogenannten Darknets, die nur über spezielle Software wie den Tor-Browser oder ähnliche Programme zugänglich sind. Diese Netzwerke bieten durch Verschlüsselung und Anonymisierung ein hohes Maß an Privatsphäre. Seiten im Darknet sind an der Endung .onion zu erkennen und bilden das Dark Web, das häufig im Zusammenhang mit Anonymität und illegalen Inhalten diskutiert wird.

Das Deep Web umfasst vor allem nicht-öffentliche Bereiche des Internets, wie private Webseiten, geschützte Datenbanken oder passwortgesicherte Plattformen. Es ist deutlich umfangreicher als das sichtbare Surface Web. Schätzungen zufolge ist es 400- bis 500-mal größer. Der Zugriff auf diese Inhalte erfordert in der Regel Zugangsdaten oder bestimmte Berechtigungen, jedoch keine speziellen Browser. Ein großer Teil des Deep Web ist völlig legal und beinhaltet Dienste wie Online-Banking, wissenschaftliche Datenbanken oder interne Netzwerke von Unternehmen.

Es stellt hingegen nur einen kleinen, verschlüsselten Teil des Deep Web dar. Der Zugang erfolgt über spezielle Software wie den Tor-Browser, die Anonymität ermöglicht. Zwar wird das Dark Web häufig mit illegalen Aktivitäten in Verbindung gebracht, doch es ist nicht repräsentativ für das gesamte Deep Web. Insgesamt machen die unsichtbaren Bereiche des Internets schätzungsweise rund 90 Prozent der gesamten Online-Welt aus, also all jene Inhalte, die aus Datenschutz-, Sicherheits- oder Zugriffsgründen nicht öffentlich indiziert sind.

Bildbeschreibung: Cover vom Whitepaper "Prozessautomatisierung mit der Power Platform in M365"

Whitepaper

Wir können Sie KI strategisch einführen und wo bietet es Mehrwert für Ihr Unternehmen?