Når Google indekserer så mange milliarder websider, at det ikke engang gider at angive nummeret mere, er det svært at forestille sig, at meget ligger ud over dets vidtgående tentakler.
Nedenfor ligger imidlertid en onlineverden, som kun få ved eksisterer. Det er et rige af enorme, uudnyttede reserver af værdifuld information, der indeholder spredte databaser, skjulte websteder og skumle fora. Det er en verden, hvor akademikere og forskere måske finder de data, der kræves for at løse nogle af menneskehedens største problemer, men også hvor kriminelle syndikater fungerer, og terroristhåndbøger og børnepornografi distribueres frit.
hvordan man screenshot, uden at nogen ved det
Forsvind på det mørke web
Der er mange gyldige grunde til, at du muligvis ikke vil have din online udnyttelse søgbar. Find ud af, hvordan du kan forsvinde fra internettet
Samtidig er det underjordiske web det bedste håb for dem, der ønsker at undslippe den totalitære statscensur og dele deres ideer eller erfaringer med omverdenen.
Interesseret? Du er ikke alene. Det dybe web og dets mørke net er en ny slagmark for dem, der ønsker at opretholde retten til privatliv online, og dem, der føler, at rettigheder skal ofres for samfundets sikkerhed. Det dybe web er også den nye grænse for dem, der ønsker at konkurrere med Google inden for søgning. Tag en rejse med os til den anden side af internettet.
Dybe baner, det mørke web og mørke net
Den første ting at forstå er, at mens elementerne, der udgør dette andet web, har aspekter til fælles, taler vi ikke om en enkelt samlet enhed. De, der kender, vil ofte tale med det dybe eller usynlige web, mørke net og det mørke web, og du tror måske, at disse alle er de samme. Faktisk er de separate fænomener, omend de er knyttet til fælles temaer, egenskaber eller interesser.
Det dybe web er ikke halvt så mærkeligt eller uhyggeligt som det lyder. I datalogi taler det om de dele af internettet, der uanset årsag har været usynlige for konventionelle søgemaskiner som Google.
Størstedelen af dette dybe web består af dynamisk oprettede sider og databaseindgange, der kun er tilgængelige via manuel udfyldning af en HTML-formular
Størstedelen af dette dybe web består af dynamisk oprettede sider og databaseindgange, der kun er tilgængelige via manuel udfyldning af en HTML-formular. En mindre andel er ved et uheld eller med vilje gjort utilgængelig for Googles webcrawlere, mens andre områder sidder bag adgangskodebeskyttede eller kun abonnementswebsteder.
Tag ikke fejl, det dybe web er enormt. Michael Bergmans banebrydende undersøgelse fra 2001, The Deep Web: Surfacing Hidden Value, anslog, at den tegnede sig for 7.500 TB data på et tidspunkt, hvor søgemaskiner kun kunne indeksere 19.
Selv de mere konservative estimater i et papir fra 2007 skrevet af Googles Jayant Madhavan, Alon Halevy og kolleger antyder, at der er mere end 25 millioner forskellige kilder til dybt webindhold, hvoraf mange er enorme arkiver.
Der er en fremherskende fornemmelse i databasesamfundet, at vi savnede båden med WWW, konkluderede Google-papiret. Det overordnede budskab i dette papir er, at en anden båd er her med svimlende mængder af strukturerede data, og at båden skal være vores.
Dybdens skatte
Der er meget legitimt og værdifuldt indhold på det dybe web, sagde Dr. Juliana Freire, leder af et University of Utah-projekt, DeepPeep, der sigter mod at gøre dybt webindhold mere tilgængeligt.
For eksempel er der flere videnskabelige datasæt (såsom Sloan Digital Sky Survey og Center for Coastal Margin Observation & Prediction), dokumenter og databaser, og disse er nyttige for samfundet og har mange vigtige applikationer.
Næste side