Quando sentiamo parlare di Deep Web, spesso la nostra mente evoca immagini di attività misteriose e contenuti nascosti. In realtà, il Deep Web è un componente essenziale e per lo più innocuo dell’ecosistema di Internet: ogni volta che controlliamo la nostra email, accediamo al conto bancario online o guardiamo un film su piattaforme streaming, stiamo navigando nel Deep Web senza rendercene conto.
Attraverso le Ricerche dell’Osservatorio Cybersecurity & Data Protection della POLIMI School of Management, in questo articolo cercheremo di fare chiarezza sul significato, sulle caratteristiche che contraddistinguono il Deep Web e su cosa differisce rispetto al Dark Web.
Cos’è il Deep Web
Per comprendere il significato di Deep Web (o Web sommerso, o ancora rete sommersa) possiamo attingere alla metafora dell’iceberg. L’iceberg rappresenta in questo caso l’insieme delle risorse informative del web. La punta dell’iceberg, la parte “sopra il livello del mare”, prende il nome di Surface Web (o web superficiale), quindi l’insieme di tutte le risorse indicizzate dai motori di ricerca (come per esempio Google, Bing, Yahoo, ecc.), che costituisce però solo una piccola parte di tutte le risorse presenti in Internet. La parte sostanziale dell’iceberg, invece, si trova “sotto il livello del mare” e prende il nome di Deep Web.
Il Deep Web è costituito dunque dall’insieme di tutti i contenuti presenti sulla rete che non sono indicizzati dai motori di ricerca, quali ad esempio siti privati aziendali, componenti di siti web non in mostra o nuovi siti ancora non indicizzati.
Sono stati eseguiti diversi studi riguardo l’effettiva dimensione del Deep Web. Stando a una recente indagine di Surface web, le risorse web sommerse rappresentano il 96% dell’intero world wide web, per un volume 500 volte superiore a quello del Surface Web. L’estensione del Deep Web è confermata anche dall’enorme mole di dati testuali e multimediali non visibili e spesso contenuti all’interno dei database e delle infrastrutture di pagine visitabili.
Differenze tra Deep Web e Dark Web
È fondamentale distinguere tra Deep Web e Dark Web, due termini spesso confusi ma con caratteristiche molto diverse.
Il Deep Web comprende tutti i contenuti non accessibili tramite motori di ricerca tradizionali, ma per lo più legittimi. Include email, pagine aziendali riservate, database accademici e contenuti protetti da password. L’accesso avviene quotidianamente tramite login normale o link diretti, senza necessità di software speciali.
Il Dark Web invece è una piccola porzione del Deep Web, accessibile solo tramite software specializzati come Tor o I2P che garantiscono anonimato e crittografia. Pur ospitando attività illegali, serve anche a dissidenti politici, giornalisti e attivisti che necessitano di privacy assoluta in contesti repressivi.
Cosa contiene il Deep Web: contenuti quotidiani e professionali
Il Deep Web contiene principalmente contenuti legittimi e sicuri che molti di noi utilizzano quotidianamente. La maggior parte di queste pagine viene infatti nascosta dall’Open Web per proteggere le informazioni e la privacy degli utenti.
Tra i contenuti più comuni del Deep Web troviamo:
- account personali e servizi privati: le nostre caselle email (Gmail, Outlook, Yahoo), i profili privati sui social network, i messaggi diretti e le chat, gli account di home banking e servizi finanziari online, le piattaforme di streaming come Netflix o Amazon Prime con i contenuti riservati agli abbonati;
- database professionali e accademici: database universitari e di ricerca scientifica, archivi di pubblicazioni accademiche e paper di ricerca, sistemi informativi aziendali e intranet, cartelle cliniche digitali e database medici, archivi governativi e documentazione ufficiale, cataloghi bibliotecari digitali e risorse specializzate;
- contenuti dinamici e temporanei: pagine generate automaticamente dai database, risultati di ricerca interni ai siti web, contenuti protetti da paywall (articoli di giornali, riviste specializzate), documenti condivisi tramite cloud storage (Google Drive, Dropbox) con accesso limitato, siti web in costruzione o versioni di test non ancora pubbliche.
- contenuti compromessi o dannosi: database violati contenenti informazioni rubate, sistemi aziendali o governativi compromessi da attacchi informatici, archivi di dati personali esposti per errori di configurazione, piattaforme di phishing che imitano servizi legittimi; questi e altri contenuti, pur rappresentando una minoranza, evidenziano l’importanza di mantenere sempre alta la guardia durante la navigazione.
Deep Web e motori di ricerca
I motori di ricerca tradizionali – come Google, Bing e Yahoo – incontrano difficoltà nell’indicizzare e rendere accessibili i contenuti del Deep Web per diverse ragioni. Ecco, nello specifico, le motivazioni di tale difficoltà:
- le pagine del Deep Web sono spesso dinamiche e generate su richiesta, quindi, non hanno link permanenti indicizzabili;
- molte pagine richiedono un accesso tramite nome utente e password, risultando inaccessibili ai crawler dei motori di ricerca;
- alcune pagine appartengono a reti private e non sono collegate ad altre pagine web, rendendole invisibili ai motori di ricerca;
- i motori di ricerca hanno difficoltà nell’indicizzare contenuti multimediali, come video e immagini, più comuni nel Deep Web;
- alcuni gestori di siti web o amministratori dei motori di ricerca possono escludere volontariamente determinate pagine dall’indicizzazione.
Solo una piccola parte dei contenuti del Deep Web, di conseguenza, viene indicizzata e resa accessibile attraverso i motori di ricerca tradizionali.
Come accedere al Deep Web in sicurezza: strumenti e best practices
L’accesso al Deep Web legittimo avviene principalmente attraverso metodi che la maggior parte degli utenti utilizza quotidianamente senza rendersene conto. Ogni volta che effettuiamo il login al nostro account email, accediamo al nostro profilo bancario online o visualizziamo i contenuti riservati di una piattaforma di streaming, stiamo navigando nel Deep Web.
Per accedere in sicurezza ai contenuti del Deep Web è importante seguire alcune best practices fondamentali:
- gestione delle credenziali: utilizzare password forti e uniche per ogni account, abilitare l’autenticazione a due fattori dove disponibile, non riutilizzare mai le stesse credenziali su servizi diversi, utilizzare un gestore di password affidabile per memorizzare in sicurezza le credenziali;
- verifica dell’autenticità: controllare sempre che i siti web utilizzino connessioni sicure (HTTPS), verificare l’autenticità dei certificati SSL, diffidare di link sospetti ricevuti via email o messaggi, assicurarsi di essere sul sito ufficiale del servizio prima di inserire le credenziali;
- protezione del sistema: mantenere sempre aggiornati il sistema operativo, i browser web, le applicazioni, gli antivirus, i firewall (questi ultimi, in particolare, devono provenire da una solida suite di sicurezza informatica, così da proteggersi da malware e altre minacce); evitare di visitare siti web sospetti, o comunque non affidabili; porre particolare attenzione ai link e agli allegati nelle e-mail, in particolar modo quelli provenienti da mittenti sconosciuti;
- privacy e protezione dei dati: ridurre al minimo la quantità di informazioni personali condivise online e usare la crittografia per proteggere i dati sensibili, specialmente in caso di condivisione su Internet o archiviazione su dispositivi esterni; monitorare la propria identità online e le transazioni finanziarie, al fine di rilevare eventuali anomalie che potrebbero indicare un furto di identità o altri tipi di frode;
- strumenti per la privacy: utilizzare strumenti per proteggere la privacy online, come browser web che supportano la navigazione privata e reti private virtuali (VPN); queste ultime creano una connessione sicura e crittografata, mascherano l’indirizzo IP – sostituendolo con quello del server VPN, rendendo più difficile monitorare le attività online – e proteggono da hacker in caso di connessioni a reti Wi-Fi pubbliche non sicure.
Per accedere alla maggior parte del Deep Web non è necessario utilizzare Tor (acronimo di “The Onion Router”, un software che permette la navigazione anonima su Internet attraverso una rete di server crittografati) o software specializzati, utilizzati solitamente per accedere invece al Dark Web. Il Deep Web legittimo è accessibile attraverso browser tradizionali utilizzando le normali credenziali di accesso. Questi sistemi interni non sono infatti ospitati su reti Tor, ma su server web standard protetti da autenticazione.
I motori di ricerca specializzati come Ahmia.fi, Haystak e Torch, accessibili solo attraverso il browser Tor, sono invece progettati specificamente per indicizzare i siti .onion del Dark Web, quella piccola porzione del Deep Web che richiede anonimato e crittografia avanzata.
Rispetto al Deep Web qundi, il Dark Web rappresenta un ecosistema separato che richiede tecnologie specifiche e comporta rischi maggiori.
Il Deep Web nell’era professionale e accademica
Il Deep Web riveste un ruolo cruciale nel mondo professionale e accademico, fornendo accesso a risorse specializzate e database che sarebbero altrimenti difficili da reperire. Per ricercatori, medici, avvocati e altri professionisti, il Deep Web rappresenta una miniera di informazioni preziose.
Nel settore accademico e della ricerca, il Deep Web ospita vasti database di pubblicazioni scientifiche, tesi di dottorato, ricerche in corso e archivi storici. Molte università e istituti di ricerca mantengono repository privati accessibili solo agli affiliati, contenenti materiali di studio avanzati, risultati di ricerche preliminari e collaborazioni internazionali.
Il settore sanitario fa ampio uso del Deep Web per archiviare e gestire cartelle cliniche digitali, database di farmaci e trattamenti, registri di pazienti e ricerche mediche. Questi sistemi sono progettati per garantire la massima riservatezza e conformità alle normative sulla privacy sanitaria.
Nel mondo legale e governativo, il Deep Web contiene archivi di giurisprudenza, documenti processuali, database normativi e documentazione ufficiale. Molti di questi contenuti sono accessibili solo a professionisti autorizzati o richiedono specifiche credenziali di accesso.
Tecnologie e futuro del Deep Web
L’evoluzione tecnologica sta continuamente ridefinendo i confini e le caratteristiche del Deep Web. L’avvento dell’Intelligenza Artificialee del Machine Learning sta introducendo nuovi metodi per organizzare e rendere accessibili i contenuti nascosti, mentre tecnologie come la blockchain promettono di rivoluzionare i sistemi di autenticazione e accesso.
Le sfide future del Deep Web riguardano principalmente il bilanciamento tra accessibilità e sicurezza. Da un lato, c’è la necessità di rendere le informazioni più facilmente reperibili per scopi legittimi; dall’altro, è fondamentale mantenere elevati standard di protezione per i dati sensibili e la privacy degli utenti.
Le nuove normative sulla protezione dei dati, come il GDPR europeo, stanno influenzando significativamente la gestione dei contenuti del Deep Web, richiedendo maggiore trasparenza nei processi di raccolta e trattamento dei dati personali, pur mantenendo la necessaria riservatezza per informazioni sensibili.
Il Deep Web come risorsa quotidiana
Il Deep Web rappresenta una componente essenziale e per lo più sicura dell’ecosistema digitale moderno. Contrariamente alle percezioni comuni, la maggior parte dei contenuti del Deep Web è costituita da informazioni legittime e servizi che utilizziamo regolarmente nella nostra vita digitale quotidiana.
Comprendere la natura e il funzionamento del Deep Web è fondamentale per navigare consapevolmente nell’era digitale. Questa conoscenza ci permette di utilizzare al meglio le risorse digitali disponibili, proteggere i nostri dati personali e distinguere tra contenuti sicuri e potenziali minacce online.
La chiave per un utilizzo sicuro ed efficace del Deep Web risiede nell’adozione di buone pratiche di sicurezza informatica, nella consapevolezza dei rischi potenziali e nell’aggiornamento costante delle proprie conoscenze in materia di Cybersecurity. Solo attraverso un approccio informato e responsabile possiamo sfruttare appieno le opportunità offerte dal Deep Web, mantenendo al contempo la sicurezza dei nostri dati e della nostra privacy online.
Contenuti suggeriti dell’Osservatorio Cybersecurity & Data Protection