La crescita esponenziale della Rete ha reso evidente un problema legato alla raggiungibilità dei contenuti disponibili. Studi recenti hanno evidenziato come soltanto il 20 per cento delle pagine web disponibili e pubbliche sia effettivamente raggiungibile attraverso i principali motori di ricerca...
Persino Google e Yahoo messi insieme indicizzano soltanto una piccola parte dei documenti raggiungibili, pur avendo recentemente implementato la possiiblità di cercare non soltanto le pagine html, ma anche i documenti Excel, Word, i pdf di Acrobat.
Le ragioni sono molteplici e ci limitiamo ad accennarle, rinviando gli interessati agli aspetti tecnici ad effettuare una ricerca su Google alla voce "web invisibile". Anzitutto i database interrogabili on line in modo dinamico, per i quali gli spider possono soltanto tentare una serie predefinita di stringhe di ricerca, ma non certo tutte quelle effettivamente possibili. Lo stesso sito di Edizioni Marco Valerio è in larga parte dinamico. I due server che ospitano i nostri siti ospitano all'incirca 80 mila pagine complessive, ma soltanto un decimo circa sono indicizzate dai motori di ricerca. Questo perché i contenuti sono generati dinamicamente in base alle stringhe di ricerca, che riassemblano le pagine ad ogni singola richiesta utente. Spesso i contenuti provengono da domini diversi, come crescereinsieme.it, mondiliberi.org. torino poesia.org. Gli aforismi e citazioni ospitati sul server di marcovalerio.it sono separati ad esempio dall'archivio della letteratura di Bartolomeo di Monaco, ospitato su marcovalerio.com.