Volledige versie bekijken : Complete web in 40 gigabyte-bestand



stallion
16 June 2006, 09:55
http://images.google.be/images?q=tbn:F9Z3eZUABLbwCM:www.p2pnet.net/story_images/8474.jpg
Nieuwkomer Webaroo belooft internet offline doorzoekbaar te maken (http://www.webaroo.com/). Het bedrijf claimt alle relevante informatie op internet in een 40 GB-bestand te kunnen stoppen.

"Door irrelevante sites, zoals spamsites, achterwege te laten en sites te indexeren op contentdichtheid kunnen we het bestand zo klein houden", verklaart directeur Brad Husick van Webaroo tegenover Webwereld. Die contentdichtheid wordt bepaald door de spider van Webaroo.
"We schatten dat er in totaal zo'n 20 miljard webpagina's zijn. Vermenigvuldig dit met een gemiddelde grootte van 50 KB en je komt op zo'n 1 miljoen gigabyte aan opslag om 'het complete internet' op te slaan. Wij hebben dit teruggebracht tot 40 gigabyte", stelt Husick.

Gebruikers kunnen de software (http://www.webaroo.com/) gratis gebruiken in ruil voor advertenties die gekoppeld zijn aan de zoektermen van de gebruiker. Webaroo kan synchroniseren zodat de content altijd actueel is. "Gebruikers kunnen ook een interessegebied aangeven. De engelstalige Wikipedia hebben we bijvoorbeeld teruggebracht naar een bestand van zes gigabyte. Iemand kan bijvoorbeeld ook alleen WK-sites binnenhalen."
Benq

Husick benadrukt dat Webaroo geen Web Accelarator is: software met compressiebeloftes waarmee de gebruiker met internet offline net zoveel zou kunnen als online. "Mensen moeten de software zelf proberen en ervaringen met ons delen. Het klinkt allemaal onvoorstelbaar, maar het werkt echt heel goed. Om die reden gaat Benq de Webaroo-software standaard meeleveren op smartphones met Windows Mobile."

De aangeboden content is vooralsnog alleen in het Engels beschikbaar. Het bedrijf hoopt op korte termijn ook content in andere talen aan te kunnen bieden.

BRON (http://www.webwereld.nl/articles/41592/complete-web-in-40-gb-bestand.html)