Inlägg taggade med: Cache

Aug 18 2009 14:38

Ditt ”eviga” liv på Google

(Denna artikel publicerades även i Second Opinion).

Även om du raderar information från en hemsida, finns den kvar på Google ett bra tag. Ett aktuellt fall är den åtalades blogg, i mordet på den 15-åriga Therese i Stureby.

Svenska medier presenterar aldrig några tekniska beskrivningar kring IT. En intressant del av Google är dess Cache-funktion. Där finns du kvar även om du har raderat information från din hemsida.

Under The Pirate Bay-rättegången jämställdes sajten med Google, även om det var under en kort period. Det påstods till och med att Googles söksida fungerade ”exakt likadant” som The Pirate Bays hemsida, dvs. den indexerade och tillhandahöll torrent-filer, och att man borde därför kunna även åtala Google för det.

Precis som tekniken bakom The Pirate Bay utnyttjar indexering av webbsidor och presentation av dessa utifrån sk. ”relevans” lika komplicerade tekniker, som dessutom förbättras och förändras hela tiden.

Dessa tekniker verkar dock inte vara intressanta för medierna i Sverige, inte ens för tekniska skrifter. När både DN och IDG publicerar artiklar om Google eller The Pirate Bay finns det knappt någon teknisk beskrivning. Tanken verkar nästan vara att inte ”avslöja” för mycket så det kan spridas till illasinnade. Däremot redovisas ofta teknisk information i utländska tidningar och tidskrifter. Bara en artikel på tidningen CIOs hemsida hade en del tekniska förklaringar, trots att tidningens målgrupp är operativa IT-chefer.


Googles Cache finns kvar även om du raderar information

Foto: stock.xchng

En av dessa tekniker som aldrig nämns i svenska medier är Googles sk. ”cache”-funktion.

Cache en term inom programmering och datorteknik som beskriver en samling av data som är kopior av originaldata som lagras någon annanstans eller som har beräknats tidigare.

Googles tolkning av cache är en funktion där Google sparar ned en kopia på texten på en hemsida medan den indexerar innehållet. Avsikten är att kunna presentera innehållet även om det har förändrats, eller om den ursprungssajten är tillfälligt nere.

Det cachade innehållet sparas till nästa gång Google indexerar om en hemsida, eller till hemsidan försvinner helt från internet, vilket kan också upptäckas av Google vid nästa indexering. Och det kan dröja ett bra tag, dvs. veckor eller månader, innan Google besöker åter samma sida för en uppdatering.

Google automatically takes a ”snapshot” of each page it crawls and archives it. This ”cached” version allows a webpage to be retrieved for your end users if the original page is ever unavailable (due to temporary failure of the page’s web server). The cached page appears to users exactly as it looked when Google last crawled it, and we display a message at the top of the page to indicate that it’s a cached version. Users can access the cached version by choosing the ”Cached” link on the search results page.


Lösenord skyddar inte åtalad för mordet i Stureby

Att lösenordskydda sin hemsida verkar inte hjälpa om sidan redan har cachats av Google. Ett exempel är bloggen till en av de åtalade för mordet på 15-åriga Therese Johansson Rojo i Stureby. Utifrån information som finns tillgänglig bl a på diskussionsforumet