先日、はてブのエントリーで上がっていた「いろいろと凄いものを久々に見た」という記事。まぁやわらか~いDisり記事なんですが、気になったのはそこではなく、
↓ コレ
いわゆるGoogleキャッシュっていうヤツで、上書きしたはずのデータが残っているんですね。
(記事では、これの改竄を指摘しています。)
まぁ、Googleキャッシュ自体は有名ですし大した事でもないのですが、ふと
「これってどこまで遡れるの?」
って思ったんですね。
結論から言うと、Googleキャッシュのデフォルトではそんなに古い情報は見れません。
でも、ある方法を使うとかなり遡れちゃうんです。
キャッシュリンクとは
Google ではウェブをクロールし、その時点でのページが表示されなくなった場合のバックアップとして各ページのスナップショットを作成します。これらのページは Google の「キャッシュ」の一部となり、ユーザーが [キャッシュ] をクリックすると、Google が保存した以前のバージョンのサイトが表示されます。
https://support.google.com/websearch/answer/1687222?hl=ja&p=cached
photo credit: fiddle oak via photopin cc
キャシュの日時を指定して過去ページを見る方法
キャシュを過去に遡るWayBackMachine
http://archive.org/web/web.php
このサイト、凄いです。
全世界のWebデータを2,400億以上保管している
というトンデモサイトです。
語るより、見た方が早い。
ちょっとUNIQLOさんを見てみましょう。
理由は、デザインをよく変えてそうだから。
ちなみに今はコレ
まずはURLを入力
http://archive.org/web/web.phpへ行き、URLを入力
入力したら「TakeMeBack」をクリック
泣ける程親切なインターフェイス。。
「カレンダー」で表示される
なんて、恐ろしくも親切なインターフェイス。。
わかりやすくキャッシュが残っている日が「カレンダー」の青丸でわかります。
まずは2013年4月30日のキャッシュを見てみる
まだそんなに変わりませんね。
上にあるバーの①でさらに過去に遡っていけます。
②には全キャプチャ数が(773もあるのかよ・・・)
さらに遡り2011年
レイアウトが変わりましたね。清志郎さんだ!う~ん感慨深い。。
最後の2009年
キャッシュ最後の2009年。
画像は表示されませんでした。約5年分ほどですかね。
サイトによってはもっと残っているようで一番古いのは1996年との事。
いや、恐ろしくも凄いサービスがあるのですね。
使い方次第では感動的でもあり、便利でもあるのですが「情報」が消えないという事は
過去から逃れられないという事でもあり、とても怖いサービスでもあると思います。
インターネットの情報(Googleキャッシュ)を削除する方法
Googleには、「ページのキャッシュを削除」を申請するページも用意されています。
上記のようなサイトを利用されるとどうしようもありませんが、一般的な効果は十分にあると思います。
ウェブマスターツール-削除リクエスト
https://www.google.com/webmasters/tools/removals?pli=1
検索エンジンは忘れない、象のごとく
「検索エンジンは忘れない、象のごとく」という記事を知っていますか?
よければこちらの記事もぜひ読んで下さい。
「理由なき悪意」が潜むインターネットの危険をもっと知らなければならないと思う
もしもあの写真がネットにバラまかれたら あなたの知らないスマートフォン、ソーシャルネットワークの落とし穴 (ビジネスファミ通)