驚愕!インターネットの情報を消す方法は無い。。2,400億以上のWebデータを保管するWayBackMachine

PR

先日、はてブのエントリーで上がっていた「いろいろと凄いものを久々に見た」という記事。まぁやわらか~いDisり記事なんですが、気になったのはそこではなく、

↓ コレ

いわゆるGoogleキャッシュっていうヤツで、上書きしたはずのデータが残っているんですね。
(記事では、これの改竄を指摘しています。)
まぁ、Googleキャッシュ自体は有名ですし大した事でもないのですが、ふと

「これってどこまで遡れるの?」

って思ったんですね。
結論から言うと、Googleキャッシュのデフォルトではそんなに古い情報は見れません。
でも、ある方法を使うとかなり遡れちゃうんです。

キャッシュリンクとは

Google ではウェブをクロールし、その時点でのページが表示されなくなった場合のバックアップとして各ページのスナップショットを作成します。これらのページは Google の「キャッシュ」の一部となり、ユーザーが [キャッシュ] をクリックすると、Google が保存した以前のバージョンのサイトが表示されます。
https://support.google.com/websearch/answer/1687222?hl=ja&p=cached

photo credit: fiddle oak via photopin cc

キャシュの日時を指定して過去ページを見る方法

キャシュを過去に遡るWayBackMachine

http://archive.org/web/web.php

このサイト、凄いです。

全世界のWebデータを2,400億以上保管している

というトンデモサイトです。

語るより、見た方が早い。

ちょっとUNIQLOさんを見てみましょう。

理由は、デザインをよく変えてそうだから。
ちなみに今はコレ

まずはURLを入力

http://archive.org/web/web.phpへ行き、URLを入力

入力したら「TakeMeBack」をクリック

泣ける程親切なインターフェイス。。
「カレンダー」で表示される

なんて、恐ろしくも親切なインターフェイス。。
わかりやすくキャッシュが残っている日が「カレンダー」の青丸でわかります。

まずは2013年4月30日のキャッシュを見てみる

まだそんなに変わりませんね。
上にあるバーの①でさらに過去に遡っていけます。

②には全キャプチャ数が(773もあるのかよ・・・)

さらに遡り2011年

レイアウトが変わりましたね。清志郎さんだ!う~ん感慨深い。。

最後の2009年

キャッシュ最後の2009年。
画像は表示されませんでした。約5年分ほどですかね。

サイトによってはもっと残っているようで一番古いのは1996年との事。

いや、恐ろしくも凄いサービスがあるのですね。
使い方次第では感動的でもあり、便利でもあるのですが「情報」が消えないという事は
過去から逃れられないという事でもあり、とても怖いサービスでもあると思います。

インターネットの情報(Googleキャッシュ)を削除する方法

Googleには、「ページのキャッシュを削除」を申請するページも用意されています。
上記のようなサイトを利用されるとどうしようもありませんが、一般的な効果は十分にあると思います。

ウェブマスターツール-削除リクエスト
https://www.google.com/webmasters/tools/removals?pli=1

検索エンジンは忘れない、象のごとく

photo credit: valerie chiang via photopin cc

「検索エンジンは忘れない、象のごとく」という記事を知っていますか?
よければこちらの記事もぜひ読んで下さい。

「理由なき悪意」が潜むインターネットの危険をもっと知らなければならないと思う

 

もしもあの写真がネットにバラまかれたら あなたの知らないスマートフォン、ソーシャルネットワークの落とし穴 (ビジネスファミ通)

-Google