サイトが落ちている(または無くなった)時には、Internet Archiveで見てみよう

スポンサーリンク

SWIGの日本語サイト(http://swig-jp.dyndns.org/)が最近落ちていて、もしやこのまま消えてしまうのか!?と思い、Googleのキャッシュをせっせとページ保存していましたが、Internet Archiveを使えば、そんな手間は必要ありませんでした。

Internet Archiveとは(はてなダイアリーのキーワードより)

デジタル形式のデータを永続的に提供する「インターネット図書館」を作るため、1996年に設立された非営利団体の名前。

膨大な数のWebページを保管した「Wayback Machine」を所有し、無料公開している。

「Wayback Machine」は、2001年10月の公開時点で約100億ページ・100テラバイト(=1億メガバイト)以上のデータを保存し、それらはブラウザ上で簡単に検索できるようなっている。

また、この保存ページ数は、今現在でも増え続けている。

Internet Archiveの良いところは、Internet Archive内でリンクを辿っていけることです。(全てのページを辿れるわけでもないようですが、同一ドメインならば結構辿れそうな感じです。)
例として、下記のリンクを参照してみてください。

上記サイト内でのリンクを見ていただけるとわかると思いますが、リンク先はInternet Archiveにて保存されているページとなっています。
なので、Googleのキャッシュを見たときみたいに、キャッシュされたページからさらにリンクで移動となったときに、そのページも同じく落ちている…といったことに嵌るのが少なくて済みます。

Googleのキャッシュの方が、Internet Archiveより新しいページにはなると思いますが、最新にこだわらなければ、Internet Archiveで探す方が使いやすいです。
それにGoogleのキャッシュはそのうち消えますが、Internet Archiveはずっと保存される(いまのところ)ので安心です。

後は、Internet Archive内での検索が出来れば、なお使いやすいのですが…(Recallという検索エンジンが以前あったけれども、無くなってしまった)