Friday 30 May 2014

Internet Archive: Wayback Machineのアーカイブを削除する方法

http://pawapoke.s41.xrea.com/memo/archive.html

Internet Archive: Wayback Machineのアーカイブを削除する方法
robots.txtを置く方法
メモ帳に
User-agent: ia_archiver
Disallow: /
と書いて保存し、それをアップロードする。ファイル名はrobots.txt。
ただし、この方法をとってもアーカイブは削除されません。robots.txtの効果は、ただ見られなくなるだけです。 この方法をとっても、robots.txtを一旦削除するとアーカイブは再び見えるようになります。 レンタルサーバーのアカウントを消失したりして、アップロードしていたrobots.txtが無くなると、見られなくしていたページが再び見られます。 完全に見られなくしてもらうためには削除依頼のメールを送らなければなりません。
robots.txtを置いても、すぐに目的のページが見られなくなるわけではありません。 でもrobots.txtを置いて目的のページを見られなくしていたときに一旦robots.txtを削除するとすぐに目的のページが見られるようになります。 robots.txtを置いても新たなアーカイブの保存はその後も続きます。
robots.txtを置く場所
index.htmlを置いている場所(一番上の階層)にrobots.txtを置きます。
public_html
   |
   ├-index.html
   ├-robots.txt(ここに置く)
   |
   ├-bookフォルダ
   |  ├01.html
   |  ├02.html
   |  └03.html
   |
   └-pictureフォルダ
      ├-a.html
      ├-b.html
      └-c.html
削除依頼のメールを出す方法
私は昔、とある無料ホームページサービスを使ってホームページを作っていましたが、 今はそこを引き払ってこのレンタルサーバーに移りました。 したがって昔のホームページのアーカイブを消したいと思っても、 そのレンタルサーバー上の内容を編集することは私には出来ず、robots.txtを置く方法はもう使えません。 そんなときには削除依頼のメールを出すことになります。
  • まず相手の連絡先ですが、info@archive.orgになります(メールを出すときは@は小文字にしましょう)。
  • メールの内容は英語で書きます(WEB上の翻訳サービスを使いましょう。Google翻訳など)。
そしてこれが一番難しいのですが、
  • 削除して欲しいページの管理者であったことを証明することが必要です。
私が昔使っていた「とある無料ホームページサービス」とは、旧ジオシティーズのことです。 旧ジオシティーズのサービス終了に伴って、私の作っていたホームページは新ジオシティーズに以降していたのですが、 そのホームページを閉鎖する前にアカウントの方だけを消失してしまっていたので、 アカウントは持っていないけど、ホームページだけは残っているという状態でした。
そこで私は、ヤフーの人の方で何とか対応してもらってアーカイブを削除する方向に持って行ってくれないかと相談のメールを送ってみたのですが、 ヤフーはそんなことはしないんだと断られてしまいました。 ほかのレンタルサーバーのことは知りませんが、レンタル元に対応してもらうことは難しいのではないかと思います。 とりあえず、ヤフーの人には新ジオシティーズのホームページだけを削除してもらいました。
PF-X.NETを利用して作られたサイトは、 普段はPF-X.NETがrobots.txtを置いているためにアーカイブは見られないのですが、 たまにrobots.txtの効果が無くなっていてアーカイブが見られることもあります。
削除依頼のメールを出してアーカイブを削除してもらうと、以降そのアドレスのアーカイブは見られなくなります。 削除して欲しいページを個別に指定せず、 たとえばhttp://web.archive.org/web/*/http://tekito.com/pawapoke/* (URLの最後に*を付けると、そのアドレスに属するすべてのページが表示される) と全体を指定して削除されると、以降そのドメイン下のアーカイブは、 たとえ新しく作ったページであっても、すべて見られなくなるので注意が必要です。 既存のページが新たにアーカイブされることもありません。 もう一度アーカイブされたいと思うときは別のレンタルサーバーに移転するなどしてドメインを変えるしかありません。
削除したいページの管理者であったことを証明する方法
  • 「移転しました」と書いて移転先にリンクを張っているページのアーカイブが残っているときは、 その移転先の管理者が自分であることを相手に訴える。私はこの方法を取りました。 要は、移転先のページの管理者である自分は、そこに移転する前のページの管理者でもあったということです。
  • このサイトのメールアドレスは「tekito@tekito」です、みたいなことを書いているページのアーカイブが残っているときは、 そのメールアドレスで削除依頼を出し、自分が管理者であったことを相手に訴える。
削除依頼のメールを出したあとの相手の対応
アーカイブを削除してもらえるかどうかの対応は相手によって変わるみたいです。 私は削除して欲しいページが2つあったので2つのメールを同じ文面で送ったところ、 一方は削除され、もう一方は削除されずに残りました。 その1か月後にもう一度、削除されなかったページの削除依頼を出したところ、 その翌日に削除依頼に応じた旨のメールがあり、私が削除して欲しかったページは2つとも消えてくれました。 なので削除してくれなかったときは間を空けて何度かメールを送ってみると良いのではないかと思います。 もしかすると私の英語が通じなかっただけかもしれませんが。
ちなみに返事があるかどうかもまちまちです。 私はこれまでに4回メールを送って3つのページを削除してもらったのですが、 そのうちの1回は返事があって削除され、残りの2回は返事なしに削除されていました。
私が出したメールの内容
  • 英語
    Archive delete request.(メールのタイトル)

    Hello,
    I would like to delete the following data from your archive.
    http://web.archive.org/web/*/http://tekito.com/pawapoke/*
    (URLの最後に*を付けると、そのアドレスに属するすべてのページが表示される。 この冒頭の英文についてはだいきん日記 Ver.6 @WP – googleとInternet Archiveのキャッシュ削除を参考にしました)

    Please look at thehttp://web.archive.org/web/20040402045148/http://tekito.com/pawapoke/index.html.
    I have changed the address of my site at this time.

    About it, I wrote in Japanese to towards the top of the site.
    I was making a link to http://pawapoke.s41.xrea.com/.
    Go to http://pawapoke.s41.xrea.com/ when you click it.

    I am the administrator of http://pawapoke.s41.xrea.com/.
    In order to prove it, I have copied the contents of this e-mail.
    Please look at the http://pawapoke.s41.xrea.com/a.html.

    In other words, I am the administrator of the http://pawapoke.s41.xrea.com/,
    It is that was also the administrator of http://tekito.com/pawapoke/ prior to transfer there.

    Thank you.
  • 日本語訳
    アーカイブ削除要求。(メールのタイトル)

    こんにちは、
    私はあなたのアーカイブから次のデータを削除したい。
    http://web.archive.org/web/*/http://tekito.com/pawapoke/*
    (URLの最後に*を付けると、そのアドレスに属するすべてのページが表示される)

    http://web.archive.org/web/20040402045148/http://tekito.com/pawapoke/index.htmlをご覧ください。
    私はこの時点で私のサイトのアドレスを変更した。

    それについて、私はサイトの上の方に日本語で書いた。
    私はhttp://pawapoke.s41.xrea.com/へのリンクを作っていた。
    あなたがそれをクリックしたときhttp://pawapoke.s41.xrea.com/に移動します。

    私はhttp://pawapoke.s41.xrea.com/の管理者です。
    それを証明するために、私はこの電子メールの内容をコピーした。
    http://pawapoke.s41.xrea.com/a.htmlをご覧ください。

    言い換えれば、http://pawapoke.s41.xrea.com/の管理者である私は、
    そこに転送する前のhttp://tekito.com/pawapoke/の管理者でもあったということです。

    ありがとう。