10年前のWebページの38%が消失──Pew Research Center調べ

38

2024年05月20日 09:11  ITmedia NEWS

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia NEWS

2013年から2023年の消滅Webページ数推移(画像:Pew Research Center)

 非営利調査機関の米Pew Research Centerは5月17日(現地時間)、「When Online Content Disappears」(オンラインコンテンツが消滅するとき)と題する調査レポートを公開した。「2013年に存在したWebページの38%が10年後にはアクセス不能に」というサブタイトルがついている。


【その他の画像】


 この調査では、非営利プロジェクト「Common Crawl」のリポジトリから2013年から2023年までの毎年の約9万ページ、合わせて約100万のWebページをサンプリングした。調査結果は、この期間の全ページの25%が現在アクセス不能であることを示している。このうち、16%はルートドメインはアクティブだがアクセスできず、残り9%はルートドメインが廃止されたものだ。


 政府の公的サイトでは、サンプリングした約50万ページのうち、21%に少なくとも1つのリンク切れが含まれていた。地方自治体レベルのページで特に顕著だった。


 ニュースメディアのWebサイトでは、約50万ページの23%に少なくとも1つのリンク切れが含まれていた。サンプルは、comScoreによって「ニュース/情報」として分類された2063ドメインのリストに基づいて収集した。


 英語版Wikipediaでサンプリングした5万ページでは、54%に少なくとも1つのリンク切れが含まれていた。


 米X(旧Twitter)については、2023年3月8日から4月28日に投稿された約500万件のツイートを追跡した。これらのツイートのうち18%(約5件に1件)は2023年6月15日までに非公開になった。そのうち60%はアカウントの非公開化、停止、削除によるもので、残り50%はアカウントはアクティブだが削除されている。なお、調査が行われた期間はTwitterは既にイーロン・マスク氏による買収は完了しているが、まだサービス名はTwitterで、ポストはツイートと呼ばれていた。


 詳しい調査方法についてはレポートを参照されたい。


このニュースに関するつぶやき

  • 10年くらい前に、学生の頃入り浸ってたチャット場を見に行ったらまだ当時のログがかなり残ってたな。黒歴史なので消えてヨシ!
    • イイネ!6
    • コメント 0件

つぶやき一覧へ(13件)

ランキングIT・インターネット

前日のランキングへ

ニュース設定