いざ調べ始めると大変、ネットにない古い情報を探すには

2

2024年06月04日 18:41  ITmedia NEWS

  • 限定公開( 2 )

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia NEWS

紙の情報なら図書館に行けば良いと思いがちだが……

 米Pew Research Centerの調査によれば、2023年10月の時点で10年前(2013年)のWebページの38%がアクセス不能であるという。


【画像を見る】どの本かわかれば「国立国会図書館」でコピーを請求できる


 10年前といえばそこそこ昔だと感じるかもしれない。20代の人からすればまだ子供時代だろう。10年前のガジェット、例えばPCやスマホはすでに役に立たなくなっても、新しいものがそれに変われば問題ない。


 だが情報はどうだろうか。われわれは常に最新の情報を求めており、うっかり古い情報をつかんでしまうと判断を誤る可能性が高くなる。その一方で過去の情報が無ければ、今の情報の価値が分からなくなるのも事実だ。データとしての年次変化やトレンドの変遷など、過去からのベクトルが追えなくなってしまえば、未来予測もできない。つまり情報は過去からの 連続性が無ければ、未来線が描けないということである。


 Webページが失われていくということは、当時のトレンドが分からなくなるということにもなりかねない。情報が書籍などの紙媒体になっていれば安心とも限らない。紙から情報を探すのは大変だ。今となっては、やり方すら分からないという人もいるかもしれない。


 筆者が先日体験した紙情報との格闘を例に、この問題を考えてみたい。


●調べられるのは新聞のみ


 宮崎市では毎年4月、市内の普通科がある公立高校四校が野球の試合で交流を深めると言うイベント、「四校定期戦」が行われる。2024年で45回目を迎えると言うこの大会、各ローカルメディアでは「伝統の野球大会」として報じた。


 実はこの四校定期戦、その第1回目は筆者が高校2年生の時、1980年に行われた。自分が始まりを知っている行事が、今となっては「伝統」になってしまっている。まあ45年も経っていればそうかなとも思うが、じゃあ一体何年経てば、あるいは何かのきっかけがあって伝統と呼ばれるようになるのか。これを調べようと思ったのだが、想像以上に大変だった。むしろ調べないほうが幸せだったのではないかと思えるほどだった。


 いつから、と言う話であれば、まあ10回目とか20回目とか、そこそこ区切りのいいところから「伝統」と呼び始めるのかもしれない。まずは宮崎県の地方新聞である、宮崎日日新聞のバックナンバーを調べれば分かるのではないか、と思い立った。初回から、新聞社とテレビ局がスタンドに取材に来ていたのを知っていたからだ。県立図書館に行けば、新聞のバックナンバーが閲覧できるだろう。


 というわけで早速図書館に出掛けていったわけだが、新聞自体は館内備え付けのPCを使って、閲覧できることが分かった。だが2000年よりも古いものは、紙面のスキャン画像が日付ごとに閲覧できるだけで、記事内容で検索がかけられないという。


 ということは、野球大会の開催日が分からないと、探しようがないということである。そんな記録がどこにあるのか。


 取りあえずネットで調べてみると、「宮崎県野球協議会」という組織が四校定期戦の開催を知らせるエントリーを出していることがわかったので、そこに電話して過去の開催日程が分かるか聞いてみた。すると四校定期戦というのは学校行事なので、記録は各学校にしかないという。


 そこで、息子が通う公立校の事務局に電話してみた。1962年開校という古い高校なので、もし学校史のような形で歴史がまとめられているのであれば、それを閲覧できないかと考えたのだ。だが学校史のようなものはないという。新聞報道を調べるために四校定期戦の過去の開催日程が知りたいんですが、というと、わざわざ資料を調べて息子に持たせてくれるという。


 息子が持って帰った紙には、大会の回数と日程がExcelできちんと表組みされていた。わざわざ作っていただいたのだろう。余計な仕事を増やしてしまって、申し訳ないことをした。


 翌日その資料を持って、再び図書館を訪れた。開催日はわかったので、その翌日の新聞から記事を探す。見出しも記事の大きさも分からないので、1ページずつめくって確認するしかない。備え付けPCのディスプレイは14インチほどしかないので、とても新聞全面を表示できない。拡大表示にして、少しずつ位置をずらしながら目で追っていく。少なくともこの作業を1980年から2000年までの20回繰り返すのである。中には記事化されていない年もあり、ものすごく時間がかかる。


 全部の記事を調べてわかったのは、2010年の第31回から「伝統の応援合戦沸く」と、初めて伝統という表記が登場したことがわかった。何のことはない、スキャン画像を目で追った限りでは、見つからなかったのである。前年の30回では「今年で節目の三十年目」と報じられているので、現代では30年目程度のキリのいい年を「節目」と評し、その翌年から「伝統」ということになるようである。


 ただしこの例では、という話であり、普遍的な慣習とは断定できない。たったこれだけの事実をつかむのに、2日かかっている。現代のビジネス感覚では、人件費が全くペイできない。


●図書館にあれば安心なのか?


 書籍や文献など図書として出版されたものは、納本制度により全て国立国会図書館に収蔵される事になっている。また電子書籍や電子雑誌も、平成25年から収集・保存が始まっている。よって知識が失われることはないと思う方も多いと思うが、実際にこれを利用する立場になったことがあるだろうか。


 国立国会図書館では、実際にそこへ行って収蔵されている資料を閲覧できるだけでなく、ネットを通じて資料のコピーを請求できる。


 だが逆に言えば、探している情報がどの書籍の何ページに掲載されているのかが分からなければ、そもそも請求もできない事になる。収蔵の資料はNDL SERCHというページから探せるが、実際にやってみると、まあ見つからない。


 例えばジェット・ダイスケ氏が広く普及させたといわれている動画編集手法「ジェットカット」について調べようと思っても、ジェットカッターに言及した論文などが見つかるだけである。ジェットカットについては、筆者が記した書籍「仕事ですぐに使える!DaVinci Resolveによる動画編集」という書籍で言及しており、この書籍も国立国会図書館に収蔵されているが、本文検索ができないので、結果的に見つからないのである。


 存在するのに、リーチする手段がない。これは、10年前のWebサイト38%が見つからない問題と、本質的には変わらないように見える。Webサイトの場合は、削除されたものもある一方、そのほとんどがリンク切れのためにリーチできないのだ。


 国立国会図書館でも収蔵されている紙資料のデジタル化とOCRは粛々と進めているが、古い順や重要度といった重みづけ順で行われているため、われわれが知りたい資料がそれに当たっているかどうかは、調べてみないと分からない。


 インターネット上に蓄積された集合知があまりにも膨大なため、われわれはググれば何でも分かると思い込んでしまったが、あったはずの情報がもう見つからない、でも紙の資料ならあるはず、ということに直面する可能性が出てきている。


 紙の資料を探すには、図書館に行く、電話する、対面で話を聞くといった手段を駆使して、少しずつ接近していくしかない。「ネット外」の資料をどう系統化し、リーチできるようにするのか。それは、「ネットに載せればよい」という方法では解決できない。


 ネットでは今後、AIを駆使した効率的な検索が実現するだろうが、ネットにはない情報を探すには、自分1人の力ではどうにもならない時がある。こうした紙の情報を探す手法に対する理解や敬意は、忘れてはならない部分である。同時に自分がなんらかの紙の資料を握っているならば、誰かの調べものを助ける立場になったときの寛容性もまた、備えておかなければならないだろう。


    前日のランキングへ

    ニュース設定