デジタルアーカイブin岐阜2022
~ 地域の文化資源を守り、知識基盤社会を支える人材の育成 ~
■ 日 時:令和5年2月11日(土) 9:00~12:00
■ 講 座:デジタルアーカイブ映像
■ 対 象:社会人
■ 募集期間:令和4年11月1日(火)~ 令和5年1月31日(火)(申し込みは終了いたしました。)
■ 趣 旨
社会のDX化が進展しており、デジタルアーカイブを通じた地域情報の収集と発信による地域活性化やGIGAスクールによる学校での活用が広がっています。
国は内閣府が中心となってデジタルアーカイブ社会を実現するため、全国のデジタルアーカイブをリンクするジャパンサーチの運用を2020年に開始し、地域の情報が続々提供され、活用の可能性が拡大しています。
今年のデジタルアーカイブin岐阜では、日本のデジタルアーカイブを牽引する3人から変貌する現状を紹介し、自治体、教育機関、博物館、図書館で取り組まれているDX化に、デジタルアーカイブを通じて取り組む際のアイデアを提供していただきます。
■ プログラム
■9:00~9:10
デジタルアーカイブ研究所長(岐阜女子大学教授) 久世均
➝ プレゼン資料:デジタルアーカイブin岐阜2022
ジャパンサーチとデジタルアーカイブ活用基盤
国立情報学研究所名誉教授 高野明彦氏
➝ プレゼン資料:ジャパンサーチとデジタルアーカイブ活用基盤
内 容
1.ジャパンサーチとは
ジャパンサーチというのは国の真ん中辺でやっているサービスなのですが、企画は内閣府の知的財産戦略推進事務局に、推進委員会及び実務者検討委員会というのが置かれまして、大体7年ほど今は活動しています。
ここでデジタルアーカイブという新しい仕掛けを日本の中にどういうふうに根づかせていくのかという議論をしております。私はこの実務者検討委員会というものの座長です。
実際のサービスがジャパンサーチという名前の検索サービスが上がっているのですけども、これについてはNDL、国立国会図書館というところが責任を持って運営しているという形になっています。
ただ、国会図書館が美術館、博物館のデータをいろいろ集めたりするというのはなかなかやりにくい面もありますので、直接だとやりにくい面もあるので、この委員会でそういう活動をするということになっています。
国の中のいろんなところでデジタルアーカイブというのが小さいものも大きいものも構築が進んでいるわけですが、それらを一覧できるような場所をつくろうということがまず、第一の目的です。
ポンチ絵を描いてありますけども、アーカイブ機関というのがあって、これは何をアーカイブと捉えるかっていうことによって随分違うのですが、デジタルアーカイブというのにとらわれずに考えていけば、博物館、美術館っていうのは大体物をためて置いておく場所ですからアーカイブの機関だろうし、文書館みたいな公文書館に代表されるような文書館はもちろん名前のとおりアーカイブすることが目的の機関なわけです。
あるいは大学とか研究機関っていうのは、一義の目的は教育ですけども、教育の中にはいろんな資料を活用したり、それを集めて初めて分かることについて深めていったりするということが含まれますから、大学の研究を進めていくとそこに何かが集まってくると。これをある人はアーカイブと呼ぶという形なわけです。
これまでアーカイブっていうのはそういう物理的なフィジカルなコレクションっていう場合が多かったわけなので、なかなか遠くからは使いにくくて、研究者っていうのは大体そういう物があるところ、資料があるところを全国あるいは海外まで出向いて、それを調べるっていうのが普通のスタイルだったのですが、これだけデジタル化が進んで、当たり前にデジタルの技術を使えるということになりましたので、だったら貴重な資料であってもみんなと共有したい、世界と共有しても構わないというようなものであればどんどん公開して、それを相互に利用し合うというような形が理想的というふうになってきております。
それをジャパンサーチでは加速したいというのがもともとの願いです。また、片側に活用者がいて、アーカイブ機関というのを、自分のホームのアーカイブもあるかもしれないですが、大体はアウエーといいますか、知り合いを頼ってそういうところにたどり着いて調べさせてくれということでこれまでやってきたと思うのですけども、そういう人間を介さなくても資料と出会う機会というのを提供したいというのがジャパンサーチの目的です。
ですから活用者とそのアーカイブ機関の間に立って、何かうまく探せる仕組みを提供しようと。探すっていうのが、グーグルがはやって以来、何か研究自身は探すことみたいに思われるかもしれないですが、探した先のことをするのが多分活用者にとっての本当に重要なことですから、どこにどんなものがあるよっていうことを一覧できるということが、そういうアイデアを生み出す一つのきっかけにもなるということで、この真ん中をやりたいということです。
しかし、ちょっと考えれば分かるのですが、ここが、アーカイブ機関が例えば1000館ほどがあって、それをじゃあ束ねましょうといいますか、そこにどこがどういうものを持っているのかを総覧できるようにしましょうとなりますと、この真ん中のサービスはその1000館と直に付き合わなきゃいけないことになるわけです。そうすると例えば契約書を一つ交わそうとすると、1000部の組織とやり取りをするということで、この真ん中のこうサービスを上げるより前に疲弊してしまうというようなことが起きます。そこで工夫として考えたのがこのつなぎ役という場所です。すなわち似たような組織は似たような契約をして、似たようなメタデータを集めよう。あるいは集める前に、メタデータの流儀みたいなものがちょっとぶれていたら分野ごとに整理をしていただいて、分野でまとめたものを頂く。そこと一発契約を交わして提供いただくほうが合理的だねということをジャパンサーチの立ち上げ時には考えました。
これは我々のアイデアというわけじゃなくて、後で多分、時実さんがお話しされると思いますけど、ヨーロピアーナ(Europeana)というヨーロッパを中心に進めているこういう同種の取組があるのですが、そこではアグリゲーターと呼んで、何かを集めてきてアグリゲーションして提供するというような形で、ヨーロピアーナはアグリゲーターとだけ付き合っていけば、その先の何千という組織とデータをやり取りできるよっていうような形をつくられて、割とうまくいっているというのを我々は知っていたので、僕たちもジャパンサーチを上げるときにそれに類したことをやろうということで。ただ、アグリゲーターというと片仮名だっていうこともありますけど、日本語でいうと何なのか分からないですが、何か収奪されるような気がすると。アグリゲーションビジネスなどというビジネス書が本屋に行くといっぱい並んでいますけども、並んでいた時期でしたが、大体割とアグレッシブといいますか、えっ、そんな言葉にされちゃうの?というような話が多いので、アーカイブ機関がそれで警戒されては元も子もないので、そうじゃなくて柔らかく日本的に、つなぎ役をするんですという形で名前もつけました。
そこで、この3つの構成、活用者がいて、アーカイブ機関がいて、それをジャパンサーチに取り次いでいくつなぎ役がいる。場合によっては活用者からの要望に応じて、このつなぎ役が整理の仕方なども工夫していくということで、この3つはそれなりに関係づいているという形になります。具体的にはこのスライドは後でダウンロードできるようにすると思いますが、この辺のリンクをたどっていただけると、政府のいろんなものが見えると。ちょっとクリックします。こんな報告書とか、取りまとめサイトみたいなものにたどり着けると思います。こんな名前で引くと、大体7年分の資料が出てくると思います。
次に行きますと、そうやって立ち上げたサイトがあると。僕は割とこういう話をするときはライブデモをする。スライドを一枚も作らずにやるっていうのが好きなんですけども、そうやると大体どこかに引っかかって時間を取られて最後までたどり着けないっていうことが多いので、今日はちょっと自制して、最後の最後で少しデモをするかもしれないですが、スライドで頑張っていこうと思っています。
ちょっと調べてみますとジャパンサーチというのは2019年2月に試行公開したんですね。仕組み自身が大体動くのかとか、こんなでこぼこ感のあるデータの集め方でうまく役に立つかしら? フィードバックを頂こう、ということでこれをやりました。1年半後ぐらいですかね、1年半後ぐらいにちょうどコロナ真っ盛りの夏、8月25日だったかに正式版公開ということにいたしました。ここでデータベースとして、データベースっていっても大もあれば小もあるんですけど、何十万も入っているデータベースからほんの数百しか入っていないデータベースまで108ぐらいのところからデータが集まって、メタデータの件数でいうと2000万件を突破するぐらいになったと。2000万件といっても本のカタログだとか、それから公文書館のように、タイトルだけは見せられるけども、公文書の本文は公文書館に来ないと見せられませんというような、そういうものも含めてのものなので、それほどリッチな感じでは当初はなかったですけども、それでも2000万件を突破したっていうのは一つ大きいメルクマールになったということで、ここで正式公開というふうにしました。
公開当日とかは何万も何十万も来たのですけども、大体平均すると6000件ぐらい。もうちょっと行ってもいいかなっていうのが当初感じたところですが。そして2年半ぐらいたっているのですが、昨日調べで見ると197データベースと。データベース、今度はどちらかというと小さいものが増えたのですけども、地域の発信のようなデータベース、今日の多分セミナーの全体のテーマはその辺にあるのかなと思っていますが、地域に埋もれているような資料を整理して上げてくるというような特徴的なものをどんどん入れましょうということで、ここ1~2年ぐらいは、地域発信においては、デジタルアーカイブを優先的に入れているので、件数はかなり増えて197データベースということになっています。
サイトに行くとどういう197かっていうのが一覧できるようなページがありますので、ぜひ、興味があればそういうところをご確認ください。メタデータはそれほど増えてなくて、大口でないというところで、それでも600万件ぐらい、700万件かな、そのぐらいは増えて、アクセス数も倍以上にはなっているというような状況です。もう一桁ぐらい行ってもいいかなというふうにつくっている側というか、運営している側は感じていますけども、まだちょっとリーチできていない部分が多いかなというふうに感じています。今日こういう機会をいただいたことで、非常にこの辺を盛り上げていくのに役に立つかと期待しておりますので、ぜひ皆様も触ってみてください。
このポンチ絵ですけども、こういう活用者、アーカイブ機関、つなぎ役っていう三者一体で、これがぐるぐる回り出すと、成果物がいろいろな活動、社会的な意義のある、防災に役に立つとか、もちろん教育に役に立つとか、学術研究。今日ここにお集まりの方々は、まずはこの辺が一番のセンターなのかもしれませんが、恐らく社会人で入られている方などは、多分もう一つ地域活性したいよとか、防災に役立てたいとか、深い中長期の目的があってこういうところに、デジタルアーキビストになってみようかなということで入られているんだと思いますけども、そういうところにつなげていくというのが僕たちの目的でもありますので、ぜひ使ったり、ちょっと眺めてみて、こういうところが足りないんじゃないかというようなことがあればフィードバックをお願いしたいと思います。
連携と一言で言いますけども、なかなか一筋縄ではいかないですね。190もいろんな組織があって、歴史的な経緯があってためてきたものですから、整理の仕方も無手勝流といいますか、自分たちがこれまで紙の帳簿でやってきたことをそのままエクセルに置き換えて、エクセルでずっとやっているとか、あるいはシステムを導入したとしても金額的な折り合いから非常に単純なことしかできないシステムしか入れられなくて、それに合わせてデータ自身もつくられるということで、もうちょっといろんな情報を入れたいのだけども、なかなか整理がついていませんというようなところが非常に多いわけですけど、それをまとめ上げる過程で少し底上げするといいますか、割とうまくいっているところに合わせて、この機会に頑張ってじゃあメタデータ、あるいは関連情報みたいなものを整備しながら上げていきましょう、あるいはつないだ後でどんどん充実させていこうというようなことにつながることを目指してやっているので、模範役が何かそうでもない人に合わせてデータがどんどん、たまっていっちゃうといいますか、整理された状態が未整理の状態に引きずられていくっていうことはしたくないですね。
そこで、このつなぎ役っていうのが模範演技の人は模範演技のままつながっていただいて、あとはまだちょっと準備が整っていない人たちも、そこに順次倣っていくような仕組みっていうのをちょっと考えたいわけです。というので、まずはその模範演技ができそうなところ、国立国会図書館自身だとかですね。これは本の分野では模範演技をしているので入っていただくとか、文化庁の文化遺産オンライン。これも僕は立ち上げ時から関わっていますけども、これはそれなりに多くの博物館、美術館の情報を入れていると。少なくとも国指定文化財は全部ここで総覧できるようにしてありますので、そういう意味では一つの模範的な文化財の整理の方法と考えられるわけです。他には、科博などはサイエンスミュージアムネットという科博だけじゃなくて科学館、科学博物館のネットワークというのがありまして、そこで非常に専門的な標本データの収集みたいなことを整理されておりますので、そういうところとか、こういう模範的なところにまずは立っていただいて、そこがもう既に持っているものを入れていただく。大抵は1館の情報ではなくて、その先に何十館、何百館というものを控えているようなところになっています。
ところが分野によってはこういう図書でもないし文化財、指定文化財とも言えるようなものではないし、科学者が専門的に使う標本などでもないという場合はどこにも引っかからないわけですよね。そうすると、つなぎ役不在ということがほとんどの場合ここになるわけです。
あるいは文化財は文化財なんだけども、文化庁のこういう整理にちょっとなじまない、学術的なデータベースになじまないっていうような人は、やはり文化遺産オンライン経由っていうのはちょっと無理で、直接そういう専門的な仲間同士くっついて入れていきたいというようなことがありますので、そういう状況で、下ではそういう個々の状況に合わせてどうやったらうまく、データのこだわりは生かした上で、発見性はそれなりに担保されていくというようなことをしたいということを考えています。
個々のデータのこだわりを生かすと、大抵の場合は細かく分かれて、項目が例えば何とか名称、発掘場所、発掘時期、発掘方法とかって、埋蔵文化財を掘った記録を残すためには非常に必要な項目なわけですけど、そうじゃない掘られたものを整理するには、必ずしもそれは必要じゃないかもしれない。あるいはこの辺の工房でつくられた工芸を整理する枠組みとはちょっと違うわけですよね。ですから同じ文化財といっても、大分こだわりが深くなると言葉が通じなくなるということをよく経験するわけですが、ここを何とかうまく勘案しながら集めていくという苦労がありました。
現在はこれもいろんなパターンがありますと書いて、それなりに実例もあるんですけども、こういうデータベースを同分野でうまくまとめられる、これはかなり理想形ですが。あるいは同じ組織だけども、こだわりの違うものをもう既に持っているので、それをうまく集めていくとかですね。それから同じ分野、テーマの資料を様々な団体・個人から収集してっていって、ちょっとずつみんなが持っているようなものを収集して、割とボリュームとして意味のあるようなものにしていくというような、収集すること自身がまた一つの活動になるようなつなぎ役の立ち方とか、それからデータベースは持っていないのだけども、これはかなり、件数として本当は多いわけですね。
我々の連携しているのは200弱ですけども、多分、1000とか2000とか国全体を眺めればいろんなものがあるはずで、研究者が1人いれば昔はデータベースが一つできるというようなことを言っていた時代もありますので、たくさんあるわけですが、これを何とかうまく入れていきたい。だけどそういうときにデータベースを個々の施設が持っていない。データだけあるという、データベースって言っても発信するようなデータベースを持っていないっていうようなケースもあるので、そういうときには、逆に言うとジャパンサーチ自身がそういう初めてみんなが触ることができる発信のプラットフォームになるような形で、データのやり取りを工夫するというようなことを考えたりもしています。
これは今後状況に合わせて、さらに柔軟な対応を迫られるかもしれません。でもこういうきめ細やかな対応を国会図書館、本当に頭が下がるぐらいなんですけども対応していただいていて増えてきたということになります。
つなぎ役として、今の何パターンかあるつなぎ役のいろんなパターンとして、こういう31機関ですかね、ここはそんなに増やさないように、先ほど言った契約の件数がこれに縛られますので、ここが何百になっちゃうともうそれだけで事務手続が大変になってくるので、できるだけ抑えながら参加データベースは増やしていくっていう努力をしているんですけども、こういうところは立っていただいて進めていると。多分かなり名のある、もちろんジャパンサーチなどよりも随分前からこういう活動の意義を見いだして、実際に進めておられたような組織になっています。
2.活⽤基盤としてのジャパンサーチ
紙とか実資料を集めるだけじゃなくて、部分的にはカタログの公開も既に行われているような組織というのがここになっています。こういう人たちが味方になってくれたっていうことが、今回ジャパンサーチ、それなりに成功っていうのもおこがましいですけども、それなりにうまくできて、日本ではほかにライバルがいないようなサービスになったというふうに思っていますが、こういう方々の蓄積を我々にちゃんと出していただいたといいますか、連携していただいたということになります。
ちょっと余談になりますけども、国のこういう委員会っていうのは、大抵は有識者会議とか、僕も有識者であんまりないかもしれないですけど、有識者会議という名前のところがいっぱい出ていますけども、大抵そういうところは言いっ放しで、コメントいただいたということが役人にとっての一つの言い訳になるといいますか。だからこのまま進めますねっていう承認のための一つのステップぐらいにしか考えられていなくて、なかなかそこで意思決定するっていうことは難しいわけですけど、今回は先ほどの実務者検討委員会だったかな、何をやるのか分からないような名前にしていただいて、そこには本当に実務者だけを集めていただいたんですね。だけをっていうのはおかしいけど、各組織のうち館長とか副館長が来ても現場のことはほぼ分かっていないので、そういう方々で議論しようっていってもなかなか本当の議論にならないわけです。データを出してくださいって言ってもどうやって出したらいいか分からない人が、じゃあ出しましょうって返事をしても実際に現場は動かないっていうことが僕らはいろいろ経験していたので、そうじゃなくて本当にデータをグリップしていて、館の方針などもこういう目的に合わせて改善していく、改定していく意欲もあるような方々に集まっていただいて。その代わり個々の職場が抱えているいろいろな実情、こういうものは博物館の分野ではちょっと無理ですよとか、写真の分野だとこういうところをクレジットしていないと、もうとても一枚も見せられませんとか、そういう個々のドメインの実情とかについてみんなが一つのテーブルで話せるような場所っていうのを目指して。
だから最近は割とルーチン化しているので、それほど腹を割った本音の議論というのが出ているかどうかちょっと怪しいですけども、最初のほうは何ができるのかちょっと分からないっていう状況だったこともあり、各分野の実情を聞きましょう、あるいは委員じゃない人も呼び込んで毎回毎回そういうもっと深い実情について報告いただいて、それについて皆さんは自分たちの館を顧みながらどうやっていったらいいかっていう相場を考えていくっていうようなことをしました。
そういう枠組みというのが結構重要で、だからこれ、データベースでデジタルアーカイブだから人が大していなくてもコンピューター同士がつながればうまくいくでしょうとか、ファイルだけ送っとけばいくでしょっていう話ではやっぱりないんですね。それを支えて、そこにそれなりの情熱をつぎ込んでいる人たちが、じゃあ手を携えましょうと。それは面白いかもしれない、自分たちにとってもプラスになるし、間違いなく集まったところでは我々のサービスだけじゃないプラスアルファが得られそうだねと、新しい広場ができそうだっていう期待で皆さんご協力いただいているのだと思います。というので、その輪を広げていきたいので、ぜひ今日集まった皆様でそういうものがちょっと思いついたりする方は、何でジャパンサーチにこれは入っていないんですか?というようなことを呼びかけていただいて、利用者の立場から、あるいは運営に関わる立場からぜひ後押ししていただければと思います。
これがさっきの数とちょっと違うのですけど、ちょっと探したらこういう表になっているのはこれしかなかったので、ちょっと2年前ぐらいですけど、1年半ぐらい前ですが、141データベースのときのブレークダウンを出しています。これ、分野って書いてあるのはそれほど厳密ではないです。国会図書館サーチで持ってきたから書籍関連だねとか、そんなふうになっていますが。書籍っていう一般書籍みたいにして集められているもの。でも、よく見ると青森県立図書館デジタルアーカイブとか。図書館だからいいのかな。この中に県史が入っていたりするのかな。地域資料はちょっと切り出していますね。図書館とか役所が管理しているような本でも、地域資料ということでそれなりの追加情報がついて、データベースでまとめられているものはこういう、青森県史デジタルアーカイブみたいな形で切り出されているとか、こういうデータベースの単位で何かラベルというか分野を規定するとすればこんな感じかなと。これは、美術と人文は完全に別とかそういうわけではなくて、美術、データベースと言われる中に入っているものが、実は書籍でも関係しているとかその逆とか、いろいろあるわけですけども、こんな観点で集められ、つくられたデータベース、デジタルアーカイブが集約されつつあるということになります。
かなり広がりがあるということは見ていただいて分かるかなと。どうしてもこういうデータベースとかデジタルアーカイブっていうと、写真がきれいなものとか、そういうところが自慢をするので、そういうコンテンツで例示してこういう新しいものができましたっていう話をするので、どうしてもビジュアルなものが何枚入っているかとかに引きずられがちで、文化財なら文化財がいっぱい集まっているんだろうなと。それ以外の分野はあんまり関係ないのかなって思われるかもしれないですが、ジャパンサーチに限って言えば、あまり、画像が必ずなきゃいけないというようなことは要請していません。
いや、ぜひ入れてもらいたいっていうのは実はあるんですけども、例えばサイエンスミュージアムネットっていう、これは先ほど言った科博を中心とするネットワークですが、ここは世界の標本のネットワーク、標本コレクションのネットワークにも参画しているジャパンのノードなわけですが、そうするとラテン名とか非常に専門的な情報がついている標本の一覧だったりするんですけど、カブトムシだけで何千もエントリーがあるような。ところが写真が一枚も、これ、ジャパンサーチには提供されていないんですね。向こうに飛んでいってもほぼほぼ写真はないんじゃないかと思うのですが。専門家同士は写真が見えるような関係っていうのを築かれているようですけど、この分野ではまだそういうものは一般的でないということで、ラテン名の公開という専門家情報の公開にとどまっているわけです。
こういうのは素人から見ると、その辺で見つけた珍しそうなカブトムシをこれは一体何なんだろうっていうのを判定したりする情報にこの辺が役に立つといいのにというふうに思いますから、写真の1枚も2枚も入っていたらいいのにとは思いますが、なかなかそれは実現していないところです。
それぞれに分野に事情がありますので、仕方がないといえば仕方がないですが。舞台芸術みたいなものも、これはenpakuですかね、早稲田の演劇博物館等から演劇系のものもいっぱい入ってきます。ですから演劇系っていうのは当然まだ著作権が生きているものが非常に多いですし、そういうもののデータっていうのがこういうところでさっと見えるかっていうと、ビジュアルなものが見えるかっていうとそうでもないということです。ただ、舞台芸術などは今日もお話しされる福井さんなどが中心になって、舞台芸術のデジタルアーカイブ化っていうのはずっと進んでおりますので、福井さんの話に出てくるかどうかはちょっと分からないですが、分野ごとにかなり予算もついて国が応援すればそういうものも進むんだなっていうのを今まさに実証してもらっているところですので、そういうのはいずれここに充実して入ってくるんじゃないかと期待しているところです。福井さんなどとはそういう話もよくしているわけです。
3.メタデータの連携⽅法
次ですが、じゃあいろんなところで集まってくるものをどういうふうに、どの範囲をジャパンサーチはじゃあ集めているのかっていう話をちょっとします。コンテンツ、これが個々の博物館、美術館がデジタル化して持っている実態だとします。高精度の写真だとか、3Dの最近だったらデータだとか、いろんなものを持っているのだと思うのですが、修復のためだけにも役に立ちそうな、ピクセルの写真とか、そういうものも入っていると思うのですが、それを全部ジャパンサーチに上げられても大変なことになっちゃう。上げたいっていうところもあるんですけど、僕たちが消さずに国会図書館がそういう写真を未来永劫お預かりしますっていうのはなかなかできそうでできない約束なので、コンテンツについてはちょっと預かることをためらうわけですね。
とはいえ、ビジュアルな、例えば浮世絵っていうのがタイトルだけでサムネイルの一枚もないと、どんな浮世絵か分からないし、果たしてその館まで見に行って、デジタル的であれ見に行って、大きい画像を出してくださいって言って出してもらう手間といいますか、そこ、この作品を見てみたいっていうふうに思うセレクションのときに役に立たないだろうということで、できたらこのサムネイル、プレビューといいますか、ある程度の大きさのものは出していただきたい。ここもでも、あんまりルールを決めるとじゃあそれだけの大きさがあればいいんですねって言って、逆に縮めてそれに合わせてくるっていうようなところが当然あるので、できるだけあまりこっちでサイズ等は指定せずに、できるだけベストエフォートで出してくださいっていうような話をしております。さっき言ったように分野によっては一切出さないというようなところもあるということになります。
メタデータは逆に言うと必須で、これは本でいえば書誌情報のようなものです。タイトル、著者、出版社、出版年みたいな、そういう基本情報はぜひとも入れてください。これは福井さんの話でいずれ出てくると思いますけど、メタデータのそういうものは大体著作権がないというふうに認められていて、自由に流通することに適していると。最近はサムネイルも一部は入れられるというふうに、著作権を主張できないというふうになっていますけども、大きいサムネイルは少なくともその範疇から外れるので、日本の法律ではサムネイルについてはやっぱりその提供館なり権利者がそれを出しても構わないよっていうことを認めるような仕組み、あるいは権利制限が加わったような状況でしかこれは追加できないというふうになりますが、この青い部分というのをジャパンサーチは集めています。
ですからタイトルとかその他の基本情報で調べることができて、その調べた結果がサムネイル等で一覧できる。場合によってはサムネイルつながりで、この山が書いてあるやつは何だろう?っていって探しにいくというようなこともできるようになっているということです。この辺をどういうふうに整理したらいいのかっていうのは、やっぱりガイドラインみたいなものをこの委員会としてはつくって、リバイズもここは今ちょっと古い版が上がっていますけど、何年かに一回はリバイズしながらこれを提供しているというところです。少し専門的な話に興味がある方はこの辺を見ていただければと思います。
もう一つのこだわりは、その利用の区分といいますか権利区分です。特にサムネイル等で、これは多分行った先でどういう形で利用できるものがぶら下がっているのかっていうことも含めての表示ですけども、少なくともサムネイルをどういうふうに扱えるよっていうようなことについて、ここに権利情報を表示するように、できるだけ表示してくださいということにしています。表示がないときは、あるいは該当なしとかって一番厳しめにしちゃっているときは、排除はしていないのでそれでも可能ですけども、できれば個々の作品について個別にできるだけ権利状況が緩いもの、できるだけ活用ができるものっていうのを挙げていただきたいということで、個別に、作品なら作品個別にこれを振ってくださいということをお願いしています。これは非常に重要なことで、これまでですとデータベース全体でこのデータベースに入っている画像はこういう権利状態でやりますという、だから商用利用は駄目ですとか、これに限っては利用できますっていうことをうたうっていうのが従来のプラクティスだったんですけども、データベース全体で1つルールを考えようとすると、当然その中の一番厳しい、まだ著作権が生きているものが例えば1000件のうちの3件あるから、その3件は駄目だから1000件全部駄目にしましょうっていうふうに悪いほうに引きずられちゃうんですね。
悪いっていうのもおかしいけど、厳しいほうに合わせちゃうっていうことが、これは不思議なものでデジタル情報屋さんが悪いんじゃない?と僕は思っているんだけども、その権利を決めるなどというのは面倒くさいから、そういうところは一番安全サイドに振りましょうっていうのが大抵の場合の判断だったわけです。その結果、これまでは美術館のデータベースっていうのはほとんど、画像は個別に、もう著作権が切れている江戸時代のものでも使えませんっていうふうな形ですね。個別にお問い合わせくださいなどとなっていて、聞けばこれは切れているからいいですよっていう、答えが返っているのですけど、そこの手間を払いながら検索結果を見るっていうのはあり得ないことなので、結局は簡便には見ることができないというところになっていたわけですが、今回このジャパンサーチにせっかくばらばらに集める、個々のものが個々のものとして見える形でデータを集めますので、それぞれに権利の情報を付与してもらうということをお願いしています。
最初はエイヤッで一番安全サイドに全てを振るかもしれないですが、これとかこれとかこれはほかの館ではオーケーが出ているのに何でおたくの館は駄目なんですか?っていうような話でプレッシャーをかけることもできますし、その提供館に気づきを与えるということができるので、少しずつよい方向に動いていくというふうに期待しているわけです。
そういうことでジャパンサーチの2次利用条件っていうのはこんな感じでその条件によって絞り込むこともできるし、個々の作品のページに行くと割と分かりやすい表示がありますので、ああ、じゃあ安心して使いましょうっていうような形で利用が進むと期待されます。
結構時間がたってしまいましたが、活用基盤としてのジャパンサーチ。これ、じゃあ何のためにつくったかというと、先ほど言った活用者がどれだけうまく使って、上に書いてあった社会的な課題の解決につなげていくっていうのが、大上段の目的なわけですが、少なくとも活用者が面白がってもらえるようなものにならないと駄目だろうということで、幾つか、最初はあんまりこういうものは国会図書館が提供するサービスにはなじまない的な、これまでの国会図書館のサービスを知っていれば大体想像がつきますけども、サービスしているものが厳密な意味で正確な情報が提供されていて、いつでも同じ振る舞いをして、淡々といい仕事をするっていうのが国会図書館的なスタイルなわけですね、まあ美意識なわけですけど、ウェブサイトにもそれが反映されていて割とこう、取りつく島がないといいますか、サービスが多かったわけですけど、ジャパンサーチはやっぱり国会図書館が主たる運営者でないということと、これまで国会図書館が付き合っていたのではないコミュニティーの人たちとうまく付き合って、そこの利用を盛り上げることが重要だから、もう少し柔らかいところに行きましょうよということをさんざん言って、最初はそんなのはどうかしら?とかいうのが多かったのですが、大分今では国会図書館の関係者、担当者は積極的にこういうものを、取り組んでいただいています。
4.ジャパンサーチAPIの活⽤例
活用っていうのは探す、検索するのはまず一番の機能としてもあるでしょう。ただ、この探すのも従来の書誌検索のようにタイトルはここの箱に入れてくださいとか、説明文の一部はここに入れてください、時代はここに入れてくださいみたいなフィールドが分かれていて、それぞれにそれぞれの対応するものを入れないとそれなりにうまいものが出てこないっていうのはちょっとしんど過ぎるので、少なくともグーグル的な1つの窓にぽんと何でも入れるとそれなりに出てくるとか、それからそういうメタデータで引くだけじゃなくて、画像つながりで画像の近さで引いてくるというような、探すっていうようなこともできたらいいだろうと。
精度はそれほど高くはないかもしれないですけど、気づいていない手がかりを与えられるというようなことでは役に立つかもしれないということです。見つけたものをいきなり仕事に生かすっていうのはありますけど、まずそれを楽しめる、何人かで楽しむとか、面白いのを見つけたよっていうことが共有できるような仕組みというのをつくっていこうということで、楽しむという軸を入れて。
そして「探す・楽しむ・活かす」ということで、だんだん生(活)かす、何らかの割と真面目な役にも立つよっていうようなことにしていこう。これがぐるぐる回るというのを目指そうじゃないかということで、検索機能を面白くするとか、楽しむっていうのを、模範演技をしてやろうというところで、ギャラリーっていうのを運営者側がいろんな専門家に頼んで、和食っていうテーマで一つギャラリーをつくってくださいとか、刀剣乱舞で刀剣がはやっているから、刀剣っていうのはこんなにいっぱい入っているんですよ、見つかるんですよっていうことで、ちょっとショーケースみたいなのをつくってくださいっていうようなことで、幾つか軸をつくってギャラリーをつくっています。
これは自分たちがギャラリーと同じものをつくることもできるように提供していますので、マイノートっていうので大体同じものをつくっていくっていうことはできますから、あ、こういうふうに集めていけばいいのかと。この、ここに集められている刀剣をネタにもっと文書のほうまで膨らましていこうというようなことで、江戸時代の和書をいっぱい集めていくなどということもできるように、こちらのほうではさらに活用できるものっていうのを提供しています。
1人で使って仲間にちょっと見せるぐらいはマイノートでできるのですけども、一般公開というのはなかなかできないので、グループの中であらかじめ決められたメンバーで共有するとか、あるいはそこに自分たちだったら見てもいいものを、ジャパンナレッジにはまだ入っていないけども、自分たちの研究の仲間では共有できるようなものを追加して、ラボのようなものをつくるというような仕組みも、プロジェクトといいますけど、提供しています。
従って、皆さんが何か課題をやったり、今後どうなのか分からないですが自分たちの周りでそういう活動されるときに、ジャパンサーチに入っているものは一部役に立つようなシチュエーションがありましたら、ぜひこの辺の機能を使ってみていただければと思います。
ちょっと書いてありますけどもこういう感じですね。つくった側のこだわりは、これはカワシマさんっていうNDLの、NDLに最近ハッカーがいるんですけど、ハッカーが何人もいるのですが、コンピューターのプロですけど、彼がつくったときのこだわりなのですが、検索窓を普通の窓で普通に引けば、普通に全部のものが引けるのですが、これを裏でチューンすることができて、あらかじめこのデータベースしか見ませんとか、ここに入れられたテキストはフィールドでいえばこの件名と何とかだけにぶち当てて引いてくださいとか、そういう検索のファセットといいますけど、ファセッティングをあらかじめフィルター条件みたいにして与えて。そうするとどんな文字を入れても結構ピンポイントでその分野だけの検索にできるというので、検索エンジンをカスタマイズするというようなことができるような感じになっているのもあります。これも別の方はこだわっているんですけど、画像検索ということで、アオキさんという方がこだわっていますけど、面白いものが見つかってくると。思いがけない、模様として似ている。土偶は土偶って大体名前がついているから面白くないですけど、形が似ているとか模様が似ているとか、そういうものが見つかってくると、なるほどと思うわけです。
ギャラリーもいろいろあります。少しこだわりはトリプルアイエフ(IIIF)に対応していて、これは画像公開のためのデファクトのようなものです。デファクトスタンダードのようなものになりつつありますけど、大きな画像をネットワーク越しに公開したり、利用したりするというとき、当然大分ネットが太くはなったものの、サーバー側にはかなりの負荷がかかるので、例えば高精細な画像を何十万点も公開していて、みんながそれをちらっと見るだけでも全体をダウンロードしなきゃいけないっていうふうになると、とてつもなくサーバーに負担がかかってうまく動かなくなるわけです。
ところがよく考えると高精細な画像を今こういうデジタルな環境で取り寄せて見るときっていうのは、いっときにはほんの一部分しか見ないわけですね。その画面の部分しか見えないわけだから。あるいは画面全体に絵全体がフィットするように見たい場合は、どちらかといえば高解像度の絵は必要ないわけです。このフィットするぐらいの解像度があれば十分ということを考えると、今ユーザーの環境が本当にどこをどのくらいの解像度で求めているのかっていうことのやり取りをして、その必要最小限のものだけを送り込むようにすれば、そんなにサーバーにも負荷がかからないし、見ている側もそんなに待つことはないということが起きますので、そこのルールをつくりましょうということです。
サーバーを、データを発信する人と、イメージサーバーといいますが、それから見る側、ビューアーといいますけど、ビューアーの技術と、これがうまくかみ合ったらうまくいくよということで、それを規格化といいますか、国際規格になっているわけではないのですけども、IIIFのコンソーシアムっていうところは世界中の主要なそういう発信者を仲間に入れて、ルールを決めている。みんなのフィードバックによって、それをどんどんリバイズしていくというようなことをやっています。これに準拠しておりますので、この辺の写真はズイズイってやると大きくなるようなものがかなり含まれています。
マイノート。こんなものですが、後でちょっと眺めておいていただければ、ちょっと使ってみようかなっていうふうに。これはちょっと申込みが必要のようですけど、あまりビジネスにすぐ役に立てるみたいな、商用が表に立っているとちょっと許諾を出しにくいですけども、学術的な興味でやられるというような活動であれば止めることはないと思われますので、ぜひ手続をしてご利用いただければと思います。
ですので、ジャパンサーチはデータベースやギャラリーっていうのは公開レベルに入っていて、プロジェクトはプライベートな空間で、これは参画、提案して利用しているメンバーだけで共有されていくというような形になります。実はこれ、海外の進んだ図書館などは大抵こういう仕組みを持っています。だから僕はスタンフォード大学の図書館っていうところに出入りしていますけども、そこなどは研究者がやっぱりプロジェクトをライブラリーに対して提案して、あ、いいですよっていうことになると、ライブラリー側に専門家、その分野の専門家はいっぱいああいう図書館だと雇っているんですけど、サブジェクトライブラリアンと呼ばれる専門家が担当となって、研究者の要望に合わせてどういうデータを集めてきたらいいかっていうことを考えて、こういうカスタムなデジタル利用環境をつくります。それはクローズドですので、公開だとなかなかできない権利上できないようなものも、クローズドだと相当できる範囲が広がりますから、そういう形で研究を進めるというので。この分野では必須の機能になっているということを聞いております。ですので、国会図書館でも少し試してみようということですね。
5.ジャパンサーチが⽬指すもの
最後にちょっと駆け足になりますが、ジャパンサーチのメタデータ連携と活用。メタデータを集めてきて引けるようにしますっていう話なんですけど、これ、提供者のところはさっきもちょっと言ったようにこだわりの項目がいっぱい入っているので、それを全部引けるようにするっていうのはなかなか大変です。かつ統一感もなくなっちゃうわけです。なのでジャパンサーチでは、大抵こういう類の項目はあるでしょうっていう共通項目ラベルっていうのだけ用意して、そこに、それはフィールドを指定して引ける。後のものは割とどれでも検索には多少利用しますけども、基本はそこのこだわりは引き継がないと。だけど、もともとのところにどういうふうに書いてあったかは調べようと思えば調べられる、見ようと思えば見られるという状況にしています。上の情報を使って検索とかマイノートとか、この辺はつくられます。下の情報、深い情報を使ってAPIを経由して深い情報を出そうと、取ろうと思えば取ることもできるというようなことにしています。
ここはAPIというのはプログラムで呼ぶこのサービスを、別のサービスから裏のシステムとして、裏のデータベースのようにして呼んで利用すると。検索をこっちのプログラムが検索して、結果をこっちのユーザーに返すというようなときに使うわけですけど、一ついろんなサービスをつくっていくコンポーネントとしてジャパンサーチを使うこともできるような形で工夫しています。
ここの共通ラベルに絞るっていうのは、次のページにたしかよく書いておきましたが、例えばAっていうデータベースはこんなフィールドになっている。Bっていうデータベースはちょっと取ってあるものが違うので、材質とか技法とか、ちょっとフィールドの名前も違う。これは作品名と言っているけど、本のほうは書名って言っているとか、作者と言っているがこっちは著者と言うとかって、そういうふうに名前の呼び方が違ったりするのですが、これも大体基本的にはこのタイトルとか作成者とかもう少し取ると思いますが、そういうところについては共通だねといって、こういう対応を取るわけですね。
で、ここの赤い部分だけを利用して、実際のサービスがつくられるという形にしています。マッピングといいますか、こういうふうに全部焼き直しちゃって、元のデータは全部潰してその他に入れるっていうのが、これは従来のマッピングの方法なんですけど、僕たちはこの必要そうなものをコピーして、デュープしてタイトル、作成者という情報もつくります。だけども大元の、これは実は作品名でしたとか、これは実は作者でしたっていう情報はそのまま保ち続けるというこだわりが。そうすると例えば映画だったりすると、映画の監督なのかラインディレクターなのか何とかなのかっていう貢献がいろいろ違いますので。原作者なのか。そういうようなものも、こちらの紫のところにはいっぱい書かれていて、それは映画を専門的に見ていくときには非常に重要な情報なので、それを捨てたりはしないということになります。
そういうのをユーザーが自分でこうやって登録するような仕組みをつくってあります。何かちょっと試したい方がおられたら、ぜひ問い合わせしてみてください。誰でも受け付けるっていうわけにはなっていないですけども、どういう形で整理したらいいかの参考の情報っていうのは少なくとも得られますし、それから適切なつなぎ役を紹介していたりして、接続につながっていくという感じです。
さっき言ったプログラマーがジャパンサーチをデータベースのようにして使うことができるよ、そういうAPIっていうのがありますけど、この仕組みを使って、これは実は僕が入っている5人、6人ぐらいのフラットなチームでつくったんですけど、カルチュラルジャパンっていうのを試しにつくってみました。ここにジャパンサーチっていうのが入っています。ジャパンサーチに入っているものを整理したやつが、このジャパンサーチRDFストアっていうのに入っています。これは外からたたいたら返事をしてくれるものですが、そういうものがあります。この後、時実さんが多分お話しするヨーロピアーナとかDPLAっていう、これはヨーロッパを束ねているもの、これは北米を束ねているものですけど、そういうものも同じようにAPIを提供しているので、そこからRDFストアっていうのをジャパンサーチと同じ乗りでつくることができます。同じ乗りでこうやってつくると、これはレジストリといいますか、データベースと呼んでもいいのですけども、いろんなクエリに答えてくれるデータの入れ物ができます。
これは皆さん知っている方はリンクトオープンデータ(Linked Open Data)とかRDFトリプルとか、そういう形で整理したもので、RDBと同じようなクエリを書いてここから取り出すことができるというような仕組みなんですけども、ここにまず入れます。そうするとこれとこれを合わせたものをデータとする新しいサービスをつくることができます。
これは僕らカルチュラルジャパンと、何かおこがましいですけど、文化的な日本の情報が入っていると。ここはビジュアルにこだわって、絵がきれいなものしか仲間に入れないということを僕たちがプライベートにやっている、プライベートにっておかしいね、ボランタリーにやっているプロジェクトなのでどういう制約も受けないということで、ちょっと勝手に取捨選択させてもらってサービスをしているというようなものになります。
ちょっとこのつくり方が実は自慢なのでこういう絵を描いてありますが、ヨーロピアーナの先にぶら下がっている3000館ぐらいものとかDPLAもかなりの館数がありますけど。あとはIIIF対応であれば個々の館がばらばらでも集めてくることはそんなに難しくないので、そういうメトロポリタンだとか、モマ(MoMA)とかブリティッシュミュージアム(British Museum)とかそういうところからも集めてここに投入しています。全部投入しちゃうと世界中のものを集めちゃうことになって無理なので、カルチュラルジャパンって切ったのは、ジャパンとかジャパニーズとかジャポネとか現地の言葉で引くと引っかかってくるような項目をここから取捨選択して集めてきて、これをつくったということになります。
これもこの辺をクリックすると実際のサービスに行って、結構面白いことができるという感じです。表示したもの、調べたものをいきなりミュージアムにするなどという仕組みもあって、ここのエクスポートってやってこの箱をクリックすると、今の検索結果が全部展示室に分かれて3Dのミュージアムができるっていう。
皆さん手元で動いているかちょっと分かりませんが、それで3Dでウオークスルーできるという、なかなかな活用といえば活用ができるようになっています。検索の結果のあれでもいいですし、自分で拾ったマイボックスっていうようなところにお気に入りを集めて、それをミュージアム仕立てで眺めるなんていうこともできるようになっています。ちょっと試していただければと思います。
最後、ジャパンサーチが目指すもので。時間になっちゃいましたね。一応、ジャパンサーチはサービスとしていろいろやっていくのだけども、そもそもどういうところを目指していくんだっけと。デジタルアーカイブっていうのをどう社会に位置づけて、僕たちの生活の中で当たり前のものにしていくのかっていうことをちょっと掲げて、5年間の戦略方針っていうような形で書き物をちょっと出しました。
ここで3つの価値が重要だと。デジタルアーカイブっていうのは、別にジャパンサーチに関わりがなくても、この3つの軸が重要だろう、価値が重要だろうということをちょっとうたいました。記録・記憶を継承していって、またその整理の仕方を新しく変えていくっていうようなことは当然重要だろうし、それからコミュニティーを支える共通知識基盤というのはそこから生まれてくるんじゃないか。これが今のキャンセルカルチャーですか、知らない間にある種の情報が全く見えなくなっているとか、それで利益が誘導されたり、僕たちの認識自身がコントロールされちゃうっていうようなことが起きつつあるわけですけど、デジタルアーカイブに価値があるとすると、もう何十年、百年前の情報が割と包み隠さず今は見えている。
それから今今(いまいま)の情報も、どうしてこの辺は欠落しているんだろう?っていうことにユーザーが気づいたりするというようなところまで行けば、こういう知識基盤は非常に重要だと。知識基盤自身がキャンセルカルチャーの総本山になってしまっては意味がないんですけど、そういうところ。こういうのもあって、みんなが草の根でつくること、つくったものが集まって全体ができるっていうことの価値っていうのがそこにあるんですけど。それからそういうものが新たな社会ネットワークの形成になると。個々でそれなりのこだわりで小さくつくっているものが、遠くのもの、同じようにつくられているものとジャパンサーチとかそういうサービスを通じて出会うことによって、お互いがお互いを知ることによって、実は違う立場があるとか、実は同じ立場で別のところで頑張っている人たちがいるとか、そういうところに気づいて新たな人と人のネットワーク、活動と活動のネットワークが生まれていくっていうところが価値なんじゃないかということで、この辺、ちょっと僕らがかなり議論したので熱いのですが、何でデジタルアーカイブなんかやるんだろう?っていうときには、少しこの辺に帰っていただければと思います。
これで終わるのですが、イサム・ノグチっていう人がこんな言葉を言っていて、ちょっと好きなんですけど。我々っていうのは、我々人間は僕たちが何をこれまで見て生きてきたかということの一つのランドスケープにすぎない。僕たち個々の人間は一人ずつが一つの景色だっていうことを言っているっていうのはなかなかいいかなというので、その景色が共通部分を持ったり、お互い同じものをいいねと思っているっていうような別の景色とつながっていったりするっていうのが重要かと思います。では時間が超過しましたけど、これで終わります。どうもありがとうございました。
(文責:久世)
世界のデジタルアーカイブの発展とその活用
東京大学大学院情報学環 時実象一氏
➝ プレゼン資料:世界のデジタルアーカイブの発展とその活用
内 容
デジタルアーカイブの種類っていうふうに考えていったときに、ここにあるようないろんなものがあるだろうと。書籍、文書、新聞それからテレビ・放送、映画、音楽・音声、舞台芸術、写真、それから美術品です。この辺が典型的な文化遺産なわけですけども。
それとかあとはウェブページ、ゲーム、ソフトウェア、その他というようなのがあるというふうに考えます。
ここでまずポータルサイトっていう、今日も今、高野先生にお話しいただいたジャパンサーチ、それからカルチュラルジャパン、こういうのはポータルサイトと呼ばれるものですけれども、世界的に有名なものとしてはヨーロピアーナとDPLAがあると。あるいは国立国会図書館でやっていただいている東日本大震災アーカイブというのがあると。
それと違ってデジタルアーカイブサイトっていっているのは、これは実際に物を集めているところです。ここではインターネットアーカイブとウィキペディアについてちょっとご紹介したいと思います。
1.書籍
本ですけれども、本のデジタル化っていうのは国立国会図書館さんが随分やっていて、今日はちょっと世界ということで国立国会図書館の話はちょっと割愛させていただいているのですけども、古いところでインターネットアーカイブというところが、2002年、今から20年前にミリオンブックプロジェクトというのを始めて、そこがこの本のデジタル化っていうことでは最初なのかなというふうに思います。
これはインドにこういう機械を切って、インドでやってもらったと。当時インドは正直言ってお給料が安かったものですから、インドでやるのがいいだろうというようなことで始めたというような話があります。これは自動的に本をめくるKirtasという装置なんですけれども、これと似たようなものは今でもありますけれども、結構いいお値段がして2000万円とか、こういうお値段がするとなかなか普及はしなかった。
それからこれはインターネットアーカイブって今でも基本的に使っている手めくりの、ですからちょっと分かるかと思いますけどV字型になっておりまして、上から本をガラス板で本を押さえて写真を撮るんですね。スキャナーって言っていますけど、実際は写真を撮影します。ですからカメラの解像度っていう関係もありまして、当時は300dpiが限度だったんですけど、今はもっとカメラが良くなっていますからもっときれいなのが撮れます。
こういうので図書館と今は協力しておりまして、これもちょっと2~3年前の数字なのでちょっと今は違っていますけども、特にボストンの公共図書館とはかなり一生懸命やっております。最近、中国とも協力して浙江大学で、やっている。
これはボストン図書館にある、スキャンをやっている様子。御覧のようにテントみたいなのを作って、その中で撮影をしているというものです。この集めた本をどうするかっていうと、実はオープンライブラリーっていう電子図書館をやっておりまして、この電子図書館は誰でも読めると。著作権が切れている本は誰でも読めると。これは国立国会図書館でもそうですけど、生きている本については、所蔵図書館のメンバー、図書館っていうのはみんな図書館のメンバーになれば本は読めるわけですよね。
それは日本でも同じですけども、同時に1名だけ読めるということなんですけれども、これは勝手に電子化しているものですから著作権侵害っていうことを訴えられておりまして、現在係争中ということです。これはオープンライブラリーの画像です。
日本で結構有名になったのはグーグルブックスっていう、ちょっと若い方は御存じないぐらいの話になっちゃったんですけど、グーグルがブックサーチというのを始めまして。これは図書館から本を借りて電子化していると。この進行状況っていうのは本当に何冊持っているかっていうのは、データがありませんで、2008年というもう大分前の数字になっているんですけども、その当時で700万冊あると。恐らく今は、1500万冊以上は電子化しているだろうと思っているんですけれども、グーグルっていうのはそもそもある意味じゃポータルですよね。自分でデータを持っていなくて、ほかの人のデータを検索できるっていう検索エンジンになるわけですけれども、自分でもデータを持とうということで始めたプロジェクトなんです。
これが2004年に始まってもう20年前になっちゃうのですけども、こういうアメリカとイギリスの主要な大学と提携して始めたということです。これも2005年に訴訟が起きていろいろあったわけです。
それでこれは最終的にはアメリカの裁判所で、要するにスキャンしてデジタル化して、それの一部分だけ、本当に、スニペットといいますけれども、短い文章を検索のために提供するっていうことは合法であると、フェアユースであるということで決着をしまして、これは今でもやっている。ただ、デジタル化のほうはいろんな事情でもう追加のデジタル化はやらないということになっております。
こういうデジタル化して検索に提供するのはいいっていうのは、日本の著作権制度も、数年、また福井先生からお話があると思いますけど、日本の著作権制度もそうなっておりまして、皆さん、デジタル化するのは何でも許諾を得なきゃいけないと思っていらっしゃるかもしれないけどそれは間違いで、デジタル化して検索に提供するのは勝手にやっていいんですよね。許諾を得ないでですね。アメリカでもそういう判決が出ているということです。
このグーグルブックスでデジタル化した書籍データをHathi Trustっていうところで管理しております。共同管理しています。CADAL(カダル)っていうのは先ほど言いました浙江大学でやっているプロジェクトで、杭州市で、ここでデジタル化を進めている。これは先ほど言いましたインターネットアーカイブが支援しているプロジェクトです。
2.写真
今、本の話をしましたけど、写真の話をしたいと思います。写真につきましてはどこのデジタルアーカイブに行っても写真はやたらいっぱいあるわけですから特に珍しいものではないのですけど、ここでは商業的に成功しているっていう上でゲッティイメージ(Getty Images)っていうのをご紹介したいと思います。
これは皆さんテレビなんかを見ていますと、テレビの、例えば有名人が死にましたと。すると写真のところ右下とか左下のところにゲッティイメージって書いてあるんですよ。気をつけてテレビを見ていてください。そうするとこれはゲッティイメージから写真を借りて使っているんですよね。これはもちろん有料で借りているわけですけど、ここで使う分には合法ですから、ものすごくたくさんの写真がありますので、マスコミはもうゲッティ様、ゲッティ様で、非常に多用されております。
これはゲッティのホームページですかね。いろんなスポーツの写真とか何でもあるというわけです。
あとは写真で有名なのはウィキメディア・コモンズっていうのがあって、これはウィキペディアに基本は掲載された画像を収録しているっていう考え方なんですけれども、必ずしもウィキペディアに載ってなくてもいいんですけれども、これのすごくいいところは、撮影者の情報と権利情報が明記してあって、これが自由に使えるというのが基本です。
ですから一番下に書いてありますデジタルアーカイブのバックアップとしても利用されているということで、日本でもいろんな方が使っています。これは岐阜女子大学の写真で、このウィキメディア・コモンズに載っている写真ですけど、右下に「CC BY-SA 3.0」って見えますかね。書いてあって、それで要するにCC BYですから誰でも使っていいっていうことで、これはMonamiさんという方が写真撮影した写真ということで、皆さん自由に使えるということであります。ここに書いてありますね。こんな感じで非常に安心して使える画像がありますので、便利なものです。
3.新聞
新聞の話をしたいと思います。新聞につきましては、日本については朝日新聞、毎日新聞、読売新聞、あるいは日経さんと皆さんアーカイブを持っていらっしゃるんですけども、アメリカではもっと古いところ、17世紀から新聞をアーカイブしています。アメリカという国は新聞ってすごく大事で、町ができると新聞ができるわけですよね。それで映画でなんか時々出ますけれども、自分たちの町の新聞っていうのをみんな持っていました。
持っていましたっていうのは、今、それがだんだん潰れちゃっていて、ちょっとこれは問題なんですけれども、そういうことで。その記事に何が載っているかというと、もちろん町の出来事が書いてあるんですけど、冠婚葬祭が載っているんですね。だから誰それが結婚しました、誰それが亡くなりましたっていうのが必ず載っているので、これが自分のルーツ探しに使えるということで、大変これ自身が商売になっているということですね。ここにありますように、これは比較的新しい1942年の新聞ですけれど、こういうふうに掲載されている名前で検索できるというようになっております。
イギリスでも新聞のアーカイブがありますけれども、イギリスの場合はこういう草の根の新聞もありますけれど、どちらかというとやっぱり重要なブリティッシュニュースペーパーなんかですと、主要な新聞って、イギリスも随分古いですから、ここあるように1600年からのアーカイブがあります。
こういうところで、例えばこれはオックスフォードガゼットっていう新聞ですけれども、これはちょっと時間がないのでちゃんと読めないですけどいろんな記事が載っておりまして、例えばこういうふうにこれは同じ新聞かな、切り裂きジャックっていうジャックザリッパーという有名な殺人鬼がいて、捕まらなかったわけですけれども、これの記事が載っております。当然ながら新聞に初めて出たときは切り裂きジャックっていう名前じゃなくて、ホワイトチャペルマーダーズ、ホワイトチャペルっていうところで殺されたのでそういう名前がつきました。
4.映画
映画の話。映画っていうのは古いものっていうのは全部テープ、フィルムで撮影していたわけですよね。これは幾つかのフィルムの種類があるんですけれども、物理的にやっぱり劣化するんですよね。こういうふうにぐしゃぐしゃになって縮んじゃっていると。ここまできちゃうとちょっともう見ることが困難ですよね。見ることができたものにつきましては、こういうスキャナーっていうのがあって、これでデジタル化できます。
これはみんぱく(国立民族学博物館)にある機械の写真を撮らせていただいたんですけど。ただ、撮っただけではなかなか汚いということで、画像修復とかカラーコレクション、こういうことをやることが望ましい。これは例えばデジタル修復版っていうのはテレビで時々やっておりますけども、“男はつらいよ”の下と上とを見ていただいて、ほぼ同じシーンなんですけれども、全然色の鮮明さが違うし、それから傷の修復はちょっとないですけど、これは色ですね。どちらかというと色の修復をやっていると。顔の色なんかも全然違いますよね。こういうことが、やっぱりやらないとなかなか商業用のものはできないので、大変手間がかかるということです。
こういう007とか、こういうもうかるものは皆さんやられますけど、なかなかもうからないものをやるのは大変ですよね、お金がかかるから。フィルムアーカイブっていうことについては、ヨーロッパのフィルムアーカイブをちょっといろいろ聞いたり、調査に行ったりしたのですけども、これはドイツのフィルムアーカイブで、これを見るとどこにもフィルムアーカイブって書いていないですけども、こういう倉庫が後ろにあって、前は家具屋さんなんですよね。家具屋さんの裏の倉庫を使っているとか、そういう。これはフランスのシネマテークフランセーズっていうのですけど、これ、は要塞の、フランスが第1次世界大戦の頃にいっぱい要塞を造っているんですよね。そういう要塞の地下っていうのは恒温恒湿、光が安定しているのでそういうところにフィルムを保存しているとかですね。こういうのが、ちょっとここは飛ばしますけど。
それでオーストリアのフィルムアーカイブというのがあるのですけども、ここはこういう地域のフィルムを集めて、それでデジタル化するというプロジェクトをやっておりまして、これは日本でも紹介されたので御覧になった方もいると思いますけど、ちょっと詳細は割愛しますけど、興味のある方はオーストリアのフィルムアーカイブということで検索していただくと文献、常石(史子)さんという方が書かれている文献があります。
5.テレビ
テレビなんですけれど、テレビのデジタルアーカイブとして割と有名なのは、アンダースタンディングナインイレブン(Understanding 9/11)っていうことで、ナインイレブンって言っても、これも若い方は御存じないと思うのですけども、2001年の9月11日にアメリカの世界貿易センタービルに飛行機が突っ込んだと。そのときの世界中のテレビを全部こうやって集めてデジタル化して、ここに保存しております。
ですからこんなフィルムですね。これはNHKのそのときのニュースがここに保存されているということで、飛行機がちょうど突っ込んだところの画像が、実際のこういうニュースの様子も見ることができます。その続きとして、インターネットアーカイブでは、このTVニュースアーカイブっていうのを今やっておりまして、これは2012年から、このナインイレブンからもう10年たっていますけども、主要なテレビのニュース番組をアーカイブしている。これはアメリカの著作権法で、アーカイブすることが、図書館なんかがアーカイブすることは合法ですので、これで全部保存している。
それからもう一つアメリカのテレビ番組については、各番組には聴覚障害者のための字幕情報をつけるということは、これも法律で決まっているので、それも一緒に入手して表示しているということであります。
そうしますと、これは例えばBBCニュースでジャパンランドスライド(Japan Landslide)。これは熱海の実は、あれは2年前かな、3年前かな、熱海の土石流のニュースで、BBCでこういうものが保存されておりますので、もちろん日本に関するテレビニュースはいっぱいありますので、大変調べると役に立ちます。
6.新型コロナ感染症 (COVID-19) 下の社会デジタルアーカイブ
最近、これはちょっと全然特殊なものなんですけれども、新型コロナ感染症っていうのはそろそろこう収束(終息)に向かっているというふうに言われていますけれども、これでデジタルアーカイブというのがあると。
これは実際ネットに載っているのを見ると、アメリカのが一番多いですけども、この辺がどういうお国柄なのかっていうところまでちょっと分析できていないのですけれども、かなりいろんなものがある。機関別に見ると、アメリカの場合は歴史協会っていうのがありまして、ヒストリーソサエティーみたいなのが各地域にあって、そういう地域がやっぱり新型コロナで皆さんロックダウンということで家から出られなくなってしまった。
そういう非常に特殊な状況ってやっぱり記録しなきゃいけないっていうことで、そういうことが始まったということです。いろんなのがありますけど、写真だったり、こういう自宅でこれはトランポリンをやっているんだか、トランポリンっぽいようなことをやっている写真とか、それとかマスクの写真とか、こういうもの。
あるいは体験記、実際に地域の方に書いていただいたこういうものは全部保存されております。それから家でこもってやることがないから、こんな絵を描きましたとか、そういうのも保存されているところがあります。これはなかなかやっぱり新型コロナという特殊な条件というものをデジタルアーカイブしようという試みですね。
7.ウェブサイト
それから非常に重要なのというのはウェブサイトで、ウェブサイトについては皆さん御存じだと思うのですけど、ウェイバックマシン(Wayback Machine)というのがありまして、ウェイバックマシンというのは、これはもともとこの空飛ぶロッキーっていう昔テレビ漫画があって、そこに出てくるこういうタイムマシンのことなんですね。それの名前を取っております。
インターネットっていうのはどのくらいで始まったかっていうことなんですけれども、大体1995年頃から商業利用が始まったということで、岐阜女子大学さんでも1998年頃からウェブサイトをつくっていると。インターネットを開始したって、ちょっと言葉はよくないですね。ウェブサイトを開始したと。これは岐阜女子大っていう上のほうに、ここのとこに、カーソルは見えるのかな、URLが入っていると思うのですけどgijodai.ac.jpで、これで検索しますとこういうふうに1998年からずっと保存されているということが分かります。これは保存されているもののうち、1998年12月12日のサイトと、こんな感じで保存されています。
あるいはこれが、これも同じ日かな。リンクで、あ、違いますね。1999年1月25日ですね。これでこういうふうに保存されています。これは世界中のウェブサイトがこういうふうに保存されているので、もう非常に貴重なリソースだということが言えます。
8.ゲーム
ゲーム。ゲームっていうのはなかなか保存が難しいのですけど、これはやっぱりインターネットアーカイブというところでアーケードゲームの保存をやっています。アーケードゲームっていっても、これも今は死後になっちゃっているわけですけれども、いわゆるゲームセンターというのが街角にあって、そういうところでゲーム機が置いてあって、そのゲーム機で流れていたゲームです。
100円を入れると何分間かゲームができると。こういうもので、これは有名なインベーダーゲームですけども、こういうものが実際に動く状態で保存されています。
以上がいろんな、このほかにもいろんなものがあって、さっきの舞台芸術とかいろんなものがありますけども、時間の関係でちょっと飛ばしたいと思います。
9.ネットワークポータル
(1)ヨーロピアーナ
それでネットワークポータルということについてお話ししたいと思いますけれども、先ほど高野先生からも何回も話がありましたけど、ヨーロピアーナというのがあります。これは欧州のデジタルアーカイブコレクション、例えば高野先生のカルチュラルジャパンの話でも出てきましたけども、欧州、アメリカも日本の文化資産っていうのをかなりいっぱい持っていらっしゃるんですね。博物館とか美術館で持っている。そういうものもデジタル化されているものがありますので、こんな感じで、これはUtamaroって書いてありますけど、歌麿の絵と、こういうものがデジタル化されて見ることができます。ここ、日本語が書いてありますのは、これはどこだったかな、National Library of Franceって書いてあります。フランスの国立図書館ですけれども、ここでは日本語のタイトルをつけていると。日本人もいるんでしょうかね。でも全部が全部ついているわけではなくて、ローマ字とか英語になっちゃっているものもあるというわけです。
これはどういうものかっていうと、そもそもデジタルアーカイブのネットワークで、ジャパンサーチのモデルとなったということで、そもそも欧州委員会というところが運営しております。欧州各国のコンテンツプロバイダーを結合。ヨーロッパの場合、もともと各国にコンテンツプロバイダーって、要するにデジタルアーカイブを提供する機関っていうのがある程度はあったわけです。
ただ、そういうところもまだ本格的にやっていない。これがどんどん統合しましょうということでいます。アグリゲーターっていうのはジャパンサーチではつなぎ役って言っていますけども、図書館とか美術館、博物館、文書館、こういうところがつなぎ役になってヨーロピアーナをつくると。この後で出てきますけど、アメリカのデジタル公共図書館、Digital Public Library of America、DPLA、こういうものとも連携しているということです。
このデータ提供者の分布っていうのを見てみますと、国別のアグリゲーターっていうののデータ数、これはメタデータ数になっております。ですから件数ですけど1200万と。それから館種別のアグリゲーターっていうのが900万。館種別っていうのは、例えばオランダの国立美術館、ライクスミュージアムって、ここなんかは自分で直接ヨーロピアーナにデータを提携しているのでこういうのが入ってる。
それからこのヨーロッパの場合はEUプロジェクトというのがあって、これは特徴的なんですけれども、EUで、ECでお金を出しているわけですよね。初めからデジタル化をやらないっていうことで、このヨーロピアーナを通じてお金を出している。
だからヨーロピアーナっていうのはある意味で、デジタルアーカイブの助成機関になっているんですよね。年間20億近いお金を持っていて、これをいろんなところにばらまくって言葉は悪いですけれども、配分して、それでデジタル化をやらせているという、こういうことがありますので、EUプロジェクトの件数が結構大きいというようなことであります。
データの種類としてはやっぱりイメージ、写真ですね。写真が圧倒的に多くて、それから文字、これは本です。新聞もあります。本とか新聞です。それからあとサウンド、ビデオ。これはちょっとデータが2015年で古いのですけれども、なかなかこの辺の新しい数字が手に入らなくてちょっと古い数字になっております。
国別ですが、これも2015年でちょっと古くて申し訳ないですけれども、フランス、ドイツ、スウェーデン、イタリアというのがあって、この大体EUを引っ張っているのはやっぱりフランスとドイツですからね。フランスとドイツが大変多いということです。
意外と少ないのはユナイテッドキングダムっていう真ん中の右のほうにありますけど、イギリスっていうのは今回EUから離脱しちゃいましたけども、なかなかやっぱり独自路線ということで、やや貢献が少ないということであります。やっぱりヨーロピアーナの特徴っていうのは、ヨーロッパのEUに加盟している、あるいは加盟していない国も含めて、ヨーロッパの非常に多くの国を網羅しておりますので、そこがやっぱり非常にダイバーシティーというか多様性を担保しているっていうことが一つはすごいのかなと思っています。
DPLAですけど、アメリカのデジタルアーカイブコレクションで、ちょっと数字が隠れちゃっていて申し訳ないですけど、そこの下に2200万と書いてありますが、これもちょっともう古くなった数字なんですけれども、ごめんなさい、ヨーロピアーナもDPLAもそうですけど、こういう数字ってなかなか難しくて、例えば時々ごみ掃除をやるんですよね。本当にどうでもいいっていったら言葉は悪いけど、非常に汚いデータなんかも紛れ込んでいますので、こういうのを捨てたりすると時々減ったりするんですよね。
だからこういう数字っていうのはあくまで目安として見ていただいて、また先ほどヨーロピアーナっていうのは4000万ぐらい、こっちは2000万ぐらいってちょっと少ないということが言えます。これもアメリカも先ほど言いましたように、大変日本の文化資産っていうのはありますし、これもたまたま歌麿ですけれどもこういうものを見ることができます。
(2)米国デジタル公共図書館(Digital Public Library of America)
これはDigital Public Library of Americaということでヨーロピアーナが非常に成功しているので、ぜひアメリカでもやりたいと。ただ、そのアメリカというのは特定の機関を除いて国っていうのがこういう文化事業に関与するっていう伝統がないんですよ。
確かに公文書館とか議会図書館とかありますけれども、例えば国立美術館っていうのはないんじゃないかな。あるかもしれないけど、そういうところはやっぱり違うんですよね。だからどうしたかっていうと、図書館なんかが話し合って、私たちでつくりましょうという、ある意味では草の根でつくったというところが大変違います。
したがって、これが2013年4月に始まって、2019年4月にはこういうふうにアメリカ中に広がったと。まだ一部参加していない国がある。これも2019年の数字ですけども、この後コロナになっちゃって、DPLAの総会っていうのがちょっとなくなっちゃったものですからその後の数字がちょっと手に入らないのですけれども、大体今はこんな状態になっています。
何を言いたかったかっていうと、ここで図書館の連合体ですから、基本的に国の支援っていうのはないわけです。図書館なんかは、会費を出しても知れているので、これは基本的にいろんなところの補助金を取って運営しています。
ですからちょっとヨーロピアーナと比べて財政的にはかなり苦しいっていうか、どうやって維持していくかっていう問題がある。もちろんスタッフもそんなに多くないというのですけども、一応かなりこう、システムとして確立している。
そういう意味では日本のモデル、ジャパンサーチっていうのは、これは完全に日本の国のお金でやっていますから大変ある意味じゃ安定している、財政的に安定しているっていうことでヨーロピアーナに近いというようなモデルになっています。
ちょっと特筆したのはウィキペディアとの連携ということで、ウィキペDPLAっていうのですけど、これはどういうのかというと、一つはDPLA、横浜っていうこれはウィキペディアの英語版ですけど、検索してみますとこういうふうにDPLAのリンクが出てくると。こういうような機能があります。
これはクロームの、グーグルクロームのアドオンみたいな形で実現できます。それからもう一つは、これをやりますと、ここをクリックしますと、この場合はニューヨークパブリックライブラリーのデジタルコレクションから横浜の横浜吉田町より馬車道を臨むという、こういう色つき写真ですね。カラー写真ではなくて後から色をつけた絵はがきですけど、こういうものを見ることができます。
(3)ジャパンサーチ
で、ジャパンサーチについてはもう既に詳しく説明がありましたのでこれは飛ばしますけど、連携機関とここにありますように、こういうようなところが現在協力関係を結んでいるということがホームページに掲載されていますので、見ていただければよろしいかと思います。
カルチュラルジャパンについても先ほどご紹介ありましたので先に行きたいと思います。
(4)東日本大震災アーカイブ (ひなぎく)
特にここでご紹介しておきたいのはポータルとしてテーマ別のポータルっていう、必ずしも多くないですけど、東日本大震災アーカイブ(ひなぎく)というのがあって、これは2011年3月11日ですか、ここに東日本大震災っていうのが発生したわけですけども、これをやっぱりデジタルアーカイブとして保存しましょうということで、いろいろ議論があって最終的に国立国会図書館が引き受けて総務省のプロジェクトということで始まったんですけど、国立国会図書館が引き受けて運営をしております。
ここにありますようにユーチューブとかそういうところにも全部リンクされていまして、これを見てもちょっと分かりにくいと思うんですけど、車が津波に流されたところですね。それを被災者の方が建物の屋上から何かからスマホで撮っているわけですよね。そういうものが記録されているというわけであります。ここにありますように、動画とかいろんな資料とか、それから写真とかが載っているというわけです。
(5)インターネットアーカイブ
ここでちょっと、これが少し実際にアーカイブをやっている機関の紹介ですけど、インターネットアーカイブにつきましては、さっきから何回も出ていますけども、もともとこれはアメリカのサンフランシスコにありまして、プレシディオというところに最初はあったんですよね。これは御覧のとおりゴールデンゲートブリッジが見えるすごく風光明媚な場所に、こんな感じですけども。ここにこういう建物があって、これがインターネットアーカイブの本部だったわけです。ここですとかなり小さいですから、20人、30人ぐらいいたらもう満杯というようなところでやっていた。
ここにあるのはただで場所を借りられたのでここに落ち着いたというわけであります。現在はここから車で20~30分でそんなに遠くないんですけど同じサンフランシスコの中でここが本部になっております。これはもともとアメリカのどっちかというと新興宗教の教会だったところを買って、それで本部にしています。こんな感じで皆さん仕事をしていると。これはどういうところかというと、まず非営利団体で、ブリュースター・ケールっていう人が創設した。
名前を読むとカールって読みたくなるんですけどケールというふうに呼んでおります。1996年にウェブサイトの収集を開始したということで、細かい経緯は書いてありませんけど、最近「カナダに支部(?)を」ってクエスチョンしているのはちょっと法的にはカナダに独立したインターネットアーカイブのブランチ機関っていうのをつくったわけですよね。
そこになぜつくったかっていうと、実はトランプが大統領になってもう6年になりますかね。6年前になったときに、もしかして言論統制が起きるかもしれないっていうことを非常にブリュースター・ケールが危惧しまして、やっぱり避難、バックアップをつくろうと。で、カナダにつくろうということで支部をつくるということを。こちらにはサンフランスコにある本部のデータをコピーして置いておくというようなことをやっております。
ここでやっている主なプロジェクトとしては、さっき言いましたウェイバックマシン、それからTVアーカイブ、それから書籍。この辺はもう既にご紹介いたしました。そのほか動画とか音声と画像、ソフトウェア。最後のソフトウェアも紹介されております。こういう多方面のものを、実際にコンテンツを集めて実際に保存しているというところが、これは博物館と一緒で、自分たちではインターネットアーカイブというのは図書館だというふうに言ってるわけですけれども、そういう機関であります。
(6)フィジカルアーカイブ
ちょっと一つだけご紹介しておきたいのは、フィジカルアーカイブというのがあって、これは本の電子化ってやっているわけですけども、この電子化した本っていうのはどうするかということです。
例えば先ほど紹介しましたアメリカの……、あれは細かく紹介していなくて、アメリカの議会図書館ですね。ライブラリー・オブ・コングレスでも新聞の電子化プロジェクトっていうのをやっているのですけども、ここでは実はもともとの新聞っていうのはもうないんですよ。それでマイクロ化しちゃって、マイクロフィルムにしたものがあると。それをデジタル化する。そうすると元のマイクロフィルム、あれはもともとの紙の新聞はどうするかっていうと大体捨てちゃうんですよね。
どこの図書館も、日本に限らず大変場所がないので、デジタル化するっていうのは書庫を整理するためにデジタル化するんだっていう考えもあるわけです。ちょっとそれはいかがなものかっていうのがこのフィジカルアーカイブの考えで、そういうものを集めて、もうとにかく捨てないで倉庫に保管しましょうと。
これはすぐに見るわけじゃないので、取りあえずとにかく保管しましょうということで、このフィジカルアーカイブというのを始める。
これはフィジカルアーカイブが始まったときのお披露目のときの写真ですけど、真ん中に立っている茶色いジャケットを着ているのはブリュースター・ケールです。後ろにあるすごいコンテナ、これが本を入れたコンテナなわけです。こんなコンテナで、この人が立っているのでサイズは分かりますけど、コンテナの中にこういうふうに段ボールをただ積んでいるわけですね。
この中に本が詰まっています。これ、めったに出すことはないわけですけど、取りあえず取っておこうと。こういうふうにラップをかけて、それから一応空調も入っておりますので恒温恒湿にして、それから虫が入らないようにして、それで保存しておく。各本については全部カタログしていますので、何かの拍子で例えばデジタル化したのにこのページ全部飛んでいるじゃないかと、これは非常に貴重な本でぜひ読みたいっていうことがあれば、ここから取り出してもう一回デジタル化すると。あるいはそういうことができるわけで、とにかく捨てないで、そういうのをやめましょうということでやっているわけです。
ブリュースター・ケールは、これは先ほどのプレシディオのところでお伝えしているんですけど、こういう人ですけれども、これはどういう人かというと、もともと人工知能といいますか知識データベースの開発者で、そこでいろいろやったものをアマゾンに売ったりして大分お金を稼いだんですね。そのお金をアメリカでは起業者っていうのはものすごくお金を稼ぐ、何億、何十億って稼げるわけですけども、そのお金を自分でリタイアして何かカリブ海か何か行ってやるっていうんじゃなくて、この人はインターネットアーカイブを始めたと。それで自分のお金で始めたというようなことであります。
(7)ウィキペディア
最後にウィキペディアの話をしたいと思います。ウィキペディアっていうのは皆さん誰でも御存じだと思いますけど、御覧のようにフリーエンサイクロペディア、フリーというのは無料だっていうことですね。お金の取られないエンサイクロペディアっていうことで、英語が620万件、これは1年ぐらい前の数字だと思うのですけど、日本語が120万件とこういうような数で、多いところでいうと日本は必ずしも上じゃないですけどトップ10には入っているのかなというふうに思います。
これはジミー・ウェルズっていう人が2001年に始めたものですけれども、ですからこれはもう20年以上ですね。もともとインターネット百科事典ということで、百科事典だから内容をやっぱり詳しくちゃんとチェックして載せるべきだっていうふうに誰でもそう思うわけです。だけど、そうすると記事が集まらないっていうか、やっぱりチェックに時間がかかるわけですよね。当たり前のことで。それをもうやめようと。要するにとにかく書いたものは全部公開して、それをみんなが訂正するような仕組みをつくった。
これがやっぱりインターネットの、一応クラウドという考えですけれども、誰でも訂正できるっていうところが大きかったですね。それで急激に記事が増加して現在に至っているということです。この絵はジミー・ウェルズですけども。先ほど言いましたようにウィキメディア・コモンズというのが姉妹プロジェクトとして、これはデジタルアーカイブの保管庫になっているということで、これはもう紹介いたしました。
(8)ウィキペディアタウン
ここでウィキペディアタウンについてちょっとご紹介したいと思いますけど、これは世界的なプロジェクトですけど、日本では結構盛んに行われています。これは地域の有志が集まって地域に関するウィキペディアの項目をつくる、あるいは項目を編集するということでイベントとして実施していると。これで集めた写真とかそういうデータをウィキメディア・コモンズに搭載して、これをギャラリーとして閲覧できるような仕組みになっています。
例えばこれは岐阜県岐阜市弥八町にある地蔵の弥八地蔵っていうんですけど、私がちょっと現物を見たことがないのですけども、こういうふうにページがある。このページはこのウィキペディアタウンっていうのでページを、ゼロからつくったのではないと思うのですけれども、編集している。ここに一番上にギャラリーがありますね。
こういう写真は新しく撮ったりして、それで編集すると。こういうことをやっているわけですね。これがその写真の一つですけれども、ここに、これはウィキメディア・コモンズに載っている写真ですので、右下に「CC 表示・継承 4.0」と書いてありますけれども、荒川宏さんという方が撮影して投稿しているわけです。
ですからこれはCC BYですので、自由に皆さん使うことができます。こういうふうにいろんなウィキペディアタウンがあって、これは函館市中央図書館のウィキペディアタウン、これは和束町っていうのですけど、どこだったかな。忘れちゃいましたけど、そういうのがある。ちょっと調べてみたんですけれども、このコロナの中でこういう人が集まるというのはなかなか難しいんじゃないかと思ったら、去年だけでもすごくたくさんやったんですね。ざっと50~60は、2022年の1年間だけれども日本中でこういうのが行われています。
そういうことでデジタルアーカイブというのはいろんな種類がありますよと。デジタルアーカイブのポータルサイトとか、その他のデジタルアーカイブにはこういうものがありますということをご紹介いたしました。 (文責:久世)
デジタルアーカイブと法制度の現在地点
骨董通り法律事務所パートナー弁護士 福井健策氏
➝ プレゼン資料:デジタルアーカイブと法制度の現在地点
内 容
1.デジタルアーカイブと著作権
「デジタルアーカイブと法制度の現在地点」ということで、法制度の中でも特にまずは大体権利のお話から始めることが多いですね。
この御覧いただいている表は、デジタルアーカイブに関わる、どんな作品利用も大体共通なんですけれども、著作権回りの権利を1枚の表にしたという比較的お値打ちなものなんですけども、大体いつもここからスタートすることにしています。もう見たことあるよという方もいらっしゃるかもしれませんが、まあ復習は何度してもいいものですので、お付き合いいただければというふうに思います。表をどういうふうに見るかというと、まず一番上のこの行を御覧ください。左から2番目です。著作権と書いてあって、いろんな文芸とか講演、映像などの要素があります。これが大体著作物の例になります。代表的な例ですね。例えば映像のアーカイブを行おうというときに、映像だって言っているだけだと、まだ権利のことっていうのは見えてこないわけです。それを要素ごとに分解する必要があります。例えば映像自体も1個の著作物ですけれども、そこには例えばシナリオがあるかもしれません。そうするとシナリオもその映像の中に要素として含まれておりますから、これも同じく著作物で著作権が働くよと。もしそこに原作があるなら、原作の文芸も著作物で著作権が働くし、映像音楽が使われているなら、この作詞作曲も著作権があるよということを意味しています。で、左側のこの列を御覧いただければなんですけれども、皆さんが行いたい利用が記載されています。例えばデジタルアーカイブにするときっていうのは、大体撮影をするとか、あるいはスキャンしてデジタル化するとか、それをサーバーに蓄積するというようなことをやるわけですが、これは全部複製です。それからデジタルアーカイブ公開を行うときには、例えばネットで人々が見られるようにする。これは広くネット配信というふうにくくっていまして、3つ下にありますね。あるいは会場に来れば、館に来ればスクリーン越しに見ることができるよっていう状態はこれ上映でして、上から2つ目のところに記載がされています。行いたい理由を決めて使いたい要素が決まりますと、その交点のところを御覧いただければなんですけれども、赤丸がついておりますね。これは何を意味するかというと、権利者に権利がある、つまり権利が働いているよと。よって、許可が要るよということを意味します。さすが著作権は権利の王様というだけあって、大体どの利用も全部権利者の許可がないとできない。だからデジタルアーカイブと言われるような行為は、原則としては許可が要るよというところからスタートになります。
これだけではまだないですね。著作物に当たらないような要素にも、別の権利が働くことがある。例えばもう一つ右側に移動していただくと、俳優・ダンサー・演奏家等というふうに括弧内に書いてあって、著作隣接権と一番上に書いてあるんですよね。これは俳優の演技とかダンサーのダンス、それ自体は著作物ではないけれども著作隣接権というちょっともうちょっと狭い権利があるよと。そして今日詳細は省きますけれども下を御覧いただくと、権利が働く場合があるよということで赤い三角が書いてあるんですね。だからやっぱりデジタル化をするとか、あるいはそれを配信するというときには、一定の場合を除いて許可が必要だと。これがなかなか大変で、映像作品なんかだと、これで一気に権利者の数が倍ぐらいに増えるわけですよね。さらに音源。レコードなどの、あるいはダウンロード音源でもいいんですけど、この音源には大体レコード会社が別な著作隣接権を持っています。原盤権とよく言われる音源の権利です。これもやっぱり丸印がデジタル化とネット配信のところに記載されていて、要するにデジタルアーカイブっていうのはかなり権利に関わる部分が多いなあということになる。で、この原則どおりにやっていると、世の中あまりうまく回らないことが多いわけですよね。よって例外規定というのが著作権法にはあって、今のどの権利についても共通なんですけれども、こういう場合には許可なく使っていいよ。こういう場合は権利者の許諾がなくても、連絡がつかなくても、場合によっては反対されていても使っていいよと、こういう例外規定が置かれています。これが緑字で一番右側に記載されているのですけれども、利用類型ごとに一番上にはどんな利用にもこういう場合は使えるよということで、写り込みと、今日詳細は話しませんけれども引用とか。皆さんにも身近な引用とかね。あとは建築物なんかだとかなり幅広に自由に使えるよっていう例外規定がありますので、こういうのは全部の利用に適用される例外規定。それに対して一つ、一番右を1つ下に下りますと、例えば私的複製という有名な例外がありまして、個人的に楽しんだり勉強するためだったらコピーは構わないよ、ダウンロードも構わないよという規定がある。これがあるから皆さん例えばホームページのプリントアウトとかができるんですね。あれって複製のうちですから、これがなければプリントアウト一つ自由にはできないということになるわけですけれども。この中に検索・解析用のアーカイブというのが書いてあって、これが非常に関わってくるので後でお話ししましょう。もう一つ下の非営利の上映なんて書いてありますから、例えば映画の非営利、入場無料の上映会なんかはこれがあるので自由に行えるという、そういう例外規定だったりします。この両方の組合せで著作権の問題というのは解消するというお話を今日の前半ではするのですけれども、赤字で書いてあるところ、つまり許可を取らなきゃいけないという原則の当てはまる部分はもちろん権利者を探し出して許可をもらう。これを許諾といいます。赤字で許諾と一番下に書いてありますね。一方でこういう場合は許可がなくてもできるよ、これが非許諾。緑字の非許諾。この両方をうまく使いこなしてデジタルアーカイブっていうのは何とか構築できる、また活用できるという場面が多いし、今は鍵になっているよというお話です。
2.所在検索サービス規定の射程
1つ先に行きましょう。この中の所在検索のためのアーカイブ化という気になる例外規定があって、これを少し紹介します。世の中にはもう膨大な作品があるわけです。そしてアーカイブっていうのは特に膨大な作品を扱うわけですけれども、この膨大な作品、世の中のどこに存在するかというのは簡単には分からないわけです。例えば書籍なんて世界中には過去1億冊以上の書籍、図書が出版されていると言われていますけれども、そのどれが一体どこに存在しているのか、どの図書館に行ったら見られるのか、どの本屋さんで売っているのかなどということは容易には分からない。我々は検索をする必要があるわけです。そこでこういう、ある情報とか作品を特定したり、その所在を調べるための所在検索サービス、これは著作権の心配はせずに行うことができます。それを行うためには特に全文検索と言われるものを行うためには、作品自体を全部デジタル化してアーカイブしておきたいわけですね。デジタル化してアーカイブしておかないと全文検索というのはなかなかできない。これをやっていいよという例外規定があります。検索サービスのために、例えば過去に出版されたどんな書籍でも、図書館から借りてこようが、あるいは購入してこようが、それをデジタル化して構いませんよ。データベースにして構いませんよ。で、ユーザーにそれを提供して、提供っていうのは検索のために提供して、ユーザーが検索して、あっ、その書籍はここにありますよという結果を得ることをやって構いませんよという規定です。これは書籍だけじゃありませんで、例えば映画だろうが音楽だろうが放送番組だろうが、どれでも行えます。ちなみにこの今、御覧いただいているイラストは文化庁の資料に載っているイラストで、文化庁自身がこういうもので自由に使ってくださいねということを発表しているわけです。ただ、これだけだと検索結果って、例えばタイトルが載っていて、いつ発行された書籍であるか、著者の名前等が出ている、いわゆるメタデータが出ている。メタデータは著作物ではないケースが大半ですから、こういうものを表示することはできるんだけど、これだけだと自分が探している本かどうかよく分からないっていう問題が生まれるわけですよね。例えば「福井健策」で全文検索すると、まあまあさすがに100冊以上多分ヒットするでしょう。もっとかもしれません、ヒットするでしょう。その中のどれが自分の探している本なのかって書籍名と著者名では分からないわけですよね。そこで、この著作権の例外規定は、抜粋の表示までしていいよというふうに言っています。抜粋。例えば福井健策が登場する箇所の前後2~3行の本文を表示していいよ。そんな大層な話じゃなくてグーグル検索なんかでふだんやっていることですけれどもね。この抜粋の2~3行っていうと、これは著作物の一部を映していることになりますから著作権の心配があるのですけれども、いや、それはやっていいよと。それどころかその書籍の場合には書影のサムネイルぐらいまでは映していいよと。これ、正面切って著作権法が認めたのは2018年の改正で初めてでありまして、まだほんの4年、施行からでいうと4年ちょっとしかたっていないわけですけれども、これ、大きいわけですね。これができると相当デジタルアーカイブというのは、権利処理なしにできるということが分かります。全文をデジタル化して、OCRをかけて、全文検索できるようにして、そして検索結果のメタデータとそれから一部の抜粋を表示することができるとなると、これはかなりいいねということになるわけです。つまり膨大な作品が流通する現代社会で、権利の壁というのはとっても高くて厚いわけですけれども、この権利の壁を乗り越えるための恐らく最重要の法改正が2018年、この今紹介している法改正ということになりそうです。誤解のないように言うと、全文読ませちゃ駄目なんですよ、デジタルで。検索結果が、はい、出ました。じゃあその書籍、全文読みましょうねって言って全文読ませちゃうと、これは無断ではできない。当たり前ですけど、それを無断でできるようだったら電子書籍サービスはみんな無断でできることになりますけど、そんなことはないわけで、それは許可を取らなきゃいけない。私の言っているのはメタデータと抜粋の表示まではできるよ、そのためのデジタルアーカイブ化、データベースづくりまではできるよという話でした。
3.非許諾/許諾モデルの活用:舞台映像、戯曲
これを組み合わせて、現にこの4年の間にいろんなデジタルアーカイブが動き始めています。まだ動き始めたというところですけどね。というのはこの制度はそこまで十分認知されていなかったりしますので、動き始めたところですが、例えば舞台映像とか戯曲、私自身も理事で加わっているのでこれをご紹介すると、EPAD(イーパッド)と言われる文化庁事業があります。文化庁から委託を受けて行っているのですけれども、これですと舞台映像ってやっぱり失われたり、散逸、忘却されやすいんですね。しばしばほこりをかぶっていたりするわけです。でもとても貴重な文化資源ですので、これをコロナ禍で危機にあえぐ舞台界から収集した。収集対価を払うわけですけれども、収集した。大体1300本ぐらい第1期で収集しました、1年間で。これを早稲田大学の演劇博物館さんにデジタルで納めて恒久保存していただく。そして利用者が今、左上で御覧いただいているようなページにアクセスをして、例えば作品名とか、あるいは何かキーワードで検索等を行うと、舞台映像、作品がヒットします。そしてメタデータ、誰が作、演出。出演者は一体誰なんだというようなメタデータが表示されて、さらにはサムネイル的な画像を見ることもできる。これ、許諾なしでやっています。そうでないと1300本の権利者を全部探し出して許可をもらうっていうのは、これはちょっと至難なんですね。舞台映像っていうのは非常に権利者が多いので。1年間で1300本の権利処理を行うっていうのは到底無理なんですけれども、ここまでは非許諾でできるから行えた。加えて非営利の上映はできますっていう話をさっきしましたよね。よって早稲田の演劇博物館さんに行くと館内で、これは予約制なんですけれども非営利の全部の閲覧を行うことができる。これは映像全体の閲覧です。ここまで非許諾でできる。これだけでもまあまあ、大変褒めていただいたんですけれども、加えて権利処理が可能なものを300本ほどピックアップしまして、弁護士などの専従チームが朝から晩まで権利処理をサポートして、そして権利処理が済んだものはユーネクストなどで商用配信しています。これは許諾です。権利者を探し出して許可をもらい、当然だけど対価を還元する。ユーネクストの商用配信で、まあ追加分は幾らでもないですけれども、チャリンチャリンとお金が権利者に落ちるようになっている。この部分は赤字で許諾なんですよね。つまり非許諾と許諾を組み合わせることで、こんなのを行えた。その後もおかげさまで事業としては継続しておりまして、現在第3期が終わりつつありますけれども、作品数も配信数もどんどん増えています。併せて、同じEPAD事業の一環として戯曲のデジタルアーカイブ化っていうのも行ったんですけども、これが下のほうなんですけどね。右下のところにあるのが、これが日本劇作家協会にさらに再委託して運営していただいている戯曲デジタルアーカイブ。ここでは553本の過去の日本を代表するような戯曲をデジタルアーカイブ化して、そして検索、それだけじゃなくて全文をダウンロード、無料でできるようにしています。御覧いただいているのは松尾スズキさんの傑作ミュージカル「キレイ」という作品ですけれども、とても人気のある作品ですけれども、このとおりPDFですけれども全文無料でダウンロードできるんです。何で全文無料でダウンロードさせるんだっていうと、この作品の詳細ページを開くと、作品詳細を表示っていうページを開くと、わあっとメタデータが出るんですけれども、その下に上演許諾の申込みはこちらというボタンがある。それをクリックしていただくと、劇作家協会に届きまして、上演許諾の取次ぎをしてくれる。これは有料なんです、恐らくは。もちろん作家さんの考え次第ですけれど。つまり劇作家は戯曲なんて書籍で売ったところでいくらも売れるもんじゃない。それよりもやっぱり上演してもらって何ぼだから、上演してもらうためには読んでもらわなきゃいけない。だから無料でダウンロードさせる。全国の中高生でも構わない。もちろん市民劇団でも構わない。読んで、自分もやりたいなと思ったらどうぞ上演許諾の申込みをしてください。それが値打ちであり、場合によってはそこで上演の許諾料はもらいましょうと。恐らくビジネス的には極めて正しい考え方ではないかなというふうに思いますけれども、こんなことをやっている。これは許諾です。全文ダウンロードですからね。こんなふうに非許諾と許諾の組合せによって行っているデジタルアーカイブ、少しずつ増えてきています。
4.変わる国会図書館とデジタルアーカイブ
さあ、このさっきの47条の5ですよね、所在検索サービスを活用している存在としては、当の国もありまして国会図書館ですね。これはやっぱり非常にこのところ調子がいいというか、積極的に取り組んでいらっしゃるなと思いますけれども、一番真ん中の映像が、お使いの方も多いと思いますが国会図書館のデジタルコレクションと言われる、彼らが過去の蔵書でデジタル化したものの検索サービスを提供している。これ、今年から全文検索が可能になったんですよね、OCRから。そうすると御覧いただいているのは、例えば『不思議の国のアリス』の昭和9年の翻訳版で、アリスの不思議な冒険譚っていう、なかなか実はこっちのほうが原題に近かったりするんですけども、翻訳タイトルがついていますけれども、こういうOCRをかけてあるものは全文検索が可能なんです。そうすると、例えばアリスインワンダーランドっていう言葉で検索をかける、あるいはアリスとウサギって言葉で検索をかけると、恐らく100冊以上わあっと出るでしょうけど、それだけだと分かりませんね。自分が探しているのはどれなんだ?って。でもさっき言ったとおり抜粋表示が可能ですから、国会図書館は既に抜粋表示をするようにしていますから、そうすると自分が探しているこれがアリスの本であるのかどうかということを探しやすい。その上で著作権が切れているこういう作品だと、インターネットで全文を読ませる。物によっては全国の図書館等に行くと見ることができる。物によっては館内閲覧だけはすぐできるというふうに使い分けていますけれども、少なくとも全文検索はどんな本についても可能にしているわけです、可能な取組を始めているわけです。これはさっきの47条の5、所在検索サービスなわけですけれども、実を言うとインターネットで全部を読めるのは、そういう著作権が切れた古い作品だけではありません。例えば向かって右側ですね。これはディケンズの『クリスマス・キャロル』なんですけれども、村山英太郎さんの訳で1967年版なんです。これ著作権は、ディケンズはとっくに切れていますけど、村山さんの翻訳は切れていないです。だから著作権の切れた、いわゆるパブリックドメイン、PD作品じゃないんです。じゃあ何で国会図書館はこれを全文をみんなに読ませることができるんだ。全部権利処理、権利者の許可を取っているのかっていったら、そんなことは国会図書館にはできません。じゃああれか、著作権侵害をしているのか。全文を読ませちゃいけないってことを知らないのかっていうとそうではなくて、これはもう一つのさらに最近の著作権法の改正、2021年の著作権法の改正によって、市場で流通していない絶版などの書籍に関しては、もう個人向けで全文送信してよいという例外規定が新たに入ったんです。直近ほやほやの2021年改正。施行は昨年夏前。えっ、岩波少年文庫の『クリスマス・キャロル』は絶版じゃないだろう?と思うわけですけれども、これはもう新訳に変わっているんですよね。ですから村山英太郎訳は既に絶版であると。入手困難であるということで、このとおり全文が読めるようになっている。そうすると、懐かしくていいですよね。私が少年時代は図書室、図書館なんかに行きますと、岩波少年文庫と言えばこの表紙でした。今の表紙も好きですけど、まあこれも懐かしいなとか思いながら中を全文読むことができる。そのほかに書籍だけじゃなくて、このNDLイメージバンクという左下のものなんかは、古い時代の着物とか、あるいは紙の図版ですよね。こういうもので著作権が切れているものは皆さんどうぞ自由にダウンロードして、例えばブックカバーでも何でも自由に使ってくださいっていうことで国会図書館は公開しています。かなりデジタルアーカイブとしては、使ってもらうアーカイブっていうことに踏み出してきていますよね。
5.著作権の潮流:許諾利用+非許諾利用
ということで最近非常にネットの人気者になっている国会図書館さんの紹介でしたけれども、こんなふうに著作権の潮流をちょっとまとめますと、許諾利用と非許諾利用の組合せということでさらに激増した作品、そして激増した利活用の方法に対応するために、権利の問題をいかにスムーズに処理するかというところに今はフォーカスが当たっています。国も完全に、政府もその方針です。例えば御覧いただいているのは非許諾利用。緑字は非許諾利用でどう充実化させてきたか。21年に本格稼働した非営利の全国の教育機関でのオンライン講義のある意味での自由化、それから今ご紹介した国会図書館での絶版などの資料の個人向けの送信、さらに今年度稼働する予定の非常に大きい改正としては、国会図書館に限らず全国の図書館や博物館などでは、いわゆる資料の複写というものをやっておりますよね、資料の複写サービス。あれは従来は紙でもらうのがほとんどだったわけです。全体の半分以下ですね。ところが遠隔の方、これは郵送してもらうことは従来できていたんですけれども、いや、こんな時代だからメール送信をお願いできると便利だなと、利用者として。それ、できるという法改正を21年にしまして、関係者間協議を経て、今年の6月に稼働の予定です。これからは国会図書館に限らず図書館や博物館などにアクセスをして、この本の資料をメール送信してくださいとお願いすると、コピーをメール送信してくれるということになります。これ、特徴はというと、さっきの絶版等っていうような、絶版などというような条件がついていないので、例えば新刊本でも理論上できます。通常の資料複写がメール送信に変わるわけです。いや当たり前でしょ、この時代だからと思われる方もいるかもしれないが、作家や出版社からするとこれはかなり思い切った改定でして、なぜならばメール送信するっていうことはデジタル化されているってことです。電子書籍サービスと限りなく近似してくるんですよ。全体の半分かもしれないけども、言ってみれば電子書籍的なものが送られてきちゃうわけですから。ということで、これは無料ではありません。利用者は出版社や作家が電子書籍を無料で読まれたとしても損失がない程度の手数料を支払うことが想定されています。また全体の半分までです、恐らくね。この全体の半分っていうことについては、現時点では恐らくと申し上げておきますけれども、こんなサービスも始まるということで、非許諾でできることってどんどん拡充しています。で、恐らくですけれども非許諾での大幅な拡充はもうそろそろ打ち止めです。まだちょっとずつはやるでしょうけども、大幅なものっていうのはそろそろ多分打ち止めで、もうここから先は赤の許諾のところをもっと便利にしていくしか恐らくは突破できない。なぜなら国際条約がありますからね。著作権ってそんなに一国の意思だけでどんどんどんどん自由化できない。国際条約でかなりきつく縛られているので、ここから先は許諾を取りやすくする方向の改正を進めていくんだろうなということで、今年というか今年度か、私も委員で加わりましてずっと文化審議会ではこの議論をしていました。権利者を探しやすくするために権利情報のデータベースを分野横断で充実させていこう。そのために民間を支援しよう。それからジャスラック的な権利の集中管理をもっと促進しよう。ジャスラック的っていうと皆さんはちょっと不安な気持ちになる方もいるかもしれないですけども、やっぱり便利は便利なんです。ワンストップで権利の許可が取れますから。ということで、他の分野でもそうした集中管理をできる限り進めていこう、その後押しをしようじゃないか。さらには権利処理をしたい、権利者を探したいという利用者側は、大体権利のことはあまり詳しくないですよね。そうすると利用者のサポートがもっと要るだろうということで、一元的な利用窓口というものを立ち上げまして、権利者とのつなぎをしてあげよう。権利者探しの手伝いをするような利用窓口を公的支援でつくろうと。その上で、なお権利者が不明であるとか、あるいは連絡をしてもいつまでたっても返事がないとかいうような場合には、時限的な利用を可能にしよう。これはかなりデジタルアーカイブにとっても恐らく重要な規定になるでしょう。この時限利用の可能化の部分は、考えようによっては緑字とも言えるかもしれませんね。結局、許諾が取れない場合のことですから。いずれにしてもこういうことを行って、許諾利用ももっと便利に取れるようにしようというわけです。こうすることによって権利者とそれから利用したい側がうまくマッチングされて、デジタルライセンス市場をつくり上げていこうよというようなことを話し合い、また進めているところです。これは間もなく、現在開かれている通常国会で法案が恐らく審議されると思いますので、皆さんも注目いただければというふうに思います。
さあ、こうした権利の壁、これを取り払うための努力というのは政府、また著作権だけとは限りませんで、これから後半に入っていくのですけれども、肖像権。これは皆さんも聞かれたことがきっとおありだと思うのですけど、人の肖像が写り(映り)込んでいる資料、写真とか映像とかやっぱりすごく悩ましいんですよね。著作権だけの問題じゃない、この肖像権というものが写っている人にはあるだろう。これは考えようによっては著作権以上に厄介なんですよ。何でかというと、著作権というのは著作権法という法律があるわけです。曲がりなりにも法律がありますから、そこにこうどういう場合に権利が働くかとか、どういう場合に例外的に許可なく使えるかというようなことは全部書かれているんですよ。読むのは大変、理解するのはもっと大変だけど、でも書かれているわけです。例えば権利っていうのはどういう順番で考えるかっていう、ちょっと皆さんの復習代わりにフローチャートを書いてみたんですけど。これはどんな権利にでも及ぶ考え方なんだけど、特に著作権をここでは例に取りましょう。何で著作権の知識を、権利の知識を身につけるかっていえば、要するにどういう場合は許可がないと使えなくて、どういう場合は許可がなくても使えるかということを仕分けるためです。だから許可がなくても使えるなっていうならデジタルアーカイブにも活用しやすい。許可がないと使えないんだなっていうなら許可を取りに行くしというわけです。この検討のスタートは、1番辺りから考え始めるのが多いでしょう。つまり自分が今行いたい利用というのは、著作権なら著作権が及ぶ利用なのかな。私は人の作品からアイデアを得たいと思っています。そのアイデアに基づいて私自身が創作したいと思っていますっていうなら、アイデアに著作権は及びませんから、これは著作権の及ぶ利用じゃないんですよね。よってノーに行きます。そうしたら利用可能です。いや、私は書籍をデジタル化してアップロードしたいんですっていうと、これは当然権利が及びますのでイエスです。著作権に及びますからね。次に、その利用を許す例外規定はあるか。私は文芸評論をやっておりまして、その評論を自分の名前で発表するんですけど、その中で対象となっている文芸作品を、必要な箇所を引用で使いたいんです。そうしたら引用の例外規定がある。じゃあ条件をうまく満たせば利用可能になる。私はみんなに小説全部を読んでもらいたいんです、大好きだからっていうと、そんな例外規定はありませんのでノーに行きます。一般個人にはそんな例外規定はありませんのでノーに行きます。で、権利は続いていますか、パブリックドメインですかっていうのは次の問いです。紫式部という方でっていうと、もちろんそれは権利が切れているわけだから利用可能ですっていうか、そういう場合はそもそも3番から考えりゃいいだろうなと思いますけれども。村上春樹さんとおっしゃいますっていうと、もちろんイエスです。じゃあ権利者、管理者と連絡できますか。連絡できて条件協議はできますかっていうほうに行くわけですけれども、権利者が見つからないケースがあるんですよね。権利者が見つからない場合は、著作権の分野では従来は文化庁の利用裁定、さらには今現在検討している新制度によって使えるケースが出てくるでしょう。いやいや、ノーですと。権利者と連絡がついてはっきりノーって言われましたっていう場合、プロジェクトの見直しを検討するかなっていうような、そういうフローチャートで普通考える。著作権だとこれで結構いけるんです。
6.権利の考え方と「肖像権」
ところが肖像権です。肖像権法っていう法律はないんですね。あれは判例で、裁判の中でちょっとずつ認められてきた権利です。だからすごく曖昧なんです。すごく曖昧。最高裁が一番権威のある2005年の判決の中で言ったのは、それはね、肖像がちょっとでも写ったら使えないっていう誤解が世の中にあるようだけども、そうではないんだ。これは程度問題なんだっていうことを言っています。社会生活を営んでいる以上は、自分の肖像がそれは人目に触れることはあるでしょう。ある程度は我慢しなさい。しかし、いろんな要素を総合的に考慮して、一般的な我慢の限界を超えたら、これは受忍限度っていうのですけど、一般的な受忍限度を超えたらそれは肖像権侵害だよって言った。総合考慮による程度問題だよって言った。それはそうかもしれないけれども厄介ですよね。だって何百枚、何千枚っていう人の肖像が写っている写真をデジタルアーカイブにしようっていうときに、毎回毎回総合考慮できますか?ということで、このフローチャートに当てはめると肖像権っていうのは結構厄介なんです。つまり曖昧なんです。権利が及ぶ利用かどうかも総合考慮しないと分からないから曖昧なんです。それから権利が存続中かどうかも曖昧なんです。死亡と同時に肖像権は消滅するっていう意見が強いのですけれども、でも遺族の権利もある程度は守られるという裁判例もかつてはあって、よって死亡と同時にじゃあどこまで権利が弱くなるのかとかちょっと曖昧なんです。さらに権利者不明。アーカイブで使う肖像写真なんかでいうと、誰が写っているかよく分からないケースが多いので権利者不明なのですけれども、そういう場合に利用できる制度なんか存在しないです、法律がないですから。ということで、この厄介な肖像権。場合によっては著作権以上に厄介なもの。じゃあ肖像権法ができるのを待てるかっていうと、多分あと10年待ってもできないと思います。すごく人格権で深く関わりますからね。仮につくるとしたら、がっちがちのものができて、むしろ現場では使えないっていう結論を裏打ちするための法律だったらできるかもしれませんけれども、多分10年待ってもできない。
7.肖像権の指針を持つ試み
そこでデジタルアーカイブ学会、私も理事を務めておりますし、今日登壇の高野先生や時実先生も皆さん理事で、いつもご一緒に活動していますけれども、このデジタルアーカイブ学会の法制度部会というところでは民間ガイドラインをつくっていました。これが何度も何度も公開の会議を繰り返しまして皆さんの意見を取り入れながら、また同時に過去肖像権に関する裁判例って何十とあるんですけど、それを全部解析しました。総合考慮っていうけれども、一体どういう属性をその肖像写真が持っているときに肖像権侵害に当たりやすいんだよ。あるいはどういう属性を持っているときには肖像権侵害に当たりにくいんだよということを定型化・パターン化してみた。で、ポイント制にしてみた。ざっくりとしたことを言うと、例えば被写体の地位、写されている人の地位が公的人物、政治家などの場合には通常肖像権侵害に当たりにくいんです。パブリックフィギュア論ですね。よって、例えばそれにはマイナス10点をつける、ここでは点数は紹介しませんけど、ガイドライン、デジタルアーカイブ学会のホームページで公開されていますので御覧いただければもっとずっと詳しい説明が出ていますけれども、例えばマイナス10点がつく。マイナスになるんです。それに対して未成年、これは要保護性が高いからプラス10点などのプラス点がつくんです。さらには2番、何をやっているところを撮られた写真ですか。公開の行事だったら、それは肖像権侵害になりにくいからマイナスなんです。被災時、負傷時、病気療養時あるいは水着など高露出度のときには、それは肖像権侵害になりやすいからプラス点なんです。どこで撮った写真ですか。例えば道路とか公園みたいな公共空間ですっていうと、これは肖像権侵害になりにくいんです、過去の裁判例からすると。だからマイナス点。それに対して閉鎖的な空間、病院や店舗あるいは避難所、あるいは私的な空間、自宅などの場合だと肖像権侵害になりやすいのでプラス点。どうやって撮られたものですか、4番。撮影については黙示の同意がある。公開についてまで同意したかはよく分からないけど、撮影についてはこの写真から見て明らかに同意がある。なぜならば写真に向かってこうやっているから。これは撮影はどうやら了承しているねと。そうするとやっぱり肖像権侵害になりにくいのでマイナス点。逆に隠し撮りだったらプラス点になりやすい。群衆の中の顔はマイナス点。逆に大写しだったらプラス点。肖像権侵害になりやすい。長時間が経過したものはマイナス点。経過すればするほど恐らくマイナス点。利用の目的が報道とか研究とか教育とか学術的なアーカイブだっていうならマイナス点、なりにくい。商用。商用で利用しますよと、フォトストックですよなんていうとプラス点。というわけで、これらそれぞれポイントにも重みづけがされているんですけど、それを写真ごとに加算減算して、何点以上だったらじゃあマスキングなしの公開オーケーねというようなことを民間ガイドラインで提示しているというわけです。おかげさまで大分利用の場面が広がってまいりまして、アーカイブ機関だけじゃなくてメディアでかなり利用いただいているみたいです。一応ユースケースとしては非営利のデジタルアーカイブでの写真利用っていうふうに想定はしているのですけれども、確かに応用はほかのジャンルでも利きますから、新聞とかテレビ局さんなんかで割と検討の指針として使っていただいているというお話を当の団体から教えていただいたりしています。ありがたいことだなと思ったりしています。
さあ、こんなふうな民間の指針、これをさらに法制度、権利はおろか法制度も越えて広くデジタルアーカイブ全体の羅針盤をつくれないかという試みをデジタルアーカイブ学会では昨年から議論しています。これは時間があったら少し今の肖像権ガイドラインの実地をやってみたいと思ったんですけどちょっと恐らくスキップと書いてあるとおり、時間の関係でもし最後余ったら戻ってくるかな、にさせてください。
8.デジタルアーカイブ憲章の提案
デジタルアーカイブ全体の指針の話に行きます。デジタルアーカイブには基本法がありません、御存じのとおり。博物館法にデジタルアーカイブという規定がやっと1文が入ったっていう段階です。そこで我々は全体の羅針盤になるようなデジタルアーカイブ憲章をつくれないかということをやはり法制度部会、そして理事会などの協力でつくり上げておりました。現在、3回のやはりオープンな公開の円卓会議を開きまして、各界を代表するような方々にご意見を頂きながら改定案をその都度公表するということをやっておりまして、現在第3回の会議終了後の改定案がアップロード準備中ですけども、これもリンクのところを御覧いただければと思いますけれども。全文ありまして、この憲章はデジタルアーカイブが社会にもたらしつつある変革が何を可能にするのか、またそのリスクはどこにあるか、そして21世紀のデジタルアーカイブが目指すべき理想の姿を提示した上で、その価値の浸透や実現に向けて私たちデジタルアーカイブ関係者が行うべきことを宣言するものである。私たちという主語は、デジタルアーカイブ関係者にしております。まだあるんですよ。前文が、吉見俊哉会長が元の原案を書いてくださった前文というのがありまして、そこでは公共的な知識基盤が今の我々の社会にはかつてないほど必要だよ。そして社会にとっては忘れられる権利ということも個人にとっては大事かもしれないが、社会にとっては記憶する権利も時に重要なんだよというようなことが記載されています。さらにデジタルアーカイブは一体何を目的とすべきなのか。人々の様々な活動の基盤、知識基盤を提示する。このこと自体も大きな目的である。さらにはあらゆる人々が障害なく情報にアクセスできるアクセス保障、情報保障ということも重要だ。文化の面で、それから学習にとっても、経済活動にとっても、研究開発にとっても、防災にとっても、そして国際化にとってもアーカイブというのは資するものであり目的とすべきものだろう、全体ではね。その上で行動指針。こうしたデジタルアーカイブつくりに、またその設計には多くの人々のオープンな参加を求めていくべきである。さらにデジタルアーカイブを支える社会制度を整備していくべきだ。先ほどのような議論ですね。さらにデータの信頼性を確保するため、デジタルアーカイブというのは設計していくべきだ。体系性の確保。恒常性の保障。ユニバーサル化。さっきのアクセス保障につながる行動指針ですね。様々な民間あるいは公的なネットワークの構築。活用の促進。そして人材の養成などなどの行動指針がそこでは記載されています。そしてこれを3年ごとに、デジタルアーカイブ憲章も見直し、またこれに即した政策提言を公表していくということまで記載されています。現在、次なるシンポジウムを恐らく3月14日に次なるデジタルアーカイブ憲章のシンポジウムを御茶ノ水ソラシティという会場で行います。ネット配信もしたいと思っておりまして、今回の登壇者が憲法学者の宍戸常寿東大教授、劇作家の平田オリザさん、シンガーソングライター、島唄の宮沢和史さん。彼は島唄の保存プロジェクトをやっていらっしゃいますね。それからクリエイティブ・コモンズ・ジャパンの常務理事で弁護士の野口祐子さん。それから私、などなどが加わりましてシンポジウムを行いますので、ご興味があればぜひ御覧いただければというふうに思います。もちろん吉見会長も参加されます。
9.デジタルアーカイブ政策提言
さあ政策提言を3年ごとに公表するというので、あんまり文字ばっかり多いスライドを御覧いただくのも気が引けるのですが、もう一つ御覧いただきましょう。政策提言、先ほどの権利に限らず法制度というものとして、あるいは国の政策として、こういうことをデジタルアーカイブの振興のために行うべきじゃないんですかというものをデジタルアーカイブ学会内での特別委員会、さらには理事会での議論を経て、理事会承認を経て、こういう提言を行っているところです。「デジタル温故知新社会に向けた政策提言2022年」ということで、かなり気宇壮大なことも述べていますけれども、政府には相当に強く今働きかけも行っているところです。政府内にデジタルアーカイブ推進会議を立ち上げてくださいと。現在は高野先生が座長のデジタルアーカイブジャパン実務者協議会及び委員会が存在していますけれども、もっと幅広にあらゆる関係者を集めたデジタルアーカイブの推進会議が現在政府にないのが問題であると。これを立ち上げてください。さらに各地域のアーカイブは非常に様々な課題に直面して苦労していらっしゃる。これをサポートできるようなデジタルアーカイブ支援のためのサポートセンターを各都道府県に設置してください。そしてデジタルアーカイブの基本法がないのが問題なんだから、デジタルアーカイブ憲章なども参考に、デジタルアーカイブ振興法の制定を行ってください。公的助成や公的資金によって生じた情報はオープンデータ化を図るべきじゃないでしょうか。また国内でも様々な障害を持っている方、あるいは海外で日本語の読み書きに課題のある方のために、様々な言語での翻訳字幕や音声読み上げなどのユニバーサル化の支援を政府としてもっと行ってください。デジタルキュレーションのための教育プログラムが不足しています。パイロット的な教育プログラムを幾つかの教育機関で立ち上げてください。デジタルアーキビストなどの必要な人材の採用、育成、これまで井上(透)先生などが牽引していらっしゃったわけですけれども、この人材の育成等をもっと政府は支援してください。井上先生はもちろんですが、岐阜女子大の皆さん等が牽引していらっしゃったわけですけれども、もっと政府が支援してください。それから膨大なアウトオブコマース著作物、つまり市場で流通していない作品について活用促進の制度、今現在さらに議論しているわけですけれども、これを必ずつくってください。それからさっきの国会図書館からの絶版等資料の個人向け配信、これは現在漫画と雑誌が除かれている。それから書籍以外の資料は除かれているなどの事情がありますけど、この部分をもっと拡充できませんか。さらに言うと国立映画アーカイブとか他の国立機関にも拡充できませんかというようなことを提言しています。1つ飛ばして、デジタルアーカイブ関連の研究開発ですね。これはEUなんかだと本当に高額の研究資金をデジタルアーカイブ関連の研究、カルチュラルヘリテージなどに支援を行っていますけれども、日本はまだまだ不足している。デジタルアーカイブに特化した研究開発にもっと支援を行ってください。それからヨーロピアーナやユネスコの文化遺産保全など、時実先生の紹介があったところですけれども、国際的な諸活動ともっと連携を図る、そのサポートもしてくださいというようなことを政策としては提言しています。こんなふうに法制度の議論から民間のガイドラインに至るまで、官民あるいは地域、あるいはジャンルの横断した連携、これを進めることで課題を解決していこう。そんなことを考えてデジタルアーカイブ学会では幾つもの活動を展開しておりますし、また政府もかなりそれには呼応してくださっている現状はあるかなというふうに思うところです。
本日はデジタルアーカイブの法制度の現在地点ということで、まずは権利の壁、そして最近の法改正でどこまで可能になったのか、肖像権の壁を越えるための民間ガイドライン、さらにはデジタルアーカイブの羅針盤をつくる試み、政策提言などを紹介いたしました。皆さんの活動の少しでもご参考になれば大変幸いに思います。(文責:久世)
資 料
1.ポスター
2.市町村長依頼文
3.高等学校依頼文
4.DAin岐阜企画書
5.デジタルアーカイブ資格について