2016年10月19日

お客様事例紹介: 横浜開港資料館 画像検索システム 開発と改修(2014/2015年度)

力武健次技術士事務所では、2014年度、2015年度の2年度にわたり、横浜開港資料館様の閲覧室にある画像検索システムの開発と改修作業を、有限会社ネクスト・ファウンデーション様のご依頼により実施致しました。詳細は横浜開港資料館様のえつらん室News(2015年5月9日の記事)にて、ご紹介いただいております。

この開発と改修作業にあたり、技術的に留意した点は以下の通りです。

  • HTML5+CSS3+各種JavaScriptツールを使いWebサイトとしてシステムを全面的に書き換えることにより、各種ブラウザに対する互換性の提供と、将来にわたってコンテンツの可用性を維持することが可能になりました。
  • 静的サイト生成を行うことで、現在の利用形態だけでなく、他の利用形態でも使えるように設計をしています。
  • UIの設計にあたっては、できるだけ簡素で、かつ利便性の高いものであることを目指しました。

横浜開港資料館様は横浜市中区のみなとみらい線日本大通り駅に位置する歴史的にも由緒ある建物で、横浜のみならず日本の歴史を知る上で貴重な資料を多数展示されています。閲覧室の画像検索システムはどなたでも利用できます。ぜひ一度ごらんになっていただければ幸いです。

力武健次技術士事務所では、お客様からのWebサイト制作のご依頼にあたっては、今後も可能な限りシンプルなWebサイトの提供を目指していきます。

なお、本記事に記した実績の公表にあたり、ご快諾いただいた横浜開港資料館様と有限会社ネクスト・ファウンデーション様に深く感謝申し上げます。

2016年10月9日

書評: 「ITエンジニアのための機械学習理論入門」

書誌情報: 中井悦司、「ITエンジニアのための機械学習理論入門」、技術評論社、2015, ISBN978-4-7741-7698-7

(本書は2015年10月に技術評論社Software Design編集部の池本様よりご恵贈いただきました。書評が大変遅れて申し訳ありません。)

現在「機械学習」と称されるニューラルネットワークの技術は、私が過去25年以上にわたって遠ざけてきた苦手なものの1つである。大量のパーセプトロンの組み合わせで特性情報が得られるという「夢のような話」に納得することは、「コンピュータというのはアルゴリズムで説明し得る作業のみが行えるもの」という定義で生きてきた私自身の考え方では極めて困難である。2016年現在得られているニューラルネットワークの成果全般に反駁するつもりはもちろんないし、その有用性を否定するものではないが、単にニューラルネットワークの説明を受けただけでは残念ながら私の疑問は消えない。申し訳ないがこの疑問は死ぬまで消えないだろう。(法的にもこの「なんで?」という問題は存在しており、「判断過程の不透明性に関わる問題」として現在も議論が続いている。)

本書はこの「なんで?」という部分に、統計学の観点から光を当てて解説しようとしたものであり、どういう計算手法を使えば結果がより目的にかなったものに近づくかの判断例が記されている。具体的には以下の流れで示されている。

  • 最小二乗法の推定から複数のデータセットを使ったクロスバリデーションとオーバーフィッティングの問題の説明
  • 尤度関数による確率モデル(最尤推定法)の導入
  • 勾配降下法による多次元ベクトルへの適用(概念としてのパーセプトロンの導入)
  • ロジスティック関数と偽陽性率の関連
  • 教師なし学習におけるk平均法とEMアルゴリズム(期待値最大化法)
  • ベイズ推定の適用と最尤推定法との比較

これらの手法は、ニューラルネットワークが「なぜそうなるか」を説明するものではない。しかし、どのように使えばより統計学的に筋の通った結果を得られるかについての手法としては一貫しており、ニューラルネットワークを「どうやって使えばマトモな結果が出るのか」についての実践的な説明になっている。アルゴリズムからの演繹的説明が不可能な以上、このような「結果が統計的にこうなるのでアルゴリズムはこう使うべき」という説明が、現時点では最も有用であると思う。その意味で本書は(統計も大の苦手である私のような者を含め)ニューラルネットワークの結果を評価する上の第一歩を知りたい人には大いに役立つであろう。そして本書は基礎理論の解説書であり、大学での教科書に使えるだけの中身のある力作である。

なお、本書にはサンプルコードが用意されているが、書籍の中ではサンプルコードがどのような概念を示しているか、そしてその動作結果が何を意味するかの説明に徹しており、サンプルコードの表面的な解説がなされているわけではない。言い換えれば、プログラマとしての知識は要求されず、数学の基本的知識があれば読めるようになっている。その意味でプログラミングの苦手な人にもおすすめできる。

書評: 「ニッポンの個人情報」

書誌情報: 鈴木正朝、高木浩光、山本一郎、「ニッポンの個人情報」、翔泳社、2015、ISBN 978-4-7981-3976-0

(本書は2015年2月に翔泳社の井浦様よりご恵贈いただきました。書評が大変遅れて申し訳ありません。)

鈴木正朝、高木浩光、山本一郎。

この3人の名前のうち、一人でも見て恐怖を感じないようであれば、日本のプライバシー問題、特に個人情報の扱いが実務者にとってどれほど難しいかについての、理解が不十分と思ったほうがいい。正直いってこの御三方のうち一人と対峙しなければならなくなったら、シッポを巻いて逃げたい。その3人がまとめて鼎談しているこの本は、正直いって重い。重すぎる。怖くて読めない。「ニッポンの個人情報」とか、「プライバシーフリーク」とか、そんな軽そうな言葉に騙されてはいけない。

しかし、現状の混沌と矛盾、法律の手抜き、そしてそもそもの「プライバシー権」への認識がバラバラになっている現状を知るには、この本に書かれている内容ぐらいは知っておかなくてはならないだろう。その意味では対談形式で重要な論点が各所にタップリと含まれているこの本は貴重な存在といえる。重要なポイントは全部QRコードでURLへのアクセスがしやすくなっているのも良い。

この書籍の発刊後、個人情報保護法は改正され、「平成27年9月9日から2年以内に全面施行」される予定である(日本政府の個人情報保護委員会のページより)。この法律改正により、「個人情報」を仕事に使うすべての事業者(個人も例外ではない)がこの法律の適用対象となる。そういう意味では、もう誰も逃げられなくなっているのである。今までの経緯と問題点をふまえた基本をおさえる上では、必読であろう。