第43回 圧縮的情報管理
2010年5月12日
(これまでの増井俊之の「界面潮流」はこちら)
ジョーク好きの2人が列車に乗り合わせた。だがこの2人はジョークを言い飽きてしまっていた。
2人: 「ジョークをいちいちしゃべるのは面倒だから、ジョークに番号を付けて番号で呼ぶことにしよう。」
A:「8番」
B:「ははは。」
B:「25番。」
A:「ははは。」
こう繰り返している内にAが、
A:「1253番。」
というと、2人とも「わっっはっはっはっはー。」と大笑いした。
そばの人:「え、まだそんなに面白いジョークが残っていたんですか?」
2人:「いやね、今のは初耳のジョークだったんだよ。」
(http://www.geocities.co.jp/SweetHome-Ivory/6352/sub2/lough.html を若干修正)
tinyurl.comやbit.lyのような「URL短縮サービス」が最近よく利用されています。このようなサービスは長いURL文字列と短い文字列を対応づけるデータベースを持っており、ブラウザから短い文字列が送られてくると長い文字列に変換して返すという処理を提供しているだけですが、一種のデータ圧縮サービスだと考えることもできます。
tinyurlやbit.lyはあらゆるURLを6〜7文字に圧縮していることになりますが、世界中のあらゆる情報は13バイトに圧縮できるという説もあります。4バイトでIPアドレスを特定し、そのマシン上のファイルの位置を9バイトで表現すれば13バイトに収まるからです。これは冗談としても、使い方を限定すれば、ファイルを特定するために必ずしも長い名前を利用する必要はないかもしれません。自分が扱う可能性のあるデータが10万種類以下なのであれば、ファイル名などを利用せずに5桁の数字だけで済むはずです。
世の中では様々なものが番号で管理されています。ほとんどの商品に13桁のバーコードが印刷されていますし、書籍にはISBNと呼ばれる数字が割り当てられています。このようなIDは商品にもともと印刷されているものですが、会社の備品を管理したり図書館の蔵書を管理したりするために、組織独自のバーコードやQRコードを貼り付けて管理する方法も広く使われています。
大きな組織ではこのような管理手法は意味がありますが、小さな組織や家庭などではこのような手法が必要になることはまずありません。しかしIDを利用してちょっとした管理や情報共有を行なうと便利なことがあります。限られた環境で利用する場合、桁数が多いIDは必要ありませんし、一時的に区別がつけば良いこともあります。
例えば、論文の参考文献表記や書籍の注釈番号は1〜2桁の数字が利用されています。このようなIDは、ひとつの論文や本の中でだけ使われるものなので、単純な数字で充分だというわけです。
論文中では通常 [数字] という表記で参考文献を示します。
参考文献リストは論文の最後に並べておきます。
この論文中では[2]は「Watch What I Do」という本のことだということになり、何度か参照する場合でもいちいち「Watch What I Do」と書かなくても[2]とだけ書けばよいことになります。
同じように、たとえばオフィス内の情報を共有するとき、オフィス外のことは考えなくてもよいのであれば、オフィス内のあらゆる情報に「123」とか「456」とか短い番号をつけておけばよさそうです。
例えば、「123.pdf」という名前の文書ファイルを印刷した紙には「123」と書いておくようにすれば、紙から元ファイルに簡単にアクセスすることができます。「123」というファイル名から中身を判断することはできませんが、中身の詳細については別の場所に書いておけばよいでしょう。オフィスで使うファイルには「戦略会議100512.pdf」のような長い名前がついていることが多いようですが、こういう名前は紙の上に記録するのが面倒ですし、名前を使ってファイルにアクセスするのも簡単ではありません。ファイル名であらゆる属性を表現することはできないのですから、とりあえずその場所で区別可能な短い数字を使えば充分です。
ファイルがネット上で共有されていれば、ファイルを他人に渡す場合にメールなどで送る必要はなく、「123のファイル」と伝えるだけですむでしょう。ファイルの名前が長い場合、口頭では伝わりにくいのでメールなどを使う手間が必要になってしまいます。
「名前の効用」で紹介した3memo.comを利用すると、簡単にこのような運用をすることができます。まずオフィス内で共通に使う名前(e.g. 「abcd」)を決めておき、情報共有するべきWebページがある場合はそのページに新しい番号(e.g. 「1234」)をつけてhttp://abcd.3memo.com/1234として登録しておきます。オフィスの中では「abcd」を使うということが完全に了解されていれば、このページの情報を他人に伝えるとき「1234」という番号だけ伝えることによって、オフィスの人間が簡単にその情報にアクセスすることができるようになります。
扱うデータすべてに適切な名前をつけるのは面倒なものです。「戦略会議資料1.pdf」「戦略会議資料2.pdf」のようなよくわからない名前をつけるぐらいなら、「123.pdf」「124.pdf」のように番号だけのファイルを作っておいて、「123」が何を意味するかを別のところに書いておく方がよさそうです。自動的に連番がふられるような仕組みを用意しておけばよいでしょう。
簡単にこのような情報共有ができれば、日常的な「コピペ」操作でも短いIDを活用できるようになります。普通のコピペ操作の場合、「コピー」操作をすると決まった領域に文字列がコピーされ、「ペースト」操作をすると同じ領域から文字列がコピーされることになりますが、ひとつの領域しか使われないので複数の文字列を同時にコピペすることができません。たとえば、あるWebページのタイトルとURLの両方をコピペしたい場合、タイトルをコピペしてからURLをコピペしなければなりません。番号がついたコピペバッファを使うことができればタイトルを「1」にコピーし、URLを「2」にコピーするといったことができるようになるでしょう。3memo.comはこのような用途にも利用することができます。
番号利用のバリエーション
番号を使った情報管理にはいろんなバリエーションが考えられます。
- 上の3memo.comを使った例では「abcd」のようなIDを決めて使う必要がありましたが、このようなIDは自動的に設定することが可能です。たとえば、LAN環境などから現在地情報を調べて、それをもとにしてIDを決めるようにすれば、自宅とオフィスで自動的に異なるIDを使うことができるでしょう。
- 書籍や商品につけられているバーコードやISBNはそのまま利用すればよいでしょう。http://3memo.com/(ISBN)/(ページ番号) のようなURLを使うことができます。
- あらゆる情報を番号で管理できるようになれば、メールにメッセージを記述するほとんど必要なくなるかもしれません。メッセージ本体はネット上のどこかに置いておいて、「8番」「25番」「ははは」といったコミュニケーションができるようになるでしょう。冒頭の話がジョークでなくなってしまうことになります。
現在のところはメールで添付ファイルが山のように飛び交っていることがまだまだ多いようですが、クラウド時代にはWeb上に様々な文書や資料を置くことがあたりまえになるでしょうから、メッセージの肝心な部分は「留まる情報」としてネット上に置いた上で「流れる情報」としてのメッセージだけを送ることが普通になるかもしれません。メールと完全に同等に使おうとする場合、短い数字を使う方法はセキュリティの問題があるでしょうが、適度なセキュリティを保ちつつ情報のやりとりを簡潔にする方法が重要になってきそうです。
増井俊之の「界面潮流」
過去の記事
- 第55回 ものづくり革命2011年5月16日
- 第54回 マイIME2011年4月15日
- 第53回 NFC革命2011年3月10日
- 第52回 自己正当化の圧力2011年2月10日
- 第51回 縦書き主義2011年1月17日