はてなの機能追加によるキーワードの存在意義の変化

はてなダイアリーに於いてキーワードの立場は微妙である。捕捉機能や辞書的機能の有用性が認められる反面、予期せぬキーワードリンク(所謂「誤爆」)やリンクの多さ自体への反発は根強く、これまでのキーワードの機能追加は事実上リンク阻止を目的としたものであった。
しかし最近のフォトライフ及びブックマークへのキーワード適用により、はてな本体とは違った形での運用が求められるようになっている。
ダイアリーでは、全体を通した検索こそ備えないものの個々のダイアリー内部については文字列をストレートに検索し得る。しかし現状、B及びFではキーワードリンク以外での検索は不可能となっている。文字情報を主体とするDではキーワードに関係なくこれまでのログから情報が検索されなくてはならないが、Fのように付加的な情報にすぎない場合は必ずしもキーワードのみに絞られることが悪いとは思わない。
とは言え、現状のキーワードデータベースはDでの利用に特化して蓄積されたものであり、それ以外のサーヴィスで利用するに充分な状態とは言えないのも確かである。


例えば、フォトライフで雲の写真を探すとする。明確な雲の種類についてイメージしているのでない限りは「雲」というキーワードで検索をかける事になるだろう。だが実際にそれをしても検索結果には何も表示されない。なんとなれば、「雲」というキーワードがないからだ。
Dではこれまで、一般的すぎる普通名詞はキーワードとして不向きと考えられてきた。文字を基本とするDに於いては、日常的に頻繁に使用され、かつ短い文字列は、徒にノイズを増やすばかりで有用でないばかりか、本文内に多数のリンクを発生させ文章を見苦しいものにする点で害と看做される事が多かった。
しかし、逆にFではタイトル部分のごく短いテキストしか捕捉対象にならず、またそもそもタイトルをつけていない例も多い為、普遍的かつ短いキーワードで検索をかけない限り有意な結果は得られないだろう。
これは検索エンジンの精度が上がったとき、or検索からand検索に移行したのと似ている。まだデータベースが小さく、また抽出精度の低かった時代は、検索範囲を広げる為に複数のキーワードを列記し、いずれかひとつでも含む結果をすべて表示した。それが現在では、多すぎる結果を絞り込む為に複数キーワードのすべてを含む結果だけを見るようになっている。
DとFにも同じ事が言える。Dでは捕捉され難くする工夫が必要になったが、未発達なFではむしろ捕捉され易くする工夫こそが求められるのである。


Dでは「不快な」キーワードリンクを排除する為のシステムとしてリンク編集機能とリンク非対象表記、リンク許可キーワードジャンル制限、更にはキーワードスコア+閾値によるフィルタリングと、これまで多重に手を講じてきた。しかし、そろそろ別の方向からもキーワードを見直す時期に来ているように思える。特にスコア処理を削除に直結する案については強く再考を促したい。
捕捉範囲の問題を中心に快/不快で捉えられる事の多かったキーワード問題であるが、ここに至って「日記がリンクされるのは鬱陶しいが写真がリンクされるのは歓迎」「捕捉範囲が広いのは困るが辞書的には有用」といった、従来のラインから外れた価値基準が生まれる事になるだろうと予想される。その時に、Dに於ける抵抗感を払拭しつつFでの利便性を確保できるようなキーワードシステムを模索して行かねばなるまい。簡単な例では、2ビット(半角で2文字、全角で1文字)以下のキーワードはDではリンクされないといった処理も幾つかの点では有効であろうし、あるいははてなで使用中のテーマについて見直しを行い、キーワードリンクの目立ちを若干抑える手もあろう。
直接的に影響を被り、また悪影響に最も敏感なのはDであるが、Dの為だけに他での有用性が抑えられてしまっては元も子もない。かといって双方のデータベースを分離するのはスマートとは言えない。難しいところではあるが、この難所を乗り越えれば、はてなキーワードは素晴らしい資産にもなりうる筈と期待している。