アプローチに見るキーワードspam問題

はてなキーワードspamかどうかを、何を以て判断するのか。
広告の割合?ではまず、何が広告で何が広告でないかの定義をせねばなるまい。極論、個人ブログにありがちな「過去の人気エントリ」などもある種「自分のエントリを広告する」行為と言える。すると個人ブログはおしなべてspamか。
キーワードに中身がないからダメ?説明のないキーワードにも言及日記・言及はてブエントリというコンテンツが付随する。見る人が見れば充分に有用なコンテンツだ。
どうも単純に内容だけを見てspamを判定するのは困難に思える。


ところではてなキーワードへのアプローチは、大雑把に2系統に分類できる。即ち(主に)ダイアリーのキーワードリンクを経由するものと、検索で直接開くものだ。あるいは、はてなキーワードと認識して読むかそうでないか、の違いでも良い。これらは重視するコンテンツが違う。

  1. キーワードリンク
    1. キーワードリンクと知らずに開く
      1. 書き手の明示する情報かと思ったら違った。無駄な情報だ
      2. 書き手の明示する情報かと思ったら違ったが、有益な情報だ
    2. キーワードリンクと知って開く
      1. キーワードの説明を期待したが空だった。無駄な情報だ
      2. キーワードの言及情報が確認できた。有益な情報だ
  2. 検索
    1. はてなキーワードと知らずに開く
      1. 言葉の説明を読みたかったのに何もない。無駄な情報だ
      2. 言葉の説明はなかったが言及先から色々な情報が得られた。有益な情報だ
    2. はてなキーワードと知って開く
      1. 言葉の説明を読みたかったのに何もない。無駄な情報だ
      2. 言及先を確認できた。有益な情報だ

結局のところ、はてなキーワードの問題点は「キーワードをハブとする情報クラスタ」としての価値と「辞書としてのキーワード」の両側面を持ち、それらを区別していないところと言えるかも知れない。
単純に辞書機能としては基本的にWikipediaに劣る。ただしこの点についてはWikipedia情報を並列表示することで補っているし、またWikipediaでは成立しないような項目が存在し得る利点もある。いずれにせよ、書き手の異なる2種の解説が併存するのは情報量増加という点でメリットと言える。
クラスターとしての機能は他では見られないものだ。敢えて言えば検索エンジンでの表示に近い。結果として、「検索結果から検索結果を開く」ような部分があり、これがとりわけ検索アプローチ派から問題視される理由かと思う。


以上から、いくつかの改善案が見出せる。
ひとつははてなのシステム側での対処である。例えば内容の存在しないはてなキーワードにはnofollowを入れる、キーワードリンクを発生させないなどの手法で、予めコンテンツ価値の低いものを抑制する。とか言ってたら対応された
もうひとつは検索側でのちょっとした対処。はてなキーワードを検索対象から外すことで、spamと感じるページを予め省いておく。Googleであれば、「-site:hatena.ne.jp/keyword/」とオプション指定することではてなキーワードを検索結果から除外できる。