はてなキーワードがspamかどうかを、何を以て判断するのか。
広告の割合?ではまず、何が広告で何が広告でないかの定義をせねばなるまい。極論、個人ブログにありがちな「過去の人気エントリ」などもある種「自分のエントリを広告する」行為と言える。すると個人ブログはおしなべてspamか。
キーワードに中身がないからダメ?説明のないキーワードにも言及日記・言及はてブエントリというコンテンツが付随する。見る人が見れば充分に有用なコンテンツだ。
どうも単純に内容だけを見てspamを判定するのは困難に思える。
ところではてなキーワードへのアプローチは、大雑把に2系統に分類できる。即ち(主に)ダイアリーのキーワードリンクを経由するものと、検索で直接開くものだ。あるいは、はてなキーワードと認識して読むかそうでないか、の違いでも良い。これらは重視するコンテンツが違う。
- キーワードリンク
- 検索
結局のところ、はてなキーワードの問題点は「キーワードをハブとする情報クラスタ」としての価値と「辞書としてのキーワード」の両側面を持ち、それらを区別していないところと言えるかも知れない。
単純に辞書機能としては基本的にWikipediaに劣る。ただしこの点についてはWikipedia情報を並列表示することで補っているし、またWikipediaでは成立しないような項目が存在し得る利点もある。いずれにせよ、書き手の異なる2種の解説が併存するのは情報量増加という点でメリットと言える。
クラスターとしての機能は他では見られないものだ。敢えて言えば検索エンジンでの表示に近い。結果として、「検索結果から検索結果を開く」ような部分があり、これがとりわけ検索アプローチ派から問題視される理由かと思う。
以上から、いくつかの改善案が見出せる。
ひとつははてなのシステム側での対処である。例えば内容の存在しないはてなキーワードにはnofollowを入れる、キーワードリンクを発生させないなどの手法で、予めコンテンツ価値の低いものを抑制する。とか言ってたら対応された。
もうひとつは検索側でのちょっとした対処。はてなキーワードを検索対象から外すことで、spamと感じるページを予め省いておく。Googleであれば、「-site:hatena.ne.jp/keyword/」とオプション指定することではてなキーワードを検索結果から除外できる。