人力検索の偽装と悪用

半年で16万を稼いだらしい回答者は終了時のポイントがかなりの割合で内容に関わらず均等配分されることを利用、検索結果だけを提示するなど拙速を旨として活動していた模様。また他の人力検索を積極的に活用、同様の質問があった場合その回答をコピーしてさも自分の回答であるかのように振る舞っていたようだ。

拙速の回答

前者について言えば、はっきり言って均等配分する質問者に問題がある。「どの質問も甲乙つけ難いので均等に」という例は恐らくごく少数だろう。むしろ殆どの場合で「もう回答は得たからどうでもいいや」とばかりに何も考えず均等配分、或いは終了せず放置の結果自動配分になっているものと思われる。
こうした行為は拙速な回答を助長する上に真面目な回答者の意欲を減衰させかねず、全体として人力検索の害となってくる。
とは言え、配分を強制するわけにもいかない。自動終了は回答者を放置しない為に必要な措置だし、自動配分機能は「考えるのが面倒だから放置」する質問者を減らすためにやはり必要だ。
面倒を増やさずに、かつ均等配分を減少させるにはどうすれば良いだろうか。一つの案として、回答モデレーションと回答者モデレーション(いるか賞)による補正を考えてみた。

回答モデレーション

質問者ではなく閲覧者がモデレートする。質問に対して優良回答と感じたものに+投票、逆に劣悪と感じるものには-投票を行う。ユーザ一人が投票可能な量は1回答あたり+または-1票のみ。
手動振り分けに制限はないが、自動振り分けの際にこの得票を元に配分が調整される。
問題は、果たしてどれほど投票があるかという点。評価者には何の利益もないから、殆ど投票が行なわれず実質的に機能しないかも知れない。投票に対し1ポイント支払うという案も考えたが、逆に無意味な投票を助長する可能性も否定できない。


モデレートに制限をつけるべきかどうかはちょっと悩ましい。例えば一つの回答以外にすべてプラスを投じれば、相対的に1回答のみ評価を減じることができてしまう。そうした工作を防ぐためには、1質問に対する投票を合計で±1の範囲に制限する-----つまり+票を投じたら-票を投じるまでそれ以上の+は不可能、逆もまた同じ-----という方法もある。しかしそうすると、今度は複数の優良回答を評価する為に他の回答を貶める(もしくは複数の劣悪回答を評価するために他の回答を持ち上げる)必要が生じてしまう。

いるか賞の適用

これはある意味でもっと堅実だ。いるか賞を貰っている回答者は、その量に応じて自動配分時に優遇されるようにする。長期的スパンで評価される為にぶれは少ないだろう。
但し、普段優良であるからといって今回の回答が必ずしもそうであるとは限らないという点に弱みがある。
また、全体としているか賞受賞者はそう多くなく、実質的にほとんど均等配分のままではないかという懸念もある。

特定URLの除外

URLを要求する質問の場合、例えば予めGoogleやYahooなどのurlを除外指定することで検索結果のみ提示するパターンを排除したり、既に知っている情報のurlを予め登録することでそれ以外の情報に限定する、そういう機能があれば>idea:12213

回答の著作権侵害

これは非常に難しい。回答内容と同じものが他にあるかどうか、自動でチェックするのは無理だろう。ある程度は検索内容の文字列との完全一致を見て判断可能だが、そのためにはシステムにかなりの負担をかけることになるし、また語尾のちょっとした改竄で抜けようがある。逆にある程度の曖昧さを持たせると、検索内容を元に回答者自身が再構成して回答するような例まで引っ掛かりかねない。


それを回避する方法は幾つか考えられる。

自然言語解析

一つは、質問文を自然言語解析してWeb検索やOKwave検索を行ない、質問時点である程度の情報を自動的に引き出す方法。この時点で答えが見付かれば質問の必要がなくなるし、また質問直下に何点か表示しておけば安易な検索回答を避けるにも役立つだろう。
欠点は、人力検索はてなの売上チャンスが幾許か失われることだが、本来のコンセプトが「巧く検索できない人のために代わりに検索する」であることを考えると、予め答えとなるかも知れないものが発見できるのは悪くない仕組みではないだろうか。

回答モデレーション

上にも書いた回答モデレーションである。但し、実質的には回答者モデレーションに近いもの。-票が付くような回答を繰り返す回答者はブラックリスト行きとなる。
以前の「いわし」のように、回答にコメントを付けられるようにしても良いかも知れないが、荒れの元でもあろう。