語彙数推定テスト

各50語のうち知っているものだけにチェックをつけ、知っている語彙数を推定する。
成績よりもその原理が面白い。単語親密度は一般に人がどの程度その単語に馴染んでいるかを表すもので、親密度が高い単語ほどよく知られていることになる。
このテストは50のランダムな単語を親密度順に並べたもので、大まかに言えば「知っている」とチェックされた単語よりも親密度の高い単語の数をカウントする形で語彙数を推定するもの。
しかし一意に親密度で知/不知が綺麗に分かれるわけではなく、個々のテストでは結果にばらつきが出るので知/不知境界を割り出す方法が問題となる。
このテストでは単純に、知らない単語が二つ以上連続する単語の親密度と、知っている単語が二つ以上連続する単語の親密度との中間点を境界と設定しているが、これはやや雑駁に過ぎるように思われる。
更にはテストに使用する単語そのものをデータベースと連動してランダムに表示し、3回程度のチェック結果を元に推定するなど、まだまだ改良点はあろう。
とは言え少ないテスト数で語彙数を推定する方法自体は非常に面白い。