英語の習得語彙を数えてくれるサイトで計測してみた

現段階での習得している単語数を概算で出してくれるサイトを見つけました。

このサイトではさまざまな人のデータを集めているので協力してください。ポルトガル語版もあるそうです。

http://testyourvocab.com/

単語数を知ることの意味

自分の到達地点を数値化、可視化できる(つまり、がんばった量が数字で見られるのでわかりやすくなる)。それにより、目標と比較できる。

目指すべき単語数指標

このサイト独自調べによると、英語圏の成人のネイティブは20000~35000語を認識できるそうです。日本の教育では高校卒業までに5000語習うそうです(習うのではなく大学受験に必要な数だったかもしれませんが、細かいことは忘れました)。

よく使われる単語の頻度順のデータもある

http://oxforddictionaries.com/words/the-oec-facts-about-the-language

このコーパスが収集したデータの内、頻繁に使われるランキング10位までの単語が25%も占めていて、100語が50%、1000語が75%、7000語が90%、5万語で95%を占めています。ちなみに、99%に達するためには100万語必要だと考えられています。

コーパスが収集したデータとは

たぶんこういうことだと思う。色んな会話とか新聞、論文、いろんな状況で使われる言語を頻度ごとに集める。例えば、日常会話の頻度は学術論文より頻度が多いから会話から多くの例文を集める。

このサイトの計測方法

http://testyourvocab.com/details

  1. この試験はコーパス(よく使われる単語を使用頻度順に並べたデータ)を4.5万語の範囲内で計測している(つまり、使用頻度5万番目の単語を知っていてもカウントされない=計測上はあなたはその単語を知らない人だと認識されてしまうという不条理)
  2. 最初に頻度が高い(簡単な)言葉からあまり使われない(難しい)単語までを40語出題する。これにより、被験者の実力を大まかに把握する。
  3. 次の40語の中は1ページ目の結果をうけて範囲を狭める。知っているであろう簡単な単語と、おそらく知らないであろう難しい単語をもう一度確認しつつ、さらにその間の言葉もどのくらい知っているか調べる。
  4. 上記2の工程をもう一度行う。

もし、15000番目から後2000語(15000番目から16999番目)までは知っているのに、15000番より前2000語(13000番目から14999番目まで)を知らないという場合は合計15000語を知っていると計算する。

上記2の工程はこういうことだと思う。最初の40語は頻度順位1位から頻度順位45000位までの中から万遍なく40語選ぶ。例えば、被験者は3000位から6000位くらいの単語までは知っているとわかれば、その次は3000位から3500位、4000位前後などなどを試すというやり方だろう

このサイトに対して不満なのは

毎回のテストの中身がほとんど同じだということ。もし別の内容の試験があればより正確な計測ができる。それと、個人的には自分の単語数が予想より遥かにに少なくて悔しいから別の試験を受けて計測し直したい。

計測試験を受けて気付いたこと

僕たち外国人と母語話者子供の語彙の違い

僕らは英語母語話者じゃないから、「でっぱり」とか「ダチョウ」などはわからないし、覚えてもほとんど使わない。「ダチョウ」は知らなくても「統語論」は分かる。でも、この試験の範囲は頻出単語45000語なので「統語論」は専門用語なので含まれない。そのため、この試験の結果としては、「統語論」を知らないこととして語彙数を計算されている。

本題とは外れるが、外国語学習の難しいところはこういうところだ。母語話者の子供でも知っている単語や言い方を学習者はずっとわからないままだ。学術論文は読めるのに、「鞄を横にしてもいいですか?」を外国語で言えない。しかし、これは正常なことで、寧ろ日常会話をマスターする前に真っ先に目的である学術論文を読めるように外国語を覚える方が効率が良い。

もう一つの英単語計測 wordengine

http://www.wordengine.jp/

このサイトでも単語数を計算してくれますが、登録しないと一度しか使えません。

日本語版

日本語の語彙を測るサイトです。

語彙推定テスト

<外国語の語彙>