VERSANTへ発音診断に関して質問
岩本年宣社長様
発音診断の音声認識に関して質問します。
AIRVIPによると次にようになっています。
VERSANTで高得点を取るためには、採点者が機械であるという点を強く意識しておく必要があります。機械による採点は、数千人のネイティブスピーカーのサンプルを使って構築されたシステム(ネイティブモデル)を利用しています。受験者の回答や発音がネイティブにどれだけ近いか、あるいはどれだけ違っているのかを把握し、正確に採点できるようになっています。
数千人のネイティブスピーカーのサンプルを使っているシステムであればニューラルネットワークを使った動的な音声の特徴の抽出をしていると思われます。
多くのネイティブスピーカーのサンブルを使っていると言う事は、言語には音声学の音素のような基本の音がないと言う前提だと思います。
音素が存在せずにどうやってネイティブに近いかを判断できるのでしょうか。ニューラルネットワークのデータを使うシステムでは統計的にそのような特徴を持っている人がどのくらいが分かるだけです。
音素のような基本の音がないのですから、発音がネイティブにどれだけ近いかを判断するのは不可能だと思われます。
音素と言う基本の音がないのにどのような判断をもって発音の診断ができるのでしょか。
更に、ネイティブスピーカーのサンブルを使う場合に、英国英語、米国英語、豪州英語にはそれぞれ特徴ありますが、そのような英語を話した場合に、どのような基準で採点されるのでしょうか。
誠意ある解答をお待ちしております。
合同会社ディープラーニング
代表社員 桜井恵三
最近のコメント