「短波」,「単体」,「単価」の 1 回目の発声全てを音声認識における標準パターンと考えて,入力パターン(2回目発声の「単体」)を認識し,その結果を考察しなさい。 認識に用いる特徴量(特徴ベクトル系列)には線形予測係数を使うこととする。 また,入力パターンの認識は,入力パターンと各標準パターンとの距離を DTW (DP マッチング)のアルゴリズムで求めることによって行う。 2音声間の距離や最適パスは,仮に lpfrmt コマンドによって得られた線形予測係数がfile1_a.txt と file2_a.txt に入っているとすれば,
dpmatch file1_a.txt file2_a.txt > dp_file1_file2.txtで求めることができる。 dp_file1_file2.txt の末尾に格納された最適パスを gnuplot で表示し,2音声間の距離の妥当性を検討すること。
なお,gnuplot で最適パスを表示するには dp_file1_file2.txt を編集して最適パスの行以外を,行頭に # をつけてコメントにするか,削除する必要がある。 この編集作業には、write コマンド(ワードパッド)や I ドライブの terapad が利用できる。 notepad (メモ帳)はファイル内の改行を正しく認識しないので使用できない。