音声の収録と母音の観察

目次

1 音声の収録

1.1 母音の収録

wavesurfer の設定を確認・変更した後で, 5 母音 (i, e, a, o, u) を1 秒程度ずつ各 2 回(高い声と低い声)発声した音声を wavesurfer で収録する。

  1. wavesurfer を起動する
  2. File -> Preferences… の SoundIO タブを開く
  3. New sound default rate が 16000 に,New sound default encoding が Lin16 に,New sound default channels が 1 になっていることを確認する。なっていなければ変更し,Apply ボタンで 適用して OK ボタンを押す。再度 SoundI/O タブの設定を確認する。

録音は wavesurfer の赤ボタンで開始できる。 必要に応じて,画面右下のスピーカーアイコンを右クリックし,録音デバイスを開いて,録音音量を調節する。 録音時には,波形の瞬時振幅が許容される最大値(32767)や最小値 (-32768) を超えないように注意する。 ただし,小さすぎても支障がある。5000 程度の振幅値があれば十分。

収録が終わったら,各母音につき音声区間 0.5 秒(発声中ほどの波形が安定している部分)ほどを,次の手順で個別のファイルに保存する。

  1. 波形の上で右クリック -> Create Panel -> Waveform
  2. 保存する区間をマウスで選択し,View -> Zoom to Selection で選択区間の音声波形を確認。
  3. 選択区間の音声を聴いてから,File -> Save Selection でファイルに保存する。ファイル名は a01.wav, a02.wav, i01.wav, i02.wav などとする。

1.2 単語の収録

母音と同様の手順で,単語音声「短波」,「単価」,「単体」を各2回ずつ wavesurfer で収録し, 各単語を個別のファイルに保存する。 ファイル名は tanpa01.wav 等とする。 音声をファイルに保存するために単語区間を選択する際には,各単語の前後には若干(0.03秒程度)の無音区間を含めること。

1.3 収録した音声の標本化周波数・チャネル数の確認

wavesurfer で音声ファイルを開き,ウィンドウ上のどこかにマウスカーソルを置いて

    右クリック -> Properties... から Sound タブ

を開いて,Sample rate と Number of channels を確認する。 この授業で使う音声は

  • Sample rate (サンプリング周波数)が 16000 Hz で
  • Number of channels が 1

になっている必要がある。 特に単語音声については,この条件を満たしていないと,後の実習で使うことができない。 なお,上記の Sound タブでサンプリング周波数等を変更すると音声信号が劣化するので,行わないこと。

2 母音の波形とスペクトルの観察

  1. コマンドプロンプトから
    wavesurfer 音声ファイル名
    

    を実行して,Choose Configuration ダイアログで Waveform を選択する。 「音声ファイル名」には収録した a のファイル名を指定する。

  2. 波形から基本周期 (秒またはミリ秒) と基本周波数 (Hz) を求める。
  3. wavesurfer でスペクトルを見るために,
           波形の上で右クリック -> Spectrum Section...
    

    を実行して,FFT スペクトルから基本周波数を求める。

  4. LPC スペクトルから F1, F2 を求める。 その際,資料の F1-F2 分布図を参照する。 本来あるべき周波数にホルマントがない場合, order を大きくすることで,スペクトル包絡 (LPC スペクトル) のピークの数を増やすことができる。
  5. 時間があれば,/a/ 以外の母音についても,上記と同じことをする。

日付: 2017/5/11

著者: Hideaki Konno

Validate