音声の収録

目次

1. 音声の収録法

wavesurfer で音声を収録し,ファイルに保存する手順を示す。

1.1. 録音設定の確認と変更

  1. wavesurfer を起動する
  2. File -> Preferences… の SoundIO タブを開く
  3. New sound default rate が 16000 に,New sound default encoding が Lin16 に,New sound default channels が 1 になっていることを 確認する。なっていなければ変更し,Apply ボタンで 適用して OK ボ タンを押してから,Wavesurfer を再起動する。再度 SoundI/O タブの 設定を確認する。 (サンプリング周波数 16000 Hz,量子化ビット数 16 bit の 1 チャネル PCM 録音とする設定)

1.2. 録音

音声を発声し録音する。 録音は wavesurfer の赤ボタンで開始できる。

録音時には,波形の瞬時振幅が許容される最大値(32767)と最小値 (-32768) を超えないように,十分に注意する。 ただし,小さすぎても S/N 比が悪くなる。5000 程度の振幅値があれば望ましい。

1.3. 録音した音声のファイル保存

次の手順によって,録音区間全体から音声区間を選択して,ファイルに保存する。

  1. 波形の上で右クリック -> Create Panel -> Waveform
  2. 保存する区間をマウスでドラッグして選択し,View -> Zoom to Selection で選択区間の音声波形を確認。
  3. 選択区間の音声を聴いてから,File -> Save Selection でファイルに保存する。 ファイル名の終わり(拡張子)は .wav とする。

音声をファイルに保存するために単語区間を選択する際には,各単語の前後には若干(今回は0.3秒程がよい)の無音区間を含めること。

1.4. 収録した音声の標本化周波数・チャネル数の確認

wavesurfer で音声ファイルを開き,ウィンドウ上のどこかにマウスカーソルを置いて

右クリック -> Properties... から Sound タブ 

を開いて,Sample rate と Number of channels を確認する。 この授業で使う音声は

  • Sample rate (サンプリング周波数)が 16000 Hz で
  • Number of channels が 1

になっている必要がある。

なお,上記の Sound タブでサンプリング周波数等を変更すると音声信号が劣化するので,行わないこと。

2. 収録音声

2.1. 母音

wavesurfer の設定を確認した後で,高い声と低い声で発声した 5 母音 /ieaou/ を wavesurfer で収録する。 保存先のファイル名は ieaou_high.wav, ieaou_low.wav などとする。

2.2. 単語

単語音声「短波」,「単価」,「単体」を各2回ずつ wavesurfer で収録し, 各単語を個別のファイルに保存する。 ファイル名は tanpa01.wav 等とする。 音声をファイルに保存するために単語区間を選択する際には,各単語の前後に 0.03秒程度の無音区間を含めること。

日付: 2023/5/11

著者: Hideaki Konno

Validate