音声データの形式確認と変換

収録した音声の標本化周波数・チャネル数の確認方法

wavesurfer で音声ファイルを開き,ウィンドウ上のどこかにマウスカーソルを置いて
右クリック -> Properties... から Sound タブ
を開いて,Sample rate と Number of channels を確認してください。 この授業で使う音声は になっている必要があります。特に単語音声については,この条件を満たしていないと,後の実習で使うことができませんので,必要であれば以下の手順で形式の変換を行ってください。 なお,上記の Sound タブでサンプリング周波数を変更すると音声信号が劣化しますので,この授業では必ず下記の sox コマンドによる方法で行ってください。

音声の標本化周波数とチャネル数の変換

  1. 次の場所から sox.exe を取得し,音声データの入ったディレクトリ(フォルダ)に保存してください。
    トップページ > 授業のページ > 計算機実習用資料等 > 実習用プログラム
  2. サンプリング周波数/チャネル数を変換する音声のファイル名を _48k.wav で終わるように変更してください。例えば tantai01.wav は tantai01_48k.wav に変更します。 コマンドプロンプトで ren コマンドでファイル名変更を行うのであれば,ren tantai01.wav tantai01_48k.wav のようにします。
  3. 変換する音声に対して,次のコマンドを実行してください。 ここで,strにはファイル名の一部である文字列を与えます。
    sox str_48k.wav -c 1 str.wav rate -h 16000
    具体的な実行例は,例えば,次のとおりです。
    sox tantai01_48k.wav -c 1 tantai01.wav rate -h 16000
    これによって,サンプリング周波数が 48kHz, チャンネル数が 2 チャンネル(ステレオ)のtantai01_48k.wav から,サンプリング周波数 16 kHz, 1 チャンネル(モノラル)のtantai01.wav が作られます。
  4. dir コマンドを実行して,ファイルのサイズを見比べてください。 新しいファイルでは,サンプリング周波数が 1/3 に,チャネル数が半分になっていますので,データサイズは約 1/6 になったはずです。