12. ファイルの種類とテキストファイルの利用

目次

1. 今回の目的

  • 表計算ソフトウェアやテキストエディタでテキスト形式のデータを扱えるようになる。
  • ファイルの種類や形式について知る。

2. ファイルの形式(テキストファイルとバイナリファイル)

ファイルはテキストファイルとバイナリファイルに大別できます。

  • テキストファイル(またはテキスト形式のファイル): 簡単に言えば,文字だけが入っているファイル
  • バイナリファイル(またはバイナリ形式のファイル): テキストファイルでないファイル1

画像や音声の入ったファイルの多くや,Word や Excel で普通に保存したファイルはバイナリファイルです。

3. テキストファイルの利点

Web 等で多くの人とデータをやりとりする際に,テキストファイルがよく使われます。 その理由はテキストファイルの持つ汎用性にあります。 テキストファイルは多くのアプリケーションや OS (Operating System)2 で共通に使えるファイル形式ですので,Excel などの特定のアプリケーションを持っていなくとも,ファイル内のデータを読むことができます3。 もちろん,Excel でテキストファイルを扱うことも可能です。

4. エディタの利用

4.1. テキストエディタ

テキストファイルを作成したり編集するためのプログラムをテキストエディタ (text editor) といいます。 これを単にエディタと呼ぶことも多いです。 世にはたくさんのエディタがありますが,Windows に標準で付属する「メモ帳」もエディタの一つと言えます。

4.2. テキストファイルの作成

  1. エディタ(メモ帳)を起動して,いわゆる半角英数字(直接入力)で自分の学生番号とローマ字氏名を入力してみましょう。
    • メモ帳の起動法: スタート → Windowsアクセサリ → メモ帳
  2. テキストを myname.txt という名前のファイル(テキストファイル)に保存(名前を付けて保存)してください。

4.3. バイナリファイルをエディタで開いてみる

以前の資料で「普通に」に作成した Excel のファイル jinkou.xlsx をメモ帳で開いてみましょう。 最も簡単な方法は,開いているメモ帳のウィンドウに,ドキュメントフォルダ等に入っている jinkou.xlsx のアイコンをドラッグすることです。

メモ帳で正常表示できるのはテキストファイルだけです。 jinkou.xlsx には,文字がそのまま入っている訳ではなく,Excel ワークシートのいろいろな情報が文字以外の状態で入っているバイナリファイルですので,メモ帳では中身を読むことはできません4

5. 表計算ソフトウェアによるテキストファイルの利用

5.1. Excel のデータを CSV 形式で保存

まず,次の手順で jinkou.xlsx 内のデータを CSV 形式のファイルに保存してみましょう。

  1. jinkou.xlsx を Excel で開いてください。
  2. 次の手順で,保存するファイルの形式を「CSV(カンマ区切り)」にします。

    「ファイル」タブ → 名前を付けて保存 → 現在のフォルダ

    の順に進み,「ファイルの種類」として「CSV(カンマ区切り)」を選択してください。

  3. ファイル名は自動的に jinkou.csv になっているはずですので,確認して「保存」ボタンをクリックします。 警告のダイアログが出ますが,「はい」を選んで保存してください。
  4. Excel を終了してください。終了時の保存確認のダイアログでは変更内容を保存しないでください。
  5. jinkou.xlsx が存在するのと同じフォルダに jinkou.csv というファイルができあがったことを確認してください。

5.2. CSV 形式とは

エディタを使って jinkou.csv を開いてみましょう。

  1. メモ帳を起動し,「ファイル」メニューから「開く」を選択してください。
  2. 新しく現れるウィンドウでファイル名を直接打ち込むか,「テキスト文書」でなく「すべてのファイル」を表示させるとマウスでファイル名を選べますので,jinkou.csv を開いてください。

jinkou.csv の内容は,Excel のセルに表示されていた文字が,カンマ (,) と改行で区切られているだけのものです。 これが CSV (comma separated values) と呼ばれる所以です。

CSV 形式のファイルは文字と記号だけを含みますのでテキストファイルです。 CSV 形式は,行と列を持つ表形式のデータをテキスト形式で表現するために,よく使われます。

5.3. CSV ファイルを Excel で開く

jinkou.csv のアイコンをダブルクリックして jinkou.csv を Excel で開いてください5。 jinkou.xlsx にあった罫線やグラフが現れませんね。セルの幅も元とは違って均一です。 これは,今開いた jinkou.csv がテキストファイルだからです。

5.4. Excel のデータをタブ区切りテキスト形式で保存

  1. 再度,Excel で jinkou.xlsx を開いてください
  2. 「ファイルの種類」を「テキスト(タブ区切り)」として「ファイル名を付けて保存」してください。ファイル名は自動的に jinkou.txt となります。
  3. 保存したら,Excel は終了してください。終了時にファイルを再度保存しないでください。

ファイル名が .txt で終わるファイルのアイコンをダブルクリックすると,通常の Windows の設定ではメモ帳が起動して,ファイルが開かれます。 ファイルをメモ帳で開いて,元の列が「タブ文字」で区切られていることを確認しましょう。

5.5. Excel で様々な形式のテキストファイルを開くには

Excel でタブ区切りのテキストファイルを開くことも,もちろん,できます。 ここでは,Excel をスタートメニュー等から起動した後(テンプレートは「空白のブック」を選ぶ),

「ファイル」タブ→「開く」→「参照」

とクリックして「ファイルを開く」というウィンドウを開きましょう。 ここで「すべてのファイル(.)」を選択しておけば,表示された全ての種類のファイルから,任意の種類のファイルをマウスでクリックして,Excel で開く操作ができます。 先に作成した jinkou.txt (テキストファイル)を選んで開いてみましょう。

テキストファイルを選ぶと「テキストファイルウィザード」というウィンドウが開きます。 これを使うと,様々な形式(列の区切り文字として何を使っているか等)のテキストファイルを,Excel で開くことができます。

6. 練習

  1. メモ帳を使って, 1 から 10 までの整数を,次のように空白区切りで 2 行で書いたデータを作り,sum.txt というファイル名で保存してください。

    1 2 3 4 5
    6 7 8 9 10
    
  2. sum.txt を Excel で開き,Excel の計算機能(式は適当なセルに入れる)で合計を求めたら,ワークシートを sum.txt に上書き保存してください。
  3. sum.txt をメモ帳で開いて,内容を確認してください。

7. ファイルの種類と拡張子

7.1. ファイルの拡張子とアプリケーションとの関連付け

ファイル名の中の最後のドット (.) に続く文字の並びは,一般的に拡張子と呼ばれます。 例えば,ファイル名 sum.txt の txt は拡張子です。

拡張子は,ファイル名の中の,ファイルの種類を表す部分です。 例えば,txt はテキスト形式のファイルに対して使われる拡張子で,xlsx は Excel のファイルに使われます。 拡張子はファイル名の一部として利用者が自由に付けることができますが,ファイルの種類と異なる拡張子をつけると,ファイルの扱いが面倒になったり,アプリケーションからうまく使えなくなりますので注意しましょう。

拡張子の役割のひとつは,アイコンをダブルクリックしたときに,どのアプリケーションでそのファイルを開くかを決めることです。 これをファイルの拡張子とアプリケーションの関連付けといいます。 Windows の標準の設定では拡張子 txt はメモ帳と関連付けされています。 Word や Excel がインストールされているコンピュータでは docx は Wordに,xlsx は Excel に関連付けされています。 そのため,これらの拡張子を持つファイルをダブルクリックすると,自動的に Word や Excel が起動して,ファイルが開きます。 拡張子とアプリケーションとの関連付けはユーザーが変更することもできます。

7.2. ファイルのプロパティ

ファイルは様々な情報(属性; property)を持っています。 それらを調べるためには,ファイルのアイコンを右クリックしてコンテキストメニューを表示し,「プロパティ」を選びます。 プロパティを見ると,ファイルの正確なサイズや作成・更新・アクセス日時などがわかります。

7.2.1. 練習

myname.txt や sum.txt のプロパティを表示してみましょう。 このファイル内の文字数とファイルサイズ(「サイズ:」行の値;単位はバイト)にどのような関係があるかを考えましょう。

7.3. 代表的なファイルの種類と拡張子

用途に基づいて分類したファイルの種類のうち,代表的なものだけを以下に幾つか紹介します。

7.3.1. テキスト形式の文書ファイル

  1. プレインテキスト(plain text)

    ファイル内部に特定の構造を持たず,文字・数字・記号だけが書かれているテキスト形式のファイルを,特にプレインテキストファイルと呼ぶことがあります。 また,テキストファイルという言葉は,プレインテキストファイルに対して使われることがあります(狭義のテキストファイル)。 拡張子は通常 txt であることが多いです。

  2. CSV ファイル

    カンマで列が区切られ,改行文字で行が区切られた表形式のテキストファイル。拡張子は通常 csv。

  3. HTML ファイル

    Web ブラウザで表示するための文書を格納したテキストファイル。 HTML はタグと呼ばれるもので文書を構造化できるマークアップ言語の一つです。 ファイルの拡張子は html や htm。

  4. XML ファイル

    XML というマークアップ言語で書かれたテキスト形式のデータファイル。 ファイルの見た目は HTML ファイルに似ていますが,用途は Web ページに限定されません。 通常,拡張子は xml です。

7.3.2. 画像・図形ファイル

大きくはビットマップ(またはラスター)形式とベクター形式に分けられます。

前者は画像を点(画素)の集まりとして表現したものです。 後者は画像(主に図形)の構成要素を,その形や位置の情報で表します。 ビットマップ形式の画像は拡大・縮小によって劣化しますが,ベクター形式では劣化しません。

前者には BMP, GIF, JPEG, PNG, TIFF 形式などがあり,後者には EPS, PDF, SVG 形式などがあります。 拡張子は形式名と同じもの(ただし,通常は小文字)が使われることが多いです。 JPEG 形式の拡張子には jpg も使われます。

7.3.3. 音声・音楽ファイル

圧縮形式と非圧縮形式のファイル形式があります。

WAV (RIFF) 形式は,非圧縮のデータを扱える代表的なファイル形式です。6

圧縮形式には MP3 や Ogg Vorbis (拡張子は .ogx や .ogg 等)などがあります。

これらはすべてバイナリファイルです。

7.3.4. 練習: 画像ファイルの作成と観察

jinkou.xlsx 上のグラフを,幾つかのファイル形式で画像ファイルに保存してみましょう。

そのためには,jinkou.xlsx を開いてからグラフをマウスで選択し, 右クリックでコンテキストメニューを表示して 「図として保存…」を選びます。

保存時に「ファイルの種類」から PNG, BMP, SVG などを選択し,各形式で画像ファイルに保存してください。 ファイルサイズや画質などを比較してみましょう。

8. 課題

この資料で作成したファイル(myname.txt, jinkou.csv, jinkou.txt, sum.txt) を提出してください。

脚注:

1

より正確にいうと,文字コードと若干の制御コードのみを含むファイルがテキストファイルであり,それ以外のファイルがバイナリファイルです。

2

一般には「基本ソフト」と呼ぶこともあります。コンピュータを動かすために必ず必要なソフトウェアと考えてください。

3

ファイルが記録されたメディアさえ利用可能ならば,テキスト形式で保存されたファイルは 30 年前のものでも使えます。

4

ただし,xlsx で終わるファイル名のファイルには,XML 形式等の複数のファイルがひとつのファイルに圧縮されて入っており, XML 形式はテキスト形式の一種なので,xlsx のファイルからテキスト形式のファイルを取り出すことは可能です。

5

Excel が利用できるコンピュータでは,通常は CSV 形式のファイルのアイコンをダブルクリックすると Excel が起動しますが,そうなっていない場合には Excel を起動して,Excel からの操作でファイルを開いてください。

6

WAV 形式は圧縮・非圧縮の両方を扱えますが,非圧縮形式のデータを扱うのが一般的です。

日付: 2023/7/6

著者: 今野 英明

Validate