表計算 (4) とファイルの種類
1 テキストファイルとバイナリファイル
テキストファイル (text file; または,テキスト形式のファイル) とは,簡単に言うと,文字だけが入っているファイルです。 それ以外のファイルをバイナリファイル (binary file; または,バイナリ形式のファイル) と呼びます1。 画像や音声の入ったファイルの多くや,Word や Excel で普通に保存したファイルはバイナリファイルです。
1.1 Excel で形式を変えてファイルを保存する (1) csv 形式
次の操作を行ってください。
- jinkou.xlsx を Excel で開いてください。
- 次の手順で,保存するファイルの形式を「CSV(カンマ区切り)」にします。
- 「ファイル」タブ → 名前を付けて保存 -> 現在のフォルダ
の順に進み,「ファイルの種類」として「CSV(カンマ区切り)」を選択してください。
- ファイル名は自動的に jinkou.csv になっているはずですので,確認して「保存」ボタンをクリックします。 警告のダイアログが出ますが,「はい」を選んで保存してください。
- Excel を終了してください。 変更内容を保存する必要はありません。
- jinkou.xlsx が存在するのと同じフォルダに jinkou.csv というファイルができあがったことを,スタートボタンから確認してください。
1.2 csv 形式のファイルを Excel で開く
アイコンをダブルクリックすることで,jinkou.csv を Excel で開いてください2。 jinkou.xlsx にあった罫線やグラフが現れませんね。セルの幅も元とは違って均一です。 これは,今開いた jinkou.csv がテキストファイルだからです。
1.3 エディタ
テキストファイルを作成したり編集するためのプログラムをテキストエディタ (text editor) といいます。 これを単にエディタと呼ぶことも多いです。 世にはたくさんのエディタがありますが,Windows に標準で付属する「メモ帳」もエディタの一つと言えます。 本校の教育用コンピュータでは,メモ帳より少し高度な機能を持つ TeraPad というエディタも使えます。
1.4 csv 形式のファイルをエディタで開く
メモ帳を起動して(スタート → すべてのプログラム → アクセサリ → メモ帳),jinkou.csv を開いてみましょう。 起動したメモ帳でファイルを開く最も簡単な方法は,メモ帳のウィンドウにファイルのアイコンをドラッグすることです。
jinkou.csv の内容は,Excel のセルに表示されていた文字が,カンマ (,) と改行で区切られているだけのものです。 このように,csv 形式のファイルは文字だけが入っていますので,テキストファイルです。
csv 形式は,行と列を持つ表形式のデータを文字だけで表現するために,よく使われます。 csv では列はカンマで区切られます。これが CSV (comma separated values) 形式と呼ばれる理由です。
1.5 Excel 標準形式のファイルをエディタで開く
Excel 2013 で「普通に」に作成した jinkou.xlsx をメモ帳で開いてみましょう。 いま開いているメモ帳のウィンドウに jinkou.xlsx のアイコンをドラッグすればいいです。
メモ帳では文字だけが入ったファイルしか,正常に表示できません。 jinkou.xlsx には,文字がそのまま入っている訳ではなく,Excel ワークシートのいろいろな情報が文字以外の状態で入っていますので,メモ帳では中身を読むことはできません。 すなわち,jinkou.xlsx はバイナリファイルです3。
1.6 Excel で形式を変えてファイルを保存する (2) タブ区切りテキスト形式
再度,Excel で jinkou.xlsx を開き,「ファイルの種類」を「テキスト(タブ区切り)」として「ファイル名を付けて保存」してください。 ファイル名は自動的に jinkou.txt となります。 保存したら,Excel は終了してください。終了時にファイルを再度保存する必要はありません。
ファイル名が .txt で終わるファイルのアイコンをダブルクリックすると,通常の Windows の設定ではメモ帳が起動して,ファイルが開かれます。 ファイルをメモ帳で開いて,元の列が「タブ文字」で区切られていることを確認しましょう。
1.7 Excel で様々なテキストファイルを開く方法
Excel でタブ区切りのテキストファイルを開くことも,もちろん,できます。 ここでは,Excel を起動してから,「ファイル」タブからを「開く」操作をしてみましょう。 ここでファイル名を指定すると「テキストファイルウィザード」というウィンドウが開きます。 これを使うと,様々な形式(列の区切り文字として何を使っているか等)のテキストファイルを,Excel で開くことができます。
1.8 テキストファイルの利点
テキストファイルは,Web 等で多くの人とデータをやりとりする際に,よく使われます。 その理由はテキストファイルの持つ汎用性です。 テキストファイルは多くのアプリケーションや OS (Operating System) で共通に使えるファイル形式ですので,Excel などの特定のアプリケーションを持っていなくとも,データの読み書きができます。 テキスト形式で保存されたファイルは 20 年前のファイルでも利用可能です。
1.9 練習
- メモ帳を使って, 1 から 5 までの整数を,次のように空白区切りで 1 行で書いたデータを作り,sum.txt というファイル名で保存してください。
1 2 3 4 5
- sum.txt を Excel で開き,Excel の計算機能で合計を求めたら,ワークシートを sum.txt に上書き保存してください。
- sum.txt を大学教育情報システムから提出してください。
2 ファイルの種類と拡張子
2.1 ファイルの拡張子とアプリケーションとの関連付け
ファイル名にはピリオド(.; またはドット)が含まれることが多いです。 ファイル名の中の最後のドットに続く文字の並びを,通常,拡張子と呼びます。 例えば,ファイル名 sum.txt の txt は拡張子です。
拡張子はファイルの種類を表すために使います。 例えば,txt はテキスト形式のファイルに対して使われる拡張子で,xlsx は Excel のファイルに使われます4。 拡張子はファイル名の一部として利用者が自由に付けることができますが,ファイルの種類と異なる拡張子をつけると,ファイルの扱いが面倒になったり,アプリケーションからうまく使えなくなりますので注意しましょう。
拡張子の役割のひとつは,アイコンをダブルクリックしたときに,どのアプリケーションでそのファイルを開くかを決めることです。 これをファイルの拡張子とアプリケーションの関連付けといいます。 Windows の標準の設定では拡張子 txt はメモ帳と関連付けされています。 Word や Excel がインストールされているコンピュータでは docx は Wordに,xlsx は Excel に関連付けされています。 そのため,これらの拡張子を持つファイルをダブルクリックすると,自動的に Word や Excel が起動して,ファイルが開きます。 拡張子とアプリケーションとの関連付けはユーザーが変更することもできます。
2.2 ファイルのプロパティ
ファイルには,必ず名前(ファイル名)と内容がありますが,それ以外にもファイルは情報を持っています。 それらを調べるためには,ファイルのアイコンを右クリックしてコンテキストメニューを表示し,「プロパティ」を選びます。 プロパティを見ると,ファイルの正確なサイズや作成・更新・アクセス日時などがわかります。
2.2.1 例
sum.txt のプロパティを表示してみましょう。 このファイル内の文字数とファイルサイズにどのような関係があるでしょう。
2.3 代表的なファイルの種類と拡張子
2.3.1 テキストファイル
- プレインテキスト(plain text)
ファイル内部に特定の構造を持たず,文章だけが書かれているようなテキスト形式のファイルを,特にプレインテキストと呼ぶことがあります。 また,テキストファイルという言葉は,プレインテキストファイルに対して使われることがあります(狭義のテキストファイル)。 拡張子は通常 txt であることが多いです。
- csv ファイル
カンマで列が区切られ,改行文字で行が区切られた表形式のテキストファイル。拡張子は通常 csv。
- html ファイル
Web ブラウザで表示することを意図して作られたテキスト形式。 タグと呼ばれるもので文書が構造化されており(マークアップ言語),タグによって Web ブラウザがどのような見た目で文字を表示するかが決まります。 拡張子は html や htm。
2.3.2 画像・図形ファイル
大まかにははビットマップ(またはラスター)形式とベクター形式に分けられます。 前者は画像を点(画素)の集まりとして表現したもので,後者は画像(主に図形)を,構成する線分の始点・終点等の座標で表します。 ビットマップ形式の画像は拡大・縮小によって劣化しますが,ベクター形式では劣化しません。 前者には BMP, GIF, JPEG, PNG,TIFF 形式などがあり,後者には EPS, PDF, SVG 形式などがあります。 拡張子は形式名と同じものが使われることが多いです。ただし,JPEG 形式の拡張子には jpg もよく使われます。
2.3.3 音声・音楽ファイル
非圧縮ファイルと圧縮ファイルがあります。 Windows では WAV (RIFF) 形式が代表的な非圧縮形式です。 圧縮形式には MP3 や WMA, Ogg Vorbis (拡張子は .ogx や .ogg 等)などがあります。
2.4 画像ファイルの変換
これまでに Excel で作ったグラフの中の一つをコピーして,ペイント(スタート → すべてのプログラム → アクセサリ → ペイント)に貼り付け,「名前を付けて保存」からグラフをいろいろな形式のファイルとして保存しましょう。 bmp, gif, jpg, png 形式のファイルは作ってください。各ファイルのファイルサイズを比較してみましょう。
脚注:
1 より正確にいうと,文字コードと若干の制御コードのみを含むファイルがテキストファイルであり,それ以外のファイルがバイナリファイルです。
2 Excel が利用できるコンピュータでは,通常は csv 形式のファイルのアイコンをダブルクリックすると Excel が起動しますが,そうなっていない場合には Excel を起動して,Excel からの操作でファイルを開いてください。
3 ただし,xlsx で終わるファイル名のファイルには,XML 形式等の複数のファイルがひとつのファイルに圧縮されて入っています。 XML 形式はテキスト形式の一種であり,xlsx のファイルからテキスト形式のファイルを取り出すことは可能です。
4 xlsx, xlsm は XML をベースにしたバージョン 2007 以降用のファイル形式。 xlsb は XML を用いないバイナリ形式。 xls は 2007 以前のバージョンとの互換性維持のための形式。