7. テキストファイルの利用; ファイルとフォルダ

目次

1 今回の目的

  • 表計算ソフトウェアやテキストエディタでテキスト形式のデータを扱えるようになる。
  • ファイルの種類や形式について知る。
  • 階層的なフォルダ(ディレクトリ)の構造を理解し,それを活用して自分のファイルを整理できるようになる。(3-9)

2 テキストファイルの利用

2.1 ファイルの形式(テキストファイルとバイナリファイル)

ファイルはテキストファイルとバイナリファイルに大別できます。

  • テキストファイル(またはテキスト形式のファイル): 簡単に言えば,文字だけが入っているファイル
  • バイナリファイル(またはバイナリ形式のファイル): テキストファイルでないファイル1

画像や音声の入ったファイルの多くや,Word や Excel で普通に保存したファイルはバイナリファイルです。

2.2 テキストファイルの利点

Web 等で多くの人とデータをやりとりする際に,テキストファイルがよく使われます。 その理由はテキストファイルの持つ汎用性にあります。 テキストファイルは多くのアプリケーションや OS (Operating System) で共通に使えるファイル形式ですので,Excel などの特定のアプリケーションを持っていなくとも,ファイル内のデータを読むことができます2。 もちろん,Excel でテキストファイルを扱うことも可能です。

2.3 エディタの利用

2.3.1 テキストエディタ

テキストファイルを作成したり編集するためのプログラムをテキストエディタ (text editor) といいます。 これを単にエディタと呼ぶことも多いです。 世にはたくさんのエディタがありますが,Windows に標準で付属する「メモ帳」もエディタの一つと言えます。 本校の教育用コンピュータでは,メモ帳より少し高度な機能を持つ TeraPad というエディタも使えます3

2.3.2 テキストファイルの作成

  1. エディタ(メモ帳)を起動して,いわゆる半角英数字(直接入力)で自分の学籍番号とローマ字氏名を入力してみましょう。
    • メモ帳の起動法: スタート → すべてのプログラム → アクセサリ → メモ帳
  2. 「書式」メニューから文字の大きさやフォントを変更してみましょう。学籍番号と氏名を異なる大きさにできますか。
  3. テキストを myname.txt という名前のファイル(テキストファイル)に保存(名前を付けて保存)してください。
  4. そのファイルをエディタ(Terapad)で開いて,ファイルの内容を確認しましょう。テキストファイルには文字の情報しか入っていないことが確認できましたか。
    • TeraPad の起動法: スタート → すべてのプログラム → TeraPad → TeraPad

2.3.3 バイナリファイルをエディタで開いてみる

Excel 2013 で「普通に」に作成した jinkou.xlsx をメモ帳で開いてみましょう。

最も簡単なのは,開いているメモ帳のウィンドウに jinkou.xlsx のアイコンをドラッグすることです。

メモ帳で正常表示できるのはテキストファイルだけです。 jinkou.xlsx には,文字がそのまま入っている訳ではなく,Excel ワークシートのいろいろな情報が文字以外の状態で入っていますので,メモ帳では中身を読むことはできません。 これで jinkou.xlsx がバイナリファイルであることが確認できました4

2.4 表計算ソフトウェアによるテキストファイルの利用

2.4.1 Excel のデータを CSV 形式で保存

まず,次の手順で jinkou.xlsx 内のデータを CSV 形式のファイルに保存してみましょう。

  1. jinkou.xlsx を Excel で開いてください。
  2. 次の手順で,保存するファイルの形式を「CSV(カンマ区切り)」にします。

    「ファイル」タブ → 名前を付けて保存 → 現在のフォルダ

    の順に進み,「ファイルの種類」として「CSV(カンマ区切り)」を選択してください。

  3. ファイル名は自動的に jinkou.csv になっているはずですので,確認して「保存」ボタンをクリックします。 警告のダイアログが出ますが,「はい」を選んで保存してください。
  4. Excel を終了してください。終了時の保存確認のダイアログでは変更内容を保存しないでください。
  5. jinkou.xlsx が存在するのと同じフォルダに jinkou.csv というファイルができあがったことを確認してください。

2.4.2 CSV 形式とは

エディタを使って jinkou.csv を開いてみましょう。

  1. メモ帳を起動し,「ファイル」メニューから「開く」を選択してください。
  2. 新しく現れるウィンドウでファイル名を直接打ち込むか,「テキスト文書」でなく「すべてのファイル」を表示させるとマウスでファイル名を選べますので,jinkou.csv を開いてください。

jinkou.csv の内容は,Excel のセルに表示されていた文字が,カンマ (,) と改行で区切られているだけのものです。 これが CSV (comma separated values) と呼ばれる所以です。

CSV 形式のファイルは文字・記号だけを含みますので,もちろんテキストファイルです。

CSV 形式は,行と列を持つ表形式のデータをテキスト形式で表現するために,よく使われます。

2.4.3 CSV ファイルを Excel で開く

アイコンをダブルクリックすることで,jinkou.csv を Excel で開いてください5。 jinkou.xlsx にあった罫線やグラフが現れませんね。セルの幅も元とは違って均一です。 これは,今開いた jinkou.csv がテキストファイルだからです。

2.4.4 Excel のデータをタブ区切りテキスト形式で保存

  1. 再度,Excel で jinkou.xlsx を開いてください
  2. 「ファイルの種類」を「テキスト(タブ区切り)」として「ファイル名を付けて保存」してください。ファイル名は自動的に jinkou.txt となります。
  3. 保存したら,Excel は終了してください。終了時にファイルを再度保存しないでください。

ファイル名が .txt で終わるファイルのアイコンをダブルクリックすると,通常の Windows の設定ではメモ帳が起動して,ファイルが開かれます。 ファイルをメモ帳で開いて,元の列が「タブ文字」で区切られていることを確認しましょう。

2.4.5 Excel で様々な形式のテキストファイルを開くには

Excel でタブ区切りのテキストファイルを開くことも,もちろん,できます。 ここでは,Excel を起動してから,「ファイル」タブからを「開く」操作をしてみましょう。 「ファイルを開く」というウィンドウで「すべてのファイル」を表示すれば,マウスですべての種類を選べます。 ここでテキストファイルを選ぶと「テキストファイルウィザード」というウィンドウが開きます。 これを使うと,様々な形式(列の区切り文字として何を使っているか等)のテキストファイルを,Excel で開くことができます。

2.5 練習

  1. エディタ(例えばメモ帳)を使って, 1 から 10 までの整数を,次のように空白区切りで 2 行で書いたデータを作り,sum.txt というファイル名で保存してください。
    1 2 3 4 5
    6 7 8 9 10
    
  2. sum.txt を Excel で開き,Excel の計算機能(式は適当なセルに入れる)で合計を求めたら,ワークシートを sum.txt に上書き保存してください。
  3. sum.txt をエディタで開いて,内容を確認してください。

3 ファイルの種類と拡張子

3.1 ファイルの拡張子とアプリケーションとの関連付け

ファイル名にはピリオド(.; またはドット)が含まれることが多いです。 ファイル名の中の最後のドットに続く文字の並びは,一般的に拡張子と呼ばれます。 例えば,ファイル名 sum.txt の txt は拡張子です。

拡張子はファイルの種類を表すために使います。 例えば,txt はテキスト形式のファイルに対して使われる拡張子で,xlsx は Excel のファイルに使われます6。 拡張子はファイル名の一部として利用者が自由に付けることができますが,ファイルの種類と異なる拡張子をつけると,ファイルの扱いが面倒になったり,アプリケーションからうまく使えなくなりますので注意しましょう。

拡張子の役割のひとつは,アイコンをダブルクリックしたときに,どのアプリケーションでそのファイルを開くかを決めることです。 これをファイルの拡張子とアプリケーションの関連付けといいます。 Windows の標準の設定では拡張子 txt はメモ帳と関連付けされています。 Word や Excel がインストールされているコンピュータでは docx は Wordに,xlsx は Excel に関連付けされています。 そのため,これらの拡張子を持つファイルをダブルクリックすると,自動的に Word や Excel が起動して,ファイルが開きます。 拡張子とアプリケーションとの関連付けはユーザーが変更することもできます。

3.2 ファイルのプロパティ

ファイルには,必ず名前(ファイル名)と内容がありますが,それ以外にもファイルは情報を持っています。 それらを調べるためには,ファイルのアイコンを右クリックしてコンテキストメニューを表示し,「プロパティ」を選びます。 プロパティを見ると,ファイルの正確なサイズや作成・更新・アクセス日時などがわかります。

3.2.1 練習

myname.txt や sum.txt のプロパティを表示してみましょう。 このファイル内の文字数とファイルサイズにどのような関係があるでしょう。

3.3 代表的なファイルの種類と拡張子

用途に基づいて分類したファイルの種類のうち,代表的なものだけを以下に幾つか紹介します。

3.3.1 テキスト形式の文書ファイル

  1. プレインテキスト(plain text)

    ファイル内部に特定の構造を持たず,文字・数字・記号だけが書かれているテキスト形式のファイルを,特にプレインテキストファイルと呼ぶことがあります。 また,テキストファイルという言葉は,プレインテキストファイルに対して使われることがあります(狭義のテキストファイル)。 拡張子は通常 txt であることが多いです。

  2. CSV ファイル

    カンマで列が区切られ,改行文字で行が区切られた表形式のテキストファイル。拡張子は通常 csv。

  3. HTML ファイル

    Web ブラウザで表示するための文書を格納したテキストファイル。 HTML はタグと呼ばれるもので文書を構造化できるマークアップ言語の一つです。 ファイルの拡張子は html や htm。

  4. XML ファイル

    XML というマークアップ言語で書かれたテキスト形式のデータファイル。 ファイルの見た目は HTML ファイルに似ていますが,用途は Web ページに限定されません。 通常,拡張子は xml です。

3.3.2 画像・図形ファイル

大きくはビットマップ(またはラスター)形式とベクター形式に分けられます。

前者は画像を点(画素)の集まりとして表現したものです。 後者は画像(主に図形)の構成要素を,その形や位置の情報で表します。 ビットマップ形式の画像は拡大・縮小によって劣化しますが,ベクター形式では劣化しません。

前者には BMP, GIF, JPEG, PNG, TIFF 形式などがあり,後者には EPS, PDF, SVG 形式などがあります。 拡張子は形式名と同じもの(ただし,通常は小文字)が使われることが多いです。 JPEG 形式の拡張子には jpg もよく使われます。

3.3.3 音声・音楽ファイル

圧縮形式と非圧縮形式のファイル形式があります。

WAV (RIFF) 形式は,非圧縮のデータを扱える代表的なファイル形式です。7

圧縮形式には MP3 や Ogg Vorbis (拡張子は .ogx や .ogg 等)などがあります。

これらはすべてバイナリファイルです。

3.4 画像ファイルの作成

jinkou.xlsx に作成した グラフ を幾つかの形式の画像ファイルに保存してみます。 以下を行ってください。

  1. jinkou.xlsx を Excel で開く
  2. ペイントを起動する(スタート → すべてのプログラム → アクセサリ → ペイント)。
  3. Excel 上の円グラフを複写(ctrl-c 等)し,ペイントに貼り付ける(ctrl-v 等)。
  4. 貼り付けたグラフを「名前を付けて保存」から「その他の形式」を選んで次の各形式(ファイル名)で保存する。
    1. PNG (ratio.png)
    2. BMP画像→24 ビット ビットマップ (ratio.bmp)
    3. BMP画像→256 色ビットマップ (ratio256color.bmp)
  5. 各ファイルのファイルサイズや画質を比較してみましょう。

4 フォルダの階層構造とファイル操作

4.1 フォルダと階層構造

所有するファイルの数が多くなってくると,重複しない適切なファイル名を考えたり,使いたいファイルを探すのが大変になってきます。 そのような場合,ファイルを入れるフォルダを複数作成しておき,適当なフォルダにファイルを入れて整理するのが普通です。

フォルダの中には,さらにフォルダを作ることができます。 この仕組みを利用すると,ファイルを大分類・中分類・小分類のように,階層的に分類して整理できます。 これをフォルダの階層構造(木構造)と呼びます。

スタートボタンからコンピュータをクリックすると,そのコンピュータから利用可能な外部記憶装置が表示されます。 Windows では各装置をドライブとして区別します8。 ドライブの名前をドライブ名といい,A から Z のアルファベットが使われます。

ドライブ毎に物理的なフォルダ(ディレクトリ)を階層的に作成することができます。

例えば,Windows では一般的に,コンピュータに内蔵されたハードディスクドライブは C ドライブ(C: と表記)となり,その中には Windows が動作するのに必要なファイルや,アプリケーションソフトウェアのためのファイルが,階層的に配置されているのを見ることができます。

4.2 ファイル操作

ファイルやフォルダの作成・複写・移動・名前変更などの操作を,ここではファイル操作と呼びます。

Windows でのファイル操作の方法はたくさんありますので,ここでは具体的な操作法の紹介は略しますが, 「Windows7(もしくは自分の使っている OS 名) ファイル操作 Tips」などのキーワードで Web 検索すると,いろいろと便利な方法があることがわかります。 正確(誤りがない)で効率の良い(素早い)ファイル操作の方法を身につけると,コンピュータをうまく使いこなすことができます。

4.3 練習

今回作った各ファイルを,フォルダを作成してそこに移動することによって,下の図のように整理しましょう。 図において,johokiki7,data,image,misc は新しく作成するフォルダの名前であり,それ以外のものは作成済みのファイルの名前です。 johokiki7 の中に他の三つのフォルダを配置し,それらの中に各ファイルを移動してください。 なお,johokiki7 を作成する場所(フォルダ)は任意ですが,ドキュメントや H ドライブの直下,デスクトップ等が考えられます。

また,jinkou.txt を作成していなければ data フォルダから省いてもよいです。

johokiki7
  |
  + data 
  |   |
  |   + jinkou.csv
  |   + jinkou.txt
  |
  + image
  |   |
  |   + ratio.png
  |   + ratio.bmp
  |   + ratio256color.bmp
  |
  + misc
      |
      + myname.txt
      + sum.txt

5 ファイル提出

前の練習問題で作成したフォルダ・ファイルの階層構造を zip ファイルにしたものを 提出してください。

  1. zip ファイルの作り方

    作成した johokiki7 をマウスで右クリックして現れるメニュー(コンテキストメニュー)の「送る」の中の「圧縮(zip形式)フォルダー」をクリックします。

  2. 提出方法

    大学教育情報システムから提出してください。

脚注:

1

より正確にいうと,文字コードと若干の制御コードのみを含むファイルがテキストファイルであり,それ以外のファイルがバイナリファイルです。

2

ファイルが記録されたメディアさえ利用可能ならば,テキスト形式で保存されたファイルは 30 年前のものでも使えます。

3

さらに高機能なエディタ vim もコマンドプロンプトや Msys のシェルのコマンドラインから使えるはずです。vim は UNIX や Linux という種類の OS における代表的なエディタの一つです。

4

ただし,xlsx で終わるファイル名のファイルには,XML 形式等の複数のファイルがひとつのファイルに圧縮されて入っています。 XML 形式はテキスト形式の一種であり,xlsx のファイルからテキスト形式のファイルを取り出すことは可能です。

5

Excel が利用できるコンピュータでは,通常は CSV 形式のファイルのアイコンをダブルクリックすると Excel が起動しますが,そうなっていない場合には Excel を起動して,Excel からの操作でファイルを開いてください。

6

xlsx, xlsm は XML をベースにしたバージョン 2007 以降用のファイル形式。 xlsb は XML を用いないバイナリ形式。 xls は 2007 以前のバージョンとの互換性維持のための形式。

7

WAV 形式は圧縮・非圧縮の両方を扱えますが,非圧縮形式のデータを扱うのが一般的です。

8

同じ装置を複数のドライブに分けて使うこともあります。

日付: 2018/6/14

著者: 今野 英明

Validate