Pythonのreadlineメソッドの振る舞いとは？文字コードによる違いやreadlineメソッドの使い方を紹介

Python
プログラミング言語

公開日時: 2021-10-12 　更新日時: 2022-06-01

Pythonのreadlineメソッドの振る舞いとは？文字コードによる違いやreadlineメソッドの使い方を紹介

この記事でわかること

システム エンジニア: Pythonのファイルオブジェクトに含まれるreadlineメソッドについて教えてください。

プロジェクト マネージャー: 分かりました。ファイルのオープンモードや文字コード、改行コードなどの違いによるreadlineメソッドの振る舞い方についてサンプルプログラムを用いて解説いたしましょう。

Pythonのreadlineメソッドの振る舞い

プログラミング言語Pythonのファイルオブジェクトに含まれるreadlineメソッドについて解説します。Pythonのファイルオブジェクトに含まれる同様のメソッドにread、readlinesというものもあります。

readlineメソッドは比較的大きなテキストファイルを1行ずつ読み込んで処理するときに適しており、それに対してreadメソッドは比較的大きなファイルを1文字ずつ読み込んで処理するとき、または小さなファイルを一括して読み込むときに適しています。

readlinesメソッドは比較的小さなテキストファイルを一括して読み込み、1行ずつ処理するときに適しています。

以下に出てくるプログラムはPython3上で動作させてください。動作確認はWindowsのPython3.9.1で行いました。

また、サンプルプログラムの実行結果（出力されたファイル）を確認するには文字コードが分かるテキストエディタかバイナリファイルエディタなどをご利用ください。

改行コードによる違い

UTF‐8のファイルをテキストモードでオープンした場合、PythonのreadlineメソッドはCR＋LF、CR、LFのいずれの改行コードも受け付けてくれます。異なる改行コードが混ざっていても問題なく動作します。

以下に改行コードによる違いが無いことを確認するためのサンプルプログラム（Sample1.py）と、異なる改行コードを出力するための（Sample1.pyの入力用ファイル作成）プログラムを紹介します。

改行コードによる違いが無いことを確認するサンプルプログラム（Sample1.py）

下記のプログラムは改行コードによる違いが無いことを確認するためのサンプルプログラム（Sample1.py）です。

testfile1～4.txtのテキストファイルをreadlineメソッドで読み込み、testfile1～4a.txtを出力するものです。

# Sample1.py
# WindowsのPython3.9.1で動作確認しました。
# 改行コードによる違いが無いことを確認するためのサンプルプログラムです。

FNNUM = 4       # ファイル数
fn = ['testfile1.txt', 'testfile2.txt', 'testfile3.txt', 'testfile4.txt']
ofn = ['testfile1a.txt', 'testfile2a.txt', 'testfile3a.txt', 'testfile4a.txt']

for i in range(FNNUM):
    print (fn[i], ofn[i])

    #ファイルオープン
    fr = open(fn[i], 'r', encoding='utf-8')
    fw = open(ofn[i], 'w', encoding='utf-8')

    #1行ずつ読み込み＆書き込み
    while( True ):
        s = fr.readline()       # 1行読み込み
        if not s:       # 読み込み終了？
            break
        print(s, end='')        # 表示
        fw.write(s)     # ファイルに書き込み

    # ファイルをクローズ
    fw.close()
    fr.close()

# Sample1.py

# WindowsのPython3.9.1で動作確認しました。

# 改行コードによる違いが無いことを確認するためのサンプルプログラムです。

FNNUM = 4 # ファイル数

fn = ['testfile1.txt', 'testfile2.txt', 'testfile3.txt', 'testfile4.txt']

ofn = ['testfile1a.txt', 'testfile2a.txt', 'testfile3a.txt', 'testfile4a.txt']

for i in range(FNNUM):

print (fn[i], ofn[i])

#ファイルオープン

fr = open(fn[i], 'r', encoding='utf-8')

fw = open(ofn[i], 'w', encoding='utf-8')

#1行ずつ読み込み＆書き込み

while( True ):

s = fr.readline() # 1行読み込み

if not s: # 読み込み終了？

break

print(s, end='') # 表示

fw.write(s) # ファイルに書き込み

# ファイルをクローズ

fw.close()

fr.close()

Sample1.py入力ファイル出力プログラム（testfile1.py）

サンプルプログラム（Sample1.py）の入力用テキストファイル（testfile1～4.txt）を出力します。なお、出力されるファイルの文字コードはUTF‐8です。

# testfile1.py
# WindowsのPython3.9.1で動作確認しました。
# 改行コードを換えたUTF-8ファイル(testfile1～4.txt)を出力します。

# testfile1(CR+LF) 出力
fw = open('testfile1.txt', 'wb')
data = '東京\r\n神奈川\r\n千葉\r\n埼玉\r\n群馬\r\n茨木\r\n杤木\r\n'
fw.write( data.encode('utf-8') )
fw.close()

# testfile2(CR) 出力
fw = open('testfile2.txt', 'wb')
data = '東京\r神奈川\r千葉\r埼玉\r群馬\r茨木\r杤木\r'
fw.write( data.encode('utf-8') )
fw.close()

# testfile3(LF) 出力
fw = open('testfile3.txt', 'wb')
data = '東京\n神奈川\n千葉\n埼玉\n群馬\n茨木\n杤木\n'
fw.write( data.encode('utf-8') )
fw.close()

# testfile4(混合) 出力
fw = open('testfile4.txt', 'wb')
data = '東京\r神奈川\n千葉\r\n埼玉\r群馬\n茨木\r\n杤木\r'
fw.write( data.encode('utf-8') )
fw.close()

# testfile1.py

# WindowsのPython3.9.1で動作確認しました。

# 改行コードを換えたUTF-8ファイル(testfile1～4.txt)を出力します。

# testfile1(CR+LF) 出力

fw = open('testfile1.txt', 'wb')

data = '東京\r\n神奈川\r\n千葉\r\n埼玉\r\n群馬\r\n茨木\r\n杤木\r\n'

fw.write( data.encode('utf-8') )

fw.close()

# testfile2(CR) 出力

fw = open('testfile2.txt', 'wb')

data = '東京\r神奈川\r千葉\r埼玉\r群馬\r茨木\r杤木\r'

fw.write( data.encode('utf-8') )

fw.close()

# testfile3(LF) 出力

fw = open('testfile3.txt', 'wb')

data = '東京\n神奈川\n千葉\n埼玉\n群馬\n茨木\n杤木\n'

fw.write( data.encode('utf-8') )

fw.close()

# testfile4(混合) 出力

fw = open('testfile4.txt', 'wb')

data = '東京\r神奈川\n千葉\r\n埼玉\r群馬\n茨木\r\n杤木\r'

fw.write( data.encode('utf-8') )

fw.close()

文字コードによる違い

次は文字コードによる違いを見てみることにします。Pythonで文字コードの異なるデータを扱う場合には、通常str型に変換する必要があります。

文字コードを変換するタイミングは2つあり、ファイルオープン時に文字コードを指定して変換するか、バイナリモードでオープンし、読み込んでから文字コード変換するかのいずれかになります。

結論から言えば、ファイルオープン時に文字コードを指定する方法の方がお勧めです。理由はいずれの文字コードおよび改行コードであっても正常に動作するためです。

以下にサンプルプログラム（Sample2.py、Sample3.py）および、その入力用ファイル作成プログラム（testfile2.py）を紹介します。

ファイルオープン時に文字コードを指定（Sample2.py）

Python3ではファイルオープン時に文字コードを指定して読み込むことができます。改行コードはCR＋LF、CR、LFのいずれでも認識されます。

ただし、1行読み込み時に改行コードがCR＋LF（実行環境に依存）に統一されてしまいます。改行コードがCR＋LFに統一されてしまっても問題ない場合は、この方法がお勧めです。

# Sample2.py
# WindowsのPython3.9.1で動作確認しました。
# ファイルオープン時に文字コードを指定する方法です。

fn = ['testfile5.txt', 'testfile6.txt', 'testfile7.txt', 'testfile8.txt']
ofn = ['testfile5a.txt', 'testfile6a.txt', 'testfile7a.txt', 'testfile8a.txt']

# ファイルを1行ずつ読み込み＆書き込み＆表示
def readall(fr,fw):
    #1行ずつ読み込み＆書き込み
    while( True ):
        s = fr.readline()        # 1行読み込み
        if not s:        # 読み込み終了？
            break
        print(s, end='')        # 表示
        fw.write(s)        # ファイルに書き込み

# サブルーチン
def sub(i,enc):
    print (fn[i], ofn[i])

    #ファイルオープン
    fr = open(fn[i], 'r', encoding=enc)
    fw = open(ofn[i], 'w', encoding=enc)

    readall(fr,fw)        # ファイル読み込み＆書き込み

    # ファイルをクローズ
    fw.close()
    fr.close()

# サブルーチンを呼び出して処理を実行
sub(0,'euc_jp')         # testfile5(EUC)
sub(1,'shift_jis')      # testfile6(シフトJIS)
sub(2,'utf-8')          # testfile7(UTF-8)
sub(3,'utf-16be')       # testfile8(UTF-16BE)

# Sample2.py

# WindowsのPython3.9.1で動作確認しました。

# ファイルオープン時に文字コードを指定する方法です。

fn = ['testfile5.txt', 'testfile6.txt', 'testfile7.txt', 'testfile8.txt']

ofn = ['testfile5a.txt', 'testfile6a.txt', 'testfile7a.txt', 'testfile8a.txt']

# ファイルを1行ずつ読み込み＆書き込み＆表示

def readall(fr,fw):

#1行ずつ読み込み＆書き込み

while( True ):

s = fr.readline() # 1行読み込み

if not s: # 読み込み終了？

break

print(s, end='') # 表示

fw.write(s) # ファイルに書き込み

# サブルーチン

def sub(i,enc):

print (fn[i], ofn[i])

#ファイルオープン

fr = open(fn[i], 'r', encoding=enc)

fw = open(ofn[i], 'w', encoding=enc)

readall(fr,fw) # ファイル読み込み＆書き込み

# ファイルをクローズ

fw.close()

fr.close()

# サブルーチンを呼び出して処理を実行

sub(0,'euc_jp') # testfile5(EUC)

sub(1,'shift_jis') # testfile6(シフトJIS)

sub(2,'utf-8') # testfile7(UTF-8)

sub(3,'utf-16be') # testfile8(UTF-16BE)

ファイルをバイナリモードでオープンしてから文字コード変換

文字コードを替えたテキストファイル（異なる改行コード混合）をバイナリモードで読み込んでみましょう（Sample3.py）。

print文の出力をご覧いただくと分かりますが、「東京神奈川」および「埼玉群馬」が繋がって出力されてしまいます。これはCRのみの改行が改行コードとして認識されておらず、2行がまとめて読み込まれてしまっているためです。

また、utf-16beをutf-16leに換えて実行すると文字コード変換の行でデコードエラーになりました。そのため、特に理由がない限りはファイルオープン時に文字コードを指定する方法を使うようにした方が良い結果が得られるでしょう。

# Sample3.py
# WindowsのPython3.9.1で動作確認しました。
# ファイルはバイナリモードでオープンし、1行読み込んでから文字コード変換する方法です。

fn = ['testfile5.txt', 'testfile6.txt', 'testfile7.txt', 'testfile8.txt']
ofn = ['testfile9a.txt', 'testfile10a.txt', 'testfile11a.txt', 'testfile12a.txt']

# ファイルを1行ずつ読み込み＆書き込み＆表示
def readall(fr,fw,decd):
    # 1行ずつ読み込み＆書き込み
    while( True ):
        bs = fr.readline()      # 1行読み込み
        if not bs:      # 読み込み終了？
            break
        s = bs.decode(decd)     # 文字コード変換(UTF-16LEだとデコードエラーになりました）
        print(s)        # 表示
        fw.write(bs)    # ファイルに書き込み

# サブルーチン
def sub(i,enc):
    print (fn[i], ofn[i])

    #ファイルオープン
    fr = open(fn[i], 'rb')
    fw = open(ofn[i], 'wb')

    readall(fr,fw,enc)          # ファイル読み込み＆書き込み

    # ファイルをクローズ
    fw.close()
    fr.close()

# サブルーチンを呼び出して処理を実行
sub(0,'euc_jp')         # testfile5(EUC)
sub(1,'shift_jis')      # testfile6(シフトJIS)
sub(2,'utf-8')          # testfile7(UTF-8)
sub(3,'utf-16be')       # testfile8(UTF-16BE)

# Sample3.py

# WindowsのPython3.9.1で動作確認しました。

# ファイルはバイナリモードでオープンし、1行読み込んでから文字コード変換する方法です。

fn = ['testfile5.txt', 'testfile6.txt', 'testfile7.txt', 'testfile8.txt']

ofn = ['testfile9a.txt', 'testfile10a.txt', 'testfile11a.txt', 'testfile12a.txt']

# ファイルを1行ずつ読み込み＆書き込み＆表示

def readall(fr,fw,decd):

# 1行ずつ読み込み＆書き込み

while( True ):

bs = fr.readline() # 1行読み込み

if not bs: # 読み込み終了？

break

s = bs.decode(decd) # 文字コード変換(UTF-16LEだとデコードエラーになりました）

print(s) # 表示

fw.write(bs) # ファイルに書き込み

# サブルーチン

def sub(i,enc):

print (fn[i], ofn[i])

#ファイルオープン

fr = open(fn[i], 'rb')

fw = open(ofn[i], 'wb')

readall(fr,fw,enc) # ファイル読み込み＆書き込み

# ファイルをクローズ

fw.close()

fr.close()

# サブルーチンを呼び出して処理を実行

sub(0,'euc_jp') # testfile5(EUC)

sub(1,'shift_jis') # testfile6(シフトJIS)

sub(2,'utf-8') # testfile7(UTF-8)

sub(3,'utf-16be') # testfile8(UTF-16BE)

Sample2～3.py入力用ファイル出力プログラム（testfile2.py）

Sample2.pyおよびSample3.pyの入力用ファイルを出力するためのプログラムです。出力されるファイルの改行コードはCR＋LF、CR、LFが混ざったファイルになります。

# testfile2.py
# WindowsのPython 3.9.1で動作確認しました。
# 文字コードを換えたUTF-8ファイル(testfile5～7.txt)を出力します。
# 改行コードは混合です。

# 出力文字列（改行コード混合）
data = '東京\r神奈川\n千葉\r\n埼玉\r群馬\n茨木\r\n杤木\r'

# testfile5 出力
fw = open('testfile5.txt', 'wb')
fw.write( data.encode('euc_jp') )       # EUC
fw.close()

# testfile6 出力
fw = open('testfile6.txt', 'wb')
fw.write( data.encode('shift_jis') )    #シフトJIS
fw.close()

# testfile7 出力
fw = open('testfile7.txt', 'wb')
fw.write( data.encode('utf-8') )        # UTF-8
fw.close()        # ファイルをクローズ

# testfile8 出力
fw = open('testfile8.txt', 'wb')
fw.write( data.encode('utf-16be') )     # UTF-16BE
fw.close()

# testfile2.py

# WindowsのPython 3.9.1で動作確認しました。

# 文字コードを換えたUTF-8ファイル(testfile5～7.txt)を出力します。

# 改行コードは混合です。

# 出力文字列（改行コード混合）

data = '東京\r神奈川\n千葉\r\n埼玉\r群馬\n茨木\r\n杤木\r'

# testfile5 出力

fw = open('testfile5.txt', 'wb')

fw.write( data.encode('euc_jp') ) # EUC

fw.close()

# testfile6 出力

fw = open('testfile6.txt', 'wb')

fw.write( data.encode('shift_jis') ) #シフトJIS

fw.close()

# testfile7 出力

fw = open('testfile7.txt', 'wb')

fw.write( data.encode('utf-8') ) # UTF-8

fw.close() # ファイルをクローズ

# testfile8 出力

fw = open('testfile8.txt', 'wb')

fw.write( data.encode('utf-16be') ) # UTF-16BE

fw.close()

Pythonのreadlineメソッドの使い方

以上のことから、readlineメソッドを使用する場合にはファイルオープン時に文字コードを指定して処理した方が良いでしょう。

もし、改行コードが変わってしまうことが問題となる場合にはテキストデータとしてではなくバイナリデータとして処理すべきでしょう。つまり、「readlineメソッドは使わない」ということです。

なぜならテキストデータにおける改行コードは、あくまで「改行」の意味しかなく、改行コード自体は何であっても（変更されたとしても）問題ないはずだからです。

システム エンジニア: Pythonのファイルのオープンモードや文字コード、改行コードなどの違いによるreadlineメソッドの振る舞い方についてよく分かりました。

プロジェクト マネージャー: ご紹介したソースコードを参考に、ぜひご自身でもソースコードを書いてみてください。

最後に

随分と細かなところを解説してしまいましたが如何でしたでしょうか。通常はここまで気にしなくても問題ないはずですが、文字コードと改行コードが異なるテキストファイルを処理するときにはつまずく場合があるでしょう。

最後まで読んでくれたあなたのお役に立てれば幸いです。

FEnet.NETナビ・.NETコラムは株式会社オープンアップシステムが運営しています。

株式会社オープンアップシステムはこんな会社です

秋葉原オフィスには株式会社オープンアップシステムをはじめグループのIT企業が集結！
数多くのエンジニアが集まります。

スマホアプリから業務系システムまで

スマホアプリから業務系システムまで開発案件多数。システムエンジニア・プログラマーとしての多彩なキャリアパスがあります。
充実した研修制度

毎年、IT技術のトレンドや社員の要望に合わせて、カリキュラムを刷新し展開しています。社内講師の丁寧なサポートを受けながら、自分のペースで学ぶことができます。
資格取得を応援

スキルアップしたい社員を応援するために資格取得一時金制度を設けています。受験料(実費)と合わせて資格レベルに合わせた最大10万円の一時金も支給しています。
東証プライム上場企業グループ

オープンアップシステムは東証プライム上場「株式会社オープンアップグループ」のグループ企業です。

安定した経営基盤とグループ間のスムーズな連携でコロナ禍でも安定した雇用を実現させています。

株式会社オープンアップシステムに興味を持った方へ

株式会社オープンアップシステムでは、開発系エンジニア・プログラマを募集しています。

年収をアップしたい！スキルアップしたい！大手の上流案件にチャレンジしたい！
まずは話だけでも聞いてみたい場合もOK。お気軽にご登録ください。

株式会社オープンアップシステムへ応募する
会員登録不要! カンタン45秒!

Pythonのreadlineメソッドの振る舞いとは？文字コードによる違いやreadlineメソッドの使い方を紹介

Pythonのreadlineメソッドの振る舞い

改行コードによる違い

改行コードによる違いが無いことを確認するサンプルプログラム（Sample1.py）

Sample1.py入力ファイル出力プログラム（testfile1.py）

文字コードによる違い

ファイルオープン時に文字コードを指定（Sample2.py）

ファイルをバイナリモードでオープンしてから文字コード変換

Sample2～3.py入力用ファイル出力プログラム（testfile2.py）

Pythonのreadlineメソッドの使い方

最後に

株式会社オープンアップシステムはこんな会社です

スマホアプリから業務系システムまで

充実した研修制度

資格取得を応援

東証プライム上場企業グループ

株式会社オープンアップシステムに興味を持った方へ

新着案件New Job

開発エンジニア/東京都品川区/【WEB面談可】/在宅ワーク

遠隔テストサービス機能改修/JavaScript/東京都港区/【WEB面談可】/テレワーク

病院内システムの不具合対応、保守/東京都豊島区/【WEB面談可】/テレワーク

開発/JavaScript/東京都豊島区/【WEB面談可】/テレワーク

債権債務システム追加開発/東京都文京区/【WEB面談可】/在宅勤務

PMO/東京都豊島区/【WEB面談可】/在宅勤務

Pythonのreadlineメソッドの振る舞いとは？文字コードによる違いやreadlineメソッドの使い方を紹介

Pythonのreadlineメソッドの振る舞い

改行コードによる違い

改行コードによる違いが無いことを確認するサンプルプログラム（Sample1.py）

Sample1.py入力ファイル出力プログラム（testfile1.py）

文字コードによる違い

ファイルオープン時に文字コードを指定（Sample2.py）

ファイルをバイナリモードでオープンしてから文字コード変換

Sample2～3.py入力用ファイル出力プログラム（testfile2.py）

Pythonのreadlineメソッドの使い方

最後に

株式会社オープンアップシステムはこんな会社です

スマホアプリから業務系システムまで

充実した研修制度

資格取得を応援

東証プライム上場企業グループ

株式会社オープンアップシステムに興味を持った方へ

新着案件New Job

開発エンジニア/東京都品川区/【WEB面談可】/在宅ワーク

遠隔テストサービス機能改修/JavaScript/東京都港区/【WEB面談可】/テレワーク

病院内システムの不具合対応、保守/東京都豊島区/【WEB面談可】/テレワーク

開発/JavaScript/東京都豊島区/【WEB面談可】/テレワーク

債権債務システム追加開発/東京都文京区/【WEB面談可】/在宅勤務

PMO/東京都豊島区/【WEB面談可】/在宅勤務

関連記事Related Posts

PythonでMySQLを扱う方法とは？基本的な使い方や例外処理などを紹介！

Pythonでのmapの使い方とは？リストやDataFrameに対するmapの使い方を解説！

Pythonにおけるreturn文の機能と使い方とは？サンプルプログラムでわかりやすく解説！

PythonでGUIを作成する方法とは？｜Tkinterを使って様々なGUIを作成する方法を紹介！

PythonでのDTOクラスとは？基本的な使い方や辞書形式やタプル形式に変換する方法を紹介します！