エラー対処：UnicodeDecodeError

2018.08.12 14:36

（pandasでcsvファイルを読み込むときなど。）

'shift_jis' codec can't decode byte 0x87 in position 4: illegal multibyte sequence

'utf-8' codec can't decode byte 0x95 in position 0: invalid start byte

など。

もしデフォルト（省略した場合）はutf-8で、utf-8ではないファイルに対しては文字化けするのではなくエラーUnicodeDecodeErrorになる。

正しいエンコーディングを指定すれば大体解決する。

ほかに文字列が混ざっている事もある。その時は　encoding='cp932'　で指定すれば読み込める　（参考リンク, リンク：encoding="utf-8_sig"）

それでも解決しない場合の対処法はこれ　リンク　を参考してください。

文字コード

簡単に言えば　「文字に割り当てられる固有の番号」のこと。

日本語を表現出来る文字コードは主に三種類がある：

WindowsでCP932(Shift-JIS)エンコード以外のファイルを開くのに苦労した話 - Qiita

初投稿記事です。非情報学部からIT業界に就職し、入社から1年がたとうとしている人の記事です。プログラミング以外にも記事を書いたり説明することも下手ですので、暖かく見守って頂けると幸いです。何か指摘がございましたらコメントお願い...

Qiita

wakid007's Ownd

0コメント