既に先人の知恵があったので助かった

https://qiita.com/niwaringo/items/d2a30e04e08da8eaa643

都道府県のデータを読み込みたくて

http://jusyo.jp/csv/new.php

ここからzenkoku.csvをpythonのpandasで読み込もうとしたときに、

'utf-8' codec can't decode byte 0x8f in position 0: invalid start byte

で怒られた

解決策

結論から言うと、pythonのデフォルトモジュールのcodecsを使って、文字コードを指定してデコードしてやればいいっぽい。

codecsは任意の文字コードでエンコードやデコードをするモジュールらしい。

さらに、最終手段としてエラーを無視するignoreもつけてやっと開ける。

まじで、行政から出してるデータどうなってんの。。。

もっとプログラムフレンドリーなデータにしてくれるくらいの親切さがあってもいいと思うんだよなぁ

import codecs
with codecs.open('./zenkoku.csv', "r", "Shift-JIS", "ignore") as file:
  df = pd.read_table(file, delimiter=",")
  print(df)