既に先人の知恵があったので助かった
https://qiita.com/niwaringo/items/d2a30e04e08da8eaa643
都道府県のデータを読み込みたくて
ここからzenkoku.csvをpythonのpandasで読み込もうとしたときに、
'utf-8' codec can't decode byte 0x8f in position 0: invalid start byte
で怒られた
解決策
結論から言うと、pythonのデフォルトモジュールのcodecsを使って、文字コードを指定してデコードしてやればいいっぽい。
codecsは任意の文字コードでエンコードやデコードをするモジュールらしい。
さらに、最終手段としてエラーを無視するignoreもつけてやっと開ける。
まじで、行政から出してるデータどうなってんの。。。
もっとプログラムフレンドリーなデータにしてくれるくらいの親切さがあってもいいと思うんだよなぁ
import codecs
with codecs.open('./zenkoku.csv', "r", "Shift-JIS", "ignore") as file:
df = pd.read_table(file, delimiter=",")
print(df)