実現したいこと
pythonで日本語/アルファベット/カタカナで書かれているCSVのリストを
文字化けなしに(エクセルで読み込むのと同様の形式で)一つのファイルに結合したい。
発生している問題・エラーメッセージ
1つのファイルに結合はできるが、文字化けしてしまい、
リストも崩れてしまった。
該当のソースコード
python
import pandas as pd import glob import codecs # パスで指定したファイルの一覧をリスト形式で取得. (ここでは一階層下のtestファイル以下)csv_files = glob.glob('C:/Users/x/x/x/x/x/*.csv') #読み込むファイルのリストを表示for a in csv_files: print(a) #csvファイルの中身を追加していくリストを用意data_list = [] #読み込むファイルのリストを走査 for csv in csv_files: # df = pd.read_csv("data/201902251104359122801.csv") with codecs.open(csv, "r", "Shift-JIS", "ignore") as file: df = pd.read_table(file, delimiter=",") data_list.append(df) #リストを全て行方向に結合#axis=0:行方向に結合, sortdataframe = pd.concat(data_list, axis=0, sort=True) dataframe.to_csv("C:/x/x/x/x/x/total1.csv",index=False)
試したこと
codecsでSHIFT-JISにしてみたが失敗
元ファイルを見たところANSI形式になっていたため、SHIFT-JISからANSIに変えたが同様の事象が起きた。
0 コメント