CSVファイルにおける特定の列群だけ取得したい

実現したいこと

・条件を満たす列の抽出

前提

環境はJupyterLabで、pythonを使用しています

csvファイルに大量の列があり、各列名は"ID+α"であり、αは列ごとに異なります

列の中から特定のIDを名前に含んだ列だけを抽出したファイルを作成したいです

特定のIDとは4桁の数で、それらは配列で与えられています

Python

1#列名の例2columns = "0001_A","0002_B","0003_C", ... ,"0027_AA", ...3#特定のID群の例4arr = ["0001","0002","0005","0012", ... ]

いくつかの方法を調べましたが、上記を容易に解決できる方法が思い浮かびませんでした

発生している問題・エラーメッセージ

皆さんのお力をお借りできれば幸いです
よろしくおねがいいたします

調査したこと・試したこと

列名の一部にIDが含まれているため、pandasのfilterでlikeを行おうとしましたが
likeは文字列でしか使えないため、配列ごとは適用できませんでした

また、列を一つずつ抜き出したファイルを作成し、条件に沿ったファイルだけを結合しようとしましたが
複数ファイルの読み込みかつキー結合が必要なため、pandasや、スクリプトでも難しく断念いたしました

コメントを投稿

0 コメント