実現したいこと
初歩的な質問で恐縮です。
以下のようなDataFrameについて、「品物」列のカテゴリ別の標準化をしたスコアを
一番右の列に加えたいのですが、やり方が分からず投稿させて頂きました。
該当のソースコード
df = pd.DataFrame({ '売上': [ 3069, 8390, 6378, 6236, 4486, 2234, 9482, 4938, 3948], '品物': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'C', 'C'] })
試したこと
列全体の標準化は以下の式で出せたのですが、「品物」カテゴリ内での標準化した数値を右の列に加えたい場合はどのようなコードを書くのが適切でしょうか?
df['売上_標準化'] = (df['売上'] - df['売上'].mean()) / df['売上'].std()
基本的な内容で恐れ入りますが、調べても中々分からなかったのでご質問させて頂きました。
何卒よろしくお願いいたします。
0 コメント