前提
統計学ソフトRでのエラーについてです。
解決策が分からないため質問させていただきます。
Windows11
R
実現したいこと
興行収入をスクレイピングしたcsvファイルにWeekend_Grossとnum_weekという興行収入と映画公開から何週間たったかを示す変数があります。この二つを散布図でplotしたいのですがエラーが出てしまいました。
ファイルの中身はこんな感じです。
csvファイルには100件以上の映画があるためnum_weekは同じ数字、特に1~6(1週間~6週間)の数値が多いです。縦軸にWeekend_Gross、横軸にnum_weekにしたいです。このままではよくわからにグラフになるので、Rのaggregate関数を使ってnum_weekの数値によってWeekend_Grossの平均をプロットしていこうと思いました。
イメージはこんな感じになるかと思います。
※このグラフは友達から提供してもらったものです。
そのコードが以下になります。
該当のソースコード
R
data1 <- read.csv("2016week_favorite.csv",encoding = "UTF-8") data1 <- filter(data1,num_week < 50) #外れ値削除 mean_Gross <- aggregate(x=data1[c("Weekend_Gross")],by = list(data1$num_week),FUN = mean) #平均 plot(mean_Gross)
発生している問題・エラーメッセージ
しかしコードを実行すると
Error in [.data.frame
(data1, c("Weekend_Gross")) :
未定義の列が選ばれました
とのエラーが吐かれます。解決方法が見つけられなかったので皆さんの力をお借りできればなと思います。
よろしくお願いいたします。
0 コメント