Google Colaboratoryで、2017年第1四半期から2018年第4四半期で,山形県で取引された不動産情報を重回帰分析したいのですが、下記のエラーが起きてしまいました。誰か分かる方教えていただけるとありがたいです。m(__)m
発生している問題・エラーメッセージ
['築年数'] not in index
該当のソースコード
python
1from google.colab import drive 2import pandas as pd 3from sklearn.model_selection import train_test_split 4from sklearn.linear_model import LinearRegression 5from sklearn import metrics 6 7data_from_csv = pd.read_csv("/content/drive/MyDrive/06_Yamagata Prefecture_20171_20184.csv", encoding='cp932')8 9df = data_from_csv 10 11features = ['最寄駅:距離(分)', '面積(㎡)', '築年数', '建ぺい率(%)', '容積率(%)', '間取り', '建物の構造', '市区町村名']12target = '取引価格(総額)'13 14data = df[features + [target]]15 16data = pd.get_dummies(data)17 18data = data.dropna()19 20X = data.drop(target, axis=1)21y = data[target]22 23X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)24 25model = LinearRegression()26model.fit(X_train, y_train)27 28y_pred = model.predict(X_test)29 30print('Mean Absolute Error:', metrics.mean_absolute_error(y_test, y_pred))31print('Mean Squared Error:', metrics.mean_squared_error(y_test, y_pred))32print('Root Mean Squared Error:', np.sqrt(metrics.mean_squared_error(y_test, y_pred)))
の data = df[features + [target]] に赤いにょろにょろが表示されています。
0 コメント