Tensorflow・kerasでの画像認識モデル作成で、学習データとテストデータをnpyで一つにまとめたい

実現したいこと

Tensorflow・kerasでの画像認識モデル作成で、学習データとテストデータをnpyで一つにまとめたい

前提

こちらのURLを参考にkerasでのモデル作成のためのデータセットを作っていました。

Tensorflow・kerasで画像認識モデル作成|深層学習×Pythonの畳み込みニューラルネットワーク(CNN)

下にあるソースコードはこのURLにあったコードとほぼ同じです
labels = ["blueberry","grapes","mixedfruit"]
のところのみ変更しました。

このエラーを解決するためになにか知っている人はいますか?

発生している問題・エラーメッセージ

Traceback (most recent call last): File "c:\Users\topaz\Desktop\Keras\createsamples.py", line 74, in <module> np.save(dataset_dir,dataset) File "<__array_function__ internals>", line 200, in save File "C:\Users\topaz\AppData\Local\Programs\Python\Python310\lib\site-packages\numpy\lib\npyio.py", line 521, in save arr = np.asanyarray(arr) ValueError: setting an array element with a sequence. The requested array has an inhomogeneous shape after 1 dimensions. The detected shape was (4,) + inhomogeneous part.

該当のソースコード

python

1from PIL import Image 2import numpy as np 3import os,glob 4 5# クラスラベル6labels = ["blueberry","grapes","mixedfruit"]7# ディレクトリ8dataset_dir = "data/dataset.npy" # 前処理済みデータ9model_dir = "data/cnn_h5" # 学習済みモデル10# リサイズ設定11resize_settings = (50,50)12 13# 画像データ14X_train = [] # 学習15y_train = [] # 学習ラベル16X_test = [] # テスト17y_test = [] # テストラベル18 19for class_num, label in enumerate(labels):20 21 # 写真のディレクトリ22 photos_dir = "data/" + label 23 24 # 画像データを取得25 files = glob.glob(photos_dir + "/*.jpg")26 27 #写真を順番に取得28 for i,file in enumerate(files):29 30 # 画像を1つ読込31 image = Image.open(file)32 33 # 画像をRGBの3色に変換34 image = image.convert("RGB")35 36 # 画像のサイズを揃える37 image = image.resize(resize_settings)38 39 # 画像を数字の配列変換40 data = np.asarray(image) 41 42 # テストデータ追加43 if i%4 ==0:44 X_test.append(data)45 y_test.append(class_num)46 47 # 学習データ傘増し48 else: 49 # -20度から20度まで4度刻みで回転したデータを追加50 for angle in range(-25,20,5):51 # 回転52 img_r = image.rotate(angle)53 # 画像 → 数字の配列変換54 data = np.asarray(img_r)55 # 追加56 X_train.append(data)57 y_train.append(class_num)58 # 画像左右反転59 img_trans = image.transpose(Image.FLIP_LEFT_RIGHT)60 data = np.asarray(img_trans)61 X_train.append(data)62 y_train.append(class_num) 63 64 65# X,YがリストなのでTensorflowが扱いやすいようnumpyの配列に変換66X_train = np.array(X_train)67X_test = np.array(X_test)68y_train = np.array(y_train)69y_test = np.array(y_test)70 71 72# 前処理済みデータを保存73dataset = (X_train,X_test,y_train,y_test)74np.save(dataset_dir,dataset)

試したこと

google翻訳でエラーを翻訳して「配列の次元?が不均一」と書かれていたので、そろえようとしたがエラーが増えてよくわからなかった。

やってほしいこと

この原因の解明と対策

補足情報(FW/ツールのバージョンなど)

python3.10.10
numpy==1.24.2
Pillow==10.0.0

コメントを投稿

0 コメント