pytorchを用いた物体検出モデルの自作datasetについて

datasetを作成するとき、説明変数と目的変数変数のペアで作成すと思うのですが、物体検出のように1枚の画像に複数の目的変数(検出したい物体が犬の場合、画像の中に2匹いる、)がある場合はどのような感じで作れば良いでしょうか。

私が考えるに、
image01 に2匹の犬が写っている
image02 に1匹の犬が写っている 
としたら、

画像名  | xmin | ymin | xmax | ymax | class
image01| hoge | hoge| hoge | hoge | 0
image01| hoge2 | hoge2| hoge2 | hoge2 | 0
image02| hoge3 | hoge3| hoge3 | hoge3 | 0

のようにimage01を複数つくる必要があると考えているのですが、あっていますでしょうか。

コメントを投稿

0 コメント