-
Notifications
You must be signed in to change notification settings - Fork 0
Home
Semantic Segmentation ๋ํ์์ ์ฌ์ฉํ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ต๋๋ค.
- ๋๋์ผ๋ก ๋ฌผ๊ฑด์ด ๋ง๋ค์ด์ง๊ณ ์๋น๋ฅผ ํ๋ฉด์ ์ฌ๊ฐํ ์ฐ๋ ๊ธฐ ๋ฌธ์ ๋ฅผ ๋ณ๊ณ ์๋ค.
- ์ฐ๋ ๊ธฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด "๋ถ๋ฆฌ ์๊ฑฐ"๋ฅผ ํตํด ์ ๋ถ๋ฆฌ ๋ฐฐ์ถ๋ ์ฐ๋ ๊ธฐ๋ ์์์ผ๋ก์ ๊ฐ์น๋ฅผ ์ธ์ ๋ฐ์ ์ฌํ์ฉ๋๋ค.
- ๊ทธ๋งํผ "๋ถ๋ฆฌ ์๊ฑฐ"๊ฐ ์ค์ํ์ง๋ง, "์ด ์ฐ๋ ๊ธฐ๊ฐ ์ด๋์ ์ํ๋์ง", "์ด๋ค ๊ฒ๋ค์ ๋ถ๋ฆฌํด์ ๋ฒ๋ฆฌ๋ ๊ฒ์ด ๋ง๋์ง" ๋ฑ ์ ํํ ๋ถ๋ฆฌ์๊ฑฐ ๋ฐฉ๋ฒ์ ์๊ธฐ ์ด๋ ต๋ค๋ ๋ฌธ์ ์ ์ด ์๋ค.
- ์ฐ๋ ๊ธฐ๊ฐ ์ฐํ ์ฌ์ง์ ๊ฐ์ง๊ณ Detection์ ์งํํด ์์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ํ๋ค.
์ฐ๋ ๊ธฐ๊ฐ ์ฐํ ์ฌ์ง์์ ์ฐ๋ ๊ธฐ๋ฅผ ํ์งํ์ฌ Box๋ฅผ ๋ง๋ค๊ณ ๋ฐฐ๊ฒฝ์ ํฌํจํ 12๊ฐ์ ํด๋์ค๋ก ๋ถ๋ฅํ๋ Detection ๋ชจ๋ธ
- input:ย ย ์ฐ๋ ๊ธฐ ์ด๋ฏธ์ง (512, 512) ์ด 4109์ฅ๊ณผ COCO Format์ผ๋ก ์ด๋ฃจ์ด์ง Annotation ํ์ผ
โโ images
โ โโ id: ํ์ผ ์์์ image ๊ณ ์ id, ex) 1
โ โโ height: 512
โ โโ width: 512
โ โโ filename: ex) batch01_vt/002.jpg
โ
โโ annotations
โโ id: ํ์ผ ์์ annotation ๊ณ ์ id, ex) 1
โโ segmentation: masking ๋์ด ์๋ ๊ณ ์ ์ ์ขํ
โโ bbox: ๊ฐ์ฒด๊ฐ ์กด์ฌํ๋ ๋ฐ์ค์ ์ขํ (xmin, ymin, w, h)
โโ area: ๊ฐ์ฒด๊ฐ ์กด์ฌํ๋ ์์ญ์ ํฌ๊ธฐ
โโ category_id: ๊ฐ์ฒด๊ฐ ํด๋นํ๋ class์ id
โโ image_id: annotation์ด ํ์๋ ์ด๋ฏธ์ง ๊ณ ์ id
-
output: 12๊ฐ์ ํด๋์ค
- Background, UNKNOWN, General trash, Paper, Paper pack, Metal, Glass, Plastic, Styrofoam, Plastic bag, Battery, Clothing
- ์์ 60๋ฑ, mAP 0.4490
- ์ ์ถํ์ ์ด 20ํ (ํ 151ํ)
ํ์ ๋ํ ์ฐธ์ฌ ๊ณผ์ ์ ๋ฐ๋ผ๊ฐ๋ฉด์ ๋ด๊ฐ ํ์ ์ด๋ค ๊ธฐ์ฌ๋ฅผ ํ๋์ง ์์ฃผ๋ก ์์ฑํ์์ต๋๋ค.
2021.05.10
์ด๋ฒ ๋ํ๋ segmentation๊ณผ ๋น์ทํ๊ฒ ๋ฒ ์ด์ค ์ฝ๋๊ฐ ์์ด ์งํ๋ ์ค ์์์ผ๋ mmdetection์ด๋ผ๋ ์์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๊ฐ์ง๊ณ ํ์ต์ ์งํํด์ผ ํ์ด์ ๊ธฐ์กด๊ณผ๋ ๋ค๋ฅธ ๋ฐฉ๋ฒ์ด ํ์ํ๋ค๊ณ ํ๋จํ๋ค.
๊ทธ๋์ ์ด๋ฒ์๋ ๋ ธ์ ์ผ๋ก ์คํ๊ณํ ๋ฐ ๊ฒฐ๊ณผ๋ฅผ ๊ณต์ ํ๊ณ ๋ค๊ฐ์ด ๊ณต์ ํ๋ฉด ์ข์ ๋ด์ฉ๋ ๋ ธ์ ์ ์ ๋ฆฌํ๊ธฐ๋ก ํ๋ค. ์คํ ์ ๋ ธ์ ์คํ ํ์ด์ง์ ์์ ์ด ์ด๋ค ์คํ์ ํ ๊ฑด์ง ์ ์ด๋๊ณ wandb ๋งํฌ์ run name์ ์ ์ด ์คํ์ด ์ด๋ป๊ฒ ์งํ๋๋์ง ํ์ธํ ์ ์๋๋ก ํ์๋ค.
์คํ ์ํฉ์ ๊ณต์ ํ๊ธฐ ์ํด ์คํ ์
, ์คํ ์ค
, ์คํ ์๋ฃ
๋ก 3๊ฐ์ง ์ํ๋ฅผ ์ ์ํ์ฌ ์คํ ๊ณํ์ ํ๋ค๋ฉด ์คํ ์
์ ๋๊ณ , ์คํ์ ์์ํ๋ฉด wandb ๋งํฌ๋ฅผ ๋ฌ์๋๊ณ ์คํ ์ค
์ผ๋ก ์ฎ๊ธฐ๊ณ ์คํ์ด ๋๋ฌ์ผ๋ฉด valid mAP์ LB mAP๋ฅผ ์ ์ด ์คํ ์๋ฃ
๋ก ์ฎ๊ธฐ๋๋ก ํ๋ค.
2021.05.11 - 2021.05.12
object detection๊ณผ mmdetection ๋ ๋ค ์ฒ์์ด์๊ธฐ์ ์ด๋ ์ ๋ object detection์ ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ํ์ ํ๊ณ mmdetection์ผ๋ก ์ด๋ป๊ฒ ํ์ต์ ์ํค๋์ง๋ฅผ ์ ํ์๊ฐ ์์๋ค. ๊ทธ๋์ ๋ถ๋ด์ ํ์ฌ ๋์ ๋ฐฐ์๋ฏผ ์บ ํผ๋์ด mmdetection ์ฌ์ฉ๋ฒ์ ์ตํ ๋ ธ์ ์ ๊ณต์ ํ๊ธฐ๋ก ํ๋ค.
mmdetection์ documentation์ ์ค๋ช ์ด ๋ถ์กฑํด documentation ์ธ์ dacon์ mmdetection ์ฌ์ฉ๋ฒ, tbd์ ์ฌ๋ผ์จ mmdetection tutorial์ ์ฐธ๊ณ ํ์ฌ ํ์๋ค์ด ๋ฐ๋ก ์ปค์คํ ์ ํ ์ ์๋๋ก ์ฌ์ฉ๋ฒ์ ์์ฑํ๊ณ , ๊ฐ์ธ์ ์ธ ๊ฟํ๋ ์ ์ด๋์๋ค.
ํ์ ์ถ๊ฐ๋ก ์ ์ง์ ์บ ํผ๋์ด wandb hook์ ์ฌ์ฉํ wandb ์คํ ์ธํ ์ ํ๋ ๋ฒ์ ์ถ๊ฐํด์ฃผ์ จ๋ค.
2021.05.12 - 2021.05.17
๋ณธ๊ฒฉ์ ์ธ ์คํ ์ ์ต์ฌํ, ์ด์๋ฆ, ์กฐ์ฑ์ง ์บ ํผ๋์ด SOTA ๋ฐ ๋ ผ๋ฌธ์ ์ฐธ๊ณ ํ์ฌ ์ข์ ๋ชจ๋ธ ๋ช ๊ฐ์ง๋ฅผ ์กฐ์ฌ๋ฅผ ํ๊ณ ์ด๋ฅผ ๋ฐํ์ผ๋ก ๋ช ๊ฐ์ง backbone๊ณผ method๋ฅผ ์ ํด ์คํ์ ์ํํ๋ค. backbone์ผ๋ก vgg16, darknet53, resnet50์, method๋ก ssd512, yolo-v3, yolo-v4, faster rcnn, detectoRS, cascade mask rcnn, vfnet, htc, mask rcnn์ ์ ์ ํ์๊ณ ์ด์ ๋ํ ์คํ์ ์ํํ๋ค.
์ด ์ค vggnet19๋ฅผ backbone์ผ๋ก ํ ๋ชจ๋ธ๊ณผ htc ๋ชจ๋ธ ์คํ์ ๋งก์๋ค. mmdetection์ ๋ชจ๋ ๋ชจ๋ธ์ด ๋ค์ด์๊ณ ๋จ์ํ backbone๋ง ๋ฐ๊พธ๊ธฐ๋ง ํ๋ฉด(ํน์ method๋ง ๋ฐ๊พธ๊ธฐ๋ง ํ๋ฉด) ๋์๊ฐ ๊ฑฐ๋ผ ์๊ฐํ์ง๋ง, vgg19๋ mmdetection์ ์์ด @register
๋ฅผ ์ฌ์ฉํด ๋ฑ๋ก์ ํด์ค์ผ ํ๊ณ htc์ ๊ฐ์ด mask๋ ์์ธกํ๋ ๊ฒฝ์ฐ ๊ทธ๋๋ก ์ฌ์ฉํ๋ฉด ์๋ฌ๊ฐ ๋ฐ์ํ๋ค.
์๋ฌ์ ์ด์ ๋ mask๊ด๋ จ annotation์ ์ค์ ํ์ง ์์์ ์๊ธด ์๋ฌ์๋ค. ์ด์ ๋ํ ๋ด์ฉ์ ๋ฐฐ์๋ฏผ ์บ ํผ๋์ด ์์ฑ์ ํด์ฃผ์ ์ mask ๊ด๋ จ ๋ชจ๋ธ๋ ๋๋ฆด ์ ์๊ฒ ๋์๋ค.
ํ ์ฐจ๋ก ์คํ์ด ๋๋ ํ UniverseNet, SwinTransformer, DetectoRS, Cascade Mask RCNN, Faster RCNN ๋ฑ ๋ ๋ค์ํ ๋ชจ๋ธ๋ค์ ์คํ์ ํ๊ณ ์ด ์ค SwinTransformer์ Cascade Mask RCNN(with DCN)์ด ๋จ์ผ ๋ชจ๋ธ๋ก LB mAP๊ฐ 0.5๊ฐ ๋๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ์๋ค. LB mAP ๊ธฐ์ค 0.4๋ถํฐ 0.55๊น์ง์ ๋ชจ๋ธ ๊ฒฐ๊ณผ๋ฅผ ๋ฐ๋ก ์ ์ฅํด๋์ด ๋์ค์ ์์๋ธ์ ์ฌ์ฉํ์๋ค.
2021.05.15
๋ํ ์ฒซ ์ฃผ์ฐจ ๋ง์ง๋ง ๋ ์ ํ๊ณ ์๊ฐ์ ๊ฐ์ก๋ค. ํ์คํ segmentation์ ๋จ์ ์ด ๋๋ถ๋ถ ๊ฐ์ ๋์์ง๋ง ์์ง ๋ ๊ฐ์ ๋์ด์ผํ ๋ถ๋ถ์ด ์กด์ฌํ๋ค. ๋ฐ๋ก ๋ํ ์ ์ฒด์ ๋ํ ๊ณํ์ด ์๋ ๋ด์ผ ๊ณํ๋ง ์ธ์ด๋ค๋ ์ ์ด์๋ค. ๊ทธ๋์ ํผ์ด์ธ์ ์๊ฐ์ ํ ์๊ฐ ๋ ํ ์ ํด์ ๋จ์ ๊ธฐ๊ฐ๋์์ ๊ณํ๊ณผ ๋ง์ผ์คํค์ ์ค์ ํ์๋ค.
backbone์ ๋ฐ๊พธ๋ ๊ฒ๋ณด๋ค๋ mmdetection ํน์ ๋ชจ๋ธ ๊ทธ ์์ฒด๋ฅผ ์คํํ๋ ๊ฒ์ด ์ต๊ณ ์ฑ๋ฅ์ด ๋์จ๋ค ์๊ฐํด ์ฌ ์คํํ ๋ชจ๋ธ๋ค์ ์ค์ ํ์๊ณ ์ถ๊ฐ๋ก ๊ตฌํํด์ผ ํ ๋ถ๋ถ์ ์ ํด 2:2:2๋ก ๋๋์ด ๊ตฌํ์ ํ์๋ค. cutmix, copyandpaste, mosaic์ ๊ตฌํํ์ง ๋ชปํ์ง๋ง, inference box, stratified k-fold, ensemble ์ฝ๋๋ ๋ค ๊ตฌํ์ ํ๋ค.
2021.05.17 - 2021.05.18
ํ์ต ์๊ฐ์ด ์์ Faster R-CNN์ ์ด์ฉํด mmdetection์ ์๋ ์ฌ๋ฌ augmentation์ ์ ์ฉํด ์คํ์ ํ๋ค. cutout, multi-scale training, randomflip, randomrotate, instaboost, photometricdistortion, autoaugment ๋ฑ์ ์คํํ๊ณ , ๊ทธ ์ธ์ ์์ segmentation์ ์๋ฌ๋์ด ์ฐ์ จ๋ augmentation๋ ๊ฐ์ ธ์ ์คํ์ ํ๋ค.
A.Compose( [
A.VerticalFlip(p=.25),
A.Cutout(num_holes=10, max_h_size=51, max_w_size=51, p=.25),
A.ShiftScaleRotate(p=.25),
A.RandomResizedCrop(512, 512, scale=[0.75, 1], p=1)
])
A.Compose( [
A.OneOf([A.RandomRotate90(p=.25), A.VerticalFlip(p=.5)], p=1),
A.Cutout(num_holes=10, max_h_size=51, max_w_size=51, p=.25),
A.ShiftScaleRotate(p=.25),
A.RandomResizedCrop(512, 512, scale=[0.75, 1], p=1)
])
tta.Compose( [
tta.VerticalFlip(),
tta.Scale(scales=[0.75, 1, 1.25])
])
์คํ ๊ฒฐ๊ณผ ๋๋ถ๋ถ ๊ธฐ๋ณธ Faster R-CNN ๊ฒฐ๊ณผ์ ๋น์ทํ์ง๋ง ์๋ฌ๋์ด ์ฐ์ Augmentation๊ณผ Multiscale Training์ ์ฑ๋ฅ์ด ์ ๋์์ ์ด ๋ ๊ฐ๋ฅผ ์ต์ข Augmentation ๊ธฐ๋ฒ์ผ๋ก ์ฑํํ์๋ค.
2021.05.18 - 2021.05.19
- ๋ฐฐ์๋ฏผ, ์กฐ์ฑ์ง ์บ ํผ๋์ด ๊ตฌํํ ์์๋ธ๋ก ์ฌ๋ฌ ๊ฐ์ง ์คํ์ ํ ๊ฒฐ๊ณผ ๊ฝค ์ฌ๋ฏธ์๋ ๊ฒฐ๊ณผ๋ฅผ ํ์ธํ ์ ์์๋ค. "๋น์ทํ ์ ์๋์ ๋ชจ๋ธ์ ์์๋ธ์ํค๋ฉด ๊ฐํํ๋ฏ์ด Public LB ์ ์๊ฐ ์ฌ๋ผ๊ฐ๋ค"๋ ๊ฒ์ด์๋ค. ๊ฑฐ์ ๋๋ถ๋ถ LB ์ ์๊ฐ ์ฌ๋ผ๊ฐ์ผ๋ฉฐ, ์ด๋ก LB mAP๋ฅผ 0.54๋๊น์ง ๋์ด์ฌ๋ ธ๋ค.
- ํ ๋ก ๊ฒ์ํ์ SwinTransformer๋ฅผ 60 epoch๊น์ง ๋๋ฆฌ๋ฉด ๋จ์ผ ๋ชจ๋ธ๋ก 0.6๊น์ง ์ค๋ฅธ๋ค๋ ๋ง์ ๋ฃ๊ณ , ์ ์ ํ์ต์ํจ Swin ๋ชจ๋ธ์ ์ ์ฒด ๋ฐ์ดํฐ์ (valid ํฌํจ)์ ์ต์ข ์ฑํํ Augmentation์ ์ ์ฉ์์ผ ์ด์ด์ ํ์ต์ ์์ผฐ์ผ๋ ํ์ต ์๊ฐ์ด ์ค๋ ๊ฑธ๋ ค์ 40 epoch๊น์ง ๋ฐ์ ํ์ต์ ํ์ง ๋ชปํ๋ค. ํ์คํ 30 epoch ์ดํ๋ก mAP๊ฐ ํญ๋ฐ์ ์ผ๋ก ๋์ง๋ ์์ง๋ง loss๊ฐ ์กฐ๊ธ์ฉ ์์์ง๋ ๊ฒ์ ํ์ธํ ์ ์์๊ณ , ๋จ์ผ ๋ชจ๋ธ๋ก 0.53์ ์ฑ๋ฅ์ ์ป์ ์ ์์๋ค.
- ์์๋ธ ๊ธฐ๋ฒ์ผ๋ก, nms, softnms, nmw, wbf๋ฅผ ์ฌ์ฉํ๊ณ
iou_thr
์skip_box_thr
๋ฅผ ๋ณ๊ฒฝํ๋ฉฐ ์คํ์ ์งํํ๋ค.iou_thr
๋ ๋ํดํธ๊ฐ์ธ 0.4๋ 0.5์์ LB mAP๊ฐ ์ ์ผ ๋์๊ณskip_box_thr
์ ์ ์ฒด์ ์ธ ๋ฐ์ค ๊ฐ์๋ฅผ ์ค์ฌ ์คํ๋ ค LB mAP๊ฐ ๋จ์ด์ก๋ค. ๊ฒฐ๊ตญ์ ๋ชจ๋ ๋ํดํธ ๊ฐ์ผ๋ก ๋๊ณ ๋ฐ์ค๊ฐ ์ ์์ฑ๋๋ softnms๋ฅผ ์ฌ์ฉํ๋ค. ์ต์ข ๋ชจ๋ธ๋ก๋ ๊ฐ์ฅ ์ฑ๋ฅ์ด ์ ๋์จ swin-b์ swin-t์ softnms ์์๋ธ์ ์ ์ถํ๋ค. - stratified k-fold ์ฝ๋๋ ๊ตฌํํ์ง๋ง ๋ชจ๋ธ ํ๋ ํ์ต ํ๋๋ฐ ์๊ฐ์ด ๋ง์ด ๊ฑธ๋ ค์ ๊ฒฐ๊ตญ ์ฌ์ฉํ์ง๋ ๋ชปํ๋ค. ๊ทธ ์ธ copyandpaste, cutmix, mosaic ๋ชจ๋ ๊ตฌํ์ ์๋ํ์ผ๋ annotation ์ฒ๋ฆฌ ์ฝ๋๊ฐ ์ด๋ ค์ ๊ฒฐ๊ตญ ๊ตฌํ์ ํฌ๊ธฐํ๋ค.
- ์ฐ์ ์์์ ์ ์๋ ๋ง์กฑ์ค๋ฝ์ง ์์ง๋ง Segmentation ๋ํ ํ๊ณ ๋ ๋์๋ ์์ฌ์ ๋ ์ ๋ค์ ๋๋ถ๋ถ ํด๊ฒฐํ๊ฑฐ๋ ๊ฐ์ ์์ผฐ๋ค๋ ์ ์์ ๊ฝค ๋ง์กฑ์ค๋ฌ์ด ๋ํ์๋ค. ์ด๋ฒ ๋ํ๋ฅผ ํ๋ฉด์ ์ ๋ง ํ์ ์ด ๋ฌด์์ธ์ง ๊นจ๋ฌ์๊ณ ์ ๋ฒ ๋ํ๋ณด๋ค๋ ์ฒด๊ณ์ ์ธ ์คํ์ผ๋ก ํ ์ ์๋ ๋๋ถ๋ถ์ ์คํ์ ์ํํ๋ค. ํนํ Segmentation ๋ํ ๋ ์์๋ธ์ ๋ชปํด์ ๋๋ฌด ์์ฌ์ ๋๋ฐ ์ด๋ฒ์๋ ๋ค์ํ ์์๋ธ ์คํ์ ํ ์ ์์ด์ ์ข์๋ค.
- ํ์ต์ ์ค๋ ์๊ฐ ๋๊ธฐ์๊ธฐ ํ์ง ๋ชปํ ์ ์ ์์ฌ์ ๋ค. ๋ชจ๋ธ ํ์ต ์๊ฐ์ด ์ค๋ ๊ฑธ๋ ค์ 30 epoch ์ฏค์ ์ฑ๋ฅ์ด ์ ์ ๋์จ๋ค๋ฉด ํ์ต์ ๋ฉ์ท๋๋ฐ ํ ์ ๊ฒ์ํ์ 60 epoch์ ๋๋ ธ์ ๋ ์ข์ ์ฑ๋ฅ์ด ๋์จ๋ค๋ ๊ฒ์ ๋ณด๊ณ ์กฐ๊ธ ๋ ์ค๋ ๋๋ ค๋ณผ ๊ฑธ ํ๋ ์์ฌ์์ด ์์๋ค.
- ๋ฆฌ๋๋ณด๋์ ํ๊ฐ์งํ์ธ mAP๋ง์ ๊ฐ์ง๊ณ ๋ชจ๋ธ์ ๊ฒ์ฆํ ์ ๋ ์์ฌ์ ๋ค. mmdetection์๋ mAP ์ธ์ loss๋ ๋ค์ํ๊ฒ ์ ๊ณต์ ํ๋๋ฐ, mAP๋ง ํ์ธ์ ํ๋ค. ๋์ค์ ์ ์ฌ์ค์ด์ง๋ง mAP๊ฐ ๋๋๋ผ๋ loss๊ฐ ๋ฎ์ง ์๋ค๋ฉด ๋ฆฌ๋๋ณด๋์ ์ ์ถํ์ ๋ ์ฑ๋ฅ์ด ์ ์๋์จ๋ค๋ ๊ฒ์ด์๋ค. mAP๊ฐ ์กฐ๊ธ ๋จ์ด์ง๋๋ผ๋ loss๊ฐ ๋ ๋ฎ์ ๋ชจ๋ธ์ด ๋ ์ ๋์๋๋ฐ, ๋ค์ ๋ํ ๋๋ ๋ํ ํ๊ฐ์งํ ์ธ์ ๋ค๋ฅธ ์งํ๋ ์ฐธ๊ณ ํด์ ๋ชจ๋ธ์ ๋ ์์ธํ ๊ฒ์ฆํด์ผ๊ฒ ๋ค๋ ์๊ฐ์ ํ๋ค.