Skip to content

Some code for DOTA dataset split and transform to voc format

Notifications You must be signed in to change notification settings

Complicateddd/DOTA2VOCtools

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 

Repository files navigation

DOTA数据集快捷、简单处理

官方切割方式:

python ImgSplit.py

txt转xml: 同时删除没有目标的图像和标注

python txt2xml.py

其他处理参考

选取需要类别 → 图片裁剪 → 标签数据自动抓取 → 格式转换txt2xml → 修改图片和标签文件名称 → 生成各类数据集索引文件

1. SelectShip.py

从有15种类别的DOTA数据集中筛选出需要的类别

catogory = ['ship'] # 指定类别的名称

2.ImgSplit2.py

数据集影像切割为1000*1000

不足1000的高或宽在在下或右方向补齐(左上角不动,因为标签数据原点为左上角)

3.txtGrab.py

标签数据自动抓取

第14行 name = im_list[:-4]

如果图像后缀为.png .jpg等则为-4,若图像后缀为.tiff则为-5

4.txt2xml.py

数据格式转换 / 两种矩形框的xml可选

hbb(水平矩形框):xmin ymin xmax ymax

obb(旋转矩形框):x0 y0 x1 y1 x2 y2 x3 y3

根据需要选择(如果生成obb,修改260行和266行的hbb=True为False)

5.Rename.py

批量修改文件夹中文件名为(000000)格式,方便直接替换VOC数据集进行训练

6.ImageSets.py

制作ImageSets文件夹下Main文件夹中的4个文件(test.txt、train.txt、trainval.txt、val.txt)

test.txt 测试集 / train.txt 训练集 / val.txt 验证集 / trainval.txt:训练和验证集

About

Some code for DOTA dataset split and transform to voc format

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages