GitHub

PyTorch implementation for BiCro: Noisy Correspondence Rectification for Multi-modality Data via Bi-directional Cross-modal Similarity Consistency (CVPR 2023).

If you have any questions, feel free to contact 20b903054@stu.hit.edu.cn

Requirements

Python 3.7
PyTorch ~1.7.1
numpy
scikit-learn
Punkt Sentence Tokenizer:

import nltk
nltk.download()
> d punkt

Datasets

MS-COCO and Flickr30K

We follow SCAN to obtain image features and vocabularies.

CC152K

We use a subset of Conceptual Captions (CC), named CC152K. CC152K contains training 150,000 samples from the CC training split, 1,000 validation samples and 1,000 testing samples from the CC validation split. We follow the pre-processing step in SCAN to obtain the image features and vocabularies.

Download Dataset

Training and Evaluation

Training new models

Modify some necessary parameters and run it.

For Flickr30K:

sh train_f30k.sh

For MSCOCO:

sh train_coco.sh

For CC152K:

sh train_cc152k.sh

Pre-trained models and evaluation

The pre-trained models are available here:

F30K 20% noise model Download

F30K 40% noise model Download

F30K 60% noise model Download

Citation

If BiCro is useful for your research, please cite the following paper:

@inproceedings{BiCro2023,
    author = {Shuo Yang, xu Zhao Pan, Kai Wang, Yang You, Hongxun Yao, Tongliang Liu, Min Xu},
    title = {BiCro: Noisy Correspondence Rectification for Multi-modality Data via Bi-directional Cross-modal Similarity Consistency},
    year = {2023},
    booktitle = {CVPR},
}

License

Apache License 2.0

Acknowledgements

The code is based on NCR, SGRAF, and SCAN licensed under Apache 2.0.

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
noise_index		noise_index
README.md		README.md
co_train.py		co_train.py
data.py		data.py
eval_coco.py		eval_coco.py
evaluation.py		evaluation.py
model.py		model.py
run.py		run.py
train_cc152k.sh		train_cc152k.sh
train_coco.sh		train_coco.sh
train_f30k.sh		train_f30k.sh
utils.py		utils.py
vocab.py		vocab.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Requirements

Datasets

MS-COCO and Flickr30K

CC152K

Training and Evaluation

Training new models

Pre-trained models and evaluation

Citation

License

Acknowledgements

About

Releases

Packages

Languages

xu5zhao/BiCro

Folders and files

Latest commit

History

Repository files navigation

Requirements

Datasets

MS-COCO and Flickr30K

CC152K

Training and Evaluation

Training new models

Pre-trained models and evaluation

Citation

License

Acknowledgements

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages