visual-recognition

Star

Here are 41 public repositories matching this topic...

X-PLUG / mPLUG-Owl

Star

mPLUG-Owl: The Powerful Multi-modal Large Language Model Family

Updated Apr 2, 2025
Python

NVlabs / MambaVision

Star

[CVPR 2025] Official PyTorch Implementation of MambaVision: A Hybrid Mamba-Transformer Vision Backbone

deep-learning transformers image-classification object-detection semantic-segmentation mamba visual-recognition instance-segmentation self-attention hybrid-models huggingface-transformers vision-transformer foundation-models

Updated Jul 7, 2025
Python

NVlabs / FasterViT

Star

[ICLR 2024] Official PyTorch implementation of FasterViT: Fast Vision Transformers with Hierarchical Attention

deep-learning backbone image-classification coco object-detection semantic-segmentation visual-recognition ade20k self-attention image-net pre-trained-model vision-transformer foundation-models

Updated Mar 20, 2025
Python

iMoonLab / yolov13

Star

Implementation of "YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception".

yolo object-detection visual-recognition real-time-object-detection hypergraph-learning correlation-modelling yolov13

Updated Jul 8, 2025
Python

NVlabs / FAN

Star

Official PyTorch implementation of Fully Attentional Networks

deep-learning corruption backbone imagenet image-classification coco object-detection semantic-segmentation visual-recognition cityscapes information-bottleneck self-attention pre-train out-of-distribution vision-transformers visual-grouping

Updated Mar 31, 2023
Python

NVlabs / GCVit

Star

[ICML 2023] Official PyTorch implementation of Global Context Vision Transformers

deep-learning backbone imagenet coco object-detection semantic-segmentation visual-recognition ade20k self-attention pre-train pre-trained-model imagenet-classification vision-transformer

Updated Dec 22, 2023
Python

iduta / iresnet

Star

YiLunLee / missing_aware_prompts

Star

Multimodal Prompting with Missing Modalities for Visual Recognition, CVPR'23

computer-vision transformer cvpr visual-recognition multimodal-learning missing-modality

Updated Dec 13, 2023
Python

whwu95 / GPT4Vis

Star

GPT4Vis: What Can GPT-4 Do for Zero-shot Visual Recognition?

visual-recognition video-recognition point-cloud-classification prompt-engineering gpt-4-vision-preview

Updated May 22, 2024
Python

HaozhiQi / ISONet

Star

Deep Isometric Learning for Visual Recognition (ICML 2020)

visual-recognition icml deep-isometric-learning

Updated May 29, 2022
Python

microsoft / snca.pytorch

Star

Improving Generalization via Scalable Neighborhood Component Analysis

computer-vision deep-learning nearest-neighbors transfer-learning visual-recognition few-shot-learning eccv-2018

Updated Jun 12, 2023
Python

ChristophReich1996 / Involution

Star

PyTorch reimplementation of the paper "Involution: Inverting the Inherence of Convolution for Visual Recognition" (2D and 3D Involution) [CVPR 2021].

machine-learning computer-vision deep-learning pytorch visual-recognition involution cvpr2021 2d-involution 3d-involution

Updated Mar 28, 2022
Python

ChenhongyiYang / GPViT

Star

[ICLR 2023 Spotlight] GPViT: A High Resolution Non-Hierarchical Vision Transformer with Group Propagation

computer-vision image-classification object-detection semantic-segmentation visual-recognition instance-segmentation vision-transformer

Updated May 26, 2023
Python

Heathcliff-saku / ViewFool_

Star

This repository contains the ViewFool and ImageNet-V proposed by the paper “ViewFool: Evaluating the Robustness of Visual Recognition to Adversarial Viewpoints” (NeurIPS2022).

visual-recognition robustness ood-generalization neurips2022 viewpoint-changes

Updated Dec 18, 2023
Python

santiago-puch-giner / vr-project

Star

Deep Understanding of Traffic Scenes for Autonomous Driving

deep-neural-networks deep-learning object-detection image-segmentation visual-recognition

Updated Apr 18, 2017
Python

VITA-Group / CV_A-FAN

Star

[TMLR] "Adversarial Feature Augmentation and Normalization for Visual Recognition", Tianlong Chen, Yu Cheng, Zhe Gan, Jianfeng Wang, Lijuan Wang, Zhangyang Wang, Jingjing Liu

data-augmentation visual-recognition generalization feature-normalization adversarial-feature-augmentation adversarial-feature-normalization feature-augmentation