GitHub - lidq92/arxiv-daily: 🎓Automatically Update Interested Papers Daily using Github Actions (Update Every 12th hours)

[![Contributors][contributors-shield]][contributors-url] [![Forks][forks-shield]][forks-url] [![Stargazers][stars-shield]][stars-url] [![Issues][issues-shield]][issues-url]

Updated on 2025.04.12

Usage instructions: here

Table of Contents

Point Cloud Compression
Compression
Quality Assessment
Super Resolution
Remote Sensing

Point Cloud Compression

Publish Date	Title	Authors	PDF	Code
2025-04-08	UVG-VPC: Voxelized Point Cloud Dataset for Visual Volumetric Video-based Coding	Guillaume Gautier et.al.	2504.05888	null
2025-04-01	Hierarchical Attention Networks for Lossless Point Cloud Attribute Compression	Yueru Chen et.al.	2504.00481	null
2025-03-24	UniPCGC: Towards Practical Point Cloud Geometry Compression via an Efficient Unified Approach	Kangli Wang et.al.	2503.18541	link
2025-03-24	Voxel-based Point Cloud Geometry Compression with Space-to-Channel Context	Bojun Liu et.al.	2503.18283	null
2025-03-21	High Efficiency Wiener Filter-based Point Cloud Quality Enhancement for MPEG G-PCC	Yuxuan Wei et.al.	2503.17467	null
2025-03-21	R2LDM: An Efficient 4D Radar Super-Resolution Framework Leveraging Diffusion Model	Boyuan Zheng et.al.	2503.17097	null
2025-03-18	RBFIM: Perceptual Quality Assessment for Compressed Point Clouds Using Radial Basis Function Interpolation	Zhang Chen et.al.	2503.14154	null
2025-03-16	RENO: Real-Time Neural Compression for 3D LiDAR Point Clouds	Kang You et.al.	2503.12382	link
2025-02-26	PCE-GAN: A Generative Adversarial Network for Point Cloud Attribute Quality Enhancement based on Optimal Transport	Tian Guo et.al.	2503.00047	null
2025-02-26	SPU-IMR: Self-supervised Arbitrary-scale Point Cloud Upsampling via Iterative Mask-recovery Network	Ziming Nie et.al.	2502.19452	link
2025-02-25	Deep-JGAC: End-to-End Deep Joint Geometry and Attribute Compression for Dense Colored Point Clouds	Yun Zhang et.al.	2502.17939	null
2025-02-10	Real-Time LiDAR Point Cloud Compression and Transmission for Resource-constrained Robots	Yuhao Cao et.al.	2502.06123	link
2025-02-07	DetVPCC: RoI-based Point Cloud Sequence Compression for 3D Object Detection	Mingxuan Yan et.al.	2502.04804	null
2025-02-05	Deep Learning-based Event Data Coding: A Joint Spatiotemporal and Polarity Solution	Abdelrahman Seleem et.al.	2502.03285	null
2025-02-22	Point Cloud Upsampling as Statistical Shape Model for Pelvic	Tongxu Zhang et.al.	2501.16716	null
2025-01-25	Efficient Point Clouds Upsampling via Flow Matching	Zhi-Song Liu et.al.	2501.15286	null
2025-02-28	Representation Learning of Point Cloud Upsampling in Global and Local Inputs	Tongxu Zhang et.al.	2501.07076	null
2024-12-19	Color Enhancement for V-PCC Compressed Point Cloud via 2D Attribute Map Optimization	Jingwei Bao et.al.	2412.14449	null
2024-12-16	EGP3D: Edge-guided Geometric Preserving 3D Point Cloud Super-resolution for RGB-D camera	Zheng Fang et.al.	2412.11680	null
2024-12-11	Implicit Neural Compression of Point Clouds	Hongning Ruan et.al.	2412.10433	null
2024-12-07	Rate-Distortion Optimized Skip Coding of Region Adaptive Hierarchical Transform Coefficients for MPEG G-PCC	Zehan Wang et.al.	2412.05574	null
2025-01-09	Rendering-Oriented 3D Point Cloud Attribute Compression using Sparse Tensor-based Transformer	Xiao Huo et.al.	2411.07899	null
2024-11-09	Linear Spherical Sliced Optimal Transport: A Fast Metric for Comparing Spherical Data	Xinran Liu et.al.	2411.06055	null
2024-11-01	PLATYPUS: Progressive Local Surface Estimator for Arbitrary-Scale Point Cloud Upsampling	Donghyun Kim et.al.	2411.00432	null
2024-10-28	Quality Analysis of the Coding Bitrate Tradeoff Between Geometry and Attributes for Colored Point Clouds	Joao Prazeres et.al.	2410.21613	null
2024-10-09	Point Cloud Compression with Bits-back Coding	Nguyen Quang Hieu et.al.	2410.18115	null
2024-10-23	Att2CPC: Attention-Guided Lossy Attribute Compression of Point Clouds	Kai Liu et.al.	2410.17823	link
2024-10-22	Joint Point Cloud Upsampling and Cleaning with Octree-based CNNs	Jihe Li et.al.	2410.17001	link
2024-10-21	MBPU: A Plug-and-Play State Space Model for Point Cloud Upsamping with Fast Point Rendering	Jiayi Song et.al.	2410.15941	null
2024-10-13	Towards Reproducible Learning-based Compression	Jiahao Pang et.al.	2410.09872	null
2024-10-06	Tensor-Train Point Cloud Compression and Efficient Approximate Nearest-Neighbor Search	Georgii Novikov et.al.	2410.04462	null
2024-10-01	Can We Remove the Ground? Obstacle-aware Point Cloud Compression for Remote Object Detection	Pengxi Zeng et.al.	2410.00582	null
2024-09-19	PVContext: Hybrid Context Model for Point Cloud Compression	Guoqing Zhang et.al.	2409.12724	null
2024-09-12	The JPEG Pleno Learning-based Point Cloud Coding Standard: Serving Man and Machine	André F. R. Guarda et.al.	2409.08130	null
2024-09-08	GET-UP: GEomeTric-aware Depth Estimation with Radar Points UPsampling	Huawei Sun et.al.	2409.02720	link
2024-09-03	GaussianPU: A Hybrid 2D-3D Upsampling Framework for Enhancing Color Point Clouds via 3D Gaussian Splatting	Zixuan Guo et.al.	2409.01581	null
2024-08-20	End-to-end learned Lossy Dynamic Point Cloud Attribute Compression	Dat Thanh Nguyen et.al.	2408.10665	null
2024-08-20	Diff-PCC: Diffusion-based Neural Compression for 3D Point Clouds	Kai Liu et.al.	2408.10543	null
2024-08-16	LLM-PCGC: Large Language Model-based Point Cloud Geometry Compression	Yuqi Ye et.al.	2408.08682	null
2024-08-06	Fast Point Cloud Geometry Compression with Context-based Residual Coding and INR-based Refinement	Hao Xu et.al.	2408.02966	null
2024-08-01	Learned Compression of Point Cloud Geometry and Attributes in a Single Model through Multimodal Rate-Control	Michael Rudolph et.al.	2408.00599	null
2024-07-22	Double Deep Learning-based Event Data Coding and Classification	Abdelrahman Seleem et.al.	2407.15531	null
2024-07-11	Enhancing octree-based context models for point cloud geometry compression with attention-based child node number prediction	Chang Sun et.al.	2407.08528	null
2024-07-11	Enhancing context models for point cloud geometry compression with context feature residuals and multi-loss	Chang Sun et.al.	2407.08520	null
2024-07-19	PCAC-GAN: A Sparse-Tensor-Based Generative Adversarial Network for 3D Point Cloud Attribute Compression	Xiaolong Mao et.al.	2407.05677	null
2024-07-05	Rethinking Data Input for Point Cloud Upsampling	Tongxu Zhang et.al.	2407.04476	null
2024-08-26	TSC-PCAC: Voxel Transformer and Sparse Convolution Based Point Cloud Attribute Compression for 3D Broadcasting	Zixi Guo et.al.	2407.04284	link
2024-06-15	Full reference point cloud quality assessment using support vector regression	Ryosuke Watanabe et.al.	2406.10520	link
2024-09-25	Bits-to-Photon: End-to-End Learned Scalable Point Cloud Compression for Direct Rendering	Yueyu Hu et.al.	2406.05915	null
2024-06-02	Towards Point Cloud Compression for Machine Perception: A Simple and Strong Baseline by Learning the Octree Depth Level Predictor	Lei Liu et.al.	2406.00791	null
2024-05-23	NeuroGauss4D-PCI: 4D Neural Fields and Gaussian Deformation Fields for Point Cloud Interpolation	Chaokang Jiang et.al.	2405.14241	link
2024-05-19	Point Cloud Compression with Implicit Neural Representations: A Unified Framework	Hongning Ruan et.al.	2405.11493	null
2024-05-02	PointCompress3D -- A Point Cloud Compression Framework for Roadside LiDARs in Intelligent Transportation Systems	Walter Zimmer et.al.	2405.01750	null
2024-04-21	Pointsoup: High-Performance and Extremely Low-Decoding-Latency Learned Geometry Codec for Large-Scale Point Cloud Scenes	Kang You et.al.	2404.13550	link
2024-04-16	Reward Learning from Suboptimal Demonstrations with Applications in Surgical Electrocautery	Zohre Karimi et.al.	2404.07185	null
2024-04-10	Efficient and Generic Point Model for Lossless Point Cloud Attribute Compression	Kang You et.al.	2404.06936	link
2024-04-09	Diffusion-Based Point Cloud Super-Resolution for mmWave Radar Data	Kai Luan et.al.	2404.06012	null
2024-03-13	Point Cloud Compression via Constrained Optimal Transport	Zezeng Li et.al.	2403.08236	link
2024-03-08	Arbitrary-Scale Point Cloud Upsampling by Voxel-Based Network with Latent Geometric-Consistent Learning	Hang Du et.al.	2403.05117	link
2024-03-01	Assessing objective quality metrics for JPEG and MPEG point cloud coding	Davi Lazzarotto et.al.	2403.00410	null
2024-02-23	Scalable Human-Machine Point Cloud Compression	Mateen Ulhaq et.al.	2402.12532	link
2024-02-18	3D Point Cloud Compression with Recurrent Neural Network and Image Compression Methods	Till Beemelmanns et.al.	2402.11680	link
2024-02-17	Hierarchical Prior-based Super Resolution for Point Cloud Geometry Compression	Dingquan Li et.al.	2402.11250	link
2024-02-11	PIVOT-Net: Heterogeneous Point-Voxel-Tree-based Framework for Point Cloud Compression	Jiahao Pang et.al.	2402.07243	null
2024-02-07	Performance analysis of Deep Learning-based Lossy Point Cloud Geometry Compression Coding Solutions	Joao Prazeres et.al.	2402.05192	null
2024-02-08	Subjective performance evaluation of bitrate allocation strategies for MPEG and JPEG Pleno point cloud compression	Davi Lazzarotto et.al.	2402.04760	null
2024-02-15	LiDAR-Forest Dataset: LiDAR Point Cloud Simulation Dataset for Forestry Application	Yawen Lu et.al.	2402.04546	null
2023-12-23	Learning Continuous Implicit Field with Local Distance Indicator for Arbitrary-Scale Point Cloud Upsampling	Shujuan Li et.al.	2312.15133	null
2024-03-13	DiffPMAE: Diffusion Masked Autoencoders for Point Cloud Reconstruction	Yanlong Li et.al.	2312.03298	link
2023-12-03	A Conditional Denoising Diffusion Probabilistic Model for Point Cloud Upsampling	Wentao Qu et.al.	2312.02719	link
2023-11-22	Learned Nonlinear Predictor for Critically Sampled 3D Point Cloud Attribute Compression	Tam Thuc Do et.al.	2311.13539	null
2023-11-22	Volumetric 3D Point Cloud Attribute Compression: Learned polynomial bilateral filter for prediction	Tam Thuc Do et.al.	2311.13533	null
2023-11-22	Test-Time Augmentation for 3D Point Cloud Classification and Segmentation	Tuan-Anh Vu et.al.	2311.13152	null
2023-11-03	PDF: Point Diffusion Implicit Function for Large-scale Scene Neural Representation	Yuhan Ding et.al.	2311.01773	null
2023-11-02	Lightweight super resolution network for point cloud geometry compression	Wei Zhang et.al.	2311.00970	link
2023-11-17	Deep Learning-based Compressed Domain Multimedia for Man and Machine: A Taxonomy and Application to Point Cloud Classification	Abdelrahman Seleem et.al.	2310.18849	null
2023-10-13	iPUNet:Iterative Cross Field Guided Point Cloud Upsampling	Guangshun Wei et.al.	2310.09092	link
2024-03-15	PU-Ray: Domain-Independent Point Cloud Upsampling via Ray Marching on Neural Implicit Surface	Sangwon Lim et.al.	2310.08755	link
2024-02-16	Quasi-Monte Carlo for 3D Sliced Wasserstein	Khai Nguyen et.al.	2309.11713	link
2023-09-08	Poster: Making Edge-assisted LiDAR Perceptions Robust to Lossy Point Cloud Compression	Jin Heo et.al.	2309.04549	null
2023-09-01	Test-Time Adaptation for Point Cloud Upsampling Using Meta-Learning	Ahmed Hatem et.al.	2308.16484	null
2024-02-08	SCP: Spherical-Coordinate-based Learned Point Cloud Compression	Ao Luo et.al.	2308.12535	null
2023-08-22	Learning a More Continuous Zero Level Set in Unsigned Distance Fields through Level Set Projection	Junsheng Zhou et.al.	2308.11441	link
2023-08-11	Learned Point Cloud Compression for Classification	Mateen Ulhaq et.al.	2308.05959	link
2023-07-27	FLiCR: A Fast and Lightweight LiDAR Point Cloud Compression Based on Lossy RI	Jin Heo et.al.	2307.15005	null
2023-07-20	Aggressive saliency-aware point cloud compression	Eleftheria Psatha et.al.	2307.10741	null
2023-07-18	Arbitrary point cloud upsampling via Dual Back-Projection Network	Zhi-Song Liu et.al.	2307.08992	null
2023-06-01	4DSR-GCN: 4D Video Point Cloud Upsampling using Graph Convolutional Networks	Lorenzo Berlincioni et.al.	2306.01081	null
2023-05-16	Learning Dynamic Point Cloud Compression via Hierarchical Inter-frame Block Matching	Shuting Xia et.al.	2305.05356	link
2023-05-02	Geometric Prior Based Deep Human Point Cloud Geometry Compression	Xinju Wu et.al.	2305.01309	null
2023-05-02	PU-EdgeFormer: Edge Transformer for Dense Prediction in Point Cloud Upsampling	Dohoon Kim et.al.	2305.01148	link
2023-04-24	Grad-PU: Arbitrary-Scale Point Cloud Upsampling via Gradient Descent with Learned Distance Functions	Yun He et.al.	2304.11846	link
2023-04-01	Volumetric Attribute Compression for 3D Point Clouds using Feedforward Network with Geometric Attention	Tam Thuc Do et.al.	2304.00335	null
2023-03-27	NeuralPCI: Spatio-temporal Neural Field for 3D Point Cloud Multi-frame Non-linear Interpolation	Zehan Zheng et.al.	2303.15126	link
2023-11-07	GQE-Net: A Graph-based Quality Enhancement Network for Point Cloud Color Attribute	Jinrui Xing et.al.	2303.13764	link
2023-03-22	Lossless Point Cloud Attribute Compression Using Cross-scale, Cross-group, and Cross-color Prediction	Jianqiang Wang et.al.	2303.12917	null
2023-12-28	Progressive Frame Patching for FoV-based Point Cloud Video Streaming	Tongyu Zong et.al.	2303.08336	null
2023-12-03	Parametric Surface Constrained Upsampler Network for Point Cloud	Pingping Cai et.al.	2303.08240	link
2024-03-20	Lossless Point Cloud Geometry and Attribute Compression Using a Learned Conditional Probability Model	Dat Thanh Nguyen et.al.	2303.06519	link
2023-03-11	Deep probabilistic model for lossless scalable point cloud attribute compression	Dat Thanh Nguyen et.al.	2303.06517	null
2023-03-09	BIRD-PCC: Bi-directional Range Image-based Deep LiDAR Point Cloud Compression	Chia-Sheng Liu et.al.	2303.04027	null
2023-02-13	gpcgc: a green point cloud geometry coding method	Qingyang Zhou et.al.	2302.06062	null
2023-02-09	BASICS: Broad quality Assessment of Static point clouds In Compression Scenarios	Ali Ak et.al.	2302.04796	null
2023-04-27	Linear Optimal Partial Transport Embedding	Yikun Bai et.al.	2302.03232	link
2023-01-31	Lidar Upsampling with Sliced Wasserstein Distance	Artem Savkin et.al.	2301.13558	null
2023-01-28	Dynamic Point Cloud Geometry Compression Using Multiscale Inter Conditional Coding	Jianqiang Wang et.al.	2301.12165	null
2023-01-27	Joint Geometry and Attribute Upsampling of Point Clouds Using Frequency-Selective Models with Overlapped Support	Viktoria Heimann et.al.	2301.11630	null
2023-01-03	Reduced Reference Quality Assessment for Point Cloud Compression	Yipeng Liu et.al.	2301.01009	null
2023-04-06	Neural Shape Compiler: A Unified Framework for Transforming between Text, Point Cloud, and Program	Tiange Luo et.al.	2212.12952	null
2022-12-11	Learning Neural Volumetric Field for Point Cloud Geometry Compression	Yueyu Hu et.al.	2212.05589	link
2022-12-01	Low-Rank Tensor Function Representation for Multi-Dimensional Data Recovery	Yisi Luo et.al.	2212.00262	null
2023-12-09	ECM-OPCC: Efficient Context Model for Octree-based Point Cloud Compression	Yiqi Jin et.al.	2211.10916	null
2022-11-19	Rate-Distortion Modeling for Bit Rate Constrained Point Cloud Compression	Pan Gao et.al.	2211.10646	null
2022-10-21	Motion Policy Networks	Adam Fishman et.al.	2210.12209	link
2022-10-28	Motion estimation and filtered prediction for dynamic point cloud attribute compression	Haoran Hong et.al.	2210.08262	null
2022-10-08	Point Cloud Upsampling via Cascaded Refinement Network	Hang Du et.al.	2210.03942	link
2023-02-14	Multiscale Latent-Guided Entropy Model for LiDAR Point Cloud Compression	Tingyu Fan et.al.	2209.12512	null
2022-09-17	CARNet:Compression Artifact Reduction for Point Cloud Attribute	Dandan Ding et.al.	2209.08276	null
2022-11-16	CU-Net: Real-Time High-Fidelity Color Upsampling for Point Clouds	Lingdong Wang et.al.	2209.06112	link
2022-09-09	GRASP-Net: Geometric Residual Analysis and Synthesis for Point Cloud Compression	Jiahao Pang et.al.	2209.04401	link
2022-09-06	Learning to Predict on Octree for Scalable Point Cloud Geometry Coding	Yixiang Mao et.al.	2209.02226	null
2022-08-26	Efficient LiDAR Point Cloud Geometry Compression Through Neighborhood Point Attention	Ruixiang Xue et.al.	2208.12573	null
2022-08-17	Efficient dynamic point cloud coding using Slice-Wise Segmentation	Faranak Tohidi et.al.	2208.08061	null
2023-01-10	Arbitrary Point Cloud Upsampling with Spherical Mixture of Gaussians	Anthony Dell'Eva et.al.	2208.05274	link
2022-08-04	IT/IST/IPLeiria Response to the Call for Proposals on JPEG Pleno Point Cloud Coding	André F. R. Guarda et.al.	2208.02716	null
2022-08-04	IPDAE: Improved Patch-Based Deep Autoencoder for Lossy Point Cloud Geometry Compression	Kang You et.al.	2208.02519	link
2022-07-25	Inter-Frame Compression for Dynamic Point Cloud Geometry Coding	Anique Akhtar et.al.	2207.12554	null
2022-07-20	GIPSO: Geometrically Informed Propagation for Online Adaptation in 3D LiDAR Segmentation	Cristiano Saltori et.al.	2207.09763	link
2022-06-25	BIMS-PU: Bi-Directional and Multi-Scale Point Cloud Upsampling	Yechao Bai et.al.	2206.12648	null
2022-06-24	Rate-Distortion Optimal Transform Coefficient Selection for Unoccupied Regions in Video-Based Point Cloud Compression	Christian Herglotz et.al.	2206.12186	null
2022-05-24	A Rate Control Algorithm for Video-based Point Cloud Compression	Fangyu Shen et.al.	2205.11825	null
2022-05-19	A Comparative Study of Feature Expansion Unit for 3D Point Cloud Upsampling	Qiang Li et.al.	2205.09594	null
2022-05-02	D-DPCC: Deep Dynamic Point Cloud Compression via 3D Motion Prediction	Tingyu Fan et.al.	2205.01135	link
2022-05-02	Point Cloud Compression with Sibling Context and Surface Priors	Zhili Chen et.al.	2205.00760	link
2022-04-29	Deep Geometry Post-Processing for Decompressed Point Clouds	Xiaoqing Fan et.al.	2204.13952	link
2022-04-27	Density-preserving Deep Point Cloud Compression	Yun He et.al.	2204.12684	null
2022-04-25	4DAC: Learning Attribute Compression for Dynamic Point Clouds	Guangchi Fang et.al.	2204.11723	null
2022-04-25	Dynamic Point Cloud Compression with Cross-Sectional Approach	Faranak Tohidi et.al.	2204.11409	null
2022-04-22	PU-EVA: An Edge Vector based Approximation Solution for Flexible-scale Point Cloud Upsampling	Luqing Luo et.al.	2204.10750	null
2022-04-18	Self-Supervised Arbitrary-Scale Point Clouds Upsampling via Implicit Neural Representation	Wenbo Zhao et.al.	2204.08196	link
2022-06-22	Learning-based Lossless Point Cloud Geometry Coding using Sparse Tensors	Dat Thanh Nguyen et.al.	2204.05043	null
2022-04-03	Sparse Tensor-based Point Cloud Attribute Compression	Jianqiang Wang et.al.	2204.01023	link
2022-03-22	IDEA-Net: Dynamic 3D Point Cloud Interpolation via Deep Embedding Alignment	Yiming Zeng et.al.	2203.11590	link
2022-03-21	Upsampling Autoencoder for Self-Supervised Point Cloud Learning	Cheng Zhang et.al.	2203.10768	null
2022-05-03	Frequency-Selective Mesh-to-Mesh Resampling for Color Upsampling of Point Clouds	Viktoria Heimann et.al.	2203.09224	null
2022-03-02	PUFA-GAN: A Frequency-Aware Generative Adversarial Network for 3D Point Cloud Upsampling	Hao Liu et.al.	2203.00914	null
2022-05-16	Variable Rate Compression for Raw 3D Point Clouds	Md Ahmed Al Muzaddid et.al.	2202.13862	link
2022-09-14	Point cloud completion via structured feature maps using a feedback network	Zejia Su et.al.	2202.08583	null
2022-05-08	OctAttention: Octree-Based Large-Scale Contexts Model for Point Cloud Compression	Chunyang Fu et.al.	2202.06028	link
2022-02-01	Point Cloud Compression for Efficient Data Broadcasting: A Performance Comparison	Francesco Nardo et.al.	2202.00719	null
2022-02-01	Fractional Motion Estimation for Point Cloud Compression	Haoran Hong et.al.	2202.00172	null
2022-01-17	SimIPU: Simple 2D Image and 3D Point Cloud Unsupervised Pre-Training for Spatial-Aware Visual Representations	Zhenyu Li et.al.	2112.04680	link
2022-03-31	Neural Points: Point Cloud Representation with Neural Fields for Arbitrary Upsampling	Wanquan Feng et.al.	2112.04148	link
2022-03-01	Attribute Artifacts Removal for Geometry-based Point Cloud Compression	Xihua Sheng et.al.	2112.00560	null
2022-10-03	PU-Transformer: Point Cloud Upsampling Transformer	Shi Qiu et.al.	2111.12242	link
2022-10-21	Sparse Tensor-based Multiscale Representation for Point Cloud Geometry Compression	Jianqiang Wang et.al.	2111.10633	link
2021-10-18	Patch-Based Deep Autoencoder for Point Cloud Geometry Compression	Kang You et.al.	2110.09109	link
2022-07-12	PC $^2$ -PU: Patch Correlation and Point Correlation for Effective Point Cloud Upsampling	Chen Long et.al.	2109.09337	link
2021-09-16	R-PCC: A Baseline for Range Image-based Point Cloud Compression	Sukai Wang et.al.	2109.07717	link
2021-09-15	Which One is Better: Assessing Objective Metrics for Point Cloud Compression	Yipeng Liu et.al.	2109.07158	null
2021-08-05	Joint Geometry and Color Projection-based Point Cloud Quality Metric	Alireza Javaheri et.al.	2108.02481	link
2021-08-03	SSPU-Net: Self-Supervised Point Cloud Upsampling via Differentiable Rendering	Yifan Zhao et.al.	2108.00454	link
2021-07-29	Video-based Point Cloud Compression Artifact Removal	Anique Akhtar et.al.	2107.14179	null
2024-02-28	Score-Based Point Cloud Denoising	Shitong Luo et.al.	2107.10981	link
2022-06-08	PU-Flow: a Point Cloud Upsampling Network with Normalizing Flows	Aihua Mao et.al.	2107.05893	link
2022-04-18	"Zero-Shot" Point Cloud Upsampling	Kaiyue Zhou et.al.	2106.13765	link
2021-06-23	Lossless Point Cloud Attribute Compression with Normal-based Intra Prediction	Qian Yin et.al.	2106.12236	null
2021-06-21	Cylindrical coordinates for LiDAR point cloud compression	Shashank N. Sridhara et.al.	2106.11237	null
2021-10-11	Neural Network Modeling of Probabilities for Coding the Octree Representation of Point Clouds	Emre Can Kaya et.al.	2106.06482	link
2021-06-09	Point Cloud Upsampling via Disentangled Refinement	Ruihui Li et.al.	2106.04779	link
2021-06-02	DeepCompress: Efficient Point Cloud Geometry Compression	Ryan Killea et.al.	2106.01504	link
2021-06-01	RAI-Net: Range-Adaptive LiDAR Point Cloud Frame Interpolation Network	Lili Zhao et.al.	2106.00496	null
2021-05-28	An Unsupervised Optical Flow Estimation For LiDAR Image Sequences	Xuezhou Guo et.al.	2105.13879	null
2021-05-05	VoxelContext-Net: An Octree based Framework for Point Cloud Compression	Zizheng Que et.al.	2105.02158	null
2021-04-20	Multiscale deep context modeling for lossless point cloud geometry compression	Dat Thanh Nguyen et.al.	2104.09859	link
2021-04-12	Towards Efficient Graph Convolutional Networks for Point Cloud Handling	Yawei Li et.al.	2104.05706	null
2021-03-11	Advanced Geometry Surface Coding for Dynamic Point Cloud Compression	Jian Xiong et.al.	2103.06549	null
2021-03-05	Hybrid Point Cloud Semantic Compression for Automotive Sensors: A Performance Evaluation	Andrea Varischio et.al.	2103.03819	null
2021-02-26	Point Cloud Upsampling and Normal Estimation using Deep Learning for Robust Surface Reconstruction	Rajat Sharma et.al.	2102.13391	link
2021-02-25	A deep perceptual metric for 3D point clouds	Maurice Quach et.al.	2102.12839	link
2021-02-08	Meta-PU: An Arbitrary-Scale Upsampling Network for Point Cloud	Shuquan Ye et.al.	2102.04317	null
2020-12-15	NeuralQAAD: An Efficient Differentiable Framework for High Resolution Point Cloud Compression	Nicolas Wagner et.al.	2012.08143	null
2022-06-11	SPU-Net: Self-Supervised Point Cloud Upsampling by Coarse-to-Fine Reconstruction with Self-Projection Optimization	Xinhai Liu et.al.	2012.04439	link
2021-11-18	Vehicular Cooperative Perception Through Action Branching and Federated Reinforcement Learning	Mohamed K. Abdel-Aziz et.al.	2012.03414	null
2020-12-05	ParaNet: Deep Regular Representation for 3D Point Clouds	Qijian Zhang et.al.	2012.03028	null
2020-11-27	Spherical Interpolated Convolutional Network with Distance-Feature Density for 3D Semantic Segmentation of Point Clouds	Guangming Wang et.al.	2011.13784	null
2020-11-25	Reduced Reference Perceptual Quality Model and Application to Rate Control for 3D Point Cloud Compression	Qi Liu et.al.	2011.12688	null
2020-11-07	Multiscale Point Cloud Geometry Compression	Jianqiang Wang et.al.	2011.03799	link
2020-10-29	Point Cloud Attribute Compression via Successive Subspace Graph Transform	Yueru Chen et.al.	2010.15302	null
2020-08-16	Real-Time Spatio-Temporal LiDAR Point Cloud Compression	Yu Feng et.al.	2008.06972	link
2021-08-03	Subjective Quality Database and Objective Study of Compressed Point Clouds With 6DoF Head-Mounted Display	Xinju Wu et.al.	2008.02501	null
2020-06-20	Pseudo-LiDAR Point Cloud Interpolation Based on 3D Motion Representation and Spatial Supervision	Haojie Liu et.al.	2006.11481	null
2020-06-24	Improved Deep Point Cloud Geometry Compression	Maurice Quach et.al.	2006.09043	link
2020-04-03	Intrinsic Point Cloud Interpolation via Dual Latent Space Navigation	Marie-Julie Rakotosaona et.al.	2004.01661	link
2020-03-30	A generalized Hausdorff distance based quality metric for point cloud geometry	Alireza Javaheri et.al.	2003.13669	null
2020-03-30	Optimizing Geometry Compression using Quantum Annealing	Sebastian Feld et.al.	2003.13253	null
2020-03-27	Model-based Joint Bit Allocation between Geometry and Color for Video-based 3D Point Cloud Compression	Qi Liu et.al.	2002.10798	null
2020-03-07	PUGeo-Net: A Geometry-centric Network for 3D Point Cloud Upsampling	Yue Qian et.al.	2002.10277	null
2020-06-22	Folding-based compression of point cloud attributes	Maurice Quach et.al.	2002.04439	null
2020-01-13	Efficient 3D Road Map Data Exchange for Intelligent Vehicles in Vehicular Fog Networks	Ivan Wang-Hei Ho et.al.	2001.04057	null
2020-01-12	Linear Model based Geometry Coding for Lidar Acquired Point Clouds	Xiang Zhang et.al.	2001.03871	null
2021-04-09	PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection	Shaoshuai Shi et.al.	1912.13192	link
2019-12-20	A Comprehensive Study and Comparison of Core Technologies for MPEG 3D Point Cloud Compression	Hao Liu et.al.	1912.09674	null
2020-10-15	Point Cloud Rendering after Coding: Impacts on Subjective and Objective Quality	Alireza Javaheri et.al.	1912.09137	null
2021-03-29	PU-GCN: Point Cloud Upsampling using Graph Convolutional Networks	Guocheng Qian et.al.	1912.03264	link
2019-11-04	Video-based compression for plenoptic point clouds	Li Li et.al.	1911.01355	null
2019-09-26	Learned Point Cloud Geometry Compression	Jianqiang Wang et.al.	1909.12037	link
2019-09-16	PLIN: A Network for Pseudo-LiDAR Point Cloud Interpolation	Haojie Liu et.al.	1909.07137	null
2019-08-17	3D Point Cloud Super-Resolution via Graph Total Variation on Surface Normals	Chinthaka Dinesh et.al.	1908.06261	null
2019-08-06	Point Cloud Super Resolution with Adversarial Residual Graph Networks	Huikai Wu et.al.	1908.02111	link
2020-08-10	Predictive Generalized Graph Fourier Transform for Attribute Compression of Dynamic Point Clouds	Yiqun Xu et.al.	1908.01970	null
2019-07-25	PU-GAN: a Point Cloud Upsampling Adversarial Network	Ruihui Li et.al.	1907.10844	null
2019-06-27	A Convolutional Decoder for Point Clouds using Adaptive Instance Normalization	Isaak Lim et.al.	1906.11478	null
2019-04-18	Deep AutoEncoder-based Lossy Geometry Compression for Point Clouds	Wei Yan et.al.	1905.03691	null
2019-05-22	Learning Convolutional Transforms for Lossy Point Cloud Geometry Compression	Maurice Quach et.al.	1903.08548	link
2019-09-30	Variational Graph Methods for Efficient Point Cloud Sparsification	Daniel Tenbrinck et.al.	1903.02858	null
2019-03-05	Pose Estimation of Vehicles Over Uneven Terrain	Yingchong Ma et.al.	1903.02052	null
2019-02-11	Occupancy-map-based rate distortion optimization for video-based point cloud compression	Li Li et.al.	1902.04169	null
2018-09-30	A Volumetric Approach to Point Cloud Compression	Maja Krivokuća et.al.	1810.00484	null
2018-05-29	Surface Light Field Compression using a Point Cloud Codec	Xiang Zhang et.al.	1805.11203	null
2018-05-23	Comments on "Compression of 3D Point Clouds Using a Region-Adaptive Hierarchical Transform"	Gustavo Sandri et.al.	1805.09146	null
2018-04-28	Hybrid Point Cloud Attribute Compression Using Slice-based Layered Structure and Block-based Intra Prediction	Yiting Shao et.al.	1804.10783	null
2018-03-26	PU-Net: Point Cloud Upsampling Network	Lequan Yu et.al.	1801.06761	link
2017-10-10	Attribute Compression of 3D Point Clouds Using Laplacian Sparsity Optimized Graph Transform	Yiting Shao et.al.	1710.03532	null
2017-03-08	Dynamic Polygon Clouds: Representation and Compression for VR/AR	Philip A. Chou et.al.	1610.00402	null

(back to top)

Compression

Publish Date	Title	Authors	PDF	Code
2025-04-09	LVC: A Lightweight Compression Framework for Enhancing VLMs in Long Video Understanding	Ziyi Wang et.al.	2504.06835	null
2025-04-09	FANeRV: Frequency Separation and Augmentation based Neural Representation for Video	Li Yu et.al.	2504.06755	null
2025-04-10	Subjective Visual Quality Assessment for High-Fidelity Learning-Based Image Compression	Mohsen Jenadeleh et.al.	2504.06301	null
2025-04-08	Old and New Results on Alphabetic Codes	Roberto Bruno et.al.	2504.05959	null
2025-04-07	InteractVLM: 3D Interaction Reasoning from 2D Foundational Models	Sai Kumar Dwivedi et.al.	2504.05303	null
2025-04-07	One-Minute Video Generation with Test-Time Training	Karan Dalal et.al.	2504.05298	null
2025-04-07	Randomized block Krylov method for approximation of truncated tensor SVD	Malihe Nobakht Kooshkghazi et.al.	2504.04989	null
2025-04-07	3DM-WeConvene: Learned Image Compression with 3D Multi-Level Wavelet-Domain Convolution and Entropy Model	Haisheng Fu et.al.	2504.04658	null
2025-04-04	Three Forensic Cues for JPEG AI Images	Sandra Bergmann et.al.	2504.03191	null
2025-04-03	F-ViTA: Foundation Model Guided Visible to Thermal Translation	Jay N. Paranjape et.al.	2504.02801	link
2025-04-03	PicoPose: Progressive Pixel-to-Pixel Correspondence Learning for Novel Object Pose Estimation	Lihua Liu et.al.	2504.02617	link
2025-04-03	Bridging the Gap between Gaussian Diffusion Models and Universal Quantization for Image Compression	Lucas Relic et.al.	2504.02579	null
2025-04-03	L-LBVC: Long-Term Motion Estimation and Prediction for Learned Bi-Directional Video Compression	Yongqi Zhai et.al.	2504.02560	null
2025-04-03	Image Coding for Machines via Feature-Preserving Rate-Distortion Optimization	Samuel Fernández-Menduiña et.al.	2504.02216	null
2025-04-02	Representing Flow Fields with Divergence-Free Kernels for Reconstruction	Xingyu Ni et.al.	2504.01913	null
2025-04-02	SELIC: Semantic-Enhanced Learned Image Compression via High-Level Textual Guidance	Haisheng Fu et.al.	2504.01279	null
2025-04-01	Fundamentals of Caching Layered Data objects	Agrim Bari et.al.	2504.01104	null
2025-04-01	Green computing toward SKA era with RICK	Giovanni Lacopo et.al.	2504.00959	null
2025-04-01	Learned Image Compression with Dictionary-based Entropy Model	Jingbo Lu et.al.	2504.00496	null
2025-04-01	Learned Image Compression and Restoration for Digital Pathology	SeonYeong Lee et.al.	2503.23862	link
2025-03-31	An extrapolated and provably convergent algorithm for nonlinear matrix decomposition with the ReLU function	Nicolas Gillis et.al.	2503.23832	link
2025-03-31	TransVFC: A Transformable Video Feature Compression Framework for Machines	Yuxiao Sun et.al.	2503.23772	link
2025-03-30	Enhancing 3D Gaussian Splatting Compression via Spatial Condition-based Prediction	Jingui Ma et.al.	2503.23337	null
2025-03-29	Improved Motion Plane Adaptive 360-Degree Video Compression Using Affine Motion Models	Marina Ritthaler et.al.	2503.23151	null
2025-03-29	ShiftLIC: Lightweight Learned Image Compression with Spatial-Channel Shift Operations	Youneng Bao et.al.	2503.23052	link
2025-03-27	DeCompress: Denoising via Neural Compression	Ali Zafari et.al.	2503.22015	null
2025-03-27	Nonlinear Multiple Response Regression and Learning of Latent Spaces	Ye Tian et.al.	2503.21608	null
2025-03-27	F-INR: Functional Tensor Decomposition for Implicit Neural Representations	Sai Karthikeya Vemuri et.al.	2503.21507	null
2025-03-27	Embedding Compression Distortion in Video Coding for Machines	Yuxiao Sun et.al.	2503.21469	link
2025-03-28	Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression	Hanyue Tu et.al.	2503.21284	link
2025-03-27	WVSC: Wireless Video Semantic Communication with Multi-frame Compensation	Bingyan Xie et.al.	2503.21197	null
2025-03-26	Bandwidth Allocation for Cloud-Augmented Autonomous Driving	Peter Schafhalter et.al.	2503.20127	null
2025-03-25	Bitstream Collisions in Neural Image Compression via Adversarial Perturbations	Jordan Madden et.al.	2503.19817	link
2025-03-25	GIViC: Generative Implicit Video Compression	Ge Gao et.al.	2503.19604	null
2025-03-25	TFIC: End-to-End Text-Focused Image Compression for Coding for Machines	Stefano Della Fiore et.al.	2503.19495	null
2025-03-25	Multiscale Feature Importance-based Bit Allocation for End-to-End Feature Coding for Machines	Junle Liu et.al.	2503.19278	null
2025-03-24	Rank-Based Modeling for Universal Packets Compression in Multi-Modal Communications	Xuanhao Luo et.al.	2503.19097	link
2025-03-24	Merge Mode for Template-based Intra Mode Derivation (TIMD) in ECM	Mohsen Abdoli et.al.	2503.18679	null
2025-03-24	GranQ: Granular Zero-Shot Quantization with Unified Layer-Channel Awareness	Inpyo Hong et.al.	2503.18339	null
2025-03-23	Compression benchmarking of holotomography data using the OME-Zarr storage format	Dohyeon Lee et.al.	2503.18037	null
2025-03-23	Guided Diffusion for the Extension of Machine Vision to Human Visual Perception	Takahiro Shindo et.al.	2503.17907	null
2025-03-21	Optimal Neural Compressors for the Rate-Distortion-Perception Tradeoff	Eric Lei et.al.	2503.17558	null
2025-03-20	Samplets: Wavelet concepts for scattered data	Helmut Harbrecht et.al.	2503.17487	null
2025-03-20	Overview of Variable Rate Coding in JPEG AI	Panqi Jia et.al.	2503.16288	null
2025-03-20	PromptMobile: Efficient Promptus for Low Bandwidth Mobile Video Streaming	Liming Liu et.al.	2503.16112	null
2025-03-19	Fast Two-photon Microscopy by Neuroimaging with Oblong Random Acquisition (NORA)	Esther Whang et.al.	2503.15487	null
2025-03-17	Highly Efficient Direct Analytics on Semantic-aware Time Series Data Compression	Guoyou Sun et.al.	2503.13246	null
2025-03-17	OLÉ -- Online Learning Emulation in Cosmology	Sven Günther et.al.	2503.13183	link
2025-03-17	OSLO-IC: On-the-Sphere Learned Omnidirectional Image Compression with Attention Modules and Spatial Context	Paul Wawerek-López et.al.	2503.13119	null
2025-03-17	Knowledge Distillation: Enhancing Neural Network Compression with Integrated Gradients	David E. Hernandez et.al.	2503.13008	null
2025-03-17	Task-Oriented Feature Compression for Multimodal Understanding via Device-Edge Co-Inference	Cheng Yuan et.al.	2503.12926	null
2025-03-20	MambaIC: State Space Models for High-Performance Learned Image Compression	Fanhu Zeng et.al.	2503.12461	link
2025-03-16	A Parametric Family of Polynomial Wavelets for Signal and Image Processing	Mariantonia Cotronei et.al.	2503.12403	null
2025-03-16	RENO: Real-Time Neural Compression for 3D LiDAR Point Clouds	Kang You et.al.	2503.12382	link
2025-03-14	Gain-MLP: Improving HDR Gain Map Encoding via a Lightweight MLP	Trevor D. Canham et.al.	2503.11883	null
2025-03-14	Pathology Image Compression with Pre-trained Autoencoders	Srikar Yellapragada et.al.	2503.11591	null
2025-03-14	Enhanced Diagnostic Fidelity in Pathology Whole Slide Image Compression via Deep Learning	Maximilian Fischer et.al.	2503.11350	null
2025-03-14	FG-DFPN: Flow Guided Deformable Frame Prediction Network	M. Akın Yılmaz et.al.	2503.11343	link
2025-03-14	Leveraging Diffusion Knowledge for Generative Image Compression with Fractal Frequency-Aware Band Learning	Lingyu Zhu et.al.	2503.11321	null
2025-03-14	Deep Lossless Image Compression via Masked Sampling and Coarse-to-Fine Auto-Regression	Tiantian Li et.al.	2503.11231	null
2025-03-14	Stabilizing Quantization-Aware Training by Implicit-Regularization on Hessian Matrix	Junbiao Pang et.al.	2503.11159	null
2025-03-14	Flow to the Mode: Mode-Seeking Diffusion Autoencoders for State-of-the-Art Image Tokenization	Kyle Sargent et.al.	2503.11056	null
2025-03-13	JPEG Compliant Compression for Both Human and Machine, A Report	Linfeng Ye et.al.	2503.10912	null
2025-03-13	Edge-Fog Computing-Enabled EEG Data Compression via Asymmetrical Variational Discrete Cosine Transform Network	Xin Zhu et.al.	2503.09961	null
2025-03-12	Bidirectional Learned Facial Animation Codec for Low Bitrate Talking Head Videos	Riku Takahashi et.al.	2503.09787	null
2025-03-12	PerCoV2: Improved Ultra-Low Bit-Rate Perceptual Image Compression with Implicit Hierarchical Masked Image Modeling	Nikolai Körber et.al.	2503.09368	link
2025-03-11	Residual Learning and Filtering Networks for End-to-End Lossless Video Compression	Md baharul Islam et.al.	2503.08819	null
2025-03-11	Using Powerful Prior Knowledge of Diffusion Model in Deep Unfolding Networks for Image Compressive Sensing	Chen Liao et.al.	2503.08429	null
2025-03-11	Explainable Autoencoder Design for RSSI-Based Multi-User Beam Probing and Hybrid Precoding	Asmaa Abdallah et.al.	2503.08267	null
2025-03-10	Inverting Parameterized Burrows-Wheeler Transform	Shogen Kawanami et.al.	2503.06970	null
2025-03-10	Rate distortion dimension and ergodic decomposition for $\mathbb{R}^d$ -actions	Masaki Tsukamoto et.al.	2503.06851	null
2025-03-09	Seeing Delta Parameters as JPEG Images: Data-Free Delta Compression with Discrete Cosine Transform	Chenyu Huang et.al.	2503.06676	null
2025-03-12	FEDS: Feature and Entropy-Based Distillation Strategy for Efficient Learned Image Compression	Haisheng Fu et.al.	2503.06399	null
2025-03-07	Cross-Layer-Optimized Link Selection for Hologram Video Streaming over Millimeter Wave Networks	Yiming Jiang et.al.	2503.05195	null
2025-03-06	Adapt3R: Adaptive 3D Scene Representation for Domain Transfer in Imitation Learning	Albert Wilcox et.al.	2503.04877	null
2025-03-13	Security and Real-time FPGA integration for Learned Image Compression	Alaa Mazouz et.al.	2503.04867	null
2025-03-13	Lightweight Embedded FPGA Deployment of Learned Image Compression with Knowledge Distillation and Hybrid Quantization	Alaa Mazouz et.al.	2503.04832	null
2025-03-06	PokéChamp: an Expert-level Minimax Language Agent	Seth Karten et.al.	2503.04094	null
2025-03-06	Significant challenges for astrophysical inference with next-generation gravitational-wave observatories	A. Makai Baker et.al.	2503.04073	null
2025-03-11	OTTER: A Vision-Language-Action Model with Text-Aware Visual Feature Extraction	Huang Huang et.al.	2503.03734	null
2025-03-08	Rethinking Video Tokenization: A Conditioned Diffusion-based Approach	Nianzu Yang et.al.	2503.03708	link
2025-03-04	UAR-NVC: A Unified AutoRegressive Framework for Memory-Efficient Neural Video Compression	Jia Wang et.al.	2503.02733	null
2025-03-04	On the sensitivity of CDAWG-grammars	Hiroto Fujimaru et.al.	2503.02415	null
2025-03-03	How Low Can You Go? Searching for the Intrinsic Dimensionality of Complex Networks using Metric Node Embeddings	Nikolaos Nakis et.al.	2503.01723	link
2025-03-03	Lossy Neural Compression for Geospatial Analytics: A Review	Carlos Gomes et.al.	2503.01505	null
2025-03-07	DLF: Extreme Image Compression with Dual-generative Latent Fusion	Naifu Xue et.al.	2503.01428	null
2025-03-03	Improving the Efficiency of VVC using Partitioning of Reference Frames	Kamran Qureshi et.al.	2503.01415	null
2025-03-03	Multi-resolution Encoding for HTTP Adaptive Streaming using VVenC	Kamran Qureshi et.al.	2503.01404	null
2025-03-01	High Dynamic Range Video Compression: A Large-Scale Benchmark Dataset and A Learned Bit-depth Scalable Compression Algorithm	Zhaoyi Tian et.al.	2503.00410	link
2025-03-01	Taming Large Multimodal Agents for Ultra-low Bitrate Semantically Disentangled Image Compression	Juan Song et.al.	2503.00399	null
2025-03-07	CAT-3DGS: A Context-Adaptive Triplane Approach to Rate-Distortion-Optimized 3DGS Compression	Yu-Ting Zhan et.al.	2503.00357	null
2025-02-28	Towards Lossless Implicit Neural Representation via Bit Plane Decomposition	Woo Kyoung Han et.al.	2502.21001	link
2025-02-28	LesionLocator: Zero-Shot Universal Tumor Segmentation and Tracking in 3D Whole-Body Imaging	Maximilian Rokuss et.al.	2502.20985	null
2025-02-28	Towards Practical Real-Time Neural Video Compression	Zhaoyang Jia et.al.	2502.20762	link
2025-02-27	Balanced Rate-Distortion Optimization in Learned Image Compression	Yichi Zhang et.al.	2502.20161	link
2025-02-27	Transformer-Based Nonlinear Transform Coding for Multi-Rate CSI Compression in MIMO-OFDM Systems	Bumsu Park et.al.	2502.19847	null
2025-02-26	Zipping many-body quantum states: a scalable approach to diagonal entropy	Yu-Hsueh Chen et.al.	2502.18898	null
2025-02-25	Novel quantum circuit for image compression utilizing modified Toffoli gate and quantized transformed coefficient alongside a novel reset gate	Ershadul Haque et.al.	2502.17815	null
2025-02-25	Quantum neural compressive sensing for ghost imaging	Xinliang Zhai et.al.	2502.17790	null
2025-02-24	Optimized Memory System Architecture for VESA VDC-M Decoder with Multi-Slice Support	Hannah Yang et.al.	2502.17729	null
2025-02-24	Pleno-Generation: A Scalable Generative Face Video Compression Framework with Bandwidth Intelligence	Bolin Chen et.al.	2502.17085	null
2025-02-24	Hierarchical Semantic Compression for Consistent Image Semantic Restoration	Shengxi Li et.al.	2502.16799	null
2025-02-24	Continuous Patch Stitching for Block-wise Image Compression	Zifu Zhang et.al.	2502.16795	null
2025-02-27	Orchestrating Joint Offloading and Scheduling for Low-Latency Edge SLAM	Yao Zhang et.al.	2502.16495	null
2025-02-22	Large Language Model for Lossless Image Compression with Visual Prompts	Junhao Du et.al.	2502.16163	null
2025-02-21	Quantum autoencoders for image classification	Hinako Asaoka et.al.	2502.15254	null
2025-02-21	Interleaved Block-based Learned Image Compression with Feature Enhancement and Quantization Error Compensation	Shiqi Jiang et.al.	2502.15188	null
2025-02-21	FD-LSCIC: Frequency Decomposition-based Learned Screen Content Image Compression	Shiqi Jiang et.al.	2502.15174	null
2025-02-20	Compact Latent Representation for Image Compression (CLRIC)	Ayman A. Ameen et.al.	2502.14937	null
2025-02-20	Stereo Image Coding for Machines with Joint Visual Feature Compression	Dengchao Jin et.al.	2502.14190	null
2025-02-19	A General Framework for Augmenting Lossy Compressors with Topological Guarantees	Nathaniel Gorski et.al.	2502.14022	null
2025-02-19	A Lightweight Model for Perceptual Image Compression via Implicit Priors	Hao Wei et.al.	2502.13988	null
2025-02-19	Improving the Sparse Structure Learning of Spiking Neural Networks from the View of Compression Efficiency	Jiangrong Shen et.al.	2502.13572	null
2025-02-18	Guaranteed Conditional Diffusion: 3D Block-based Models for Scientific Data Compression	Jaemoon Lee et.al.	2502.12951	null
2025-02-17	Fully Dynamic LZ77 in Sublinear Time	Itai Boneh et.al.	2502.12000	null
2025-02-17	On Quantizing Neural Representation for Variable-Rate Video Coding	Junqi Shi et.al.	2502.11729	link
2025-02-15	AquaScope: Reliable Underwater Image Transmission on Mobile Devices	Beitong Tian et.al.	2502.10891	null
2025-02-15	ResiComp: Loss-Resilient Image Compression via Dual-Functional Masked Visual Token Modeling	Sixian Wang et.al.	2502.10812	null
2025-02-15	A Fast Quantum Image Compression Algorithm based on Taylor Expansion	Vu Tuan Hai et.al.	2502.10684	link
2025-02-15	Optimizing CNN Architectures for Advanced Thoracic Disease Classification	Tejas Mirthipati et.al.	2502.10614	null
2025-02-14	Conditional Latent Coding with Learnable Synthesized Reference for Deep Image Compression	Siqi Wu et.al.	2502.09971	null
2025-02-13	Differentially Private Compression and the Sensitivity of LZ77	Jeremiah Blocki et.al.	2502.09584	null
2025-02-13	SQ-GAN: Semantic Image Communications Using Masked Vector Quantization	Francesco Pezone et.al.	2502.09520	link
2025-02-13	Large Images are Gaussians: High-Quality Large Image Representation with Levels of 2D Gaussian Splatting	Lingting Zhu et.al.	2502.09039	link
2025-02-12	Compression of Site-Specific Deep Neural Networks for Massive MIMO Precoding	Ghazal Kasalaee et.al.	2502.08758	null
2025-02-11	To clean or not to clean? Influence of pixel removal on event reconstruction using deep learning in CTAO	Tom François et.al.	2502.07643	null
2025-02-19	HDCompression: Hybrid-Diffusion Image Compression for Ultra-Low Bitrates	Lei Lu et.al.	2502.07160	null
2025-02-12	Lumina-Video: Efficient and Flexible Video Generation with Multi-scale Next-DiT	Dongyang Liu et.al.	2502.06782	null
2025-02-10	Solving Optimal Power Flow on a Data-Budget: Feature Selection on Smart Meter Data	Vassilis Kekatos et.al.	2502.06683	null
2025-02-13	CANeRV: Content Adaptive Neural Representation for Video Compression	Lv Tang et.al.	2502.06181	null
2025-02-09	Online Reward-Weighted Fine-Tuning of Flow Matching with Wasserstein Regularization	Jiajun Fan et.al.	2502.06061	null
2025-02-09	Constant sensitivity on the CDAWGs	Rikuya Hamai et.al.	2502.05915	null
2025-02-09	Linear Attention Modeling for Learned Image Compression	Donghui Feng et.al.	2502.05741	null
2025-02-08	Convolutional Deep Colorization for Image Compression: A Color Grid Based Approach	Ian Tassin et.al.	2502.05402	null
2025-02-07	CMamba: Learned Image Compression with State Space Models	Zhuojie Wu et.al.	2502.04988	null
2025-02-06	Semantic Feature Division Multiple Access for Digital Semantic Broadcast Channels	Shuai Ma et.al.	2502.03949	null
2025-02-06	Enhancing Online Learning Efficiency Through Heterogeneous Resource Integration with a Multi-Agent RAG System	Devansh Srivastav et.al.	2502.03948	null
2025-02-05	All-in-One Image Compression and Restoration	Huimin Zeng et.al.	2502.03649	link
2025-02-05	Towards characterizing dark matter subhalo perturbations in stellar streams with graph neural networks	Peter Xiangyuan Ma et.al.	2502.03522	null
2025-02-05	LED there be DoS: Exploiting variable bitrate IP cameras for network DoS	Emmanuel Goldberg et.al.	2502.03177	null
2025-02-04	On likelihood-based analysis of the gravitationally (de)lensed CMB	Julien Carron et.al.	2502.02399	null
2025-02-04	PALQA: A Novel Parameterized Position-Aware Lossy Quantum Autoencoder using LSB Control Qubit for Efficient Image Compression	Ershadul Haque et.al.	2502.02188	null
2025-02-01	Semantic Communication based on Generative AI: A New Approach to Image Compression and Edge Optimization	Francesco Pezone et.al.	2502.01675	null
2025-02-10	Compressed Image Generation with Denoising Diffusion Codebook Models	Guy Ohayon et.al.	2502.01189	null
2025-02-02	S2CFormer: Reorienting Learned Image Compression from Spatial Interaction to Channel Aggregation	Yunuo Chen et.al.	2502.00700	null
2025-01-28	Rate-Distortion under Neural Tracking of Speech: A Directed Redundancy Approach	Jan Østergaard et.al.	2501.16762	null
2025-02-05	Hybrid Quantum Neural Networks with Amplitude Encoding: Advancing Recovery Rate Predictions	Ying Chen et.al.	2501.15828	null
2025-01-23	The Redundancy of Non-Singular Channel Simulation	Gergely Flamich et.al.	2501.14053	null
2025-02-01	On Disentangled Training for Nonlinear Transform in Learned Image Compression	Han Li et.al.	2501.13751	link
2025-01-23	Diffusion-based Perceptual Neural Video Compression with Temporal Diffusion Information Reuse	Wenzhuo Ma et.al.	2501.13528	null
2025-01-22	Using simulation based inference on tidally perturbed dwarf galaxies: the dynamics of NGC205	Axel Widmark et.al.	2501.13148	null
2025-01-22	Nonlinear reduction strategies for data compression: a comprehensive comparison from diffusion to advection problems	Isabella Carla Gonnella et.al.	2501.12816	null
2025-01-22	Entropy Polarization-Based Data Compression Without Frozen Set Construction	Zichang Ren et.al.	2501.12584	null
2025-01-21	The Gap Between Principle and Practice of Lossy Image Coding	Haotian Zhang et.al.	2501.12330	null
2025-01-21	RL-RC-DoT: A Block-level RL agent for Task-Aware Video Compression	Uri Gadot et.al.	2501.12216	null
2025-01-20	Efficient Bearing Sensor Data Compression via an Asymmetrical Autoencoder with a Lifting Wavelet Transform Layer	Xin Zhu et.al.	2501.11737	null
2025-01-20	Towards Loss-Resilient Image Coding for Unstable Satellite Networks	Hongwei Sha et.al.	2501.11263	null
2025-01-18	Mathematical model of parameters relevance in adaptive level-crossing sampling for electrocardiogram signals	Silvio Zanoli et.al.	2501.10829	null
2025-01-30	Lossless data compression at pragmatic rates	Andreas Theocharous et.al.	2501.10103	null
2025-01-17	Multi-Modal Attention Networks for Enhanced Segmentation and Depth Estimation of Subsurface Defects in Pulse Thermography	Mohammed Salah et.al.	2501.09994	link
2025-01-31	A Simple Aerial Detection Baseline of Multimodal Language Models	Qingyun Li et.al.	2501.09720	link
2025-01-16	Split Fine-Tuning for Large Language Models in Wireless Networks	Songge Zhang et.al.	2501.09237	null
2025-01-13	Motion Tracks: A Unified Representation for Human-Robot Transfer in Few-Shot Imitation Learning	Juntao Ren et.al.	2501.06994	null
2025-01-12	A General Framework for Error-controlled Unstructured Scientific Data Compression	Qian Gong et.al.	2501.06910	null
2025-01-10	From My View to Yours: Ego-Augmented Learning in Large Vision Language Models for Understanding Exocentric Daily Living Activities	Dominick Reilly et.al.	2501.05711	link
2025-01-09	Neural Architecture Codesign for Fast Physics Applications	Jason Weitz et.al.	2501.05515	link
2025-01-09	Principles and Metrics of Extreme Learning Machines Using a Highly Nonlinear Fiber	Mathilde Hary et.al.	2501.05233	null
2025-01-09	Emergence of Painting Ability via Recognition-Driven Evolution	Yi Lin et.al.	2501.04966	null
2025-01-08	GaussianVideo: Efficient Video Representation via Hierarchical Gaussian Splatting	Andrew Bond et.al.	2501.04782	null
2025-01-08	Unified Coding for Both Human Perception and Generalized Machine Analytics with CLIP Supervision	Kangsheng Yin et.al.	2501.04579	link
2025-01-08	An Efficient Adaptive Compression Method for Human Perception and Machine Vision Tasks	Lei Liu et.al.	2501.04329	null
2025-01-03	Listening and Seeing Again: Generative Error Correction for Audio-Visual Speech Recognition	Rui Liu et.al.	2501.04038	link
2024-12-24	MERCURY: A fast and versatile multi-resolution based global emulator of compound climate hazards	Shruti Nath et.al.	2501.04018	null
2025-01-06	A Novel Structure-Agnostic Multi-Objective Approach for Weight-Sharing Compression in Deep Neural Networks	Rasa Khosrowshahli et.al.	2501.03095	null
2025-01-06	Region of Interest based Medical Image Compression	Utkarsh Prakash Srivastava et.al.	2501.02895	null
2025-01-06	Constructing 4D Radio Map in LEO Satellite Networks with Limited Samples	Haoxuan Yuan et.al.	2501.02775	null
2025-01-06	Artificial Intelligence in Creative Industries: Advances Prior to 2025	Nantheera Anantrasirichai et.al.	2501.02725	null
2025-01-05	Remote Inference over Dynamic Links via Adaptive Rate Deep Task-Oriented Vector Quantization	Eyal Fishel et.al.	2501.02521	link
2025-01-17	MetaNeRV: Meta Neural Representations for Videos with Spatial-Temporal Guidance	Jialong Guo et.al.	2501.02427	null
2025-01-03	Compressed Domain Prior-Guided Video Super-Resolution for Cloud Gaming Content	Qizhe Wang et.al.	2501.01773	null
2025-01-01	CoordFlow: Coordinate Flow for Pixel-wise Neural Video Representation	Daniel Silver et.al.	2501.00975	null
2025-01-01	Gradient Compression and Correlation Driven Federated Learning for Wireless Traffic Prediction	Chuanting Zhang et.al.	2501.00732	link
2025-01-07	*Rapid, High-resolution and Distortion-free $R_{2}^{}$ Mapping of Fetal Brain using Multi-echo Radial FLASH and Model-based Reconstruction**	Xiaoqing Wang et.al.	2501.00256	null
2024-12-29	Distributed Hybrid Sketching for $\ell_2$ -Embeddings	Neophytos Charalambides et.al.	2412.20301	null
2024-12-19	Quantum Implicit Neural Compression	Takuya Fujihashi et.al.	2412.19828	null
2024-12-25	Adaptive Rate Control for Deep Video Compression with Rate-Distortion Prediction	Bowen Gu et.al.	2412.18834	null
2024-12-24	Ultra-Low Complexity On-Orbit Compression for Remote Sensing Imagery via Block Modulated Imaging	Zhibin Wang et.al.	2412.18417	link
2024-12-24	Semantics Disentanglement and Composition for Versatile Codec toward both Human-eye Perception and Machine Vision Task	Jinming Liu et.al.	2412.18158	null
2024-12-23	CALLIC: Content Adaptive Learning for Lossless Image Compression	Daxin Li et.al.	2412.17464	null
2024-12-23	AsymLLIC: Asymmetric Lightweight Learned Image Compression	Shen Wang et.al.	2412.17270	null
2024-12-22	Foundation Model for Lossy Compression of Spatiotemporal Scientific Data	Xiao Li et.al.	2412.17184	null
2024-12-24	L3TC: Leveraging RWKV for Learned Lossless Low-Complexity Text Compression	Junxuan Zhang et.al.	2412.16642	link
2024-12-20	Schmidt quantum compressor	Israel F. Araujo et.al.	2412.16337	null
2024-12-20	Sparse Point Clouds Assisted Learned Image Compression	Yiheng Jiang et.al.	2412.15752	null
2024-12-18	Super-Resolution Generative Adversarial Network for Data Compression of Direct Numerical Simulations	Ludovico Nista et.al.	2412.14150	null
2024-12-18	Efficient high performance computing with the ALICE Event Processing Nodes GPU-based farm	Federico Ronchetti et.al.	2412.13755	null
2024-12-18	Robust UAV Jittering and Task Scheduling in Mobile Edge Computing with Data Compression	Bin Li et.al.	2412.13676	null
2024-12-18	DarkIR: Robust Low-Light Image Restoration	Daniel Feijoo et.al.	2412.13443	link
2024-12-17	Identifying Bias in Deep Neural Networks Using Image Transforms	Sai Teja Erukude et.al.	2412.13079	link
2024-12-17	Stable Diffusion is a Natural Cross-Modal Decoder for Layered AI-generated Image Compression	Ruijie Chen et.al.	2412.12982	null
2024-12-17	Invisible Watermarks: Attacks and Robustness	Dongjun Hwang et.al.	2412.12511	link
2024-12-16	Representation learning for fast radio burst dynamic spectra	Dirk Kuiper et.al.	2412.12394	link
2024-12-16	Point Cloud-Assisted Neural Image Compression	Ziqun Li et.al.	2412.11771	null
2024-12-16	Whisper-GPT: A Hybrid Representation Audio Large Language Model	Prateek Verma et.al.	2412.11449	null
2024-12-16	Controllable Distortion-Perception Tradeoff Through Latent Diffusion for Neural Image Compression	Chuqin Zhou et.al.	2412.11379	null
2024-12-16	VRVVC: Variable-Rate NeRF-Based Volumetric Video Compression	Qiang Hu et.al.	2412.11362	null
2024-12-14	Progressive Compression with Universally Quantized Diffusion Models	Yibo Yang et.al.	2412.10935	null
2024-12-14	Learned Data Compression: Challenges and Opportunities for the Future	Qiyu Liu et.al.	2412.10770	null
2024-12-11	Implicit Neural Compression of Point Clouds	Hongning Ruan et.al.	2412.10433	null
2024-12-12	Video Seal: Open and Efficient Video Watermarking	Pierre Fernandez et.al.	2412.09492	link
2024-12-12	Learned Compression for Compressed Learning	Dan Jacobellis et.al.	2412.09405	link
2024-12-12	Versatile Volumetric Medical Image Coding for Human-Machine Vision	Jietao Chen et.al.	2412.09231	null
2024-12-11	Unicorn: Unified Neural Image Compression with One Number Reconstruction	Qi Zheng et.al.	2412.08210	null
2024-12-09	Splatter-360: Generalizable 360 $^{\circ}$ Gaussian Splatting for Wide-baseline Panoramic Images	Zheng Chen et.al.	2412.06250	link
2024-12-08	Vision Transformer-based Semantic Communications With Importance-Aware Quantization	Joohyuk Park et.al.	2412.06038	null
2024-12-08	Matrix Pre-orthogonal-Matching Pursuit as a Fundamental AI Algorithm	Wei Qu et.al.	2412.05878	null
2024-12-09	UniMIC: Towards Universal Multi-modality Perceptual Image Compression	Yixin Gao et.al.	2412.04912	null
2024-12-05	Solving High-dimensional Inverse Problems Using Amortized Likelihood-free Inference with Noisy and Incomplete Data	Jice Zeng et.al.	2412.04565	null
2024-12-05	Diagnosing Systematic Effects Using the Inferred Initial Power Spectrum	Tristan Hoellinger et.al.	2412.04443	null
2024-12-05	Multi-Scale Node Embeddings for Graph Modeling and Generation	Riccardo Milocco et.al.	2412.04354	null
2024-12-05	Feature Coding in the Era of Large Models: Dataset, Test Conditions, and Benchmark	Changsheng Gao et.al.	2412.04307	link
2024-12-05	LL-ICM: Image Compression for Low-level Machine Vision via Large Vision-Language Model	Yuan Xue et.al.	2412.03841	null
2024-12-04	Electrocardiogram-based diagnosis of liver diseases: an externally validated and explainable machine learning approach	Juan Miguel Lopez Alcaraz et.al.	2412.03717	link
2024-12-04	Is JPEG AI going to change image forensics?	Edoardo Daniele Cannas et.al.	2412.03261	link
2024-12-03	Efficient Algorithms for Low Tubal Rank Tensor Approximation with Applications to Image Compression, Super-Resolution and Deep Learning	Salman Ahmadi-Asl et.al.	2412.02598	null
2024-12-03	Randomized algorithms for Kroncecker tensor decomposition and applications	Salman Ahmadi-Asl et.al.	2412.02597	null
2024-12-03	Efficient Model Compression Techniques with FishLeg	Jamie McGowan et.al.	2412.02328	null
2024-12-02	Efficient Compression of Sparse Accelerator Data Using Implicit Neural Representations and Importance Sampling	Xihaier Luo et.al.	2412.01754	link
2024-12-02	Robust and Transferable Backdoor Attacks Against Deep Image Compression With Selective Frequency Prior	Yi Yu et.al.	2412.01646	null
2024-12-01	Construction of generalized samplets in Banach spaces	Peter Balazs et.al.	2412.00954	null
2024-11-30	Good, Cheap, and Fast: Overfitted Image Compression with Wasserstein Distortion	Jona Ballé et.al.	2412.00505	null
2024-11-30	Hybrid Local-Global Context Learning for Neural Video Compression	Yongqi Zhai et.al.	2412.00446	null
2024-11-30	DeepFGS: Fine-Grained Scalable Coding for Learned Image Compression	Yongqi Zhai et.al.	2412.00437	null
2024-11-29	AIDetx: a compression-based method for identification of machine-learning generated text	Leonardo Almeida et.al.	2411.19869	link
2024-11-29	Memristive Nanowire Network for Energy Efficient Audio Classification: Pre-Processing-Free Reservoir Computing with Reduced Latency	Akshaya Rajesh et.al.	2411.19611	null
2024-11-29	MCUCoder: Adaptive Bitrate Learned Video Compression for IoT Devices	Ali Hojjat et.al.	2411.19442	link
2024-11-28	Generalized Gaussian Model for Learned Image Compression	Haotian Zhang et.al.	2411.19320	null
2024-11-28	Upsampling Improvement for Overfitted Neural Coding	Pierrick Philippe et.al.	2411.19249	null
2024-11-27	Learning Optimal Linear Block Transform by Rate Distortion Minimization	Alessandro Gnutti et.al.	2411.18494	null
2024-11-27	HEMGS: A Hybrid Entropy Model for 3D Gaussian Splatting Data Compression	Lei Liu et.al.	2411.18473	null
2024-11-26	Evaluating the Overhead of the Performance Profiler Cloudprofiler With MooBench	Shinhyung Yang et.al.	2411.17413	null
2024-11-26	Motion Free B-frame Coding for Neural Video Compression	Van Thang Nguyen et.al.	2411.17160	null
2024-11-30	An Information-Theoretic Regularizer for Lossy Neural Image Compression	Yingwen Zhang et.al.	2411.16727	null
2024-11-25	WTDUN: Wavelet Tree-Structured Sampling and Deep Unfolding Network for Image Compressed Sensing	Kai Han et.al.	2411.16336	null
2024-11-25	Learning Optimal Lattice Vector Quantizers for End-to-end Neural Image Compression	Xi Zhang et.al.	2411.16119	null
2024-11-25	TransCompressor: LLM-Powered Multimodal Data Compression for Smart Transportation	Huanqi Yang et.al.	2411.16020	null
2024-11-24	Variable-size Symmetry-based Graph Fourier Transforms for image compression	Alessandro Gnutti et.al.	2411.15824	null
2024-11-24	M3-CVC: Controllable Video Compression with Multimodal Generative Models	Rui Wan et.al.	2411.15798	null
2024-11-24	Advanced Learning-Based Inter Prediction for Future Video Coding	Yanchen Zhao et.al.	2411.15759	null
2024-11-24	PEnG: Pose-Enhanced Geo-Localisation	Tavis Shore et.al.	2411.15742	null
2024-11-21	U-Motion: Learned Point Cloud Video Compression with U-Structured Motion Estimation	Tingyu Fan et.al.	2411.14501	null
2024-11-21	Differentiable SVD based on Moore-Penrose Pseudoinverse for Inverse Imaging Problems	Yinghao Zhang et.al.	2411.14141	link
2024-11-21	Compact Visual Data Representation for Green Multimedia -- A Human Visual System Perspective	Peilin Chen et.al.	2411.14135	null
2024-11-27	Image Compression Using Novel View Synthesis Priors	Luyuan Peng et.al.	2411.13862	null
2024-11-20	Sparse Input View Synthesis: 3D Representations and Reliable Priors	Nagabhushan Somraj et.al.	2411.13631	null
2024-11-20	Benchmarking Quantum Convolutional Neural Networks for Classification and Data Compression Tasks	Jun Yong Khoo et.al.	2411.13468	null
2024-11-20	Practical Compact Deep Compressed Sensing	Bin Chen et.al.	2411.13081	link
2024-11-20	LMM-driven Semantic Image-Text Coding for Ultra Low-bitrate Learned Image Compression	Shimon Murai et.al.	2411.13033	link
2024-11-22	Large Language Models for Lossless Image Compression: Next-Pixel Prediction in Language Space is All You Need	Kecheng Chen et.al.	2411.12448	null
2024-11-19	Breathless: An 8-hour Performance Contrasting Human and Robot Expressiveness	Catie Cuan et.al.	2411.12361	null
2024-11-18	Variable Rate Neural Compression for Sparse Detector Data	Yi Huang et.al.	2411.11942	link
2024-11-18	Exploring adversarial robustness of JPEG AI: methodology, comparison and new methods	Egor Kovalev et.al.	2411.11795	null
2024-11-18	Additional Tests for TV 3.0	Eduardo Peixoto et.al.	2411.11755	null
2024-11-18	Towards fast DBSCAN via Spectrum-Preserving Data Compression	Yongyu Wang et.al.	2411.11421	null
2024-11-17	BVI-CR: A Multi-View Human Dataset for Volumetric Video Compression	Ge Gao et.al.	2411.11199	link
2024-11-16	An End-to-End Real-World Camera Imaging Pipeline	Kepeng Xu et.al.	2411.10773	null
2024-11-16	Deep Learning-Based Image Compression for Wireless Communications: Impacts on Reliability,Throughput, and Latency	Mostafa Naseri et.al.	2411.10650	link
2024-11-15	Efficient Progressive Image Compression with Variance-aware Masking	Alberto Presta et.al.	2411.10185	link
2024-11-15	A Multi-Scale Spatial-Temporal Network for Wireless Video Transmission	Xinyi Zhou et.al.	2411.09936	null
2024-11-14	Application of signal separation to diffraction image compression and serial crystallography	Jérôme Kieffer et.al.	2411.09515	link
2024-11-14	DT-JRD: Deep Transformer based Just Recognizable Difference Prediction Model for Video Coding for Machines	Junqi Liu et.al.	2411.09308	null
2024-11-14	Towards efficient compression and communication for prototype-based decentralized learning	Pablo Fernández-Piñeiro et.al.	2411.09267	null
2024-11-13	Learning Optimal and Interpretable Summary Statistics of Galaxy Catalogs with SBI	Kai Lehman et.al.	2411.08957	null
2024-11-13	LSH-MoE: Communication-efficient MoE Training via Locality-Sensitive Hashing	Xiaonan Nie et.al.	2411.08446	null
2024-11-18	Rendering-Oriented 3D Point Cloud Attribute Compression using Sparse Tensor-based Transformer	Xiao Huo et.al.	2411.07899	null
2024-11-11	Accelerating radio astronomy imaging with RICK	Emanuele De Rubeis et.al.	2411.07321	link
2024-11-11	Low Complexity Learning-based Lossless Event-based Compression	Ahmadreza Sezavar et.al.	2411.07155	null
2024-11-11	JPEG AI Image Compression Visual Artifacts: Detection Methods and Dataset	Daria Tsereh et.al.	2411.06810	null
2024-11-11	Machine vision-aware quality metrics for compressed image and video assessment	Mikhail Dremin et.al.	2411.06776	null
2024-11-11	High-Frequency Enhanced Hybrid Neural Representation for Video Compression	Li Yu et.al.	2411.06685	null
2024-11-09	HiHa: Introducing Hierarchical Harmonic Decomposition to Implicit Neural Compression for Atmospheric Data	Zhewen Xu et.al.	2411.06155	null
2024-11-08	A method based on Generative Adversarial Networks for disentangling physical and chemical properties of stars in astronomical spectra	Raúl Santoveña et.al.	2411.05960	null
2024-11-07	Don't Look Twice: Faster Video Transformers with Run-Length Tokenization	Rohan Choudhury et.al.	2411.05222	null
2024-11-05	Tuning into spatial frequency space: Satellite and space debris detection in the ZTF alert stream	J. P. Carvajal et.al.	2411.03258	null
2024-11-15	ZipCache: A DRAM/SSD Cache with Built-in Transparent Compression	Rui Xie et.al.	2411.03174	null
2024-11-05	Learning-based Lossless Event Data Compression	Ahmadreza Sezavar et.al.	2411.03010	null
2024-11-04	Neural optical flow for planar and stereo PIV	Andrew I. Masker et.al.	2411.02373	null
2024-11-04	The evolution of volumetric video: A survey of smart transcoding and compression approaches	Preetish Kakkar et.al.	2411.02095	null
2024-11-03	Efficient Deep Learning Infrastructures for Embedded Computing Systems: A Comprehensive Survey and Future Envision	Xiangzhong Luo et.al.	2411.01431	null
2024-11-02	Autoencoders for At-Source Data Reduction and Anomaly Detection in High Energy Particle Detectors	Alexander Yue et.al.	2411.01118	null
2024-11-01	SANN-PSZ: Spatially Adaptive Neural Network for Head-Tracked Personal Sound Zones	Yue Qiao et.al.	2411.00772	null
2024-10-28	MultiTok: Variable-Length Tokenization for Efficient LLMs Adapted from LZW Compression	Noel Elias et.al.	2410.21548	link
2024-10-29	Enhancing Learned Image Compression via Cross Window-based Attention	Priyanka Mudgal et.al.	2410.21144	link
2024-10-26	Cross-Platform Neural Video Coding: A Case Study	Ruhan Conceição et.al.	2410.20145	null
2024-10-25	Conditional Hallucinations for Image Compression	Till Aczel et.al.	2410.19493	null
2024-10-29	Integration of Communication and Computational Imaging	Zhenming Yu et.al.	2410.19415	null
2024-10-24	DMVC: Multi-Camera Video Compression Network aimed at Improving Deep Learning Accuracy	Huan Cui et.al.	2410.18400	null
2024-10-23	Predicting total time to compress a video corpus using online inference systems	Xin Shu et.al.	2410.18260	null
2024-10-23	FIPER: Generalizable Factorized Fields for Joint Image Compression and Super-Resolution	Yang-Che Sun et.al.	2410.18083	null
2024-10-23	Learning Lossless Compression for High Bit-Depth Volumetric Medical Image	Kai Wang et.al.	2410.17814	null
2024-10-21	Variable Rate Learned Wavelet Video Coding with Temporal Layer Adaptivity	Anna Meyer et.al.	2410.15873	link
2024-10-20	Extensions on low-complexity DCT approximations for larger blocklengths based on minimal angle similarity	A. P. Radünz et.al.	2410.15244	null
2024-10-19	Standardizing Generative Face Video Compression using Supplemental Enhancement Information	Bolin Chen et.al.	2410.15105	null
2024-10-16	MatryoshkaKV: Adaptive KV Compression via Trainable Orthogonal Projection	Bokai Lin et.al.	2410.14731	null
2024-10-18	Design and Prototype of a Unified Framework for Error-robust Compression and Encryption in IoT	Gajraj Kuldeep et.al.	2410.14396	null
2024-10-18	Compression using Discrete Multi-Level Divisor Transform for Heterogeneous Sensor Data	Gajraj Kuldeep et.al.	2410.14287	null
2024-10-17	In-context learning and Occam's razor	Eric Elmoznino et.al.	2410.14086	link
2024-10-17	Co-Segmentation without any Pixel-level Supervision with Application to Large-Scale Sketch Classification	Nikolaos-Antonios Ypsilantis et.al.	2410.13582	null
2024-10-16	Test-time adaptation for image compression with distribution regularization	Kecheng Chen et.al.	2410.12191	null
2024-10-16	Joint Data Compression, Secure Multi-Part Collaborative Task Offloading and Resource Assignment in Ultra-Dense Networks	Tianqing Zhou et.al.	2410.12186	null
2024-10-14	Large Language Model Evaluation via Matrix Nuclear-Norm	Yahan Li et.al.	2410.10672	link
2024-10-14	QIANets: Quantum-Integrated Adaptive Networks for Reduced Latency and Improved Inference Times in CNN Models	Zhumazhan Balapanov et.al.	2410.10318	link
2024-10-14	Generative Human Video Compression with Multi-granularity Temporal Trajectory Factorization	Shanzhi Yin et.al.	2410.10171	null
2024-10-13	Towards Reproducible Learning-based Compression	Jiahao Pang et.al.	2410.09872	null
2024-10-13	Compressing Scene Dynamics: A Generative Approach	Shanzhi Yin et.al.	2410.09768	link
2024-10-13	ECVC: Exploiting Non-Local Correlations in Multiple Frames for Contextual Video Compression	Wei Jiang et.al.	2410.09706	link
2024-10-12	Fine-grained subjective visual quality assessment for high-fidelity compressed images	Michela Testolina et.al.	2410.09501	link
2024-10-11	Fast Data-independent KLT Approximations Based on Integer Functions	A. P. Radünz et.al.	2410.09227	null
2024-10-10	Compressing high-resolution data through latent representation encoding for downscaling large-scale AI weather forecast model	Qian Liu et.al.	2410.09109	null
2024-10-11	Data-Driven Neural Estimation of Indirect Rate-Distortion Function	Zichao Yu et.al.	2410.09018	null
2024-10-11	Compressing regularised dynamics improves link prediction in sparse networks	Maja Lindström et.al.	2410.08777	link
2024-10-11	Beyond GFVC: A Progressive Face Video Compression Framework with Adaptive Visual Tokens	Bolin Chen et.al.	2410.08485	link
2024-10-10	What is Left After Distillation? How Knowledge Transfer Impacts Fairness and Bias	Aida Mohammadshahi et.al.	2410.08407	null
2024-10-16	Delta-ICM: Entropy Modeling with Delta Function for Learned Image Compression	Takahiro Shindo et.al.	2410.07669	null
2024-10-10	MotionAura: Generating High-Quality and Motion Consistent Videos using Discrete Diffusion	Onkar Susladkar et.al.	2410.07659	link
2024-10-10	R-Adaptive Mesh Optimization to Enhance Finite Element Basis Compression	Graham Harper et.al.	2410.07646	null
2024-10-09	JPEG Inspired Deep Learning	Ahmed H. Salamah et.al.	2410.07081	link
2024-10-09	SHRINK: Data Compression by Semantic Extraction and Residuals Encoding	Guoyou Sun et.al.	2410.06713	null
2024-10-09	Convex Distillation: Efficient Compression of Deep Networks via Convex Optimization	Prateek Varshney et.al.	2410.06567	null
2024-10-09	Efficient and Robust Knowledge Distillation from A Stronger Teacher Based on Correlation Matching	Wenqi Niu et.al.	2410.06561	null
2024-10-08	Covering Numbers for Deep ReLU Networks with Applications to Function Approximation and Nonparametric Regression	Weigutian Ou et.al.	2410.06378	null
2024-10-08	Toward Scalable Image Feature Compression: A Content-Adaptive and Diffusion-Based Approach	Sha Guo et.al.	2410.06149	null
2024-10-08	Resolution limit of the eye: how many pixels can we see?	Maliha Ashraf et.al.	2410.06068	null
2024-10-07	Transformers learn variable-order Markov chains in-context	Ruida Zhou et.al.	2410.05493	null
2024-10-07	Salient Store: Enabling Smart Storage for Continuous Learning Edge Servers	Cyan Subhra Mishra et.al.	2410.05435	null
2024-10-07	Causal Context Adjustment Loss for Learned Image Compression	Minghao Han et.al.	2410.04847	link
2024-10-06	Channel-Aware Throughput Maximization for Cooperative Data Fusion in CAV	Haonan An et.al.	2410.04320	null
2024-10-05	Robust Task-Oriented Communication Framework for Real-Time Collaborative Vision Perception	Zhengru Fang et.al.	2410.04168	link
2024-10-04	On the Rate-Distortion-Complexity Trade-offs of Neural Video Coding	Yi-Hsin Chen et.al.	2410.03898	null
2024-10-04	A Framework for Automatic Validation and Application of Lossy Data Compression in Ensemble Data Assimilation	Kai Keller et.al.	2410.03184	null
2024-10-03	GABIC: Graph-based Attention Block for Image Compression	Gabriele Spadaro et.al.	2410.02981	link
2024-10-03	Diffusion-based Extreme Image Compression with Compressed Feature Initialization	Zhiyuan Li et.al.	2410.02640	link
2024-10-03	High-Efficiency Neural Video Compression via Hierarchical Predictive Learning	Ming Lu et.al.	2410.02598	link
2024-10-02	A Spark of Vision-Language Intelligence: 2-Dimensional Autoregressive Transformer for Efficient Finegrained Image Generation	Liang Chen et.al.	2410.01912	link
2024-10-02	COSMIC: Compress Satellite Images Efficiently via Diffusion Compensation	Ziyuan Zhang et.al.	2410.01698	link
2024-10-03	Releasing the Parameter Latency of Neural Representation for High-Efficiency Video Compression	Gai Zhang et.al.	2410.01654	null
2024-10-02	Task-Oriented Edge-Assisted Cooperative Data Compression, Communications and Computing for UGV-Enhanced Warehouse Logistics	Jiaming Yang et.al.	2410.01515	null
2024-10-01	STanH : Parametric Quantization for Variable Rate Learned Image Compression	Alberto Presta et.al.	2410.00557	null
2024-09-30	LaMMA-P: Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner	Xiaopan Zhang et.al.	2409.20560	null
2024-09-30	PerCo (SD): Open Perceptual Compression	Nikolai Körber et.al.	2409.20255	link
2024-09-29	All-in-One Image Coding for Joint Human-Machine Vision with Multi-Path Aggregation	Xu Zhang et.al.	2409.19660	link
2024-09-28	Fast Encoding and Decoding for Implicit Video Representation	Hao Chen et.al.	2409.19429	null
2024-09-27	Learning-Based Image Compression for Machines	Kartik Gupta et.al.	2409.19184	link
2024-09-27	Effectiveness of learning-based image codecs on fingerprint storage	Daniele Mari et.al.	2409.18730	link
2024-09-27	Decoding Complexity-Rate-Quality Pareto-Front for Adaptive VVC Streaming	Angeliki Katsenou et.al.	2409.18713	null
2024-09-27	Neural Video Representation for Redundancy Reduction and Consistency Preservation	Taiga Hayami et.al.	2409.18497	null
2024-09-20	Blockchain-Enabled Variational Information Bottleneck for Data Extraction Based on Mutual Information in Internet of Vehicles	Cui Zhang et.al.	2409.17287	null
2024-09-25	Streaming Neural Images	Marcos V. Conde et.al.	2409.17134	null
2024-09-25	PhD Forum: Efficient Privacy-Preserving Processing via Memory-Centric Computing	Mpoki Mwaisela et.al.	2409.16777	null
2024-09-25	The Effect of Lossy Compression on 3D Medical Images Segmentation with Deep Learning	Anvar Kurmukov et.al.	2409.16733	null
2024-09-24	AIM 2024 Challenge on UHD Blind Photo Quality Assessment	Vlad Hosu et.al.	2409.16271	null
2024-09-25	COHERENT: Collaboration of Heterogeneous Multi-Robot System with Large Language Models	Kehui Liu et.al.	2409.15146	link
2024-09-23	AlphaZip: Neural Network-Enhanced Lossless Text Compression	Swathi Shree Narashiman et.al.	2409.15046	link
2024-09-23	Anomaly Detection from a Tensor Train Perspective	Alejandro Mata Ali et.al.	2409.15030	null
2024-09-23	AIM 2024 Challenge on Video Saliency Prediction: Methods and Results	Andrey Moskalenko et.al.	2409.14827	link
2024-09-21	Window-based Channel Attention for Wavelet-enhanced Learned Image Compression	Heng Xu et.al.	2409.14090	null
2024-09-20	Reduced bit median quantization: A middle process for Efficient Image Compression	Fikresilase Wondmeneh Abebayew et.al.	2409.13789	null
2024-09-20	Data Compression using Rank-1 Lattices for Parameter Estimation in Machine Learning	Michael Gnewuch et.al.	2409.13453	null
2024-09-19	Breaking the Barriers of One-to-One Usage of Implicit Neural Representation in Image Compression: A Linear Combination Approach with Performance Guarantees	Sai Sanjeet et.al.	2409.13117	link
2024-09-19	Optimal Coding for Randomized Kolmogorov Complexity and Its Applications	Shuichi Hirahara et.al.	2409.12744	null
2024-09-19	Multi-Scale Feature Prediction with Auxiliary-Info for Neural Image Compression	Chajin Shin et.al.	2409.12719	null
2024-09-18	One Map to Find Them All: Real-time Open-Vocabulary Mapping for Zero-shot Multi-Object Navigation	Finn Lukas Busch et.al.	2409.11764	null
2024-09-18	LFIC-DRASC: Deep Light Field Image Compression Using Disentangled Representation and Asymmetrical Strip Convolution	Shiyu Feng et.al.	2409.11711	null
2024-09-18	k-mer-based approaches to bridging pangenomics and population genetics	Miles D. Roberts et.al.	2409.11683	null
2024-09-17	Few-Shot Domain Adaptation for Learned Image Compression	Tianyu Zhang et.al.	2409.11111	null
2024-09-17	Edge-based Denoising Image Compression	Ryugo Morita et.al.	2409.10978	null
2024-09-16	Frequency-Guided Masking for Enhanced Vision Self-Supervised Learning	Amin Karimi Monsefi et.al.	2409.10362	link
2024-09-14	Lossy Image Compression with Stochastic Quantization	Anton Kozyriev et.al.	2409.09488	null
2024-09-13	Fast DCT+: A Family of Fast Transforms Based on Rank-One Updates of the Path Graph	Samuel Fernández-Menduiña et.al.	2409.08970	null
2024-09-13	On the Computation of BD-Rate over a Set of Videos for Fair Assessment of Performance of Learned Video Codecs	M. Akin Yilmaz et.al.	2409.08772	null
2024-09-13	USTC-TD: A Test Dataset and Benchmark for Image and Video Coding in 2020s	Zhuoyuan Li et.al.	2409.08481	null
2024-09-12	Learned Compression for Images and Point Clouds	Mateen Ulhaq et.al.	2409.08376	link
2024-09-11	NVRC: Neural Video Representation Compression	Ho Man Kwan et.al.	2409.07414	null
2024-09-11	Dynamic Error-Bounded Hierarchical Matrices in Neural Network Compression	John Mango et.al.	2409.07028	null
2024-09-10	Universal End-to-End Neural Network for Lossy Image Compression	Bouzid Arezki et.al.	2409.06586	null
2024-09-10	Rate-Constrained Quantization for Communication-Efficient Federated Learning	Shayan Mohajer Hamidi et.al.	2409.06319	null
2024-09-09	Design and Implementation of TAO DAQ System	Shuihan Zhang et.al.	2409.05522	null
2024-09-09	A Taxonomy of Miscompressions: Preparing Image Forensics for Neural Compression	Nora Hofer et.al.	2409.05490	null
2024-09-09	Attention Based Machine Learning Methods for Data Reduction with Guaranteed Error Bounds	Xiao Li et.al.	2409.05357	null
2024-09-06	Convolutional Transformer-Based Image Compression	Bouzid Arezki et.al.	2409.04118	null
2024-09-06	3D-GP-LMVIC: Learning-based Multi-View Image Coding with 3D Gaussian Geometric Priors	Yujun Huang et.al.	2409.04013	link
2024-09-05	TropNNC: Structured Neural Network Compression Using Tropical Geometry	Konstantinos Fotopoulos et.al.	2409.03945	null
2024-09-05	Unified Framework for Neural Network Compression via Decomposition and Optimal Rank Selection	Ali Aghababaei-Harandi et.al.	2409.03555	null
2024-09-05	Efficient Image Compression Using Advanced State Space Models	Bouzid Arezki et.al.	2409.02743	null
2024-09-10	FrameCorr: Adaptive, Autoencoder-based Neural Compression for Video Reconstruction in Resource and Timing Constrained Network Settings	John Li et.al.	2409.02453	null
2024-09-03	Compressed learning based onboard semantic compression for remote sensing platforms	Protim Bhattacharjee et.al.	2409.01988	link
2024-09-03	Map-Assisted Remote-Sensing Image Compression at Extremely Low Bitrates	Yixuan Ye et.al.	2409.01935	link
2024-09-03	Privacy-Preserving Multimedia Mobile Cloud Computing Using Protective Perturbation	Zhongze Tang et.al.	2409.01710	null
2024-09-02	Multi-Reference Generative Face Video Compression with Contrastive Learning	Goluck Konuko et.al.	2409.01029	link
2024-09-02	Accelerating block-level rate control for learned image compression	Muchen Dong et.al.	2409.01009	null
2024-09-02	PNVC: Towards Practical INR-based Video Compression	Ge Gao et.al.	2409.00953	null
2024-09-01	BWT construction and search at the terabase scale	Heng Li et.al.	2409.00613	link
2024-08-30	Prioritized Information Bottleneck Theoretic Framework with Distributed Online Learning for Edge Video Analytics	Zhengru Fang et.al.	2409.00146	link
2024-08-28	Quantum Kernel Principal Components Analysis for Compact Readout of Chemiresistive Sensor Arrays	Zeheng Wang et.al.	2409.00115	null
2024-08-30	NDP: Next Distribution Prediction as a More Broad Target	Junhao Ruan et.al.	2408.17377	null
2024-08-30	Approximately Invertible Neural Network for Learned Image Compression	Yanbo Gao et.al.	2408.17073	null
2024-08-29	UAV-Based Human Body Detector Selection and Fusion for Geolocated Saliency Map Generation	Piotr Rudol et.al.	2408.16501	null
2024-08-29	Convolutional Neural Network Compression Based on Low-Rank Decomposition	Yaping He et.al.	2408.16289	null
2024-08-27	Bandwidth-Aware and Overlap-Weighted Compression for Communication-Efficient Federated Learning	Zichen Tang et.al.	2408.14736	null
2024-08-25	Condensed Sample-Guided Model Inversion for Knowledge Distillation	Kuluhan Binici et.al.	2408.13850	null
2024-08-12	Semantic Variational Bayes Based on a Semantic Information Theory for Solving Latent Variables	Chenguang Lu et.al.	2408.13122	null
2024-08-22	Quantization-free Lossy Image Compression Using Integer Matrix Factorization	Pooya Ashtari et.al.	2408.12691	link
2024-08-22	DeepHQ: Learned Hierarchical Quantizer for Progressive Deep Image Coding	Jooyoung Lee et.al.	2408.12150	null
2024-08-28	AIM 2024 Challenge on Compressed Video Quality Assessment: Methods and Results	Maksim Smirnov et.al.	2408.11982	link
2024-08-20	Trustworthy Compression? Impact of AI-based Codecs on Biometrics for Law Enforcement	Sandra Bergmann et.al.	2408.10823	null
2024-08-20	Diff-PCC: Diffusion-based Neural Compression for 3D Point Clouds	Kai Liu et.al.	2408.10543	null
2024-08-16	LLM-PCGC: Large Language Model-based Point Cloud Geometry Compression	Yuqi Ye et.al.	2408.08682	null
2024-08-16	Bi-Directional Deep Contextual Video Compression	Xihua Sheng et.al.	2408.08604	null
2024-08-16	Tell Codec What Worth Compressing: Semantically Disentangled Image Coding for Machine with LMMs	Jinming Liu et.al.	2408.08575	null
2024-08-15	Algebraic Vertex Ordering of a Sparse Graph for Adjacency Access Locality and Graph Compression	Dimitris Floros et.al.	2408.08439	null
2024-08-15	When Video Coding Meets Multimodal Large Language Models: A Unified Paradigm for Video Coding	Pingping Zhang et.al.	2408.08093	null
2024-08-15	DM2RM: Dual-Mode Multimodal Ranking for Target Objects and Receptacles Based on Open-Vocabulary Instructions	Ryosuke Korekata et.al.	2408.07910	null
2024-08-14	Towards Real-time Video Compressive Sensing on Mobile Devices	Miao Cao et.al.	2408.07530	link
2024-08-14	Encoding and Decoding Algorithms of ANS Variants and Evaluation of Their Average Code Lengths	Hirosuke Yamamoto et.al.	2408.07322	null
2024-08-13	Subjective and Objective Quality Assessment of Rendered Human Avatar Videos in Virtual Reality	Yu-Chih Chen et.al.	2408.07041	null
2024-08-13	Feature-Preserving Rate-Distortion Optimization in Image Coding for Machines	Samuel Fernández Menduiña et.al.	2408.07028	null
2024-08-19	Joint Source-Channel Optimization for UAV Video Coding and Transmission	Kesong Wu et.al.	2408.06667	null
2024-08-08	Flow-Lenia.png: Evolving Multi-Scale Complexity by Means of Compression	Tadashi Adachi et.al.	2408.06374	null
2024-08-09	Benchmarking Conventional and Learned Video Codecs with a Low-Delay Configuration	Siyue Teng et.al.	2408.05042	null
2024-08-08	SG-JND: Semantic-Guided Just Noticeable Distortion Predictor For Image Compression	Linhan Cao et.al.	2408.04273	null
2024-08-07	Bi-Level Spatial and Channel-aware Transformer for Learned Image Compression	Hamidreza Soltani et.al.	2408.03842	null
2024-08-07	BVI-AOM: A New Training Dataset for Deep Video Compression Optimization	Jakub Nawała et.al.	2408.03265	link
2024-08-06	Enabling High-Throughput Parallel I/O in Particle-in-Cell Monte Carlo Simulations with openPMD and Darshan I/O Monitoring	Jeremy J. Williams et.al.	2408.02869	null
2024-08-05	Dimensionality Reduction and Nearest Neighbors for Improving Out-of-Distribution Detection in Medical Image Segmentation	McKell Woodland et.al.	2408.02761	link
2024-08-04	CACE-Net: Co-guidance Attention and Contrastive Enhancement for Effective Audio-Visual Event Localization	Xiang He et.al.	2408.01952	link
2024-08-03	Channel-Aware Distributed Transmission Control and Video Streaming in UAV Networks	Masoud Ghazikor et.al.	2408.01885	null
2024-08-02	An Adaptive Tensor-Train Decomposition Approach for Efficient Deep Neural Network Compression	Shiyi Luo et.al.	2408.01534	null
2024-07-31	Exploiting Change Blindness for Video Coding: Perspectives from a Less Promising User Study	Mitra Amiri et.al.	2408.00052	null
2024-07-31	Tora: Trajectory-oriented Diffusion Transformer for Video Generation	Zhenghao Zhang et.al.	2407.21705	link
2024-07-30	Edge Learning Based Collaborative Automatic Modulation Classification for Hierarchical Cognitive Radio Networks	Peihao Dong et.al.	2407.20772	link
2024-07-30	Understanding the Impact of Synchronous, Asynchronous, and Hybrid In-Situ Techniques in Computational Fluid Dynamics Applications	Yi Ju et.al.	2407.20717	null
2024-07-29	Homomorphic data compression for real time photon correlation analysis	Sebastian Strempfer et.al.	2407.20356	null
2024-07-24	Accelerating the Low-Rank Decomposed Models	Habib Hajimolahoseini et.al.	2407.20266	null
2024-07-29	ComNeck: Bridging Compressed Image Latents and Multimodal LLMs via Universal Transform-Neck	Chia-Hao Kao et.al.	2407.19651	null
2024-07-28	NVC-1B: A Large Neural Video Coding Model	Xihua Sheng et.al.	2407.19402	null
2024-07-18	Generative AI Augmented Induction-based Formal Verification	Aman Kumar et.al.	2407.18965	null
2024-07-25	The seismic purifier: An unsupervised approach to seismic signal detection via representation learning	Onur Efe et.al.	2407.18402	link
2024-07-25	Adaptable Deep Joint Source-and-Channel Coding for Small Satellite Applications	Olga Kondrateva et.al.	2407.18146	null
2024-07-25	Scaling Training Data with Lossy Image Compression	Katherine L. Mentzer et.al.	2407.17954	link
2024-07-25	Towards the Spectral bias Alleviation by Normalizations in Coordinate Networks	Zhicheng Cai et.al.	2407.17834	link
2024-07-24	Lossy Data Compression By Adaptive Mesh Coarsening	N. Böing et.al.	2407.17316	null
2024-07-24	High Efficiency Image Compression for Large Visual-Language Models	Binzhe Li et.al.	2407.17060	null
2024-07-23	Accelerating Learned Video Compression via Low-Resolution Representation Learning	Zidian Qiu et.al.	2407.16418	null
2024-07-24	FCNR: Fast Compressive Neural Representation of Visualization Images	Yunfei Lu et.al.	2407.16369	link
2024-07-19	Shapley Pruning for Neural Network Compression	Kamil Adamczewski et.al.	2407.15875	null
2024-07-18	CIC: Circular Image Compression	Honggui Li et.al.	2407.15870	null
2024-07-22	Online String Attractors	Philip Whittington et.al.	2407.15599	null
2024-07-22	Spectral properties of bright deposits in permanently shadowed craters on Ceres	Stefan Schröder et.al.	2407.15327	null
2024-07-21	Lessons Learned on the Path to Guaranteeing the Error Bound in Lossy Quantizers	Alex Fallin et.al.	2407.15037	null
2024-07-19	A Benchmark for Gaussian Splatting Compression and Quality Assessment Study	Qi Yang et.al.	2407.14197	link
2024-07-18	Training Foundation Models as Data Compression: On Information, Model Weights and Copyright Law	Giorgio Franceschelli et.al.	2407.13493	null
2024-07-18	Learned HDR Image Compression for Perceptually Optimal Storage and Display	Peibei Cao et.al.	2407.13179	null
2024-07-17	High Frequency Matters: Uncertainty Guided Image Compression with Wavelet Diffusion	Juan Song et.al.	2407.12538	link
2024-07-17	Enhancing Film Grain Coding in VVC: Improving Encoding Quality and Efficiency	Vignesh V Menon et.al.	2407.12465	null
2024-07-17	Reliability Function of Classical-Quantum Channels	Ke Li et.al.	2407.12403	null
2024-07-17	Exploiting Inter-Image Similarity Prior for Low-Bitrate Remote Sensing Image Compression	Junhui Li et.al.	2407.12295	null
2024-07-16	Tiled Bit Networks: Sub-Bit Neural Network Compression Through Reuse of Learnable Binary Vectors	Matt Gorbett et.al.	2407.12075	null
2024-07-17	Rate-Distortion-Cognition Controllable Versatile Neural Image Compression	Jinming Liu et.al.	2407.11700	null
2024-07-16	MINI-LLM: Memory-Efficient Structured Pruning for Large Language Models	Hongrong Cheng et.al.	2407.11681	null
2024-07-17	Neural Compression of Atmospheric States	Piotr Mirowski et.al.	2407.11666	null
2024-07-16	Rethinking Learned Image Compression: Context is All You Need	Jixiang Luo et.al.	2407.11590	null
2024-07-16	The impact of lossy data compression on the power spectrum of the high redshift 21-cm signal with LOFAR	J. K. Chege et.al.	2407.11557	null
2024-07-21	Uniformly Accelerated Motion Model for Inter Prediction	Zhuoyuan Li et.al.	2407.11541	null
2024-07-15	M18K: A Comprehensive RGB-D Dataset and Benchmark for Mushroom Detection and Instance Segmentation	Abdollah Zakeri et.al.	2407.11275	link
2024-07-15	Enhancing Electrocardiogram Signal Analysis Using NLP-Inspired Techniques: A Novel Approach with Embedding and Self-Attention	Prapti Ganguly et.al.	2407.11102	null
2024-07-15	In-Loop Filtering via Trained Look-Up Tables	Zhuoyuan Li et.al.	2407.10926	null
2024-07-15	Bidirectional Stereo Image Compression with Cross-Dimensional Entropy Model	Zhening Liu et.al.	2407.10632	link
2024-07-14	UMI on Legs: Making Manipulation Policies Mobile with Manipulation-Centric Whole-body Controllers	Huy Ha et.al.	2407.10353	null
2024-07-13	WeConvene: Learned Image Compression with Wavelet-Domain Convolution and Entropy Model	Haisheng Fu et.al.	2407.09983	null
2024-07-13	Zero-Shot Image Compression with Diffusion-Based Posterior Sampling	Noam Elata et.al.	2407.09896	link
2024-07-13	Image Compression for Machine and Human Vision with Spatial-Frequency Adaptation	Han Li et.al.	2407.09853	link
2024-07-13	Infinite families of optimal and minimal codes over rings using simplicial complexes	Yanan Wu et.al.	2407.09783	null
2024-07-12	HPC: Hierarchical Progressive Coding Framework for Volumetric Video	Zihan Zheng et.al.	2407.09026	null
2024-07-12	Hybrid Temporal Computing for Lower Power Hardware Accelerators	Maliha Tasnim et.al.	2407.08975	null
2024-07-11	Manipulating a Tetris-Inspired 3D Video Representation	Mihir Godbole et.al.	2407.08885	null
2024-07-11	OMR-NET: a two-stage octave multi-scale residual network for screen content image compression	Shiqi Jiang et.al.	2407.08545	null
2024-07-11	CADC: Encoding User-Item Interactions for Compressing Recommendation Model Training Data	Hossein Entezari Zarch et.al.	2407.08108	null
2024-07-10	Using Low-Discrepancy Points for Data Compression in Machine Learning: An Experimental Comparison	Simone Göttlich et.al.	2407.07450	null
2024-07-10	Standard compliant video coding using low complexity, switchable neural wrappers	Yueyu Hu et.al.	2407.07395	null
2024-07-10	MNeRV: A Multilayer Neural Representation for Videos	Qingling Chang et.al.	2407.07347	link
2024-07-11	Entropy Law: The Story Behind Data Compression and LLM Performance	Mingjia Yin et.al.	2407.06645	link
2024-07-08	A Hybrid Algorithm for Computing a Partial Singular Value Decomposition Satisfying a Given Threshold	James Baglama et.al.	2407.06306	link
2024-07-08	TAPVid-3D: A Benchmark for Tracking Any Point in 3D	Skanda Koppula et.al.	2407.05921	link
2024-07-05	The Impact of Quantization and Pruning on Deep Reinforcement Learning Models	Heng Lu et.al.	2407.04803	null
2024-07-05	An autoencoder for compressing angle-resolved photoemission spectroscopy data	Steinn Ymir Agustsson et.al.	2407.04631	link
2024-07-05	Rethinking Image Compression on the Web with Generative AI	Shayan Ali Hassan et.al.	2407.04542	null
2024-07-11	A High-Quality Workflow for Multi-Resolution Scientific Data Reduction and Visualization	Daoce Wang et.al.	2407.04267	null
2024-07-04	Autoencoded Image Compression for Secure and Fast Transmission	Aryan Kashyap Naveen et.al.	2407.03990	link
2024-07-03	Value-Penalized Auxiliary Control from Examples for Learning without Rewards or Demonstrations	Trevor Ablett et.al.	2407.03311	link
2024-07-03	KeyVideoLLM: Towards Large-scale Video Keyframe Selection	Hao Liang et.al.	2407.03104	null
2024-07-01	Statistical Analysis of ZFP: Understanding Bias	Alyson Fox et.al.	2407.01826	null
2024-07-01	An AI-based, Error-bounded Compression Scheme for High-frequency Power Quality Disturbance Data	Markus Stroot et.al.	2407.01112	null
2024-06-28	Wavelets Are All You Need for Autoregressive Image Generation	Wael Mattar et.al.	2406.19997	null
2024-06-28	Optimal Video Compression using Pixel Shift Tracking	Hitesh Saai Mananchery Panneerselvam et.al.	2406.19630	link
2024-06-27	MCNC: Manifold Constrained Network Compression	Chayne Thrash et.al.	2406.19301	null
2024-06-27	Staggered Quantizers for Perfect Perceptual Quality: A Connection between Quantizers with Common Randomness and Without	Ruida Zhou et.al.	2406.19248	null
2024-06-25	Asymptotically Minimax Regret by Bayes Mixtures	Jun'ichi Takeuchi et.al.	2406.17929	null
2024-06-24	Hierarchical B-frame Video Coding for Long Group of Pictures	Ivan Kirillov et.al.	2406.16544	null
2024-06-20	Ranking LLMs by compression	Peijia Guo et.al.	2406.14171	null
2024-06-21	Measuring Sample Importance in Data Pruning for Training LLMs from a Data Compression Perspective	Minsang Kim et.al.	2406.14124	null
2024-06-20	Prediction and Reference Quality Adaptation for Learned Video Compression	Xihua Sheng et.al.	2406.14118	null
2024-06-19	Convex-hull Estimation using XPSNR for Versatile Video Coding	Vignesh V Menon et.al.	2406.13712	null
2024-06-19	A Study on the Effect of Color Spaces in Learned Image Compression	Srivatsa Prativadibhayankaram et.al.	2406.13709	null
2024-06-19	Stability and Generalizability in SDE Diffusion Models with Measure-Preserving Dynamics	Weitong Zhang et.al.	2406.13652	null
2024-06-18	Learned Image Compression for HE-stained Histopathological Images via Stain Deconvolution	Maximilian Fischer et.al.	2406.12623	null
2024-06-18	Competitive Learning for Achieving Content-specific Filters in Video Coding for Machines	Honglei Zhang et.al.	2406.12367	null
2024-06-15	How Should We Extract Discrete Audio Tokens from Self-Supervised Models?	Pooneh Mousavi et.al.	2406.10735	null
2024-06-15	Object-Attribute-Relation Representation based Video Semantic Communication	Qiyuan Du et.al.	2406.10469	null
2024-06-14	On Efficient Neural Network Architectures for Image Compression	Yichi Zhang et.al.	2406.10361	link
2024-06-14	Information Compression in the AI Era: Recent Advances and Future Challenges	Jun Chen et.al.	2406.10036	null
2024-06-13	CMC-Bench: Towards a New Paradigm of Visual Signal Compression	Chunyi Li et.al.	2406.09356	link
2024-06-13	Neural NeRF Compression	Tuan Pham et.al.	2406.08943	null
2024-06-14	Beyond LLaVA-HD: Diving into High-Resolution Large Multimodal Models	Yi-Fan Zhang et.al.	2406.08487	link
2024-06-12	On Annotation-free Optimization of Video Coding for Machines	Marc Windsheimer et.al.	2406.07938	null
2024-06-11	SSNVC: Single Stream Neural Video Compression with Implicit Temporal Information	Feng Wang et.al.	2406.07645	null
2024-06-11	Image and Video Tokenization with Binary Spherical Quantization	Yue Zhao et.al.	2406.07548	link
2024-06-11	Optimal Matrix-Mimetic Tensor Algebras via Variable Projection	Elizabeth Newman et.al.	2406.06942	link
2024-06-10	Deep Generative Modeling Reshapes Compression and Transmission: From Efficiency to Resiliency	Jincheng Dai et.al.	2406.06446	null
2024-06-10	Image Compression with Isotropic and Anisotropic Shepard Inpainting	Rahul Mohideen Kaja Mohideen et.al.	2406.06247	null
2024-06-10	Efficient Neural Compression with Inference-time Decoding	C. Metz et.al.	2406.06237	null
2024-06-10	Fiducial-Cosmology-dependent systematics for the DESI 2024 BAO Analysis	A. Pérez-Fernández et.al.	2406.06085	null
2024-06-10	Quantum Sparse Coding and Decoding Based on Quantum Network	Xun Ji et.al.	2406.06012	null
2024-06-09	Region of Interest Loss for Anonymizing Learned Image Compression	Christoph Liebender et.al.	2406.05726	link
2024-06-08	Regularized Training with Generated Datasets for Name-Only Transfer of Vision-Language Models	Minho Park et.al.	2406.05432	link
2024-06-07	PatchSVD: A Non-uniform SVD-based Image Compression Algorithm	Zahra Golpayegani et.al.	2406.05129	link
2024-06-07	SMC++: Masked Learning of Unsupervised Video Semantic Compression	Yuan Tian et.al.	2406.04765	link
2024-06-06	LDM-RSIC: Exploring Distortion Prior with Latent Diffusion Models for Remote Sensing Image Compression	Junhui Li et.al.	2406.03961	link
2024-06-05	Lossless Image Compression Using Multi-level Dictionaries: Binary Images	Samar Agnihotri et.al.	2406.03087	null
2024-06-05	On Jacob Ziv's Individual-Sequence Approach to Information Theory	Neri Merhav et.al.	2406.02904	null
2024-06-04	Towards AI-Assisted Sustainable Adaptive Video Streaming Systems: Tutorial and Survey	Reza Farahani et.al.	2406.02302	null
2024-06-03	Video Coding with Cross-Component Sample Offset	Han Gao et.al.	2406.01795	null
2024-06-05	Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaption	Anqi Li et.al.	2406.00758	link
2024-06-01	Efficient Massive Black Hole Binary parameter estimation for LISA using Sequential Neural Likelihood	Iván Martín Vílchez et.al.	2406.00565	null
2024-06-01	A Review of Pulse-Coupled Neural Network Applications in Computer Vision and Image Processing	Nurul Rafi et.al.	2406.00239	null
2024-05-31	ContextGS: Compact 3D Gaussian Splatting with Anchor Level Context Model	Yufei Wang et.al.	2405.20721	link
2024-05-30	Quantum encoder for fixed Hamming-weight subspaces	Renato M. S. Farias et.al.	2405.20408	null
2024-05-29	Implicit Neural Image Field for Biological Microscopy Image Compression	Gaole Dai et.al.	2405.19012	link
2024-05-28	Deep Network Pruning: A Comparative Study on CNNs in Face Recognition	Fernando Alonso-Fernandez et.al.	2405.18302	null
2024-05-28	Channel Reciprocity Based Attack Detection for Securing UWB Ranging by Autoencoder	Wenlong Gou et.al.	2405.18255	null
2024-05-27	Evaluation of Resource-Efficient Crater Detectors on Embedded Systems	Simon Vellas et.al.	2405.16953	link
2024-05-27	UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation	Runzhao Yang et.al.	2405.16850	null
2024-05-27	Controlling Rate, Distortion, and Realism: Towards a Single Comprehensive Neural Image Compression Model	Shoma Iwai et.al.	2405.16817	link
2024-05-25	N-BVH: Neural ray queries with bounding volume hierarchies	Philippe Weier et.al.	2405.16237	link
2024-05-25	A 7K Parameter Model for Underwater Image Enhancement based on Transmission Map Prior	Fuheng Zhou et.al.	2405.16197	link
2024-05-24	Analytical proxy to families of numerical solutions: the case study of spherical mini-boson stars	Jianzhi Yang et.al.	2405.15651	null
2024-05-24	SATSense: Multi-Satellite Collaborative Framework for Spectrum Sensing	Haoxuan Yuan et.al.	2405.15542	null
2024-05-24	Meta-meshing and triangulating lattice structures at a large scale	Qiang Zou et.al.	2405.15197	null
2024-05-23	NeCGS: Neural Compression for 3D Geometry Sets	Siyu Ren et.al.	2405.15034	link
2024-05-23	An augmented Lagrangian trust-region method with inexact gradient evaluations to accelerate constrained optimization problems using model hyperreduction	Tianshu Wen et.al.	2405.14827	null
2024-05-23	Motion-based video compression for resource-constrained camera traps	Malika Nisal Ratnayake et.al.	2405.14419	null
2024-06-01	I $^2$ VC: A Unified Framework for Intra- & Inter-frame Video Compression	Meiqin Liu et.al.	2405.14336	link
2024-05-23	Sparse $L^1$ -Autoencoders for Scientific Data Compression	Matthias Chung et.al.	2405.14270	null
2024-05-22	"Turing Tests" For An AI Scientist	Xiaoxin Yin et.al.	2405.13352	null
2024-05-21	Efficient Learned Wavelet Image and Video Coding	Anna Meyer et.al.	2405.12631	null
2024-05-24	Accelerating Relative Entropy Coding with Space Partitioning	Jiajun He et.al.	2405.12203	null
2024-05-20	Refining Coded Image in Human Vision Layer Using CNN-Based Post-Processing	Takahiro Shindo et.al.	2405.11894	null
2024-05-19	Effective In-Context Example Selection through Data Compression	Zhongxiang Sun et.al.	2405.11465	null
2024-05-18	InfRS: Incremental Few-Shot Object Detection in Remote Sensing Images	Wuzhou Li et.al.	2405.11293	link
2024-05-17	Dark Energy Survey Year 3 results: simulation-based cosmological inference with wavelet harmonics, scattering transforms, and moments of weak lensing mass maps II. Cosmological results	M. Gatti et.al.	2405.10881	null
2024-05-17	Reduced storage direct tensor ring decomposition for convolutional neural networks compression	Mateusz Gabor et.al.	2405.10802	link
2024-05-17	Enhancing Perception Quality in Remote Sensing Image Compression via Invertible Neural Network	Junhui Li et.al.	2405.10518	null
2024-05-15	Properties that allow or prohibit transferability of adversarial attacks among quantized networks	Abhishek Shrestha et.al.	2405.09598	link
2024-05-15	Sensitivity Decouple Learning for Image Compression Artifacts Reduction	Li Ma et.al.	2405.09291	null
2024-05-18	Scalable Image Coding for Humans and Machines Using Feature Fusion Network	Takahiro Shindo et.al.	2405.09152	link
2024-05-14	Parameter-Efficient Instance-Adaptive Neural Video Compression	Hyunmo Yang et.al.	2405.08530	link
2024-05-13	Goal-oriented compression for $L_p$ -norm-type goal functions: Application to power consumption scheduling	Yifei Sun et.al.	2405.07808	null
2024-05-13	Neural Network Compression for Reinforcement Learning Tasks	Dmitry A. Ivanov et.al.	2405.07748	null
2024-05-13	On the Adversarial Robustness of Learning-based Image Compression Against Rate-Distortion Attacks	Chenhao Wu et.al.	2405.07717	null
2024-05-21	An Efficient Compression Method for Sign Information of DCT Coefficients via Sign Retrieval	Chihiro Tsutake et.al.	2405.07487	link
2024-05-10	Time-of-arrival Estimation and Phase Unwrapping of Head-related Transfer Functions With Integer Linear Programming	Chin-Yun Yu et.al.	2405.06804	link
2024-05-08	Urban Boundary Delineation from Commuting Data with Bayesian Stochastic Blockmodeling: Scale, Contiguity, and Hierarchy	Sebastian Morel-Balbi et.al.	2405.04911	link
2024-05-14	Some Notes on the Sample Complexity of Approximate Channel Simulation	Gergely Flamich et.al.	2405.04363	null
2024-05-07	Group-aware Parameter-efficient Updating for Content-Adaptive Neural Video Compression	Zhenghao Chen et.al.	2405.04274	null
2024-05-08	Verified Neural Compressed Sensing	Rudy Bunel et.al.	2405.04260	null
2024-05-15	Lossy Compression with Data, Perception, and Classification Constraints	Yuhan Wang et.al.	2405.04144	null
2024-05-07	DMOFC: Discrimination Metric-Optimized Feature Compression	Changsheng Gao et.al.	2405.04044	null
2024-05-06	Computational ghost imaging with hybrid transforms by integrating Hadamard, discrete cosine, and Haar matrices	Yi-Ning Zhao et.al.	2405.03729	null
2024-05-06	A Rate-Distortion-Classification Approach for Lossy Image Compression	Yuefeng Zhang et.al.	2405.03500	null
2024-05-06	Structure-Preserving Network Compression Via Low-Rank Induced Training Through Linear Layers Composition	Xitong Zhang et.al.	2405.03089	link
2024-05-04	Deep Pulse-Signal Magnification for remote Heart Rate Estimation in Compressed Videos	Joaquim Comas et.al.	2405.02652	null
2024-05-06	Torch2Chip: An End-to-end Customizable Deep Neural Network Compression and Deployment Toolkit for Prototype Hardware Accelerator Design	Jian Meng et.al.	2405.01775	link
2024-05-02	PointCompress3D -- A Point Cloud Compression Framework for Roadside LiDARs in Intelligent Transportation Systems	Walter Zimmer et.al.	2405.01750	null
2024-04-28	Lightweight Conceptual Dictionary Learning for Text Classification Using Information Compression	Li Wan et.al.	2405.01584	null
2024-05-02	GroupedMixer: An Entropy Model with Group-wise Token-Mixers for Learned Image Compression	Daxin Li et.al.	2405.01170	null
2024-04-30	Analysis and Enhancement of Lossless Image Compression in JPEG-XL	Rustam Mamedov et.al.	2404.19755	null
2024-04-30	EfficientASR: Speech Recognition Network Compression via Attention Redundancy and Chunk-Level FFN Optimization	Jianzong Wang et.al.	2404.19214	null
2024-04-29	Towards Extreme Image Compression with Latent Feature Guidance and Diffusion Prior	Zhiyuan Li et.al.	2404.18820	link
2024-04-28	Joint Reference Frame Synthesis and Post Filter Enhancement for Versatile Video Coding	Weijie Bao et.al.	2404.18058	null
2024-04-25	Learning Visuotactile Skills with Two Multifingered Hands	Toru Lin et.al.	2404.16823	link
2024-04-24	Domain Adaptation for Learned Image Compression with Supervised Adapters	Alberto Presta et.al.	2404.15591	link
2024-04-23	One-Pass Randomized Algorithm with Practical Rangefinder for Low-Rank Approximation to Quaternion Matrices	Chao Chang et.al.	2404.14783	link
2024-04-22	Neural Compress-and-Forward for the Relay Channel	Ezgi Ozyilkan et.al.	2404.14594	null
2024-04-22	Taming Server Memory TCO with Multiple Software-Defined Compressed Tiers	Sandeep Kumar et.al.	2404.13886	null
2024-04-20	HybridFlow: Infusing Continuity into Masked Codebook for Extreme Low-Bitrate Image Compression	Lei Lu et.al.	2404.13372	null
2024-04-18	Image Compression and Reconstruction Based on Quantum Network	Xun Ji et.al.	2404.11994	null
2024-04-17	Spatio-Temporal Motion Retargeting for Quadruped Robots	Taerim Yoon et.al.	2404.11557	null
2024-04-17	Multi-resolution Rescored ByteTrack for Video Object Detection on Ultra-low-power Embedded Systems	Luca Bompani et.al.	2404.11488	link
2024-04-17	Image Generative Semantic Communication with Multi-Modal Similarity Estimation for Resource-Limited Networks	Eri Hosonuma et.al.	2404.11280	null
2024-04-16	Tripod: Three Complementary Inductive Biases for Disentangled Representation Learning	Kyle Hsu et.al.	2404.10282	link
2024-04-16	Compressible and Searchable: AI-native Multi-Modal Retrieval System with Learned Image Compression	Jixiang Luo et.al.	2404.10234	null
2024-04-15	One-Click Upgrade from 2D to 3D: Sandwiched RGB-D Video Compression for Stereoscopic Teleconferencing	Yueyu Hu et.al.	2404.09979	null
2024-04-15	Quantization of Large Language Models with an Overdetermined Basis	Daniil Merkulov et.al.	2404.09737	null
2024-04-18	Post-Training Network Compression for 3D Medical Image Segmentation: Reducing Computational Efforts via Tucker Decomposition	Tobias Weber et.al.	2404.09683	link
2024-04-15	MarsQE: Semantic-Informed Quality Enhancement for Compressed Martian Image	Chengfeng Liu et.al.	2404.09433	null
2024-04-17	Incremental data compression for PDE-constrained optimization with a data assimilation application	Xuejian Li et.al.	2404.09323	null
2024-04-14	A Joint Data Compression and Time-Delay Estimation Method For Distributed Systems via Extremum Encoding	Amir Weiss et.al.	2404.09244	null
2024-04-12	Lossy Image Compression with Foundation Diffusion Models	Lucas Relic et.al.	2404.08580	null
2024-04-12	Mitigating Challenges of the Space Environment for Onboard Artificial Intelligence: Design Overview of the Imaging Payload on SpIRIT	Miguel Ortiz del Castillo et.al.	2404.08399	null
2024-04-11	Video Compression Beyond VVC: Quantitative Analysis of Intra Coding Tools in Enhanced Compression Model (ECM)	Mohsen Abdoli et.al.	2404.07872	null
2024-04-11	Learning to Classify New Foods Incrementally Via Compressed Exemplars	Justin Yang et.al.	2404.07507	null
2024-04-14	A comparison between Shapefit compression and Full-Modelling method with PyBird for DESI 2024 and beyond	Y. Lai et.al.	2404.07283	link
2024-04-10	Exploring Repetitiveness Measures for Two-Dimensional Strings	Giuseppe Romana et.al.	2404.07030	null
2024-04-10	Fine color guidance in diffusion models and its application to image compression at extremely low bitrates	Tom Bordin et.al.	2404.06865	null
2024-04-09	Encoder-Quantization-Motion-based Video Quality Metrics	Yixu Chen et.al.	2404.06620	null
2024-04-09	DiffHarmony: Latent Diffusion Model Meets Image Harmonization	Pengfei Zhou et.al.	2404.06139	link
2024-04-09	Communication-Efficient Large-Scale Distributed Deep Learning: A Comprehensive Survey	Feng Liang et.al.	2404.06114	null
2024-04-09	Image and Video Compression using Generative Sparse Representation with Fidelity Controls	Wei Jiang et.al.	2404.06076	null
2024-04-07	Correcting Diffusion-Based Perceptual Image Compression with Privileged End-to-End Decoder	Yiyang Ma et.al.	2404.04916	null
2024-04-07	Task-Aware Encoder Control for Deep Video Compression	Xingtong Ge et.al.	2404.04848	null
2024-04-06	Power-Efficient Image Storage: Leveraging Super Resolution Generative Adversarial Network for Sustainable Compression and Reduced Carbon Footprint	Ashok Mondal et.al.	2404.04642	null
2024-04-05	ClickDiffusion: Harnessing LLMs for Interactive Precise Image Editing	Alec Helbling et.al.	2404.04376	link
2024-04-03	Convolutional variational autoencoders for secure lossy image compression in remote sensing	Alessandro Giuliano et.al.	2404.03696	null
2024-03-25	RL for Consistency Models: Faster Reward Guided Text-to-Image Generation	Owen Oertell et.al.	2404.03673	link
2024-04-04	Training LLMs over Neurally Compressed Text	Brian Lester et.al.	2404.03626	null
2024-04-04	Leveraging Interpolation Models and Error Bounds for Verifiable Scientific Machine Learning	Tyler Chang et.al.	2404.03586	link
2024-04-04	Semantic Compression with Information Lattice Learning	Haizi Yu et.al.	2404.03131	null
2024-04-01	Accounting for contact network uncertainty in epidemic inferences with Approximate Bayesian Computation	Maxwell H. Wang et.al.	2404.02924	null
2024-04-03	Building test batteries based on analysing random number generator tests within the framework of algorithmic information theory	Boris Ryabko et.al.	2404.02708	null
2024-04-03	Optimizing traffic signs and lights visibility for the teleoperation of autonomous vehicles through ROI compression	I. Dror et.al.	2404.02481	null
2024-04-03	MOPAR: A Model Partitioning Framework for Deep Learning Inference Services on Serverless Platforms	Jiaang Duan et.al.	2404.02445	null
2024-04-02	NeRFCodec: Neural Feature Compression Meets Neural Radiance Fields for Memory-Efficient Scene Representation	Sicheng Li et.al.	2404.02185	null
2024-04-01	The Rate-Distortion-Perception Trade-off: The Role of Private Randomness	Yassine Hamdi et.al.	2404.01111	null
2024-03-31	Metric dimensions of generalized Sierpiński graphs over squares	Savari Prabhu et.al.	2404.00771	null
2024-03-27	Computationally and Memory-Efficient Robust Predictive Analytics Using Big Data	Daniel Menges et.al.	2403.19721	null
2024-03-28	RootInteractive tool for multidimensional statistical analysis, machine learning and analytical model validation	Marian Invanov et.al.	2403.19330	null
2024-03-28	Uncertainty-Aware Deep Video Compression with Ensembles	Wufei Ma et.al.	2403.19158	null
2024-04-08	Neural Embedding Compression For Efficient Multi-Task Earth Observation Modelling	Carlos Gomes et.al.	2403.17886	link
2024-03-26	Low-Latency Neural Stereo Streaming	Qiqi Hou et.al.	2403.17879	null
2024-03-26	Fully-fused Multi-Layer Perceptrons on Intel Data Center GPUs	Kai Yuan et.al.	2403.17607	link
2024-03-25	Neural Image Compression with Quantization Rectifier	Wei Luo et.al.	2403.17236	null
2024-03-25	Invertible Diffusion Models for Compressed Sensing	Bin Chen et.al.	2403.17006	link
2024-03-25	Virtual Cylindrical PET for Efficient DOI Image Reconstruction with Sub-millimetre Resolution	Francisco E Enríquez-Mier-y-Terán et.al.	2403.16465	null
2024-03-25	Impact of Video Compression Artifacts on Fisheye Camera Visual Perception Tasks	Madhumitha Sakthi et.al.	2403.16338	null
2024-03-24	Laplacian-guided Entropy Model in Neural Codec with Blur-dissipated Synthesis	Atefeh Khoshkhahtinat et.al.	2403.16258	null
2024-03-23	Understanding The Effectiveness of Lossy Compression in Machine Learning Training Sets	Robert Underwood et.al.	2403.15953	null
2024-03-23	Droplet shape representation using Fourier series and autoencoders	Mihir Durve et.al.	2403.15797	null
2024-03-21	S2LIC: Learned Image Compression with the SwinV2 Block, Adaptive Channel-wise and Global-inter Attention Context	Yongqiang Wang et.al.	2403.14471	link
2024-03-21	Tensor network compressibility of convolutional models	Sukhbinder Singh et.al.	2403.14379	null
2024-03-26	Powerful Lossy Compression for Noisy Images	Shilv Cai et.al.	2403.14135	null
2024-03-20	String attractors and bi-infinite words	Pierre Béaur et.al.	2403.13449	null
2024-03-19	Super-High-Fidelity Image Compression via Hierarchical-ROI and Adaptive Quantization	Jixiang Luo et.al.	2403.13030	null
2024-03-19	Privacy-Preserving Face Recognition Using Trainable Feature Subtraction	Yuxi Mi et.al.	2403.12457	link
2024-03-19	VQ-NeRV: A Vector Quantized Neural Representation for Videos	Yunjie Xu et.al.	2403.12401	link
2024-03-18	Encoding of linear kinetic plasma problems in quantum circuits via data compression	Ivan Novikau et.al.	2403.11989	null
2024-03-18	Object Segmentation-Assisted Inter Prediction for Versatile Video Coding	Zhuoyuan Li et.al.	2403.11694	null
2024-03-18	Overfitted image coding at reduced complexity	Théophile Blard et.al.	2403.11651	link
2024-03-18	Hierarchical Frequency-based Upsampling and Refining for Compressed Video Quality Enhancement	Qianyu Zhang et.al.	2403.11556	null
2024-03-18	Earth+: on-board satellite imagery compression leveraging historical earth observations	Kuntai Du et.al.	2403.11434	null
2024-03-17	Fidelity-preserving Learning-Based Image Compression: Loss Function and Subjective Evaluation Methodology	Shima Mohammadi et.al.	2403.11241	link
2024-03-16	Channel-wise Feature Decorrelation for Enhanced Learned Image Compression	Farhad Pakdaman et.al.	2403.10936	null
2024-03-16	NARRATE: Versatile Language Architecture for Optimal Control in Robotics	Seif Ismail et.al.	2403.10762	link
2024-03-15	Process-and-Forward: Deep Joint Source-Channel Coding Over Cooperative Relay Networks	Chenghong Bian et.al.	2403.10613	null
2024-03-15	CPGA: Coding Priors-Guided Aggregation Network for Compressed Video Quality Enhancement	Qiang Zhu et.al.	2403.10362	link
2024-03-15	Interactive Distance Field Mapping and Planning to Enable Human-Robot Collaboration	Usama Ali et.al.	2403.09988	link
2024-03-14	SketchINR: A First Look into Sketches as Implicit Neural Representations	Hmrishav Bandyopadhyay et.al.	2403.09344	link
2024-03-14	Noise Dimension of GAN: An Image Compression Perspective	Ziran Zhu et.al.	2403.09196	null
2024-03-20	Content-aware Masked Image Modeling Transformer for Stereo Image Compression	Xinjie Zhang et.al.	2403.08505	link
2024-03-12	Approaching Rate-Distortion Limits in Neural Compression with Lattice Transform Coding	Eric Lei et.al.	2403.07320	null
2024-03-11	Grid Monitoring and Protection with Continuous Point-on-Wave Measurements and Generative AI	Lang Tong et.al.	2403.06942	null
2024-03-16	Enhancing Adversarial Training with Prior Knowledge Distillation for Robust Image Compression	Zhi Cao et.al.	2403.06700	null
2024-03-13	FSViewFusion: Few-Shots View Generation of Novel Objects	Rukhshanda Hussain et.al.	2403.06394	null
2024-03-10	Probing Image Compression For Class-Incremental Learning	Justin Yang et.al.	2403.06288	null
2024-03-10	Blockchain-Enabled Variational Information Bottleneck for IoT Networks	Qiong Wu et.al.	2403.06129	link
2024-03-09	Wavelet-Like Transform-Based Technology in Response to the Call for Proposals on Neural Network-Based Image Coding	Cunhui Dong et.al.	2403.05937	null
2024-03-07	Complexity-constrained quantum thermodynamics	Anthony Munson et.al.	2403.04828	null
2024-03-07	Image Coding for Machines with Edge Information Learning Using Segment Anything	Takahiro Shindo et.al.	2403.04173	link
2024-03-06	3D Diffusion Policy	Yanjie Ze et.al.	2403.03954	link
2024-03-06	Unifying Generation and Compression: Ultra-low bitrate Image Coding Via Multi-stage Transformer	Naifu Xue et.al.	2403.03736	null
2024-03-06	ZF Beamforming Tensor Compression for Massive MIMO Fronthaul	Libin Zheng et.al.	2403.03675	null
2024-03-06	Space Complexity of Euclidean Clustering	Xiaoyi Zhu et.al.	2403.02971	null
2024-03-05	Neural Image Compression with Text-guided Encoding for both Pixel-level and Perceptual Fidelity	Hagyeong Lee et.al.	2403.02944	link
2024-03-05	Enhancing the Rate-Distortion-Perception Flexibility of Learned Image Codecs with Conditional Diffusion Decoders	Daniele Mari et.al.	2403.02887	null
2024-03-04	Dark Energy Survey Year 3 results: likelihood-free, simulation-based $w$ CDM inference with neural compression of weak-lensing map statistics	N. Jeffrey et.al.	2403.02314	null
2024-03-04	Neural Network Assisted Lifting Steps For Improved Fully Scalable Lossy Image Compression in JPEG 2000	Xinyue Li et.al.	2403.01647	link
2024-03-03	On the Compressibility of Quantized Large Language Models	Yu Mao et.al.	2403.01384	null
2024-03-02	Towards Accurate Lip-to-Speech Synthesis in-the-Wild	Sindhu Hegde et.al.	2403.01087	null
2024-03-01	Region-Adaptive Transform with Segmentation Prior for Image Compression	Yuxi Liu et.al.	2403.00628	link
2024-03-07	ODVista: An Omnidirectional Video Dataset for super-resolution and Quality Enhancement Tasks	Ahmed Telili et.al.	2403.00604	link
2024-02-29	Towards Explaining Deep Neural Network Compression Through a Probabilistic Latent Space	Mahsa Mozafari-Nia et.al.	2403.00155	null
2024-02-29	Deep Network for Image Compressed Sensing Coding Using Local Structural Sampling	Wenxue Cui et.al.	2402.19111	null
2024-02-29	Variable-Rate Learned Image Compression with Multi-Objective Optimization and Quantization-Reconstruction Offsets	Fatih Kamisli et.al.	2402.18930	link
2024-02-29	Towards Backward-Compatible Continual Learning of Image Compression	Zhihao Duan et.al.	2402.18862	link
2024-02-29	Exploration of Learned Lifting-Based Transform Structures for Fully Scalable and Accessible Wavelet-Like Image Compression	Xinyue Li et.al.	2402.18761	null
2024-01-10	Motion Guided Token Compression for Efficient Masked Video Modeling	Yukun Feng et.al.	2402.18577	null
2024-02-28	Tokenization Is More Than Compression	Craig W. Schmidt et.al.	2402.18376	link
2024-02-28	NERV++: An Enhanced Implicit Neural Video Representation	Ahmed Ghorbel et.al.	2402.18305	null
2024-02-28	Computing Minimal Absent Words and Extended Bispecial Factors with CDAWG Space	Shunsuke Inenaga et.al.	2402.18090	null
2024-03-03	Towards Optimal Learning of Language Models	Yuxian Gu et.al.	2402.17759	null
2024-02-27	$ζ$ -QVAE: A Quantum Variational Autoencoder utilizing Regularized Mixed-state Latent Representations	Gaoyuan Wang et.al.	2402.17749	null
2024-02-27	Bit Rate Matching Algorithm Optimization in JPEG-AI Verification Model	Panqi Jia et.al.	2402.17487	null
2024-02-27	Bit Distribution Study and Implementation of Spatial Quality Map in the JPEG-AI Standardization	Panqi Jia et.al.	2402.17470	null
2024-02-29	Neural Video Compression with Feature Modulation	Jiahao Li et.al.	2402.17414	link
2024-01-19	MB-RACS: Measurement-Bounds-based Rate-Adaptive Image Compressed Sensing Network	Yujun Huang et.al.	2402.16855	null
2024-02-29	MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large Multimodal Model	Chunyi Li et.al.	2402.16749	link
2024-02-26	Enabling robust sensor network design with data processing and optimization making use of local beehive image and video files	Ephrance Eunice Namugenyi et.al.	2402.16655	null
2024-02-26	Resolution-Agnostic Neural Compression for High-Fidelity Portrait Video Conferencing via Implicit Radiance Fields	Yifei Li et.al.	2402.16599	null
2024-02-26	Distortion-Controlled Dithering with Reduced Recompression Rate	Morriel Kasher et.al.	2402.16447	null
2024-02-26	Adaptive Online Learning of Separable Path Graph Transforms for Intra-prediction	Wen-Yang Lu et.al.	2402.16371	null
2024-02-26	SPC-NeRF: Spatial Predictive Compression for Voxel Based Radiance Field	Zetian Song et.al.	2402.16366	null
2024-02-24	Traditional Transformation Theory Guided Model for Learned Image Compression	Zhiyuan Li et.al.	2402.15744	null
2024-02-22	Distributed Radiance Fields for Edge Video Compression and Metaverse Integration in Autonomous Driving	Eugen Šlapak et.al.	2402.14642	null
2024-02-21	Exploring the Limits of Semantic Image Compression at Micro-bits per Pixel	Jordan Dotzel et.al.	2402.13536	null
2024-02-20	Compressing the two-particle Green's function using wavelets: Theory and application to the Hubbard atom	Emin Moghadas et.al.	2402.13030	null
2024-02-20	RealCompo: Dynamic Equilibrium between Realism and Compositionality Improves Text-to-Image Diffusion Models	Xinchen Zhang et.al.	2402.12908	link
2024-02-20	Transformer-based Learned Image Compression for Joint Decoding and Denoising	Yi-Hsin Chen et.al.	2402.12888	null
2024-02-19	Weakly Supervised Object Detection in Chest X-Rays with Differentiable ROI Proposal Networks and Soft ROI Pooling	Philip Müller et.al.	2402.11985	link
2024-02-18	3D Point Cloud Compression with Recurrent Neural Network and Image Compression Methods	Till Beemelmanns et.al.	2402.11680	link
2024-02-18	Learning to Learn Faster from Human Feedback with Language Model Predictive Control	Jacky Liang et.al.	2402.11450	null
2024-02-17	TinyLIC-High efficiency lossy image compression method	Gaocheng Ma et.al.	2402.11164	null
2024-02-15	Analysis of Neural Video Compression Networks for 360-Degree Video Coding	Andy Regensky et.al.	2402.10257	null
2024-02-14	Reducing Texture Bias of Deep Neural Networks via Edge Enhancing Diffusion	Edgar Heinert et.al.	2402.09530	link
2024-02-14	A Comprehensive Review of Software and Hardware Energy Efficiency of Video Decoders	Matthias Kränzler et.al.	2402.09001	null
2024-02-14	Extreme Video Compression with Pre-trained Diffusion Models	Bohan Li et.al.	2402.08934	link
2024-02-14	Saliency-aware End-to-end Learned Variable-Bitrate 360-degree Image Compression	Oguzhan Gungordu et.al.	2402.08862	null
2024-02-13	Learned Image Compression with Text Quality Enhancement	Chih-Yu Lai et.al.	2402.08643	null
2024-02-13	Motion-Adaptive Inference for Flexible Learned B-Frame Compression	M. Akin Yilmaz et.al.	2402.08550	null
2024-02-21	A Neural-network Enhanced Video Coding Framework beyond ECM	Yanchen Zhao et.al.	2402.08397	null
2024-02-13	Improving Image Coding for Machines through Optimizing Encoder via Auxiliary Loss	Kei Iino et.al.	2402.08267	null
2024-02-12	Distributed Compression in the Era of Machine Learning: A Review of Recent Advances	Ezgi Ozyilkan et.al.	2402.07997	null
2024-02-13	Towards Meta-Pruning via Optimal Transport	Alexander Theus et.al.	2402.07839	link
2024-02-09	Parameter estimation for quantum jump unraveling	Marco Radaelli et.al.	2402.06556	link
2024-02-07	RAGE for the Machine: Image Compression with Low-Cost Random Access for Embedded Applications	Christian D. Rask et.al.	2402.05974	null
2024-02-08	Sandwiched Compression: Repurposing Standard Codecs with Neural Network Wrappers	Onur G. Guleryuz et.al.	2402.05887	link
2024-02-08	Joint End-to-End Image Compression and Denoising: Leveraging Contrastive Learning and Multi-Scale Self-ONNs	Yuxin Xie et.al.	2402.05582	null
2024-02-05	TexShape: Information Theoretic Sentence Embedding for Language Models	H. Kaan Kale et.al.	2402.05132	link
2024-02-07	Compression of Structured Data with Autoencoders: Provable Benefit of Nonlinearities and Depth	Kevin Kögler et.al.	2402.05013	null
2024-02-06	A Novel Local and Hyper-Local Multicast Services Transmission Scheme for Beyond 5G Networks	Sweta Singh et.al.	2402.03963	null
2024-02-06	Cool-chic video: Learned video coding with 800 parameters	Thomas Leguay et.al.	2402.03179	link
2024-02-05	Perceptual Learned Image Compression via End-to-End JND-Based Optimization	Farhad Pakdaman et.al.	2402.02836	null
2024-02-04	Discovering More Effective Tensor Network Structure Search Algorithms via Large Language Models (LLMs)	Junhua Zeng et.al.	2402.02456	link
2024-03-04	RecNet: An Invertible Point Cloud Encoding through Range Image Embeddings for Multi-Robot Map Sharing and Reconstruction	Nikolaos Stathoulopoulos et.al.	2402.02192	null
2024-02-03	Generative Visual Compression: A Review	Bolin Chen et.al.	2402.02140	null
2024-02-23	Immersive Video Compression using Implicit Neural Representations	Ho Man Kwan et.al.	2402.01596	link
2024-02-02	Efficient Dynamic-NeRF Based Volumetric Video Coding with Rate Distortion Optimization	Zhiyu Zhang et.al.	2402.01380	null
2024-02-02	UCVC: A Unified Contextual Video Compression Framework with Joint P-frame and B-frame Coding	Jiayu Yang et.al.	2402.01289	null
2024-02-02	Flexible Variational Information Bottleneck: Achieving Diverse Compression with a Single Training	Sota Kudo et.al.	2402.01238	link
2024-02-02	The O2 software framework and GPU usage in ALICE online and offline reconstruction in Run 3	Giulio Eulisse et.al.	2402.01205	null
2024-02-01	Compressed image quality assessment using stacking	S. Farhad Hosseini-Benvidi et.al.	2402.00993	null
2024-02-04	Evaluating Large Language Models for Generalization and Robustness via Data Compression	Yucheng Li et.al.	2402.00861	link
2024-03-11	LVC-LGMC: Joint Local and Global Motion Compensation for Learned Video Compression	Wei Jiang et.al.	2402.00680	null
2024-02-01	Gain of Grain: A Film Grain Handling Toolchain for VVC-based Open Implementations	Vignesh V Menon et.al.	2402.00622	null
2024-01-31	EPSD: Early Pruning with Self-Distillation for Efficient Model Compression	Dong Chen et.al.	2402.00084	null
2024-01-31	A Neural Enhancement Post-Processor with a Dynamic AV1 Encoder Configuration Strategy for CLIC 2024	Darren Ramsook et.al.	2401.18021	null
2024-01-31	Robustly overfitting latents for flexible neural image compression	Yura Perugachi-Diaz et.al.	2401.17789	null
2024-01-30	A Group Theoretic Metric for Robot State Estimation Leveraging Chebyshev Interpolation	Varun Agrawal et.al.	2401.17463	null
2024-01-30	SLIC: A Learned Image Codec Using Structure and Color	Srivatsa Prativadibhayankaram et.al.	2401.17246	link
2024-01-30	Large Language Model Evaluation via Matrix Entropy	Lai Wei et.al.	2401.17139	link
2024-01-30	Local integrals of motion in dipole-conserving models with Hilbert space fragmentation	Patrycja Łydżba et.al.	2401.17097	null
2024-01-29	On Channel Simulation with Causal Rejection Samplers	Daniel Goc et.al.	2401.16579	null
2024-01-29	Spatial Decomposition and Temporal Fusion based Inter Prediction for Learned Video Compression	Xihua Sheng et.al.	2401.15864	null
2024-01-29	Bayesian one- and two-sided inference on the local effective dimension	Eduard Belitser et.al.	2401.15816	null
2024-01-28	Towards Arbitrary-Scale Histopathology Image Super-resolution: An Efficient Dual-branch Framework via Implicit Self-texture Enhancement	Minghong Duan et.al.	2401.15613	null
2024-01-26	Shadow simulation of quantum processes	Xuanqiang Zhao et.al.	2401.14934	null
2024-01-26	Study of the gOMP Algorithm for Recovery of Compressed Sensed Hyperspectral Images	Jon Alvarez Justo et.al.	2401.14786	null
2024-01-26	A Comparative Study of Compressive Sensing Algorithms for Hyperspectral Imaging Reconstruction	Jon Alvarez Justo et.al.	2401.14762	null
2024-01-26	Residual Quantization with Implicit Neural Codebooks	Iris Huijben et.al.	2401.14732	link
2024-01-25	Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression	Daxin Li et.al.	2401.14007	null
2024-02-07	Perceptual-oriented Learned Image Compression with Dynamic Kernel	Nianxiang Fu et.al.	2401.13967	null
2024-01-25	Conditional Neural Video Coding with Spatial-Temporal Super-Resolution	Henan Wang et.al.	2401.13959	null
2024-01-24	FLLIC: Functionally Lossless Image Compression	Xi Zhang et.al.	2401.13616	null
2024-01-23	Fast Implicit Neural Representation Image Codec in Resource-limited Devices	Xiang Liu et.al.	2401.12587	null
2024-01-22	PairwiseHist: Fast, Accurate and Space-Efficient Approximate Query Processing with Data Compression	Aaron Hurst et.al.	2401.12018	null
2024-01-22	A Training-Free Defense Framework for Robust Learned Image Compression	Myungseo Song et.al.	2401.11902	null
2024-01-21	Another Way to the Top: Exploit Contextual Clustering in Learned Image Coding	Yichi Zhang et.al.	2401.11615	null
2024-01-21	ColorVideoVDP: A visual difference predictor for image, video and display distortions	Rafal K. Mantiuk et.al.	2401.11485	link
2024-01-21	Data-driven compression of electron-phonon interactions	Yao Luo et.al.	2401.11393	null
2024-01-20	Learned Image Compression with Dual-Branch Encoder and Conditional Information Coding	Haisheng Fu et.al.	2401.11093	null
2024-01-19	NN-VVC: Versatile Video Coding boosted by self-supervisedly learned image coding for machines	Jukka I. Ahonen et.al.	2401.10761	null
2024-01-19	Bridging the gap between image coding for machines and humans	Nam Le et.al.	2401.10732	null
2024-01-18	Attack and Defense Analysis of Learned Image Compression	Tianyu Zhu et.al.	2401.10345	null
2024-01-18	Explaining the Implicit Neural Canvas: Connecting Pixels to Neurons by Tracing their Contributions	Namitha Padmanabhan et.al.	2401.10217	null
2024-01-18	Depth Over RGB: Automatic Evaluation of Open Surgery Skills Using Depth Camera	Ido Zuckerman et.al.	2401.10037	null
2024-01-18	Memory Efficient Corner Detection for Event-driven Dynamic Vision Sensors	Pao-Sheng Vincent Sun et.al.	2401.09797	null
2024-01-18	Compressing MIMO Channel Submatrices with Tucker Decomposition: Enabling Efficient Storage and Reducing SINR Computation Overhead	Yuanwei Zhang et.al.	2401.09792	null
2024-01-17	Idempotence and Perceptual Image Compression	Tongda Xu et.al.	2401.08920	link
2024-01-16	End-to-End Optimized Image Compression with the Frequency-Oriented Transform	Yuefeng Zhang et.al.	2401.08194	null
2024-01-17	Learned Image Compression with ROI-Weighted Distortion and Bit Allocation	Wei Jiang et.al.	2401.08154	null
2024-01-15	Convolutional Neural Network Compression via Dynamic Parameter Rank Pruning	Manish Sharma et.al.	2401.08014	null
2024-01-15	Machine Perceptual Quality: Evaluating the Impact of Severe Lossy Compression on Audio and Image Models	Dan Jacobellis et.al.	2401.07957	link
2024-01-14	Exploring Compressed Image Representation as a Perceptual Proxy: A Study	Chen-Hsiu Huang et.al.	2401.07200	link
2024-01-13	Progressive Feature Fusion Network for Enhancing Image Quality Assessment	Kaiqun Wu et.al.	2401.06992	null
2024-01-12	Efficient Parallel Algorithms for Inpainting-Based Representations of 4K Images -- Part II: Spatial and Tonal Data Optimization	Niklas Kämper et.al.	2401.06747	null
2024-03-18	LiDAR Depth Map Guided Image Compression Model	Alessandro Gnutti et.al.	2401.06517	null
2024-01-11	Transformer Masked Autoencoders for Next-Generation Wireless Communications: Architecture and Opportunities	Abdullah Zayat et.al.	2401.06274	null
2024-01-11	MGARD: A multigrid framework for high-performance, error-controlled data compression and refactoring	Qian Gong et.al.	2401.05994	null
2024-01-10	SnapCap: Efficient Snapshot Compressive Video Captioning	Jianqiao Sun et.al.	2401.04903	null
2024-01-09	Modified Levenberg-Marquardt Algorithm For Tensor CP Decomposition in Image Compression	Ramin Goudarzi Karim et.al.	2401.04670	null
2024-01-09	Optimal Transcoding Resolution Prediction for Efficient Per-Title Bitrate Ladder Estimation	Jinhai Yang et.al.	2401.04405	null
2024-01-08	Low-light Image Enhancement via CLIP-Fourier Guided Wavelet Diffusion	Minglong Xue et.al.	2401.03788	link
2024-01-08	A Video Coding Method Based on Neural Network for CLIC2024	Zhengang Li et.al.	2401.03623	null
2024-01-06	Spatiotemporally adaptive compression for scientific dataset with feature preservation -- a case study on simulation data with extreme climate events analysis	Qian Gong et.al.	2401.03317	null
2024-01-06	Comparison of spectrum models as applied to single-particle $\bf p_t$ spectra from high-energy p-p collisions and their physical interpretations	Thomas A. Trainor et.al.	2401.03290	null
2024-01-06	Transferable Learned Image Compression-Resistant Adversarial Perturbations	Yang Sui et.al.	2401.03115	null
2024-01-05	MsDC-DEQ-Net: Deep Equilibrium Model (DEQ) with Multi-scale Dilated Convolution for Image Compressive Sensing (CS)	Youhao Yu et.al.	2401.02884	null
2024-03-08	Importance Matching Lemma for Lossy Compression with Side Information	Buu Phan et.al.	2401.02609	null
2024-01-04	Cool-Chic: Perceptually Tuned Low Complexity Overfitted Image Coder	Théo Ladune et.al.	2401.02156	link
2024-01-04	ED: Perceptually tuned Enhanced Compression Model	Pierrick Philippe et.al.	2401.02145	null
2024-01-02	NU-Class Net: A Novel Deep Learning-based Approach for Video Quality Enhancement	Parham Zilouchian Moghaddam et.al.	2401.01163	null
2024-01-28	Higher-Order Cellular Automata Generated Symmetry-Protected Topological Phases and Detection Through Multi-Point Strange Correlators	Jie-Yu Zhang et.al.	2401.00505	null
2023-12-28	Selective Run-Length Encoding	Xutan Peng et.al.	2312.17024	null
2023-12-29	FFCA-Net: Stereo Image Compression via Fast Cascade Alignment of Side Information	Yichong Xia et.al.	2312.16963	null
2023-12-26	Range Entropy Queries and Partitioning	Sanjay Krishnan et.al.	2312.15959	null
2023-12-25	MaskCRT: Masked Conditional Residual Transformer for Learned Video Compression	Yi-Hsin Chen et.al.	2312.15829	null
2023-12-25	On Robust Wasserstein Barycenter: The Model and Algorithm	Xu Wang et.al.	2312.15762	null
2023-12-25	Scalable Face Image Coding via StyleGAN Prior: Towards Compression for Human-Machine Collaborative Vision	Qi Mao et.al.	2312.15622	null
2023-12-22	The Rate-Distortion-Perception-Classification Tradeoff: Joint Source Coding and Modulation via Inverse-Domain GANs	Junli Fang et.al.	2312.14792	null
2024-01-09	Enhanced Color Palette Modeling for Lossless Screen Content Compression	Hannah Och et.al.	2312.14491	null
2023-12-30	Efficient Communication in Federated Learning Using Floating-Point Lossy Compression	Grant Wilkins et.al.	2312.13461	null
2023-12-19	A Huffman based short message service compression technique using adjacent distance array	Pranta Sarker et.al.	2312.12495	null
2023-12-19	Full-reference Video Quality Assessment for User Generated Content Transcoding	Zihao Qi et.al.	2312.12317	null
2023-12-19	Low-Consumption Partial Transcoding by HEVC	Mohsen Abdoli et.al.	2312.12174	link
2023-12-19	Comparative Study of Hardware and Software Power Measurements in Video Compression	Angeliki Katsenou et.al.	2312.12150	link
2023-12-18	Blind-Touch: Homomorphic Encryption-Based Distributed Neural Network Inference for Privacy-Preserving Fingerprint Authentication	Hyunmin Choi et.al.	2312.11575	link
2024-01-11	Quantized Decoder in Learned Image Compression for Deterministic Reconstruction	Esin Koyuncu et.al.	2312.11209	null
2023-12-19	A Computationally Efficient Neural Video Compression Accelerator Based on a Sparse CNN-Transformer Hybrid Network	Siyu Zhang et.al.	2312.10716	null
2023-12-17	IntraSeismic: a coordinate-based learning approach to seismic inversion	Juan Romero et.al.	2312.10568	null
2023-12-17	Light-weight CNN-based VVC Inter Partitioning Acceleration	Yiqun Liu et.al.	2312.10567	null
2023-12-16	Statistical Analysis of Inter Coding in VVC Test Model (VTM)	Yiqun Liu et.al.	2312.10406	null
2023-12-15	IQNet: Image Quality Assessment Guided Just Noticeable Difference Prefiltering For Versatile Video Coding	Yu-Han Sun et.al.	2312.09799	null
2023-12-15	Towards Neuromorphic Compression based Neural Sensing for Next-Generation Wireless Implantable Brain Machine Interface	Vivek Mohan et.al.	2312.09503	null
2023-12-14	Geometry-Corrected Geodesic Motion Modeling with Per-Frame Camera Motion for 360-Degree Video Compression	Andy Regensky et.al.	2312.09266	link
2023-12-14	Efficient Online Learning of Contact Force Models for Connector Insertion	Kevin Tracy et.al.	2312.09190	null
2023-12-13	Balanced and Deterministic Weight-sharing Helps Network Performance	Oscar Chang et.al.	2312.08401	null
2023-12-13	Preparing VVC for Streaming: A Fast Multi-Rate Encoding Approach	Yiqun Liu et.al.	2312.08330	null
2023-12-13	CenterGrasp: Object-Aware Implicit Representation Learning for Simultaneous Shape Reconstruction and 6-DoF Grasp Estimation	Eugenio Chisari et.al.	2312.08240	null
2023-12-13	Explainable Trajectory Representation through Dictionary Learning	Yuanbo Tang et.al.	2312.08052	null
2023-12-12	Deep Hierarchical Video Compression	Ming Lu et.al.	2312.07126	null
2023-12-12	Communication Cost Reduction for Subgraph Counting under Local Differential Privacy via Hash Functions	Quentin Hillebrand et.al.	2312.07055	link
2023-12-11	RAFIC: Retrieval-Augmented Few-shot Image Classification	Hangfei Lin et.al.	2312.06868	link
2023-12-11	A New Projection Pursuit Index for Big Data	Yajie Duan et.al.	2312.06465	null
2023-12-11	Variational Auto-Encoder Based Deep Learning Technique For Filling Gaps in Reacting PIV Data	Shashank Yellapantula et.al.	2312.06461	null
2023-12-07	Analysis of Coding Gain Due to In-Loop Reshaping	Chau-Wai Wong et.al.	2312.04022	null
2023-12-05	C3: High-performance and low-complexity neural compression from a single image or video	Hyunjik Kim et.al.	2312.02753	null
2023-12-05	Unified learning-based lossy and lossless JPEG recompression	Jianghui Zhang et.al.	2312.02705	null
2023-12-05	Accelerating Learnt Video Codecs with Gradient Decay and Layer-wise Distillation	Tianhao Peng et.al.	2312.02605	null
2023-12-04	Hyperspectral Image Compression Using Sampling and Implicit Neural Representations	Shima Rezasoltani et.al.	2312.01558	null

(back to top)

Quality Assessment

Publish Date	Title	Authors	PDF	Code
2025-04-10	PixelFlow: Pixel-Space Generative Models with Flow	Shoufa Chen et.al.	2504.07963	null
2025-04-10	TokenFocus-VQA: Enhancing Text-to-Image Alignment with Position-Aware Focus and Multi-Perspective Aggregations on LVLMs	Zijian Zhang et.al.	2504.07556	null
2025-04-10	AI-Slop to AI-Polish? Aligning Language Models through Edit-Based Writing Rewards and Test-time Computation	Tuhin Chakrabarty et.al.	2504.07532	null
2025-04-10	AgentAda: Skill-Adaptive Data Analytics for Tailored Insight Discovery	Amirhossein Abaskohi et.al.	2504.07421	null
2025-04-09	Dependency Update Adoption Patterns in the Maven Software Ecosystem	Baltasar Berretta et.al.	2504.07310	null
2025-04-09	MoEDiff-SR: Mixture of Experts-Guided Diffusion Model for Region-Adaptive MRI Super-Resolution	Zhe Wang et.al.	2504.07308	null
2025-04-09	Q-Agent: Quality-Driven Chain-of-Thought Image Restoration Agent through Robust Multimodal Large Language Model	Yingjie Zhou et.al.	2504.07148	null
2025-04-09	End2end-ALARA: Approaching the ALARA Law in CT Imaging with End-to-end Learning	Xi Tao et.al.	2504.06777	null
2025-04-09	RAGME: Retrieval Augmented Video Generation for Enhanced Motion Realism	Elia Peruzzo et.al.	2504.06672	null
2025-04-10	Subjective Visual Quality Assessment for High-Fidelity Learning-Based Image Compression	Mohsen Jenadeleh et.al.	2504.06301	null
2025-04-08	HiFlow: Training-free High-Resolution Image Generation with Flow-Aligned Guidance	Jiazi Bu et.al.	2504.06232	null
2025-04-08	CamContextI2V: Context-aware Controllable Video Generation	Luis Denninger et.al.	2504.06022	null
2025-04-08	ViralQC: A Tool for Assessing Completeness and Contamination of Predicted Viral Contigs	Cheng Peng et.al.	2504.05790	null
2025-04-08	A Lightweight Multi-Module Fusion Approach for Korean Character Recognition	Inho Jake Park et.al.	2504.05770	null
2025-04-08	STRIVE: A Think & Improve Approach with Iterative Refinement for Enhancing Question Quality Estimation	Aniket Deroy et.al.	2504.05693	null
2025-04-07	Improved Stochastic Texture Filtering Through Sample Reuse	Bartlomiej Wronski et.al.	2504.05562	null
2025-04-07	Towards Efficient Real-Time Video Motion Transfer via Generative Time Series Modeling	Tasmiah Haque et.al.	2504.05537	null
2025-04-07	L3GS: Layered 3D Gaussian Splats for Efficient 3D Scene Delivery	Yi-Zhen Tsai et.al.	2504.05517	null
2025-04-07	Let it Snow! Animating Static Gaussian Scenes With Dynamic Weather Effects	Gal Fiebelman et.al.	2504.05296	null
2025-04-07	Balancing Task-invariant Interaction and Task-specific Adaptation for Unified Image Fusion	Xingyu Hu et.al.	2504.05164	null
2025-04-07	Content-Distortion High-Order Interaction for Blind Image Quality Assessment	Shuai Liu et.al.	2504.05076	null
2025-04-07	Low-Rate Semantic Communication with Codebook-based Conditional Generative Models	Kailang Ye et.al.	2504.04977	null
2025-04-07	Video-Bench: Human-Aligned Video Generation Benchmark	Hui Han et.al.	2504.04907	null
2025-04-07	Bidirectional Hierarchical Protein Multi-Modal Representation Learning	Xuefeng Liu et.al.	2504.04770	null
2025-04-06	BrainMRDiff: A Diffusion Model for Anatomically Consistent Brain MRI Synthesis	Moinak Bhattacharya et.al.	2504.04532	null
2025-04-06	FluentLip: A Phonemes-Based Two-stage Approach for Audio-Driven Lip Synthesis with Optical Flow Consistency	Shiyan Liu et.al.	2504.04427	null
2025-04-05	Multi-identity Human Image Animation with Structural Video Diffusion	Zhenzhi Wang et.al.	2504.04126	null
2025-04-05	Mapping at First Sense: A Lightweight Neural Network-Based Indoor Structures Prediction Method for Robot Autonomous Exploration	Haojia Gao et.al.	2504.04061	null
2025-04-05	OpenCodeInstruct: A Large-scale Instruction Tuning Dataset for Code LLMs	Wasi Uddin Ahmad et.al.	2504.04030	null
2025-04-05	DiTaiListener: Controllable High Fidelity Listener Video Generation with Diffusion	Maksim Siniukov et.al.	2504.04010	null
2025-04-04	From Keypoints to Realism: A Realistic and Accurate Virtual Try-on Network from 2D Images	Maliheh Toozandehjani et.al.	2504.03807	null
2025-04-04	Quantifying the uncertainty of model-based synthetic image quality metrics	Ciaran Bench et.al.	2504.03623	null
2025-04-04	Multimodal Diffusion Bridge with Attention-Based SAR Fusion for Satellite Image Cloud Removal	Yuyang Hu et.al.	2504.03607	null
2025-04-04	BUFF: Bayesian Uncertainty Guided Diffusion Probabilistic Model for Single Image Super-Resolution	Zihao He et.al.	2504.03490	null
2025-04-04	NeRFlex: Resource-aware Real-time High-quality Rendering of Complex Scenes on Mobile Devices	Zhe Wang et.al.	2504.03415	null
2025-04-04	Point Cloud Objective Quality: Benchmarking Features and Quality Evaluation	Joao Prazeres et.al.	2504.03381	null
2025-04-04	Space-Time Encoded Modulation for High-Fidelity Diffuse Optical Imaging	Ben Wiesel et.al.	2504.03246	null
2025-04-04	Three Forensic Cues for JPEG AI Images	Sandra Bergmann et.al.	2504.03191	null
2025-04-04	FontGuard: A Robust Font Watermarking Approach Leveraging Deep Font Knowledge	Kahim Wong et.al.	2504.03128	null
2025-04-03	Compressing 3D Gaussian Splatting by Noise-Substituted Vector Quantization	Haishan Wang et.al.	2504.03059	null
2025-04-03	Fuzzy Implicative Rules: A Unified Approach	Raquel Fernandez-Peralta et.al.	2504.03000	null
2025-04-03	Efficient Autoregressive Shape Generation via Octree-Based Adaptive Tokenization	Kangle Deng et.al.	2504.02817	null
2025-04-03	Development of Automated Data Quality Assessment and Evaluation Indices by Analytical Experience	Yuka Haruki et.al.	2504.02663	null
2025-04-03	Charm: The Missing Piece in ViT fine-tuning for Image Aesthetic Assessment	Fatemeh Behrad et.al.	2504.02522	null
2025-04-03	MultiNeRF: Multiple Watermark Embedding for Neural Radiance Fields	Yash Kulthe et.al.	2504.02517	null
2025-04-03	Translation of Fetal Brain Ultrasound Images into Pseudo-MRI Images using Artificial Intelligence	Naomi Silverstein et.al.	2504.02408	null
2025-04-03	SemiISP/SemiIE: Semi-Supervised Image Signal Processor and Image Enhancement Leveraging One-to-Many Mapping sRGB-to-RAW	Masakazu Yoshimura et.al.	2504.02345	null
2025-04-03	ConsDreamer: Advancing Multi-View Consistency for Zero-Shot Text-to-3D Generation	Yuan Zhou et.al.	2504.02316	link
2025-04-03	Image Coding for Machines via Feature-Preserving Rate-Distortion Optimization	Samuel Fernández-Menduiña et.al.	2504.02216	null
2025-04-02	Foreground Focus: Enhancing Coherence and Fidelity in Camouflaged Image Generation	Pei-Chi Chen et.al.	2504.02180	null
2025-04-02	BioAtt: Anatomical Prior Driven Low-Dose CT Denoising	Namhun Kim et.al.	2504.01662	null
2025-04-02	Q-Adapt: Adapting LMM for Visual Quality Assessment with Progressive Instruction Tuning	Yiting Lu et.al.	2504.01655	link
2025-04-02	RealityAvatar: Towards Realistic Loose Clothing Modeling in Animatable 3D Gaussian Avatars	Yahui Li et.al.	2504.01559	null
2025-04-02	Multi-Marker Similarity enables reduced-reference and interpretable image quality assessment in optical microscopy	Elena Corbetta et.al.	2504.01537	null
2025-04-02	Luminance-GS: Adapting 3D Gaussian Splatting to Challenging Lighting Conditions with View-Adaptive Curve Adjustment	Ziteng Cui et.al.	2504.01503	link
2025-04-02	FlowMotion: Target-Predictive Flow Matching for Realistic Text-Driven Human Motion Generation	Manolo Canales Cuba et.al.	2504.01338	null
2025-04-01	FUSION: Frequency-guided Underwater Spatial Image recOnstructioN	Jaskaran Singh Walia et.al.	2504.01243	null
2025-04-01	A Conformal Risk Control Framework for Granular Word Assessment and Uncertainty Calibration of CLIPScore Quality Estimates	Gonçalo Gomes et.al.	2504.01225	null
2025-04-01	Epistemic Alignment: A Mediating Framework for User-LLM Knowledge Delivery	Nicholas Clark et.al.	2504.01205	null
2025-04-01	Video Quality Assessment for Resolution Cross-Over in Live Sports	Jingwen Zhu et.al.	2504.01190	null
2025-04-01	ScholarCopilot: Training Large Language Models for Academic Writing with Accurate Citations	Yubo Wang et.al.	2504.00824	null
2025-04-01	The GLASS-JWST Early Release Science Programme: The NIRISS Spectroscopic Catalogue	Peter J. Watson et.al.	2504.00823	null
2025-04-01	DropGaussian: Structural Regularization for Sparse-view Gaussian Splatting	Hyunwoo Park et.al.	2504.00773	null
2025-04-01	Enhancing Fundus Image-based Glaucoma Screening via Dynamic Global-Local Feature Integration	Yuzhuo Zhou et.al.	2504.00431	null
2025-03-31	Bayesian Imaging of Interferometric Data from Polarized Electromagnetic Signals	Philipp Arras et.al.	2504.00227	null
2025-03-31	Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation	Shengqiong Wu et.al.	2503.24379	null
2025-03-31	ERUPT: Efficient Rendering with Unposed Patch Transformer	Maxim V. Shugaev et.al.	2503.24374	null
2025-03-31	StochasticSplats: Stochastic Rasterization for Sorting-Free 3D Gaussian Splatting	Shakiba Kheradmand et.al.	2503.24366	null
2025-03-31	DiET-GS: Diffusion Prior and Event Stream-Assisted Motion Deblurring 3D Gaussian Splatting	Seungjun Lee et.al.	2503.24210	null
2025-03-31	FineCausal: A Causal-Based Framework for Interpretable Fine-Grained Action Quality Assessment	Ruisheng Han et.al.	2503.23911	link
2025-03-31	Training-Free Text-Guided Image Editing with Visual Autoregressive Model	Yufei Wang et.al.	2503.23897	null
2025-04-01	Learned Image Compression and Restoration for Digital Pathology	SeonYeong Lee et.al.	2503.23862	link
2025-03-30	What Makes an Evaluation Useful? Common Pitfalls and Best Practices	Gil Gekker et.al.	2503.23424	null
2025-03-30	Improving underwater semantic segmentation with underwater image quality attention and muti-scale aggregation attention	Xin Zuo et.al.	2503.23422	link
2025-03-30	Visual Acuity Consistent Foveated Rendering towards Retinal Resolution	Zhi Zhang et.al.	2503.23410	null
2025-03-30	Map Feature Perception Metric for Map Generation Quality Assessment and Loss Optimization	Chenxing Sun et.al.	2503.23370	null
2025-03-29	NeuralGS: Bridging Neural Fields and 3D Gaussian Splatting for Compact 3D Representations	Zhenyu Tang et.al.	2503.23162	null
2025-03-29	STSA: Spatial-Temporal Semantic Alignment for Visual Dubbing	Zijun Ding et.al.	2503.23039	link
2025-03-28	Concept and Demonstration of a Low-cost Compact Electron Microscope Enabled by a Photothermionic Carbon Nanotube Cathode	Casimir Kuzyk et.al.	2503.22910	null
2025-03-28	Learning to Reason for Long-Form Story Generation	Alexander Gurung et.al.	2503.22828	link
2025-03-28	Q-Insight: Understanding Image Quality via Visual Reinforcement Learning	Weiqi Li et.al.	2503.22679	link
2025-03-28	Evaluation of Machine-generated Biomedical Images via A Tally-based Similarity Measure	Frank J. Brooks et.al.	2503.22658	null
2025-03-28	RELD: Regularization by Latent Diffusion Models for Image Restoration	Pasquale Cascarano et.al.	2503.22563	null
2025-03-28	Data Quality Matters: Quantifying Image Quality Impact on Machine Learning Performance	Christian Steinhauser et.al.	2503.22375	null
2025-03-28	Imperceptible but Forgeable: Practical Invisible Watermark Forgery via Diffusion Models	Ziping Dong et.al.	2503.22330	null
2025-03-28	Mono2Stereo: A Benchmark and Empirical Study for Stereo Conversion	Songsong Yu et.al.	2503.22262	null
2025-03-27	Multispectral Demosaicing via Dual Cameras	SaiKiran Tedla et.al.	2503.22026	null
2025-03-27	Uni4D: Unifying Visual Foundation Models for 4D Modeling from a Single Video	David Yifan Yao et.al.	2503.21761	link
2025-03-27	Lumina-Image 2.0: A Unified and Efficient Image Generative Framework	Qi Qin et.al.	2503.21758	link
2025-03-27	3DGen-Bench: Comprehensive Benchmark Suite for 3D Generative Models	Yuhan Zhang et.al.	2503.21745	null
2025-03-27	Evaluating Text-to-Image Synthesis with a Conditional Fréchet Distance	Jaywon Koo et.al.	2503.21721	null
2025-03-27	Audio-driven Gesture Generation via Deviation Feature in the Latent Space	Jiahui Chen et.al.	2503.21616	null
2025-03-27	In vivo dynamic optical coherence tomography of human skin with hardware- and software-based motion correction	Yu Guo et.al.	2503.21384	link
2025-03-27	Zero-Shot Visual Concept Blending Without Text Guidance	Hiroya Makino et.al.	2503.21277	link
2025-03-27	Reducing CT Metal Artifacts by Learning Latent Space Alignment with Gemstone Spectral Imaging Data	Wencheng Han et.al.	2503.21259	null
2025-03-26	Generalized Ray Tracing with Basis functions for Tomographic Projections	Youssef Haouchat et.al.	2503.20907	null
2025-03-26	Debiasing Kernel-Based Generative Models	Tian Qin et.al.	2503.20825	null
2025-03-27	Mitigating Low-Level Visual Hallucinations Requires Self-Awareness: Database, Model and Training Strategy	Yinan Sun et.al.	2503.20673	null
2025-03-26	VPO: Aligning Text-to-Video Generation Models with Prompt Optimization	Jiale Cheng et.al.	2503.20491	link
2025-03-26	Adaptive Local Clustering over Attributed Graphs	Haoran Zheng et.al.	2503.20488	link
2025-03-26	Dissecting and Mitigating Diffusion Bias via Mechanistic Interpretability	Yingdong Shi et.al.	2503.20483	null
2025-03-26	3D Convolutional Neural Networks for Improved Detection of Intracranial bleeding in CT Imaging	Bargava Subramanian et.al.	2503.20306	null
2025-03-26	Traversing Distortion-Perception Tradeoff using a Single Score-Based Generative Model	Yuhan Wang et.al.	2503.20297	null
2025-03-26	QualiSpeech: A Speech Quality Assessment Dataset with Natural Language Reasoning and Descriptions	Siyin Wang et.al.	2503.20290	null
2025-03-26	EGVD: Event-Guided Video Diffusion Model for Physically Realistic Large-Motion Frame Interpolation	Ziran Zhang et.al.	2503.20268	link
2025-03-25	Scaling Down Text Encoders of Text-to-Image Diffusion Models	Lifu Wang et.al.	2503.19897	link
2025-03-25	LENVIZ: A High-Resolution Low-Exposure Night Vision Benchmark Dataset	Manjushree Aithal et.al.	2503.19804	null
2025-03-25	SITA: Structurally Imperceptible and Transferable Adversarial Attacks for Stylized Image Generation	Jingdan Kang et.al.	2503.19791	link
2025-03-25	EventMamba: Enhancing Spatio-Temporal Locality with State Space Models for Event-Based Video Reconstruction	Chengjie Ge et.al.	2503.19721	null
2025-03-25	Improved tissue sodium concentration quantification in breast cancer by reducing partial volume effects: a preliminary study	Olgica Zaric et.al.	2503.19570	null
2025-03-25	Single-Step Latent Consistency Model for Remote Sensing Image Super-Resolution	Xiaohui Sun et.al.	2503.19505	null
2025-03-25	AccVideo: Accelerating Video Diffusion Model with Synthetic Dataset	Haiyu Zhang et.al.	2503.19462	null
2025-03-26	COB-GS: Clear Object Boundaries in 3DGS Segmentation Based on Boundary-Adaptive Gaussian Splitting	Jiaxin Zhang et.al.	2503.19443	link
2025-03-25	Exploring Semantic Feature Discrimination for Perceptual Image Super-Resolution and Opinion-Unaware No-Reference Image Quality Assessment	Guanglu Dong et.al.	2503.19295	link
2025-03-25	Learning Hazing to Dehazing: Towards Realistic Haze Generation for Real-World Image Dehazing	Ruiyi Wang et.al.	2503.19262	null
2025-03-24	Latent Space Class Dispersion: Effective Test Data Quality Assessment for DNNs	Vivek Vekariya et.al.	2503.18799	null
2025-03-24	Linguistics-aware Masked Image Modeling for Self-supervised Scene Text Recognition	Yifei Zhang et.al.	2503.18746	link
2025-03-24	Generative Dataset Distillation using Min-Max Diffusion Model	Junqiao Fan et.al.	2503.18626	null
2025-03-25	AMD-Hummingbird: Towards an Efficient Text-to-Video Model	Takashi Isobe et.al.	2503.18559	link
2025-03-24	EvAnimate: Event-conditioned Image-to-Video Generation for Human Animation	Qiang Qu et.al.	2503.18552	null
2025-03-24	Uncertainty-guided Perturbation for Image Super-Resolution Diffusion Model	Leheng Zhang et.al.	2503.18512	null
2025-03-24	MuMA: 3D PBR Texturing via Multi-Channel Multi-View Generation and Agentic Post-Processing	Lingting Zhu et.al.	2503.18461	null
2025-03-24	Panorama Generation From NFoV Image Done Right	Dian Zheng et.al.	2503.18420	link
2025-03-24	Limited-angle SPECT image reconstruction using deep image prior	Kensuke Hori et.al.	2503.18342	null
2025-03-23	Collaborating with AI Agents: Field Experiments on Teamwork, Productivity, and Performance	Harang Ju et.al.	2503.18238	null
2025-03-23	TCFG: Tangential Damping Classifier-free Guidance	Mingi Kwon et.al.	2503.18137	null
2025-03-23	Real-World Remote Sensing Image Dehazing: Benchmark and Baseline	Zeng-Hui Zhu et.al.	2503.17966	link
2025-03-23	Cross-Domain Underwater Image Enhancement Guided by No-Reference Image Quality Assessment: A Transfer Learning Approach	Zhi Zhang et.al.	2503.17937	null
2025-03-23	Guided Diffusion for the Extension of Machine Vision to Human Visual Perception	Takahiro Shindo et.al.	2503.17907	null
2025-03-22	DVG-Diffusion: Dual-View Guided Diffusion Model for CT Reconstruction from X-Rays	Xing Xie et.al.	2503.17804	null
2025-03-22	Improving Preference Extraction In LLMs By Identifying Latent Knowledge Through Classifying Probes	Sharan Maiya et.al.	2503.17755	null
2025-03-22	MAMAT: 3D Mamba-Based Atmospheric Turbulence Removal and its Object Detection Capability	Paul Hill et.al.	2503.17700	null
2025-03-22	DCEvo: Discriminative Cross-Dimensional Evolutionary Learning for Infrared and Visible Image Fusion	Jinyuan Liu et.al.	2503.17673	link
2025-03-21	Generating, Fast and Slow: Scalable Parallel Video Generation with Video Interface Networks	Bhishma Dedhia et.al.	2503.17539	null
2025-03-21	ProDehaze: Prompting Diffusion Models Toward Faithful Image Dehazing	Tianwen Zhou et.al.	2503.17488	link
2025-03-21	Cross-Modal Interactive Perception Network with Mamba for Lung Tumor Segmentation in PET-CT Images	Jie Mei et.al.	2503.17261	link
2025-03-21	FFaceNeRF: Few-shot Face Editing in Neural Radiance Fields	Kwan Yun et.al.	2503.17095	link
2025-03-21	STFTCodec: High-Fidelity Audio Compression through Time-Frequency Domain Representation	Tao Feng et.al.	2503.16989	null
2025-03-21	Uncertainty-Driven Modeling of Microporosity and Permeability in Clastic Reservoirs Using Random Forest	Muhammad Risha et.al.	2503.16957	null
2025-03-21	MagicColor: Multi-Instance Sketch Colorization	Yinhan Zhang et.al.	2503.16948	null
2025-03-21	Design of 3D Non-Cartesian Trajectories for Fast Volumetric MRI via Analytic Coordinate Discretization	Kwang Eun Jang et.al.	2503.16918	null
2025-03-21	Depth-Aided Color Image Inpainting in Quaternion Domain	Shunki Tatsumi et.al.	2503.16818	null
2025-03-21	A-IDE : Agent-Integrated Denoising Experts	Uihyun Cho et.al.	2503.16780	null
2025-03-21	On Explaining (Large) Language Models For Code Using Global Code-Based Explanations	David N. Palacio et.al.	2503.16771	null
2025-03-20	SAGE: Semantic-Driven Adaptive Gaussian Splatting in Extended Reality	Chiara Schiavo et.al.	2503.16747	null
2025-03-20	EDiT: Efficient Diffusion Transformers with Linear Compressed Attention	Philipp Becker et.al.	2503.16726	null
2025-03-20	Euclid: Star clusters in IC 342, NGC 2403, and Holmberg II	S. S. Larsen et.al.	2503.16637	null
2025-03-20	Fed-NDIF: A Noise-Embedded Federated Diffusion Model For Low-Count Whole-Body PET Denoising	Yinchi Zhou et.al.	2503.16635	null
2025-03-20	A Recipe for Generating 3D Worlds From a Single Image	Katja Schwarz et.al.	2503.16611	null
2025-03-20	1000+ FPS 4D Gaussian Splatting for Dynamic Scene Rendering	Yuheng Yuan et.al.	2503.16422	null
2025-03-20	MagicMotion: Controllable Video Generation with Dense-to-Sparse Trajectory Guidance	Quanhao Li et.al.	2503.16421	null
2025-03-20	InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity	Liming Jiang et.al.	2503.16418	link
2025-03-20	ScalingNoise: Scaling Inference-Time Search for Generating Infinite Videos	Haolin Yang et.al.	2503.16400	null
2025-03-20	Gaussian Graph Network: Learning Efficient and Generalizable Gaussian Representations from Multi-view Images	Shengjun Zhang et.al.	2503.16338	null
2025-03-20	Enhancing Software Quality Assurance with an Adaptive Differential Evolution based Quantum Variational Autoencoder-Transformer Model	Seshu Babu Barma et.al.	2503.16335	null
2025-03-20	Do image and video quality metrics model low-level human vision?	Dounia Hammou et.al.	2503.16264	null
2025-03-20	Iterative Optimal Attention and Local Model for Single Image Rain Streak Removal	Xiangyu Li et.al.	2503.16165	link
2025-03-20	Automatically Generating Chinese Homophone Words to Probe Machine Translation Estimation Systems	Shenbin Qian et.al.	2503.16158	link
2025-03-20	3-D Image-to-Image Fusion in Lightsheet Microscopy by Two-Step Adversarial Network: Contribution to the FuseMyCells Challenge	Marek Wodzinski et.al.	2503.16075	null
2025-03-20	PoseTraj: Pose-Aware Trajectory Control in Video Diffusion	Longbin Ji et.al.	2503.16068	null
2025-03-20	Single Image Iterative Subject-driven Generation and Editing	Yair Shpitzer et.al.	2503.16025	link
2025-03-20	A Survey on fMRI-based Brain Decoding for Reconstructing Multimodal Stimuli	Pengyu Liu et.al.	2503.15978	null
2025-03-20	GraPLUS: Graph-based Placement Using Semantics for Image Composition	Mir Mohammad Khaleghi et.al.	2503.15761	null
2025-03-19	5D free-running, reconstruction, variable projection, ADMM, VPAL	Yitong Yang et.al.	2503.15711	null
2025-03-19	Toward task-driven satellite image super-resolution	Maciej Ziaja et.al.	2503.15474	null
2025-03-19	Learn Your Scales: Towards Scale-Consistent Generative Novel View Synthesis	Fereshteh Forghani et.al.	2503.15412	null
2025-03-19	Boosting HDR Image Reconstruction via Semantic Knowledge Transfer	Qingsen Yan et.al.	2503.15361	null
2025-03-19	Euclid Quick Data Release (Q1): VIS processing and data products	Euclid Collaboration et.al.	2503.15303	null
2025-03-19	Automated Non-Functional Requirements Generation in Software Engineering with Large Language Models: A Comparative Study	Jomar Thomas Almonte et.al.	2503.15248	null
2025-03-19	3D Engine-ready Photorealistic Avatars via Dynamic Textures	Yifan Wang et.al.	2503.14943	null
2025-03-19	FetalFlex: Anatomy-Guided Diffusion Model for Flexible Control on Fetal Ultrasound Image Synthesis	Yaofei Duan et.al.	2503.14906	null
2025-03-19	Temporal-Consistent Video Restoration with Pre-trained Diffusion Models	Hengkang Wang et.al.	2503.14863	null
2025-03-19	ClimateGS: Real-Time Climate Simulation with 3D Gaussian Style Transfer	Yuezhen Xie et.al.	2503.14845	null
2025-03-18	Involution and BSConv Multi-Depth Distillation Network for Lightweight Image Super-Resolution	Akram Khatami-Rizi et.al.	2503.14779	null
2025-03-18	A Simple Combination of Diffusion Models for Better Quality Trade-Offs in Image Denoising	Jonas Dornbusch et.al.	2503.14654	null
2025-03-18	The Power of Context: How Multimodality Improves Image Super-Resolution	Kangfu Mei et.al.	2503.14503	null
2025-03-18	ICE-Bench: A Unified and Comprehensive Benchmark for Image Creating and Editing	Yulin Pan et.al.	2503.14482	null
2025-03-18	Optimized 3D Gaussian Splatting using Coarse-to-Fine Image Frequency Modulation	Umar Farooq et.al.	2503.14475	null
2025-03-18	RFMI: Estimating Mutual Information on Rectified Flow for Text-to-Image Alignment	Chao Wang et.al.	2503.14358	null
2025-03-18	Four checks for low-fidelity synthetic data: recommendations for disclosure control and quality evaluation	Gillian M Raab et.al.	2503.14211	null
2025-03-18	RBFIM: Perceptual Quality Assessment for Compressed Point Clouds Using Radial Basis Function Interpolation	Zhang Chen et.al.	2503.14154	null
2025-03-18	Towards properties of adversarial image perturbations	Egor Kuznetsov et.al.	2503.14111	null
2025-03-18	Image-Based Metrics in Ultrasound for Estimation of Global Speed-of-Sound	Roman Denkin et.al.	2503.14094	null
2025-03-18	Fast Autoregressive Video Generation with Diagonal Decoding	Yang Ye et.al.	2503.14070	null
2025-03-18	YOLO-LLTS: Real-Time Low-Light Traffic Sign Detection via Prior-Guided Enhancement and Multi-Branch Feature Interaction	Ziyu Lin et.al.	2503.13883	null
2025-03-17	Zero-Shot Denoising for Fluorescence Lifetime Imaging Microscopy with Intensity-Guided Learning	Hao Chen et.al.	2503.13779	null
2025-03-17	FiVE: A Fine-grained Video Editing Benchmark for Evaluating Emerging Diffusion and Rectified Flow Models	Minghan Li et.al.	2503.13684	null
2025-03-17	One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation	Daniil Selikhanovych et.al.	2503.13358	null
2025-03-17	MagicDistillation: Weak-to-Strong Video Distillation for Large-Scale Portrait Few-Step Synthesis	Shitong Shao et.al.	2503.13319	null
2025-03-19	FlexWorld: Progressively Expanding 3D Scenes for Flexiable-View Synthesis	Luxi Chen et.al.	2503.13265	null
2025-03-17	Don't Judge Before You CLIP: A Unified Approach for Perceptual Tasks	Amit Zalcher et.al.	2503.13260	null
2025-03-17	MedLoRD: A Medical Low-Resource Diffusion Model for High-Resolution 3D CT Image Synthesis	Marvin Seyfarth et.al.	2503.13211	null
2025-03-18	Rethinking Image Evaluation in Super-Resolution	Shaolin Su et.al.	2503.13074	null
2025-03-17	DehazeMamba: SAR-guided Optical Remote Sensing Image Dehazing with Adaptive State Space Model	Zhicheng Zhao et.al.	2503.13073	null
2025-03-17	DreamRenderer: Taming Multi-Instance Attribute Control in Large-Scale Text-to-Image Models	Dewei Zhou et.al.	2503.12885	null
2025-03-17	CompMarkGS: Robust Watermarking for Compression 3D Gaussian Splatting	Sumin In et.al.	2503.12836	null
2025-03-17	R3-Avatar: Record and Retrieve Temporal Codebook for Reconstructing Photorealistic Human Avatars	Yifan Zhan et.al.	2503.12751	null
2025-03-17	GenStereo: Towards Open-World Generation of Stereo Images and Unsupervised Matching	Feng Qiao et.al.	2503.12720	link
2025-03-16	GraphEval: A Lightweight Graph-Based LLM Framework for Idea Evaluation	Tao Feng et.al.	2503.12600	null
2025-03-16	BalancedDPO: Adaptive Multi-Metric Alignment	Dipesh Tamboli et.al.	2503.12575	null
2025-03-16	Segment Any-Quality Images with Generative Latent Space Enhancement	Guangqian Guo et.al.	2503.12507	null
2025-03-16	SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models	Jiakang Chen et.al.	2503.12484	null
2025-03-16	Pathology Image Restoration via Mixture of Prompts	Jiangdong Cai et.al.	2503.12399	link
2025-03-15	DLA-Count: Dynamic Label Assignment Network for Dense Cell Distribution Counting	Yuqing Yan et.al.	2503.12063	null
2025-03-15	MoDM: Efficient Serving for Image Generation via Mixture-of-Diffusion Models	Yuchen Xia et.al.	2503.11972	null
2025-03-14	TASTE-Rob: Advancing Video Generation of Task-Oriented Hand-Object Interaction for Generalizable Robotic Manipulation	Hongxiang Zhao et.al.	2503.11423	null
2025-03-14	TransiT: Transient Transformer for Non-line-of-sight Videography	Ruiqian Li et.al.	2503.11328	null
2025-03-14	Safe-VAR: Safe Visual Autoregressive Model for Text-to-Image Generative Watermarking	Ziyi Wang et.al.	2503.11324	null
2025-03-14	Leveraging Diffusion Knowledge for Generative Image Compression with Fractal Frequency-Aware Band Learning	Lingyu Zhu et.al.	2503.11321	null
2025-03-14	Toward Generalized Image Quality Assessment: Relaxing the Perfect Reference Quality Assumption	Du Chen et.al.	2503.11221	null
2025-03-14	Zero-TIG: Temporal Consistency-Aware Zero-Shot Illumination-Guided Low-light Video Enhancement	Yini Li et.al.	2503.11175	link
2025-03-14	Unifying Perplexing Behaviors in Modified BP Attributions through Alignment Perspective	Guanhua Zheng et.al.	2503.11160	null
2025-03-14	GaussianIP: Identity-Preserving Realistic 3D Human Generation via Human-Centric Diffusion Prior	Zichen Tang et.al.	2503.11143	link
2025-03-14	MobiVital: Self-supervised Time-series Quality Estimation for Contactless Respiration Monitoring Using UWB Radar	Ziqi Wang et.al.	2503.11064	link
2025-03-14	Comparative Analysis of Advanced AI-based Object Detection Models for Pavement Marking Quality Assessment during Daytime	Gian Antariksa et.al.	2503.11008	null
2025-03-13	Statistical Analysis of Sentence Structures through ASCII, Lexical Alignment and PCA	Abhijeet Sahdev et.al.	2503.10470	null
2025-03-13	RealGeneral: Unifying Visual Generation via Temporal In-Context Learning with Video Models	Yijing Lin et.al.	2503.10406	null
2025-03-13	MACS: Multi-source Audio-to-image Generation with Contextual Significance and Semantic Alignment	Hao Zhou et.al.	2503.10287	null
2025-03-13	KVQ: Boosting Video Quality Assessment via Saliency-guided Local Perception	Yunpeng Qu et.al.	2503.10259	null
2025-03-13	Automatic quality control in multi-centric fetal brain MRI super-resolution reconstruction	Thomas Sanchez et.al.	2503.10156	null
2025-03-13	Image Quality Assessment: From Human to Machine Preference	Chunyi Li et.al.	2503.10078	link
2025-03-12	Bidirectional Learned Facial Animation Codec for Low Bitrate Talking Head Videos	Riku Takahashi et.al.	2503.09787	null
2025-03-12	Silent Branding Attack: Trigger-free Data Poisoning Attack on Text-to-Image Diffusion Models	Sangwon Jang et.al.	2503.09669	null
2025-03-12	CoRe^2: Collect, Reflect and Refine to Generate Better and Faster	Shitong Shao et.al.	2503.09662	link
2025-03-12	Fair Federated Medical Image Classification Against Quality Shift via Inter-Client Progressive State Matching	Nannan Wu et.al.	2503.09587	link
2025-03-12	FCaS: Fine-grained Cardiac Image Synthesis based on 3D Template Conditional Diffusion Model	Jiahao Xia et.al.	2503.09560	null
2025-03-12	Multi-Agent Image Restoration	Xu Jiang et.al.	2503.09403	null
2025-03-12	Bidirectional Prototype-Reward co-Evolution for Test-Time Adaptation of Vision-Language Models	Xiaozhen Qiao et.al.	2503.09394	null
2025-03-12	PerCoV2: Improved Ultra-Low Bit-Rate Perceptual Image Compression with Implicit Hierarchical Masked Image Modeling	Nikolai Körber et.al.	2503.09368	link
2025-03-12	Fully-Synthetic Training for Visual Quality Inspection in Automotive Production	Christoph Huber et.al.	2503.09354	null
2025-03-12	Unified Dense Prediction of Video Diffusion	Lehan Yang et.al.	2503.09344	null
2025-03-12	Experimental study of the first telescope with a toroidal curved detector	Eduard Muslimov et.al.	2503.09300	null
2025-03-12	IQPFR: An Image Quality Prior for Blind Face Restoration and Beyond	Peng Hu et.al.	2503.09294	null
2025-03-12	Better Together: Unified Motion Capture and 3D Avatar Reconstruction	Arthur Moreau et.al.	2503.09293	null
2025-03-12	Active Learning Inspired ControlNet Guidance for Augmenting Semantic Segmentation Datasets	Hannah Kniesel et.al.	2503.09221	null
2025-03-12	Teaching LMMs for Image Quality Scoring and Interpreting	Zicheng Zhang et.al.	2503.09197	link
2025-03-11	Residual Learning and Filtering Networks for End-to-End Lossless Video Compression	Md baharul Islam et.al.	2503.08819	null
2025-03-11	Posterior-Mean Denoising Diffusion Model for Realistic PET Image Reconstruction	Yiran Sun et.al.	2503.08546	null
2025-03-11	Segmentation-Guided CT Synthesis with Pixel-Wise Conformal Uncertainty Bounds	David Vallmanya Poch et.al.	2503.08515	null
2025-03-11	NullFace: Training-Free Localized Face Anonymization	Han-Wei Kung et.al.	2503.08478	link
2025-03-11	DG16M: A Large-Scale Dataset for Dual-Arm Grasping with Force-Optimized Grasps	Md Faizal Karim et.al.	2503.08358	null
2025-03-11	Pathology-Aware Adaptive Watermarking for Text-Driven Medical Image Synthesis	Chanyoung Kim et.al.	2503.08346	null
2025-03-11	Diffusion Transformer Meets Random Masks: An Advanced PET Reconstruction Framework	Bin Huang et.al.	2503.08339	null
2025-03-11	Feature Alignment with Equivariant Convolutions for Burst Image Super-Resolution	Xinyi Liu et.al.	2503.08300	null
2025-03-11	PromptLNet: Region-Adaptive Aesthetic Enhancement via Prompt Guidance in Low-Light Enhancement Net	Jun Yin et.al.	2503.08276	null
2025-03-11	ArticulatedGS: Self-supervised Digital Twin Modeling of Articulated Objects using 3D Gaussian Splatting	Junfu Guo et.al.	2503.08135	null
2025-03-10	Artificial Intelligence in Deliberation: The AI Penalty and the Emergence of a New Deliberative Divide	Andreas Jungherr et.al.	2503.07690	null
2025-03-10	GM-MoE: Low-Light Enhancement with Gated-Mechanism Mixture-of-Experts	Minwen Liao et.al.	2503.07417	null
2025-03-10	SPEED: Scalable, Precise, and Efficient Concept Erasure for Diffusion Models	Ouxiang Li et.al.	2503.07392	link
2025-03-10	Multimodal Human-AI Synergy for Medical Imaging Quality Control: A Hybrid Intelligence Framework with Adaptive Dataset Curation and Closed-Loop Evaluation	Zhi Qin et.al.	2503.07032	null
2025-03-10	Lightweight Multimodal Artificial Intelligence Framework for Maritime Multi-Scene Recognition	Xinyu Xi et.al.	2503.06978	null
2025-03-09	GenDR: Lightning Generative Detail Restorator	Yan Wang et.al.	2503.06790	null
2025-03-09	Unsupervised Multi-Clustering and Decision-Making Strategies for 4D-STEM Orientation Mapping	Junhao Cao et.al.	2503.06699	null
2025-03-09	PixelPonder: Dynamic Patch Adaptation for Enhanced Multi-Conditional Text-to-Image Generation	Yanjie Pan et.al.	2503.06684	null
2025-03-09	Learning Few-Step Diffusion Models by Trajectory Distribution Matching	Yihong Luo et.al.	2503.06674	link
2025-03-09	The New CMS Measure of Excessive Radiation Dose or Inadequate CT Image Quality: Methods for Size-Adjusted Dose and Their Variabilities	Gary Y Ge et.al.	2503.06644	null
2025-03-09	One-Step Diffusion Model for Image Motion-Deblurring	Xiaoyang Liu et.al.	2503.06537	link
2025-03-08	PTDiffusion: Free Lunch for Generating Optical Illusion Hidden Pictures with Phase-Transferred Diffusion Model	Xiang Gao et.al.	2503.06186	null
2025-03-08	BioMoDiffuse: Physics-Guided Biomechanical Diffusion for Controllable and Authentic Human Motion Synthesis	Zixi Kang et.al.	2503.06151	null
2025-03-08	Next Token Is Enough: Realistic Image Quality and Aesthetic Scoring with Multimodal Large Language Model	Mingxing Li et.al.	2503.06141	null
2025-03-08	Viewport-Unaware Blind Omnidirectional Image Quality Assessment: A Flexible and Effective Paradigm	Jiebin Yan et.al.	2503.06129	link
2025-03-08	Feature Fusion Attention Network with CycleGAN for Image Dehazing, De-Snowing and De-Raining	Akshat Jain et.al.	2503.06107	null
2025-03-07	MagicInfinite: Generating Infinite Talking Videos with Your Words and Voice	Hongwei Yi et.al.	2503.05978	null
2025-03-07	LapLoss: Laplacian Pyramid-based Multiscale loss for Image Translation	Krish Didwania et.al.	2503.05974	null
2025-03-10	VideoPainter: Any-length Video Inpainting and Editing with Plug-and-Play Context Control	Yuxuan Bian et.al.	2503.05639	link
2025-03-07	A-SEE2.0: Active-Sensing End-Effector for Robotic Ultrasound Systems with Dense Contact Surface Perception Enabled Probe Orientation Adjustment	Yernar Zhetpissov et.al.	2503.05569	null
2025-03-07	Development and Enhancement of Text-to-Image Diffusion Models	Rajdeep Roshan Sahu et.al.	2503.05149	null
2025-03-07	SMILENet: Unleashing Extra-Large Capacity Image Steganography via a Synergistic Mosaic InvertibLE Hiding Network	Jun-Jie Huang et.al.	2503.05118	null
2025-03-06	Toward Lightweight and Fast Decoders for Diffusion Models in Image and Video Generation	Alexey Buzovkin et.al.	2503.04871	link
2025-03-08	The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation	Aoxiong Yin et.al.	2503.04606	null
2025-03-06	In-Context Reverse Classification Accuracy: Efficient Estimation of Segmentation Quality without Ground-Truth	Matias Cosarinsky et.al.	2503.04522	null
2025-03-06	IMFine: 3D Inpainting via Geometry-guided Multi-view Refinement	Zhihao Shi et.al.	2503.04501	null
2025-03-07	LEDiT: Your Length-Extrapolatable Diffusion Transformer without Positional Encoding	Shen Zhang et.al.	2503.04344	null
2025-03-05	Positive-Unlabeled Diffusion Models for Preventing Sensitive Data Generation	Hiroshi Takahashi et.al.	2503.03789	null
2025-03-05	DO-IQS: Dynamics-Aware Offline Inverse Q-Learning for Optimal Stopping with Unknown Gain Functions	Anna Kuchko et.al.	2503.03515	null
2025-03-05	Automatic Drywall Analysis for Progress Tracking and Quality Control in Construction	Mariusz Trzeciakiewicz et.al.	2503.03422	null
2025-03-05	On the Relation Between Speech Quality and Quantized Latent Representations of Neural Codecs	Mhd Modar Halimeh et.al.	2503.03304	null
2025-03-05	Computational Analysis of Degradation Modeling in Blind Panoramic Image Quality Assessment	Jiebin Yan et.al.	2503.03255	null
2025-03-05	DSVD: Dynamic Self-Verify Decoding for Faithful Generation in Large Language Models	YiQiu Guo et.al.	2503.03149	null
2025-03-04	QE4PE: Word-level Quality Estimation for Human Post-Editing	Gabriele Sarti et.al.	2503.03044	link
2025-03-04	A Causal Framework for Aligning Image Quality Metrics and Deep Neural Network Robustness	Nathan Drenkow et.al.	2503.02797	null
2025-03-04	LADM: Long-context Training Data Selection with Attention-based Dependency Measurement for LLMs	Jianghao Chen et.al.	2503.02502	null
2025-03-04	Deep Robust Reversible Watermarking	Jiale Chen et.al.	2503.02490	null
2025-03-04	ERetinex: Event Camera Meets Retinex Theory for Low-Light Image Enhancement	Xuejian Guo et.al.	2503.02484	link
2025-03-05	Q-Eval-100K: Evaluating Visual Quality and Alignment Level for Text-to-Vision Content	Zicheng Zhang et.al.	2503.02357	link
2025-03-04	Exploring Simple Siamese Network for High-Resolution Video Quality Assessment	Guotao Shen et.al.	2503.02330	null
2025-03-04	Semantic Prior Distillation with Vision Foundation Model for Enhanced Rapid Bone Scintigraphy Image Restoration	Pengchen Liang et.al.	2503.02321	null
2025-03-04	Language-Guided Visual Perception Disentanglement for Image Quality Assessment and Conditional Image Generation	Zhichao Yang et.al.	2503.02206	null
2025-03-04	DarkDeblur: Learning single-shot image deblurring in low-light condition	S M A Sharif et.al.	2503.02194	link
2025-03-03	Integrating Misclassified EHR Outcomes with Validated Outcomes from a Non-probability Sample	Jenny Shen et.al.	2503.02071	null
2025-03-03	Quality Measures for Dynamic Graph Generative Models	Ryien Hosseini et.al.	2503.01720	link
2025-03-03	Evaluating LLMs' Assessment of Mixed-Context Hallucination Through the Lens of Summarization	Siya Qi et.al.	2503.01670	link
2025-03-03	MRI super-resolution reconstruction using efficient diffusion probabilistic model with residual shifting	Mojtaba Safari et.al.	2503.01576	link
2025-03-03	Evaluation and Facilitation of Online Discussions in the LLM Era: A Survey	Katerina Korre et.al.	2503.01513	null
2025-03-03	FlowDec: A flow-based full-band general audio codec with high perceptual quality	Simon Welker et.al.	2503.01485	link
2025-03-03	Improving the Efficiency of VVC using Partitioning of Reference Frames	Kamran Qureshi et.al.	2503.01415	null
2025-03-03	Wavelet-Enhanced Desnowing: A Novel Single Image Restoration Approach for Traffic Surveillance under Adverse Weather Conditions	Zihan Shen et.al.	2503.01339	null
2025-03-03	Reconciling Stochastic and Deterministic Strategies for Zero-shot Image Restoration using Diffusion Model in Dual	Chong Wang et.al.	2503.01288	link
2025-03-03	Every SAM Drop Counts: Embracing Semantic Priors for Multi-Modality Image Fusion and Beyond	Guanyao Wu et.al.	2503.01210	null
2025-03-03	DifIISR: A Diffusion Model with Gradient Guidance for Infrared Image Super-Resolution	Xingyuan Li et.al.	2503.01187	link
2025-02-28	Raccoon: Multi-stage Diffusion Training with Coarse-to-Fine Curating Videos	Zhiyu Tan et.al.	2502.21314	null
2025-02-28	Bilevel Optimized Implicit Neural Representation for Scan-Specific Accelerated MRI Reconstruction	Hongze Yu et.al.	2502.21292	null
2025-02-28	Back to the Future Cyclopean Stereo: a human perception approach unifying deep and geometric constraints	Sherlon Almeida da Silva et.al.	2502.21280	null
2025-02-28	Does Generation Require Memorization? Creative Diffusion Models using Ambient Diffusion	Kulin Shah et.al.	2502.21278	null
2025-02-28	PET Image Denoising via Text-Guided Diffusion: Integrating Anatomical Priors through Text Prompts	Boxiao Yu et.al.	2502.21260	null
2025-02-28	Training-free and Adaptive Sparse Attention for Efficient Long Video Generation	Yifei Xia et.al.	2502.21079	null
2025-02-28	Decoder Gradient Shield: Provable and High-Fidelity Prevention of Gradient-Based Box-Free Watermark Removal	Haonan An et.al.	2502.20924	null
2025-02-28	Chain-of-Thought Matters: Improving Long-Context Language Models with Reasoning Path Supervision	Dawei Zhu et.al.	2502.20790	null
2025-02-28	WorldModelBench: Judging Video Generation Models As World Models	Dacheng Li et.al.	2502.20694	null
2025-02-28	Advancing AI-Powered Medical Image Synthesis: Insights from MedVQA-GI Challenge Using CLIP, Fine-Tuned Stable Diffusion, and Dream-Booth + LoRA	Ojonugwa Oluwafemi Ejiga Peter et.al.	2502.20667	null
2025-02-27	FlexVAR: Flexible Visual Autoregressive Modeling without Residual Prediction	Siyu Jiao et.al.	2502.20313	link
2025-02-27	Mobius: Text to Seamless Looping Video Generation via Latent Shift	Xiuli Bi et.al.	2502.20307	link
2025-02-27	Low-rank tensor completion via a novel minimax $p$ -th order concave penalty function	Hongbing Zhang et.al.	2502.19979	null
2025-02-28	Alleviating Distribution Shift in Synthetic Data for Machine Translation Quality Estimation	Xiang Geng et.al.	2502.19941	null
2025-02-27	Picking the Cream of the Crop: Visual-Centric Data Selection with Collaborative Agents	Zhenyu Liu et.al.	2502.19917	link
2025-02-27	High-Fidelity Relightable Monocular Portrait Animation with Lighting-Controllable Video Diffusion Model	Mingtao Guo et.al.	2502.19894	link
2025-02-27	Striving for Faster and Better: A One-Layer Architecture with Auto Re-parameterization for Low-Light Image Enhancement	Nan An et.al.	2502.19867	null
2025-02-27	LMHLD: A Large-scale Multi-source High-resolution Landslide Dataset for Landslide Detection based on Deep Learning	Guanting Liu et.al.	2502.19866	null
2025-02-27	Adaptive Score Alignment Learning for Continual Perceptual Quality Assessment of 360-Degree Videos in Virtual Reality	Kanglei Zhou et.al.	2502.19644	link
2025-02-26	3D Nephrographic Image Synthesis in CT Urography with the Diffusion Model and Swin Transformer	Hongkun Yu et.al.	2502.19623	null
2025-02-26	Distill Not Only Data but Also Rewards: Can Smaller Language Models Surpass Larger Ones?	Yudi Zhang et.al.	2502.19557	null
2025-02-26	CLIP-Optimized Multimodal Image Enhancement via ISP-CNN Fusion for Coal Mine IoVT under Uneven Illumination	Shuai Wang et.al.	2502.19450	null
2025-02-26	Does 3D Gaussian Splatting Need Accurate Volumetric Rendering?	Adam Celarek et.al.	2502.19318	link
2025-02-27	RetinaRegen: A Hybrid Model for Readability and Detail Restoration in Fundus Images	Yuhan Tang et.al.	2502.19153	null
2025-02-26	Max360IQ: Blind Omnidirectional Image Quality Assessment with Multi-axis Attention	Jiebin Yan et.al.	2502.19046	link
2025-02-26	InternVQA: Advancing Compressed Video Quality Assessment with Distilling Large Foundation Model	Fengbin Guan et.al.	2502.19026	null
2025-02-26	Hyperspectral image reconstruction by deep learning with super-Rayleigh speckles	Ziyan Chen et.al.	2502.18777	null
2025-02-25	Is OpenAlex Suitable for Research Quality Evaluation and Which Citation Indicator is Best?	Mike Thelwall et.al.	2502.18427	null
2025-02-25	LAG: LLM agents for Leaderboard Auto Generation on Demanding	Jian Wu et.al.	2502.18209	null
2025-02-25	OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation	Yunpeng Gao et.al.	2502.18041	null
2025-02-25	Towards Better Understanding of Program-of-Thought Reasoning in Cross-Lingual and Multilingual Environments	Patomporn Payoungkhamdee et.al.	2502.17956	null
2025-02-25	Integrating Boosted learning with Differential Evolution (DE) Optimizer: A Prediction of Groundwater Quality Risk Assessment in Odisha	Sonalika Subudhi et.al.	2502.17929	null
2025-02-24	Optimized Memory System Architecture for VESA VDC-M Decoder with Multi-Slice Support	Hannah Yang et.al.	2502.17729	null
2025-02-24	Requirements for Quality Assurance of AI Models for Early Detection of Lung Cancer	Horst K. Hahn et.al.	2502.17639	null
2025-02-25	KV-Edit: Training-Free Image Editing for Precise Background Preservation	Tianrui Zhu et.al.	2502.17363	link
2025-02-24	Motion-Robust T2 Quantification from Gradient Echo MRI with Physics-Informed Deep Learning*	Hannah Eichhorn et.al.	2502.17209	null
2025-02-24	SFLD: Reducing the content bias for AI-generated Image Detection	Seoyeon Gye et.al.	2502.17105	null
2025-02-24	Pleno-Generation: A Scalable Generative Face Video Compression Framework with Bandwidth Intelligence	Bolin Chen et.al.	2502.17085	null
2025-02-24	PQDAST: Depth-Aware Arbitrary Style Transfer for Games via Perceptual Quality-Guided Distillation	Eleftherios Ioannou et.al.	2502.16996	null
2025-02-24	Multi-Dimensional Quality Assessment for Text-to-3D Assets: Dataset and Model	Kang Fu et.al.	2502.16915	null
2025-02-24	CRTrack: Low-Light Semi-Supervised Multi-object Tracking Based on Consistency Regularization	Zijing Zhao et.al.	2502.16809	null
2025-02-23	Automatic Input Rewriting Improves Translation with Large Language Models	Dayeon Ki et.al.	2502.16682	link
2025-02-23	AdverX-Ray: Ensuring X-Ray Integrity Through Frequency-Sensitive Adversarial VAEs	Francisco Caetano et.al.	2502.16610	link
2025-02-22	Multi-Party Data Pricing for Complex Data Trading Markets: A Rubinstein Bargaining Approach	Bing Mi et.al.	2502.16363	null
2025-02-21	Improved Partial Differential Equation and Fast Approximation Algorithm for Hazy/Underwater/Dust Storm Image Enhancement	Uche A. Nnolim et.al.	2502.15986	null
2025-02-21	Evaluate with the Inverse: Efficient Approximation of Latent Explanation Quality Distribution	Carlos Eiras-Franco et.al.	2502.15403	null
2025-02-21	Super-Resolution for Interferometric Imaging: Model Comparisons and Performance Analysis	Hasan Berkay Abdioglu et.al.	2502.15397	null
2025-02-21	Ultrasound Phase Aberrated Point Spread Function Estimation with Convolutional Neural Network: Simulation Study	Wei-Hsiang Shen et.al.	2502.15298	null
2025-02-21	Omnidirectional Image Quality Captioning: A Large-scale Database and A New Model	Jiebin Yan et.al.	2502.15271	link
2025-02-21	Lung-DDPM: Semantic Layout-guided Diffusion Models for Thoracic CT Image Synthesis	Yifan Jiang et.al.	2502.15204	link
2025-02-21	LUMINA-Net: Low-light Upgrade through Multi-stage Illumination and Noise Adaptation Network for Image Enhancement	Namrah Siddiqua et.al.	2502.15186	null
2025-02-21	M3-AGIQA: Multimodal, Multi-Round, Multi-Aspect AI-Generated Image Quality Assessment	Chuan Cui et.al.	2502.15167	null
2025-02-21	Optimized Pap Smear Image Enhancement: Hybrid PMD Filter-CLAHE Using Spider Monkey Optimization	Ach Khozaimi et.al.	2502.15156	null
2025-02-20	Hardware-Friendly Static Quantization Method for Video Diffusion Transformers	Sanghyun Yi et.al.	2502.15077	null
2025-02-20	Multi-Source Static CT with Adaptive Fluence Modulation to Minimize Hallucinations in Generative Reconstructions	Matthew Tivnan et.al.	2502.15060	null
2025-02-20	GS-Cache: A GS-Cache Inference Framework for Large-scale Gaussian Splatting Models	Miao Tao et.al.	2502.14938	null
2025-02-20	Compact Latent Representation for Image Compression (CLRIC)	Ayman A. Ameen et.al.	2502.14937	null
2025-02-20	Benchmarking Multimodal RAG through a Chart-based Document Question-Answering Generation Framework	Yuming Yang et.al.	2502.14864	link
2025-02-20	Towards a Perspectivist Turn in Argument Quality Assessment	Julia Romberg et.al.	2502.14501	link
2025-02-20	Early-Exit and Instant Confidence Translation Quality Estimation	Vilém Zouhar et.al.	2502.14429	link
2025-02-20	NeRF-3DTalker: Neural Radiance Field with 3D Prior Aided Audio Disentanglement for Talking Head Synthesis	Xiaoxing Liu et.al.	2502.14178	null
2025-02-19	A Baseline Method for Removing Invisible Image Watermarks using Deep Image Prior	Hengyue Liang et.al.	2502.13998	link
2025-02-19	Remote Sensing Semantic Segmentation Quality Assessment based on Vision Language Model	Huiying Shi et.al.	2502.13990	null
2025-02-19	A Lightweight Model for Perceptual Image Compression via Implicit Priors	Hao Wei et.al.	2502.13988	null
2025-02-19	An Overall Real-Time Mechanism for Classification and Quality Evaluation of Rice	Wanke Xia et.al.	2502.13764	null
2025-02-19	HawkBench: Investigating Resilience of RAG Methods on Stratified Information-Seeking Tasks	Hongjin Qian et.al.	2502.13465	null
2025-02-19	OGBoost: A Python Package for Ordinal Gradient Boosting	Mansour T. A. Sharabiani et.al.	2502.13456	null
2025-02-18	VUS: Effective and Efficient Accuracy Measures for Time-Series Anomaly Detection	Paul Boniol et.al.	2502.13318	link
2025-02-18	Optimal covering of rectangular grid graphs with tours of constrained length	Sergey Bereg et.al.	2502.13306	null
2025-02-18	Application of Context-dependent Interpretation of Biosignals Recognition to Control a Bionic Multifunctional Hand Prosthesis	Pawel Trajdos et.al.	2502.13301	null
2025-02-18	Enhancing Machine Learning Performance through Intelligent Data Quality Assessment: An Unsupervised Data-centric Framework	Manal Rahal et.al.	2502.13198	null
2025-02-18	GS-QA: Comprehensive Quality Assessment Benchmark for Gaussian Splatting View Synthesis	Pedro Martin et.al.	2502.13196	null
2025-02-18	Language Barriers: Evaluating Cross-Lingual Performance of CNN and Transformer Architectures for Speech Quality Estimation	Wafaa Wardah et.al.	2502.13004	null
2025-02-18	VidCapBench: A Comprehensive Benchmark of Video Captioning for Controllable Text-to-Video Generation	Xinlong Chen et.al.	2502.12782	null
2025-02-18	Efficient Machine Translation Corpus Generation: Integrating Human-in-the-Loop Post-Editing with Large Language Models	Kamer Ali Yuksel et.al.	2502.12755	link
2025-02-18	3D Shape-to-Image Brownian Bridge Diffusion for Brain MRI Synthesis from Cortical Surfaces	Fabian Bongratz et.al.	2502.12742	null
2025-02-18	Translate Smart, not Hard: Cascaded Translation Systems with Quality-Aware Deferral	António Farinhas et.al.	2502.12701	null
2025-02-19	Spherical Dense Text-to-Image Synthesis	Timon Winter et.al.	2502.12691	null
2025-02-18	Design and Implementation of a Dual Uncrewed Surface Vessel Platform for Bathymetry Research under High-flow Conditions	Dinesh Kumar et.al.	2502.12539	null
2025-02-18	Comprehensive Assessment and Analysis for NSFW Content Erasure in Text-to-Image Diffusion Models	Die Chen et.al.	2502.12527	null
2025-02-18	Local Flaw Detection with Adaptive Pyramid Image Fusion Across Spatial Sampling Resolution for SWRs	Siyu You et.al.	2502.12512	null
2025-02-17	Token Communications: A Unified Framework for Cross-modal Context-aware Semantic Communications	Li Qiao et.al.	2502.12096	null
2025-02-17	Low-Rank Thinning	Annabelle Michael Carrell et.al.	2502.12063	null
2025-02-17	MultiFlow: A unified deep learning framework for multi-vessel classification, segmentation and clustering of phase-contrast MRI validated on a multi-site single ventricle patient cohort	Tina Yao et.al.	2502.11993	null
2025-02-17	Deep Spatio-Temporal Neural Network for Air Quality Reanalysis	Ammar Kheder et.al.	2502.11941	link
2025-02-17	No-reference geometry quality assessment for colorless point clouds via list-wise rank learning	Zheng Li et.al.	2502.11726	link
2025-02-17	The Worse The Better: Content-Aware Viewpoint Generation Network for Projection-related Point Cloud Quality Assessment	Zhiyong Su et.al.	2502.11710	link
2025-02-17	Assessing Correctness in LLM-Based Code Generation via Uncertainty Estimation	Arindam Sharma et.al.	2502.11620	null
2025-02-17	Syllables to Scenes: Literary-Guided Free-Viewpoint 3D Scene Synthesis from Japanese Haiku	Chunan Yu et.al.	2502.11586	null
2025-02-18	AI-Assisted Thin Section Image Processing for Pore-Throat Characterization in Tight Clastic Rocks	Muhammad Risha et.al.	2502.11523	null
2025-02-17	Semantically Robust Unsupervised Image Translation for Paired Remote Sensing Images	Sheng Fang et.al.	2502.11468	null
2025-02-17	HellaSwag-Pro: A Large-Scale Bilingual Benchmark for Evaluating the Robustness of LLMs in Commonsense Reasoning	Xiaoyuan Li et.al.	2502.11393	null
2025-02-17	A Physics-Informed Blur Learning Framework for Imaging Systems	Liqun Chen et.al.	2502.11382	link
2025-02-17	LLMs can Perform Multi-Dimensional Analytic Writing Assessments: A Case Study of L2 Graduate-Level Academic English Writing	Zhengxiang Wang et.al.	2502.11368	link
2025-02-16	Generating Skyline Datasets for Data Science Models	Mengying Wang et.al.	2502.11262	null
2025-02-16	Exploiting network optimization stability for enhanced PET image denoising using deep image prior	Fumio Hashimoto et.al.	2502.11259	null
2025-02-16	Are Generative Models Underconfident? An Embarrassingly Simple Quality Estimation Approach	Tu Anh Dinh et.al.	2502.11115	null
2025-02-16	Imaging current flow and injection in scalable graphene devices through NV-magnetometry	Kaj Dockx et.al.	2502.11076	null
2025-02-15	Automatic Quality Assessment of First Trimester Crown-Rump-Length Ultrasound Images	Sevim Cengiz et.al.	2502.10908	null
2025-02-15	AquaScope: Reliable Underwater Image Transmission on Mobile Devices	Beitong Tian et.al.	2502.10891	null
2025-02-15	E-3DGS: Event-Based Novel View Rendering of Large-Scale Scenes Using 3D Gaussian Splatting	Sohaib Zahid et.al.	2502.10827	null
2025-02-14	Large Language Models and Synthetic Data for Monitoring Dataset Mentions in Research Papers	Aivin V. Solatorio et.al.	2502.10263	null
2025-02-14	Step-Video-T2V Technical Report: The Practice, Challenges, and Future of Video Foundation Model	Guoqing Ma et.al.	2502.10248	link
2025-02-14	ProReco: A Process Discovery Recommender System	Tsung-Hao Huang et.al.	2502.10230	null
2025-02-14	RealCam-I2V: Real-World Image-to-Video Generation with Interactive Complex Camera Control	Teng Li et.al.	2502.10059	null
2025-02-14	AffectSRNet : Facial Emotion-Aware Super-Resolution Network	Syed Sameen Ahmad Rizvi et.al.	2502.09932	null
2025-02-14	A Deep Learning Approach to Interface Color Quality Assessment in HCI	Shixiao Wang et.al.	2502.09914	null
2025-02-14	Compression-Aware One-Step Diffusion Model for JPEG Artifact Removal	Jinpei Guo et.al.	2502.09873	link
2025-02-14	Optimizing GPT for Video Understanding: Zero-Shot Performance and Prompt Engineering	Mark Beliaev et.al.	2502.09573	null
2025-02-13	Learned Correction Methods for Ultrasound Computed Tomography Imaging Using Simplified Physics Models	Luke Lozenski et.al.	2502.09546	null
2025-02-13	SQ-GAN: Semantic Image Communications Using Masked Vector Quantization	Francesco Pezone et.al.	2502.09520	link
2025-02-13	A Physics-Informed Deep Learning Model for MRI Brain Motion Correction	Mojtaba Safari et.al.	2502.09296	link
2025-02-13	ConsistentDreamer: View-Consistent Meshes Through Balanced Multi-View Gaussian Optimization	Onat Şahin et.al.	2502.09278	null
2025-02-13	PixLift: Accelerating Web Browsing via AI Upscaling	Yonas Atinafu et.al.	2502.08995	null
2025-02-13	Some problems of developing astrophysical equipment and combining it with optical telescopes	Edward Emelianov et.al.	2502.08992	null
2025-02-13	Dynamic watermarks in images generated by diffusion models	Yunzhuo Chen et.al.	2502.08927	null
2025-02-12	A procedure for assessing of machine health index data prediction quality	Daniel Kuzio et.al.	2502.08837	null
2025-02-12	Ultrasound imaging of cortical bone: cortex geometry and measurement of porosity based on wave speed for bone remodeling estimation	Amadou S. Dia et.al.	2502.08824	null
2025-02-12	Skrr: Skip and Re-use Text Encoder Layers for Memory Efficient Text-to-Image Generation	Hoigi Seo et.al.	2502.08690	null
2025-02-12	Light-A-Video: Training-free Video Relighting via Progressive Light Fusion	Yujie Zhou et.al.	2502.08590	link
2025-02-12	Quality-Aware Decoding: Unifying Quality Estimation and Decoding	Sai Koneru et.al.	2502.08561	null
2025-02-12	A Survey on Image Quality Assessment: Insights, Analysis, and Future Outlook	Chengqian Ma et.al.	2502.08540	null
2025-02-12	TuMag: the tunable magnetograph for the Sunrise III mission	J. C. del Toro Iniesta et.al.	2502.08268	null
2025-02-12	Forward and Inverse Problems in Nonlinear Acoustics	Barbara Kaltenbacher et.al.	2502.08194	null
2025-02-11	Automatic Prostate Volume Estimation in Transabdominal Ultrasound Images	Tiziano Natali et.al.	2502.07859	null
2025-02-11	Magic 1-For-1: Generating One Minute Video Clips within One Minute	Hongwei Yi et.al.	2502.07701	link
2025-02-11	An Improved Optimal Proximal Gradient Algorithm for Non-Blind Image Deblurring	Qingsong Wang et.al.	2502.07602	null
2025-02-13	Enhance-A-Video: Better Generated Video for Free	Yang Luo et.al.	2502.07508	link
2025-02-11	Compound Mask for Divergent Wave Imaging in Medical Ultrasound	Zahraa Alzein et.al.	2502.07453	null
2025-02-11	On Iterative Evaluation and Enhancement of Code Quality Using GPT-4o	Rundong Liu et.al.	2502.07399	link
2025-02-11	USRNet: Unified Scene Recovery Network for Enhancing Traffic Imaging under Multiple Adverse Weather Conditions	Yuxu Lu et.al.	2502.07372	link
2025-02-11	Multi-Task-oriented Nighttime Haze Imaging Enhancer for Vision-driven Measurement Systems	Ai Chen et.al.	2502.07351	link
2025-02-11	Playmate: Flexible Control of Portrait Animation via 3D-Implicit Space Guided Diffusion	Xingpei Ma et.al.	2502.07203	null
2025-02-11	HDCompression: Hybrid-Diffusion Image Compression for Ultra-Low Bitrates	Lei Lu et.al.	2502.07160	null
2025-02-10	Evaluation of Multilingual Image Captioning: How far can we get with CLIP models?	Gonçalo Gomes et.al.	2502.06600	link
2025-02-10	Image Intrinsic Scale Assessment: Bridging the Gap Between Quality and Resolution	Vlad Hosu et.al.	2502.06476	null
2025-02-10	How Humans Help LLMs: Assessing and Incentivizing Human Preference Annotators	Shang Liu et.al.	2502.06387	null
2025-02-10	Guidance-base Diffusion Models for Improving Photoacoustic Image Quality	Tatsuhiro Eguchi et.al.	2502.06354	null
2025-02-10	LANTERN++: Enhanced Relaxed Speculative Decoding with Static Tree Drafting for Visual Auto-regressive Models	Sihwan Park et.al.	2502.06352	link
2025-02-10	A CT Geometry With Multiple Centers Of Rotation For Solving Sparse View Problem	Jiayu Duan et.al.	2502.06125	null
2025-02-10	Token-Domain Multiple Access: Exploiting Semantic Orthogonality for Collision Mitigation	Li Qiao et.al.	2502.06118	null
2025-02-09	Dual Caption Preference Optimization for Diffusion Models	Amir Saeidi et.al.	2502.06023	null
2025-02-09	A Comprehensive Survey on Image Signal Processing Approaches for Low-Illumination Image Enhancement	Muhammad Turab et.al.	2502.05995	null
2025-02-09	Multi-Branch Collaborative Learning Network for Video Quality Assessment in Industrial Video Search	Hengzhu Tang et.al.	2502.05924	null
2025-02-09	Devil is in the Details: Density Guidance for Detail-Aware Generation with Flow Models	Rafał Karczewski et.al.	2502.05807	null
2025-02-08	Semantic-Aware Adaptive Video Streaming Using Latent Diffusion Models for Wireless Networks	Zijiang Yan et.al.	2502.05695	null
2025-02-08	FreeBlend: Advancing Concept Blending with Staged Feedback-Driven Interpolation Diffusion	Yufan Zhou et.al.	2502.05606	null
2025-02-07	Distillation and Pruning for Scalable Self-Supervised Representation-Based Speech Quality Assessment	Benjamin Stahl et.al.	2502.05356	link
2025-02-07	AuraFusion360: Augmented Unseen Region Alignment for Reference-based 360° Unbounded Scene Inpainting	Chung-Ho Wu et.al.	2502.05176	null
2025-02-07	Meta Audiobox Aesthetics: Unified Automatic Quality Assessment for Speech, Music, and Sound	Andros Tjandra et.al.	2502.05139	link
2025-02-07	Cached Multi-Lora Composition for Multi-Concept Image Generation	Xiandong Zou et.al.	2502.04923	link
2025-02-07	Integration Concept of the CBM Micro Vertex Detector	Franz Matejcek et.al.	2502.04858	null
2025-02-06	ADIFF: Explaining audio difference using natural language	Soham Deshmukh et.al.	2502.04476	link
2025-02-05	DreamDPO: Aligning Text-to-3D Generation with Human Preferences via Direct Preference Optimization	Zhenglin Zhou et.al.	2502.04370	null
2025-02-06	BOUQuET: dataset, Benchmark and Open initiative for Universal Quality Evaluation in Translation	The Omnilingual MT Team et.al.	2502.04314	null
2025-02-06	Content-Rich AIGC Video Quality Assessment via Intricate Text Alignment and Motion-Aware Consistency	Shangkun Sun et.al.	2502.04076	link
2025-02-06	DICE: Distilling Classifier-Free Guidance into Text Embeddings	Zhenyu Zhou et.al.	2502.03726	null
2025-02-05	Quasi-Monte Carlo Methods: What, Why, and How?	Fred J. Hickernell et.al.	2502.03644	null
2025-02-05	Efficient Image Restoration via Latent Consistency Flow Matching	Elad Cohen et.al.	2502.03500	null
2025-02-05	A new method for structural diagnostics with muon tomography and deep learning	Lorenzo Pezzotti et.al.	2502.03339	null
2025-02-05	A Framework for Measuring the Quality of Infrastructure-as-Code Scripts	Pandu Ranga Reddy Konala et.al.	2502.03127	null
2025-02-05	Poisson Flow Joint Model for Multiphase contrast-enhanced CT	Rongjun Ge et.al.	2502.03079	null
2025-02-05	A Decade of Action Quality Assessment: Largest Systematic Survey of Trends, Challenges, and Future Directions	Hao Yin et.al.	2502.02817	null
2025-02-04	Muographic Image Upsampling with Machine Learning for Built Infrastructure Applications	William O'Donnell et.al.	2502.02624	null
2025-02-04	A comparison of translation performance between DeepL and Supertext	Alex Flückiger et.al.	2502.02577	link
2025-02-04	Privacy Attacks on Image AutoRegressive Models	Antoni Kowalczuk et.al.	2502.02514	link
2025-02-04	VideoJAM: Joint Appearance-Motion Representations for Enhanced Motion Generation in Video Models	Hila Chefer et.al.	2502.02492	null
2025-02-04	High-Fidelity Human Avatars from Laptop Webcams using Edge Compute	Akash Haridas et.al.	2502.02468	null
2025-02-04	Exploring the Feasibility of AI-Assisted Spine MRI Protocol Optimization Using DICOM Image Metadata	Alice Vian et.al.	2502.02351	null
2025-02-04	When Dimensionality Hurts: The Role of LLM Embedding Compression for Noisy Regression Tasks	Felix Drinkall et.al.	2502.02199	link
2025-02-04	PALQA: A Novel Parameterized Position-Aware Lossy Quantum Autoencoder using LSB Control Qubit for Efficient Image Compression	Ershadul Haque et.al.	2502.02188	null
2025-02-05	IPO: Iterative Preference Optimization for Text-to-Video Generation	Xiaomeng Yang et.al.	2502.02088	null
2025-02-03	Spectra of He isotopes and the $^3$He/$^4$ He ratio	M. J. Boschini et.al.	2502.01887	null
2025-02-03	Sparse Measurement Medical CT Reconstruction using Multi-Fused Block Matching Denoising Priors	Maliha Hossain et.al.	2502.01832	null
2025-02-03	Generating Multi-Image Synthetic Data for Text-to-Image Customization	Nupur Kumari et.al.	2502.01720	null
2025-02-03	CLIP-DQA: Blindly Evaluating Dehazed Images from Global and Local Perspectives Using CLIP	Yirui Zeng et.al.	2502.01707	null
2025-02-03	Proposal and Evaluation of a Practical CBCT Dose Optimization Method	S. Gros et.al.	2502.01509	null
2025-02-03	Human Body Restoration with One-Step Diffusion Model and A New Benchmark	Jue Gong et.al.	2502.01411	null
2025-02-03	Explainability-Driven Quality Assessment for Rule-Based Systems	Oshani Seneviratne et.al.	2502.01253	null
2025-02-03	Imaging simulation of a dual-panel PET geometry with ultrafast TOF detectors	Taiyo Ishikawa et.al.	2502.01006	null
2025-02-02	Weak Supervision Dynamic KL-Weighted Diffusion Models Guided by Large Language Models	Julian Perry et.al.	2502.00826	null
2025-02-02	EmoTalkingGaussian: Continuous Emotion-conditioned Talking Head Synthesis	Junuk Cha et.al.	2502.00654	null
2025-02-01	Deep Task-Based Beamforming and Channel Data Augmentations for Enhanced Ultrasound Imaging	Ariel Amar et.al.	2502.00524	null
2025-02-01	A framework for river connectivity classification using temporal image processing and attention based neural networks	Timothy James Becker et.al.	2502.00474	null
2025-01-31	Trust and Trustworthiness from Human-Centered Perspective in HRI -- A Systematic Literature Review	Debora Firmino de Souza et.al.	2501.19323	null
2025-01-31	Inference-Time Text-to-Video Alignment with Diffusion Latent Beam Search	Yuta Oshima et.al.	2501.19252	null
2025-01-31	Ambient Denoising Diffusion Generative Adversarial Networks for Establishing Stochastic Object Models from Noisy Image Data	Xichen Xu et.al.	2501.19094	null
2025-01-31	OmniPhysGS: 3D Constitutive Gaussians for General Physics-Based Dynamics Generation	Yuchen Lin et.al.	2501.18982	null
2025-01-31	Distorting Embedding Space for Safety: A Defense Mechanism for Adversarially Robust Diffusion Models	Jaesin Ahn et.al.	2501.18877	link
2025-01-29	Fake News Detection After LLM Laundering: Measurement and Explanation	Rupak Kumar Das et.al.	2501.18649	link
2025-01-31	Task-based Regularization in Penalized Least-Squares for Binary Signal Detection Tasks in Medical Image Denoising	Wentao Chen et.al.	2501.18418	null
2025-01-30	Adaptive Video Streaming with AI-Based Optimization for Dynamic Network Conditions	Mohammad Tarik et.al.	2501.18332	null
2025-01-30	AGAV-Rater: Adapting Large Multimodal Model for AI-Generated Audio-Visual Quality Assessment	Yuqin Cao et.al.	2501.18314	null
2025-02-03	Efficient Feature Fusion for UAV Object Detection	Xudong Wang et.al.	2501.17983	link
2025-01-29	Discrete Dielectric Coatings for Length Control and Tunability of Half-Wave Dipole Antennas at 300 MHz Magnetic Resonance Imaging Applications	Aditya A Bhosale et.al.	2501.17954	null
2025-01-29	Leveraging In-Context Learning and Retrieval-Augmented Generation for Automatic Question Generation in Educational Domains	Subhankar Maity et.al.	2501.17397	null
2025-01-29	On the Coexistence and Ensembling of Watermarks	Aleksandar Petrov et.al.	2501.17356	link
2025-01-28	Giving the Old a Fresh Spin: Quality Estimation-Assisted Constrained Decoding for Automatic Post-Editing	Sourabh Deoghare et.al.	2501.17265	null
2025-01-27	Audio Large Language Models Can Be Descriptive Speech Quality Evaluators	Chen Chen et.al.	2501.17202	null
2025-01-31	IC-Portrait: In-Context Matching for View-Consistent Personalized Portrait	Han Yang et.al.	2501.17159	null
2025-01-28	Three-Dimensional Diffusion-Weighted Multi-Slab MRI With Slice Profile Compensation Using Deep Energy Model	Reza Ghorbani et.al.	2501.17152	null
2025-01-28	Evaluating CrowdSplat: Perceived Level of Detail for Gaussian Crowds	Xiaohan Sun et.al.	2501.17085	null
2025-01-28	EdgeMLOps: Operationalizing ML models with Cumulocity IoT and thin-edge.io for Visual quality Inspection	Kanishk Chaturvedi et.al.	2501.17062	null
2025-01-28	EZOA: Nançay HI follow-up observations in the Zone of Avoidance	A. C. Schröder et.al.	2501.17038	null
2025-01-28	Image-Space Gridding for Nonrigid Motion-Corrected MR Image Reconstruction	Kwang Eun Jang et.al.	2501.16713	null
2025-01-25	MambaTron: Efficient Cross-Modal Point Cloud Enhancement using Aggregate Selective State Space Modeling	Sai Tarun Inaganti et.al.	2501.16384	null
2025-01-27	Adaptive Iterative Compression for High-Resolution Files: an Approach Focused on Preserving Visual Quality in Cinematic Workflows	Leonardo Melo et.al.	2501.16319	null
2025-01-27	UDBE: Unsupervised Diffusion-based Brightness Enhancement in Underwater Images	Tatiana Taís Schein et.al.	2501.16211	link
2025-01-27	Skeleton-Guided-Translation: A Benchmarking Framework for Code Repository Translation with Fine-Grained Quality Evaluation	Xing Zhang et.al.	2501.16050	null
2025-01-30	Can Location Embeddings Enhance Super-Resolution of Satellite Imagery?	Daniel Panangian et.al.	2501.15847	null
2025-01-26	Advancing quantum imaging through learning theory	Yunkai Wang et.al.	2501.15685	null
2025-01-26	Radiologist-in-the-Loop Self-Training for Generalizable CT Metal Artifact Reduction	Chenglong Ma et.al.	2501.15610	link
2025-01-26	Differentiable Low-computation Global Correlation Loss for Monotonicity Evaluation in Quality Assessment	Yipeng Liu et.al.	2501.15485	null
2025-01-25	Image formation theory of optical coherence tomography with optical aberrations and its application for computational aberration correction	Shuichi Makita et.al.	2501.15011	null
2025-01-24	SyncAnimation: A Real-Time End-to-End Framework for Audio-Driven Human Pose and Talking Head Animation	Yujian Liu et.al.	2501.14646	null
2025-01-24	WanJuanSiLu: A High-Quality Open-Source Webtext Dataset for Low-Resource Languages	Jia Yu et.al.	2501.14506	link
2025-01-24	Enhancing Intelligibility for Generative Target Speech Extraction via Joint Optimization with Target Speaker ASR	Hao Ma et.al.	2501.14477	null
2025-01-24	Deep Learning-Powered Classification of Thoracic Diseases in Chest X-Rays	Yiming Lei et.al.	2501.14279	null
2025-01-24	CDI: Blind Image Restoration Fidelity Evaluation based on Consistency with Degraded Image	Xiaojun Tang et.al.	2501.14264	null
2025-01-24	GreedyPixel: Fine-Grained Black-Box Adversarial Attack Via Greedy Algorithm	Hanrui Wang et.al.	2501.14230	null
2025-01-24	Sparse Mixture-of-Experts for Non-Uniform Noise Reduction in MRI Images	Zeyun Deng et.al.	2501.14198	null
2025-01-24	VideoShield: Regulating Diffusion-based Video Generation Models via Watermarking	Runyi Hu et.al.	2501.14195	link
2025-01-23	AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models	Yang Fan et.al.	2501.13983	null
2025-01-23	Improving Video Generation with Human Feedback	Jie Liu et.al.	2501.13918	null
2025-01-23	VARFVV: View-Adaptive Real-Time Interactive Free-View Video Streaming with Edge Computing	Qiang Hu et.al.	2501.13630	null
2025-01-23	Diffusion-based Perceptual Neural Video Compression with Temporal Diffusion Information Reuse	Wenzhuo Ma et.al.	2501.13528	null
2025-01-23	LDR-Net: A Novel Framework for AI-generated Image Detection via Localized Discrepancy Representation	JiaXin Chen et.al.	2501.13475	null
2025-01-23	From Images to Point Clouds: An Efficient Solution for Cross-media Blind Quality Assessment without Annotated Training	Yipeng Liu et.al.	2501.13387	null
2025-01-23	Enhanced Extractor-Selector Framework and Symmetrization Weighted Binary Cross-Entropy for Edge Detections	Hao Shu et.al.	2501.13365	null
2025-01-22	UniRestore: Unified Perceptual and Task-Oriented Image Restoration Model Using Diffusion Prior	I-Hsiang Chen et.al.	2501.13134	null
2025-01-23	Accelerate High-Quality Diffusion Models with Inner Loop Feedback	Matthew Gwilliam et.al.	2501.13107	null
2025-01-22	Real-time Terahertz Compressive Optical-Digital Neural Network Imaging	Shao-Hsuan Wu et.al.	2501.13065	null
2025-01-22	Sketch and Patch: Efficient 3D Gaussian Representation for Man-Made Scenes	Yuang Shi et.al.	2501.13045	null
2025-01-22	Characterizing Collective Efforts in Content Sharing and Quality Control for ADHD-relevant Content on Video-sharing Platforms	Hanxiu 'Hazel' Zhu et.al.	2501.13020	null
2025-01-22	Paper Quality Assessment based on Individual Wisdom Metrics from Open Peer Review	Andrii Zahorodnii et.al.	2501.13014	null
2025-01-22	SoundSpring: Loss-Resilient Audio Transceiver with Dual-Functional Masked Language Modeling	Shengshi Yao et.al.	2501.12696	null
2025-01-22	Approximate Puzzlepiece Compositing	Xuan Huang et.al.	2501.12581	null
2025-01-21	Interaction Dataset of Autonomous Vehicles with Traffic Lights and Signs	Zheng Li et.al.	2501.12536	null
2025-01-21	Bidirectional Brain Image Translation using Transfer Learning from Generic Pre-trained Models	Fatima Haimour et.al.	2501.12488	null
2025-01-21	DiffDoctor: Diagnosing Image Diffusion Models Before Treating	Yiyang Wang et.al.	2501.12382	null
2025-01-21	Regressor-Guided Image Editing Regulates Emotional Response to Reduce Online Engagement	Christoph Gebhardt et.al.	2501.12289	null
2025-01-21	A Dynamic Programming Framework for Generating Approximately Diverse and Optimal Solutions	Waldo Gálvez et.al.	2501.12261	null
2025-01-21	Joint Reconstruction and Motion Estimation in Sparse-View 4DCT Using Diffusion Models within a Blind Inverse Problem Framework	Antoine De Paepe et.al.	2501.12249	null
2025-01-21	DLEN: Dual Branch of Transformer for Low-Light Image Enhancement in Dual Domains	Junyu Xia et.al.	2501.12235	null
2025-01-21	RL-RC-DoT: A Block-level RL agent for Task-Aware Video Compression	Uri Gadot et.al.	2501.12216	null
2025-01-21	Fast-RF-Shimming: Accelerate RF Shimming in 7T MRI using Deep Learning	Zhengyi Lu et.al.	2501.12157	null
2025-01-21	A Multi-annotated and Multi-modal Dataset for Wide-angle Video Quality Assessment	Bo Hu et.al.	2501.12082	null
2025-01-22	GSVC: Efficient Video Representation and Compression Through 2D Gaussian Splatting	Longan Wang et.al.	2501.12060	null
2025-01-21	Power Amplifier-Aware Transmit Power Optimization for OFDM and SC-FDMA Systems	Pawel Kryszkiewicz et.al.	2501.11994	null
2025-01-21	Bayesian Despeckling of Structured Sources	Ali Zafari et.al.	2501.11860	null
2025-01-20	EfficientVITON: An Efficient Virtual Try-On Model using Optimized Diffusion Process	Mostafa Atef et.al.	2501.11776	null
2025-01-20	Teaching Large Language Models to Regress Accurate Image Quality Scores using Score Distribution	Zhiyuan You et.al.	2501.11561	null
2025-01-20	Fundus Image Quality Assessment and Enhancement: a Systematic Review	Heng Li et.al.	2501.11520	null
2025-01-20	Multitask Auxiliary Network for Perceptual Quality Assessment of Non-Uniformly Distorted Omnidirectional Images	Jiebin Yan et.al.	2501.11512	link
2025-01-20	Subjective and Objective Quality Assessment of Non-Uniformly Distorted Omnidirectional Images	Jiebin Yan et.al.	2501.11511	link
2025-01-20	See In Detail: Enhancing Sparse-view 3D Gaussian Splatting with Local Depth and Semantic Regularization	Zongqi He et.al.	2501.11508	null
2025-01-20	Advancing Oyster Phenotype Segmentation with Multi-Network Ensemble and Multi-Scale mechanism	Wenli Yang et.al.	2501.11203	null
2025-01-19	Unit Region Encoding: A Unified and Compact Geometry-aware Representation for Floorplan Applications	Huichao Zhang et.al.	2501.11097	null
2025-01-18	EMO2: End-Effector Guided Audio-Driven Avatar Video Generation	Linrui Tian et.al.	2501.10687	null
2025-01-17	Fundamental mode power estimation through a $M^2$ -measurement	Filipp Lausch et.al.	2501.10345	null
2025-01-17	DiffStereo: High-Frequency Aware Diffusion Model for Stereo Image Restoration	Huiyun Cao et.al.	2501.10325	null
2025-01-17	CSHNet: A Novel Information Asymmetric Image Translation Method	Xi Yang et.al.	2501.10197	link
2025-01-17	DiffVSR: Enhancing Real-World Video Super-Resolution with Diffusion Models for Advanced Visual Quality and Temporal Consistency	Xiaohui Li et.al.	2501.10110	null
2025-01-17	CLIP-PCQA: Exploring Subjective-Aligned Vision-Language Modeling for Point Cloud Quality Assessment	Yating Liu et.al.	2501.10071	link
2025-01-17	One-D-Piece: Image Tokenizer Meets Quality-Controllable Compression	Keita Miwa et.al.	2501.10064	null
2025-01-17	CaFA: Cost-aware, Feasible Attacks With Database Constraints Against Neural Tabular Classifiers	Matan Ben-Tov et.al.	2501.10013	link
2025-01-17	IE-Bench: Advancing the Measurement of Text-Driven Image Editing for Human Perception Alignment	Shangkun Sun et.al.	2501.09927	null
2025-01-17	Decoding Patterns of Data Generation Teams for Clinical and Scientific Success: Insights from the Bridge2AI Talent Knowledge Graph	Jiawei Xu et.al.	2501.09897	null
2025-01-16	EraseBench: Understanding The Ripple Effects of Concept Erasure Techniques	Ibtihel Amara et.al.	2501.09833	null
2025-01-16	Scan-Adaptive MRI Undersampling Using Neighbor-based Optimization (SUNO)	Siddhant Gautam et.al.	2501.09799	link
2025-01-16	Evaluating Conversational Recommender Systems with Large Language Models: A User-Centric Evaluation Framework	Nuo Chen et.al.	2501.09493	null
2025-01-16	Joint Transmission and Deblurring: A Semantic Communication Approach Using Events	Pujing Yang et.al.	2501.09396	null
2025-01-16	PATCHEDSERVE: A Patch Management Framework for SLO-Optimized Hybrid Resolution Diffusion Serving	Desen Sun et.al.	2501.09253	null
2025-01-16	Estimating Task-based Performance Bounds for Accelerated MRI Image Reconstruction Methods by Use of Learned-Ideal Observers	Kaiyan Li et.al.	2501.09224	null
2025-01-15	UNIR-Net: A Novel Approach for Restoring Underwater Images with Non-Uniform Illumination Using Synthetic Data	Ezequiel Perez-Zarate et.al.	2501.09053	link
2025-01-15	Lights, Camera, Matching: The Role of Image Illumination in Fair Face Recognition	Gabriella Pangelinan et.al.	2501.08910	null
2025-01-15	XMusic: Towards a Generalized and Controllable Symbolic Music Generation Framework	Sida Tian et.al.	2501.08809	null
2025-01-16	Holoview: Interactive 3D visualization of medical data in AR	Pankaj Kaushik et.al.	2501.08736	null
2025-01-15	DynamicFace: High-Quality and Consistent Video Face Swapping using Composable 3D Facial Priors	Runqi Wang et.al.	2501.08553	null
2025-01-15	Comprehensive Subjective and Objective Evaluation Method for Text-generated Video	Zelu Qi et.al.	2501.08545	null
2025-01-14	Head Motion Degrades Machine Learning Classification of Alzheimer's Disease from Positron Emission Tomography	Eléonore V. Lieffrig et.al.	2501.08459	null
2025-01-14	Vchitect-2.0: Parallel Transformer for Scaling Up Video Diffusion Models	Weichen Fan et.al.	2501.08453	null
2025-01-14	Cross-Modal Transferable Image-to-Video Attack on Video Quality Metrics	Georgii Gotin et.al.	2501.08415	link
2025-01-14	Rolling phase modulation regime for dynamic full field OCT	Tual Monfort et.al.	2501.08359	null
2025-01-15	Optical information encryption using general temporal ghost imaging with practical experimental condition	Juan Wu et.al.	2501.08136	null
2025-01-13	Evaluating Human Perception of Novel View Synthesis: Subjective Quality Assessment of Gaussian Splatting and NeRF in Dynamic Scenes	Yuhang Zhang et.al.	2501.08072	null
2025-01-14	VENOM: Text-driven Unrestricted Adversarial Example Generation with Diffusion Models	Hui Kuurila-Zhang et.al.	2501.07922	link
2025-01-14	Demographic Variability in Face Image Quality Measures	Wassim Kabbani et.al.	2501.07898	null
2025-01-14	State-of-the-Art Transformer Models for Image Super-Resolution: Techniques, Challenges, and Applications	Debasish Dutta et.al.	2501.07855	null
2025-01-13	FaceOracle: Chat with a Face Image Oracle	Wassim Kabbani et.al.	2501.07202	null
2025-01-13	Radial Distortion in Face Images: Detection and Impact	Wassim Kabbani et.al.	2501.07179	null
2025-01-13	Eye Sclera for Fair Face Image Quality Assessment	Wassim Kabbani et.al.	2501.07158	null
2025-01-13	Privacy-Preserving Data Quality Assessment for Time-Series IoT Sensors	Novoneel Chakraborty et.al.	2501.07154	null
2025-01-13	Video Quality Assessment for Online Processing: From Spatial to Temporal Sampling	Jiebin Yan et.al.	2501.07087	null
2025-01-12	Real-Time Neural-Enhancement for Online Cloud Gaming	Shan Jiang et.al.	2501.06880	null
2025-01-14	Generalized and Efficient 2D Gaussian Splatting for Arbitrary-scale Super-Resolution	Du Chen et.al.	2501.06838	link
2025-01-11	NVS-SQA: Exploring Self-Supervised Quality Representation Learning for Neurally Synthesized Scenes without References	Qiang Qu et.al.	2501.06488	link
2025-01-10	VideoAuteur: Towards Long Narrative Video Generation	Junfei Xiao et.al.	2501.06173	null
2025-01-10	CamCtrl3D: Single-Image Scene Exploration with Precise 3D Camera Control	Stefan Popov et.al.	2501.06006	null
2025-01-10	Universal-2-TF: Robust All-Neural Text Formatting for ASR	Yash Khare et.al.	2501.05948	null
2025-01-10	UltraRay: Full-Path Ray Tracing for Enhancing Realism in Ultrasound Simulation	Felix Duelmer et.al.	2501.05828	null
2025-01-13	AI-Driven Diabetic Retinopathy Screening: Multicentric Validation of AIDRSS in India	Amit Kr Dey et.al.	2501.05826	null
2025-01-10	Conditional Diffusion Model for Electrical Impedance Tomography	Duanpeng Shi et.al.	2501.05769	null
2025-01-10	LLVD: LSTM-based Explicit Motion Modeling in Latent Space for Blind Video Denoising	Loay Rashid et.al.	2501.05744	null
2025-01-10	FIRM: Federated Image Reconstruction using Multimodal Tomographic Data	Geunyeong Byeon et.al.	2501.05642	null
2025-01-09	Interpretable deep learning illuminates multiple structures fluorescence imaging: a path toward trustworthy artificial intelligence in microscopy	Mingyang Chen et.al.	2501.05490	null
2025-01-09	Consistent Flow Distillation for Text-to-3D Generation	Runjie Yan et.al.	2501.05445	null
2025-01-09	Scaffold-SLAM: Structured 3D Gaussians for Simultaneous Localization and Photorealistic Mapping	Wen Tianci et.al.	2501.05242	null
2025-01-09	3DIS-FLUX: simple and efficient multi-instance generation with DiT rendering	Dewei Zhou et.al.	2501.05131	null
2025-01-09	TipSegNet: Fingertip Segmentation in Contactless Fingerprint Imaging	Laurenz Ruzicka et.al.	2501.05076	null
2025-01-09	Towards Fingerprint Mosaicking Artifact Detection: A Self-Supervised Deep Learning Approach	Laurenz Ruzicka et.al.	2501.05034	null
2025-01-08	Enhancing Virtual Try-On with Synthetic Pairs and Error-Aware Noise Scheduling	Nannan Li et.al.	2501.04666	null
2025-01-08	Enhancing Low-Cost Video Editing with Lightweight Adaptors and Temporal-Aware Inversion	Yangfan He et.al.	2501.04606	link
2025-01-08	When LLMs Struggle: Reference-less Translation Evaluation for Low-resource Languages	Archchana Sindhujan et.al.	2501.04473	null
2025-01-08	Enhancing kidney quality assessment: Power Doppler during normothermic machine perfusion	Yitian Fang et.al.	2501.04457	null
2025-01-08	iFADIT: Invertible Face Anonymization via Disentangled Identity Transform	Lin Yuan et.al.	2501.04390	null
2025-01-08	DGQ: Distribution-Aware Group Quantization for Text-to-Image Diffusion Models	Hyogon Ryu et.al.	2501.04304	link
2025-01-07	Spatiotemporal Gaussian Optimization for 4D Cone Beam CT Reconstruction from Sparse Projections	Yabo Fu et.al.	2501.04140	link
2025-01-07	Motion-Aware Generative Frame Interpolation	Guozhen Zhang et.al.	2501.03699	null
2025-01-07	Action Quality Assessment via Hierarchical Pose-guided Multi-stage Contrastive Regression	Mengshi Qi et.al.	2501.03674	link
2025-01-07	Deep Learning-based Compression Detection for explainable Face Image Quality Assessment	Laurin Jonientz et.al.	2501.03619	link
2025-01-07	A generative approach for lensless imaging in low-light conditions	Ziyang Liu et.al.	2501.03511	null
2025-01-07	Can Deep Learning Trigger Alerts from Mobile-Captured Images?	Pritisha Sarkar et.al.	2501.03499	null
2025-01-06	A Trust-Guided Approach to MR Image Reconstruction with Side Information	Arda Atalık et.al.	2501.03021	link
2025-01-06	Quality Estimation based Feedback Training for Improving Pronoun Translation	Harshit Dhankhar et.al.	2501.03008	null
2025-01-06	GLFC: Unified Global-Local Feature and Contrast Learning with Mamba-Enhanced UNet for Synthetic CT Generation from CBCT	Xianhao Zhou et.al.	2501.02992	link
2025-01-06	Region of Interest based Medical Image Compression	Utkarsh Prakash Srivastava et.al.	2501.02895	null
2025-01-06	COph100: A comprehensive fundus image registration dataset from infants constituting the "RIDIRP" database	Yan Hu et.al.	2501.02800	null
2025-01-06	Ultrasound-QBench: Can LLMs Aid in Quality Assessment of Ultrasound Imaging?	Hongyi Miao et.al.	2501.02751	null
2025-01-06	Brick-Diffusion: Generating Long Videos with Brick-to-Wall Denoising	Yunlong Yuan et.al.	2501.02741	null
2025-01-06	Artificial Intelligence in Creative Industries: Advances Prior to 2025	Nantheera Anantrasirichai et.al.	2501.02725	null
2025-01-06	Multilevel Semantic-Aware Model for AI-Generated Video Quality Assessment	Jiaze Li et.al.	2501.02706	null
2025-01-05	DepthMaster: Taming Diffusion Models for Monocular Depth Estimation	Ziyang Song et.al.	2501.02576	link
2025-01-05	Multi-LLM Collaborative Caption Generation in Scientific Documents	Jaeyoung Kim et.al.	2501.02552	link
2025-01-05	Pixel-Wise Feature Selection for Perceptual Edge Detection without post-processing	Hao Shu et.al.	2501.02534	null
2025-01-07	ACE++: Instruction-Based Image Creation and Editing via Context-Aware Content Filling	Chaojie Mao et.al.	2501.02487	null
2025-01-05	Reducing the Gap Between Pretrained Speech Enhancement and Recognition Models Using a Real Speech-Trained Bridging Module	Zhongjian Cui et.al.	2501.02452	null
2025-01-05	Journey into Automation: Image-Derived Pavement Texture Extraction and Evaluation	Bingjie Lu et.al.	2501.02414	null
2025-01-04	Optimizing Audio Compression Through Entropy-Controlled Dithering	Ellison Murray et.al.	2501.02293	null
2025-01-04	TDM: Temporally-Consistent Diffusion Model for All-in-One Real-World Video Restoration	Yizhou Li et.al.	2501.02269	null
2025-01-04	Exploring Secure Machine Learning Through Payload Injection and FGSM Attacks on ResNet-50	Umesh Yadav et.al.	2501.02147	null
2025-01-03	JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing	Qili Wang et.al.	2501.01798	link
2025-01-03	Multi-modal classification of forest biodiversity potential from 2D orthophotos and 3D airborne laser scanning point clouds	Simon B. Jensen et.al.	2501.01728	null
2025-01-03	Aesthetic Matters in Music Perception for Image Stylization: A Emotion-driven Music-to-Visual Manipulation	Junjie Xu et.al.	2501.01700	null
2025-01-02	A Metasemantic-Metapragmatic Framework for Taxonomizing Multimodal Communicative Alignment	Eugene Yu Ji et.al.	2501.01535	null
2025-01-02	Embedding Similarity Guided License Plate Super Resolution	Abderrezzaq Sendjasni et.al.	2501.01483	null
2024-12-31	Estimation of 3T MR images from 1.5T images regularized with Physics based Constraint	Prabhjot Kaur et.al.	2501.01464	null
2024-12-31	GDSR: Global-Detail Integration through Dual-Branch Network with Wavelet Losses for Remote Sensing Image Super-Resolution	Qiwei Zhu et.al.	2501.01460	null
2025-01-02	ScarNet: A Novel Foundation Model for Automated Myocardial Scar Quantification from LGE in Cardiac MRI	Neda Tavakoli et.al.	2501.01372	link
2025-01-02	TexAVi: Generating Stereoscopic VR Video Clips from Text Descriptions	Vriksha Srihari et.al.	2501.01156	null
2025-01-02	HarmonyIQA: Pioneering Benchmark and Model for Image Harmonization Quality Assessment	Zitong Xu et.al.	2501.01116	null
2025-01-02	Generalized Task-Driven Medical Image Quality Enhancement with Gradient Promotion	Dong Zhang et.al.	2501.01114	null
2025-01-02	EliGen: Entity-Level Controlled Image Generation with Regional Attention	Hong Zhang et.al.	2501.01097	link
2025-01-02	Enhancing Precision of Automated Teller Machines Network Quality Assessment: Machine Learning and Multi Classifier Fusion Approaches	Alireza Safarzadeh et.al.	2501.01067	null
2025-01-01	Deconstructing the emission order of protons, neutrons and $α$-particles following fusion in $^{28,30,32}$Si + $^{28}$ Si	Rohit Kumar et.al.	2501.00963	null
2025-01-01	Enhancing Early Diabetic Retinopathy Detection through Synthetic DR1 Image Generation: A StyleGAN3 Approach	Sagarnil Das et.al.	2501.00954	null
2025-01-01	SPADE: Enhancing Adaptive Cyber Deception Strategies with Generative AI and Structured Prompt Engineering	Shihab Ahmed et.al.	2501.00940	null
2025-01-01	Hierarchical Vision-Language Alignment for Text-to-Image Generation via Diffusion Models	Emily Johnson et.al.	2501.00917	null
2025-01-01	Text2Earth: Unlocking Text-driven Remote Sensing Image Generation with a Global-Scale Dataset and a Foundation Model	Chenyang Liu et.al.	2501.00895	null
2025-01-01	RORem: Training a Robust Object Remover with Human-in-the-Loop	Ruibin Li et.al.	2501.00740	link
2024-12-31	Token Pruning for Caching Better: 9 Times Acceleration on Stable Diffusion for Free	Evelyn Zhang et.al.	2501.00375	link
2024-12-31	SG-Splatting: Accelerating 3D Gaussian Splatting with Spherical Gaussians	Yiwen Wang et.al.	2501.00342	null
2024-12-31	Improving image quality of the Solar Disk Imager (SDI) of the Lyman-alpha Solar Telescope (LST) onboard the ASO-S mission	Hui Liu et.al.	2501.00231	null
2024-12-30	What Makes for a Good Stereoscopic Image?	Netanel Y. Tamir et.al.	2412.21127	null
2024-12-30	VisionReward: Fine-Grained Multi-Dimensional Human Preference Learning for Image and Video Generation	Jiazheng Xu et.al.	2412.21059	link
2024-12-30	DDIM sampling for Generative AIBIM, a faster intelligent structural design framework	Zhili He et.al.	2412.20899	null
2024-12-30	Acquisition-Independent Deep Learning for Quantitative MRI Parameter Estimation using Neural Controlled Differential Equations	Daan Kuppens et.al.	2412.20844	null
2024-12-30	4D Gaussian Splatting: Modeling Dynamic Scenes with Native 4D Primitives	Zeyu Yang et.al.	2412.20720	null
2024-12-29	Single-image reflection removal via self-supervised diffusion models	Zhengyang Lu et.al.	2412.20466	null
2024-12-29	ESVQA: Perceptual Quality Assessment of Egocentric Spatial Videos	Xilei Zhu et.al.	2412.20423	null
2024-12-29	Bringing Objects to Life: 4D generation from 3D objects	Ohad Rahamim et.al.	2412.20422	null
2024-12-28	An Ordinary Differential Equation Sampler with Stochastic Start for Diffusion Bridge Models	Yuang Wang et.al.	2412.19992	null
2024-12-27	Structural Similarity in Deep Features: Image Quality Assessment Robust to Geometrically Disparate Reference	Keke Zhang et.al.	2412.19553	null
2024-12-30	DrivingWorld: Constructing World Model for Autonomous Driving via Video GPT	Xiaotao Hu et.al.	2412.19505	link
2024-12-27	RAIN: Real-time Animation of Infinite Video Stream	Zhilei Shu et.al.	2412.19489	null
2024-12-27	Generative Adversarial Network on Motion-Blur Image Restoration	Zhengdong Li et.al.	2412.19479	null
2024-12-27	Adrenaline: Adaptive Rendering Optimization System for Scalable Cloud Gaming	Jin Heo et.al.	2412.19446	null
2024-12-27	The Hobby-Eberly Telescope Dark Energy Experiment Survey (HETDEX) Active Galactic Nuclei Catalog: the Fourth Data Release	Chenxu Liu et.al.	2412.19414	null
2024-12-26	Reflective Gaussian Splatting	Yuxuan Yao et.al.	2412.19282	null
2024-12-26	FineVQ: Fine-Grained User Generated Content Video Quality Assessment	Huiyu Duan et.al.	2412.19238	null
2024-12-26	FACEMUG: A Multimodal Generative and Fusion Framework for Local Facial Editing	Wanglong Lu et.al.	2412.19009	null
2024-12-25	TINQ: Temporal Inconsistency Guided Blind Video Quality Assessment	Yixiao Li et.al.	2412.18933	link
2024-12-25	ArtNVG: Content-Style Separated Artistic Neighboring-View Gaussian Stylization	Zixiao Gu et.al.	2412.18783	null
2024-12-25	Embodied Image Quality Assessment for Robotic Intelligence	Jianbo Zhang et.al.	2412.18774	link
2024-12-25	MRI Reconstruction with Regularized 3D Diffusion Model (R3DM)	Arya Bangun et.al.	2412.18723	null
2024-12-24	ZenSVI: An Open-Source Software for the Integrated Acquisition, Processing and Analysis of Street View Imagery Towards Scalable Urban Science	Koichi Ito et.al.	2412.18641	link
2024-12-24	Long-Form Speech Generation with Spoken Language Models	Se Jin Park et.al.	2412.18603	link
2024-12-24	LatentCRF: Continuous CRF for Efficient Latent Diffusion	Kanchana Ranasinghe et.al.	2412.18596	null
2024-12-24	Agreement of Image Quality Metrics with Radiological Evaluation in the Presence of Motion Artifacts	Elisa Marchetto et.al.	2412.18389	null
2024-12-24	RSGaussian:3D Gaussian Splatting with LiDAR for Aerial Remote Sensing Novel View Synthesis	Yiling Yao et.al.	2412.18380	null
2024-12-24	Expand VSR Benchmark for VLLM to Expertize in Spatial Rules	Peijin Xie et.al.	2412.18224	link
2024-12-24	Image Quality Assessment: Exploring Regional Heterogeneity via Response of Adaptive Multiple Quality Factors in Dictionary Space	Xuting Lan et.al.	2412.18160	null
2024-12-24	DepthLab: From Partial to Complete	Zhiheng Liu et.al.	2412.18153	null
2024-12-24	AEIOU: A Unified Defense Framework against NSFW Prompts in Text-to-Image Models	Yiming Wang et.al.	2412.18123	null
2024-12-24	SAR Despeckling via Log-Yeo-Johnson Transformation and Sparse Representation	Xuran Hu et.al.	2412.18121	null
2024-12-24	An Ensemble Approach to Short-form Video Quality Assessment Using Multimodal LLM	Wen Wen et.al.	2412.18060	null
2024-12-23	ANID: How Far Are We? Evaluating the Discrepancies Between AI-synthesized Images and Natural Images through Multimodal Guidance	Renyang Liu et.al.	2412.17632	link
2024-12-23	HumanVBench: Exploring Human-Centric Video Understanding Capabilities of MLLMs with Synthetic Benchmark Data	Ting Zhou et.al.	2412.17574	link
2024-12-24	An Evaluation Framework for Product Images Background Inpainting based on Human Feedback and Product Consistency	Yuqi Liang et.al.	2412.17504	null
2024-12-23	Predicting Satisfied User and Machine Ratio for Compressed Images: A Unified Approach	Qi Zhang et.al.	2412.17477	null
2024-12-23	Assessment of Deep-Learning Methods for the Enhancement of Experimental Low Dose Dental CBCT Volumes	Louise Friot--Giroux et.al.	2412.17423	null
2024-12-23	Balanced 3DGS: Gaussian-wise Parallelism Rendering with Fine-Grained Tiling	Hao Gui et.al.	2412.17378	null
2024-12-23	FFA Sora, video generation as fundus fluorescein angiography simulator	Xinyuan Wu et.al.	2412.17346	null
2024-12-23	GCS-M3VLT: Guided Context Self-Attention based Multi-modal Medical Vision Language Transformer for Retinal Image Captioning	Teja Krishna Cherukuri et.al.	2412.17251	null
2024-12-22	Deep Joint Source Channel Coding for Secure End-to-End Image Transmission	Mehdi Letafati et.al.	2412.17110	null
2024-12-24	ErasableMask: A Robust and Erasable Privacy Protection Scheme against Black-box Face Recognition Models	Sipeng Shen et.al.	2412.17038	null
2024-12-22	PromptDresser: Improving the Quality and Controllability of Virtual Try-On via Generative Textual Prompt and Prompt-aware Mask	Jeongho Kim et.al.	2412.16978	link
2024-12-22	Image Quality Assessment: Investigating Causal Perceptual Effects with Abductive Counterfactual Inference	Wenhao Shen et.al.	2412.16939	null
2024-12-22	Time-Graph Frequency Representation with Singular Value Decomposition for Neural Speech Enhancement	Tingting Wang et.al.	2412.16823	link
2024-12-21	RoomPainter: View-Integrated Diffusion for Consistent Indoor Scene Texturing	Zhipeng Huang et.al.	2412.16778	null
2024-12-21	VAST 1.0: A Unified Framework for Controllable and Consistent Video Generation	Chi Zhang et.al.	2412.16677	null
2024-12-21	Complementary Advantages: Exploiting Cross-Field Frequency Correlation for NIR-Assisted Image Denoising	Yuchen Wang et.al.	2412.16645	null
2024-12-21	OmniSplat: Taming Feed-Forward 3D Gaussian Splatting for Omnidirectional Images with Editable Capabilities	Suyoung Lee et.al.	2412.16604	null
2024-12-21	A Generalizable 3D Diffusion Framework for Low-Dose and Few-View Cardiac SPECT	Huidong Xie et.al.	2412.16573	null
2024-12-21	Federal Learning Framework for Quality Evaluation of Blastomere Cleavage	Jung-Hua Wang et.al.	2412.16567	null
2024-12-21	Positive2Negative: Breaking the Information-Lossy Barrier in Self-Supervised Single Image Denoising	Tong Li et.al.	2412.16460	null
2024-12-20	IMPLY-based Approximate Full Adders for Efficient Arithmetic Operations in Image Processing and Machine Learning	Melanie Qiu et.al.	2412.15888	null
2024-12-20	Image Quality Assessment: Enhancing Perceptual Exploration and Interpretation with Collaborative Feature Refinement and Hausdorff distance	Xuekai Wei et.al.	2412.15847	null
2024-12-20	DOLLAR: Few-Step Video Generation via Distillation and Latent Reward Optimization	Zihan Ding et.al.	2412.15689	null
2024-12-20	AI-generated Image Quality Assessment in Visual Communication	Yu Tian et.al.	2412.15677	link
2024-12-20	Underwater Image Quality Assessment: A Perceptual Framework Guided by Physical Imaging	Weizhi Xian et.al.	2412.15527	null
2024-12-19	Log-Time K-Means Clustering for 1D Data: Novel Approaches with Proof and Implementation	Jake Hyun et.al.	2412.15295	link
2024-12-18	A Systematic Examination of Preference Learning through the Lens of Instruction-Following	Joongwon Kim et.al.	2412.15282	null
2024-12-19	SqueezeMe: Efficient Gaussian Avatars for VR	Shunsuke Saito et.al.	2412.15171	null
2024-12-19	OnlineVPO: Align Video Diffusion Model with Online Video-Centric Preference Optimization	Jiacheng Zhang et.al.	2412.15159	null
2024-12-19	Jet: A Modern Transformer-Based Normalizing Flow	Alexander Kolesnikov et.al.	2412.15129	null
2024-12-19	Joint estimation of activity, attenuation and motion in respiratory-self-gated time-of-flight PET	Masoud Elhamiasl et.al.	2412.15018	null
2024-12-19	Unified Image Restoration and Enhancement: Degradation Calibrated Cycle Reconstruction Diffusion Model	Minglong Xue et.al.	2412.14630	link
2024-12-19	Qua $^2$ SeDiMo: Quantifiable Quantization Sensitivity of Diffusion Models	Keith G. Mills et.al.	2412.14628	null
2024-12-19	Successive optimization of optics and post-processing with differentiable coherent PSF operator and field information	Zheng Ren et.al.	2412.14603	link
2024-12-19	Enhancing Diffusion Models for High-Quality Image Generation	Jaineet Shah et.al.	2412.14422	null
2024-12-18	Improving diabetic retinopathy screening using Artificial Intelligence: design, evaluation and before-and-after study of a custom development	Imanol Pinto et.al.	2412.14221	null
2024-12-19	E-CAR: Efficient Continuous Autoregressive Image Generation via Multistage Modeling	Zhihang Yuan et.al.	2412.14170	null
2024-12-18	VideoDPO: Omni-Preference Alignment for Video Diffusion Generation	Runtao Liu et.al.	2412.14167	null
2024-12-18	AKiRa: Augmentation Kit on Rays for optical video generation	Xi Wang et.al.	2412.14158	null
2024-12-18	Real-Time Position-Aware View Synthesis from Single-View Input	Manu Gond et.al.	2412.14005	null
2024-12-18	Data-Efficient Inference of Neural Fluid Fields via SciML Foundation Model	Yuqiu Liu et.al.	2412.13897	null
2024-12-18	VIIS: Visible and Infrared Information Synthesis for Severe Low-light Image Enhancement	Chen Zhao et.al.	2412.13655	link
2024-12-18	PASCO (PArallel Structured COarsening): an overlay to speed up graph clustering algorithms	Etienne Lasalle et.al.	2412.13592	link
2024-12-18	T $^3$ -S2S: Training-free Triplet Tuning for Sketch to Scene Generation	Zhenhong Sun et.al.	2412.13486	link
2024-12-18	Real-time One-Step Diffusion-based Expressive Portrait Videos Generation	Hanzhong Guo et.al.	2412.13479	link
2024-12-17	Optimisation of Magnetic Field Sensing with Optically Pumped Magnetometers for Magnetic Detection Electrical Impedance Tomography	Kai Mason et.al.	2412.13354	null
2024-12-17	Real-time Free-view Human Rendering from Sparse-view RGB Videos using Double Unprojected Textures	Guoxing Sun et.al.	2412.13183	null
2024-12-17	F-Bench: Rethinking Human Preference Evaluation Metrics for Benchmarking Face Generation, Customization, and Restoration	Lu Liu et.al.	2412.13155	null
2024-12-17	Unlocking the Potential of Digital Pathology: Novel Baselines for Compression	Maximilian Fischer et.al.	2412.13137	null
2024-12-18	AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark	Jianlyu Chen et.al.	2412.13102	link
2024-12-17	Smartphone-based Iris Recognition through High-Quality Visible Spectrum Iris Capture	Naveenkumar G Venkataswamy et.al.	2412.13063	null
2024-12-17	Experimental Study of Low-Latency Video Streaming in an ORAN Setup with Generative AI	Andreas Casparsen et.al.	2412.12751	null
2024-12-17	Subspace Implicit Neural Representations for Real-Time Cardiac Cine MR Imaging	Wenqi Huang et.al.	2412.12742	link
2024-12-17	Complex extension of optical flow and its practical evaluation for undersampled dynamic MRI	Matthias J. Ehrhardt et.al.	2412.12711	null
2024-12-17	A Two-Fold Patch Selection Approach for Improved 360-Degree Image Quality Assessment	Abderrezzaq Sendjasni et.al.	2412.12667	link
2024-12-17	RDPI: A Refine Diffusion Probability Generation Method for Spatiotemporal Data Imputation	Zijin Liu et.al.	2412.12642	link
2024-12-17	Consistent Diffusion: Denoising Diffusion Model with Data-Consistent Training for Image Restoration	Xinlong Cheng et.al.	2412.12550	null
2024-12-17	Invisible Watermarks: Attacks and Robustness	Dongjun Hwang et.al.	2412.12511	link
2024-12-16	PanSplat: 4K Panorama Synthesis with Feed-Forward Gaussian Splatting	Cheng Zhang et.al.	2412.12096	link
2024-12-16	Wonderland: Navigating 3D Scenes from a Single Image	Hanwen Liang et.al.	2412.12091	null
2024-12-16	SPADE: Spectroscopic Photoacoustic Denoising using an Analytical and Data-free Enhancement Framework	Fangzhou Lin et.al.	2412.12068	null
2024-12-16	Industrial-scale Prediction of Cement Clinker Phases using Machine Learning	Sheikh Junaid Fayaz et.al.	2412.11981	link
2024-12-16	Towards Physically-Based Sky-Modeling	Ian J. Maquignaz et.al.	2412.11883	null
2024-12-16	Impact of Face Alignment on Face Image Quality	Eren Onaran et.al.	2412.11779	null
2024-12-16	Formal Quality Measures for Predictors in Markov Decision Processes	Christel Baier et.al.	2412.11754	null
2024-12-16	Comparison of three reconstruction algorithms for low-dose phase-contrast computed tomography of the breast with synchrotron radiation	Sandro Donato et.al.	2412.11641	null
2024-12-16	MT-LENS: An all-in-one Toolkit for Better Machine Translation Evaluation	Javier García Gilabert et.al.	2412.11615	link
2024-12-16	Block-Based Multi-Scale Image Rescaling	Jian Li et.al.	2412.11468	null
2024-12-16	Controllable Distortion-Perception Tradeoff Through Latent Diffusion for Neural Image Compression	Chuqin Zhou et.al.	2412.11379	null
2024-12-15	VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping	Hao Shao et.al.	2412.11279	null
2024-12-15	CATER: Leveraging LLM to Pioneer a Multidimensional, Reference-Independent Paradigm in Translation Quality Evaluation	Kurando IIDA et.al.	2412.11261	null
2024-12-15	Benchmarking and Learning Multi-Dimensional Quality Evaluator for Text-to-3D Generation	Yujie Zhang et.al.	2412.11170	null
2024-12-15	A Comprehensive Survey of Action Quality Assessment: Method and Benchmark	Kanglei Zhou et.al.	2412.11149	null
2024-12-14	Zigzag Diffusion Sampling: The Path to Success Is Zigzag	Lichen Bai et.al.	2412.10891	link
2024-12-14	Unbiased General Annotated Dataset Generation	Dengyang Jiang et.al.	2412.10831	null
2024-12-14	Rapid Reconstruction of Extremely Accelerated Liver 4D MRI via Chained Iterative Refinement	Di Xu et.al.	2412.10629	null
2024-12-13	RAID-Database: human Responses to Affine Image Distortions	Paula Daudén-Oliver et.al.	2412.10211	null
2024-12-13	GT23D-Bench: A Comprehensive General Text-to-3D Generation Benchmark	Sitong Su et.al.	2412.09997	null
2024-12-13	EP-CFG: Energy-Preserving Classifier-Free Guidance	Kai Zhang et.al.	2412.09966	null
2024-12-13	$\textrm{A}^{\textrm{2}}$ RNet: Adversarial Attack Resilient Network for Robust Infrared and Visible Image Fusion	Jiawei Li et.al.	2412.09954	link
2024-12-13	Prompt2Perturb (P2P): Text-Guided Diffusion-Based Adversarial Attacks on Breast Ultrasound Images	Yasamin Medghalchi et.al.	2412.09910	link
2024-12-13	LinGen: Towards High-Resolution Minute-Length Text-to-Video Generation with Linear Computational Complexity	Hongjie Wang et.al.	2412.09856	null
2024-12-13	A Single-Frame and Multi-Frame Cascaded Image Super-Resolution Method	Jing Sun et.al.	2412.09846	null
2024-12-13	Super-Resolution for Remote Sensing Imagery via the Coupling of a Variational Model and Deep Learning	Jing Sun et.al.	2412.09841	null
2024-12-13	Prospects for Systematic Planetary Nebulae Detection with the Census of the Local Universe Narrowband Survey	Rong Du et.al.	2412.09836	null
2024-12-13	Speech-based Multimodel Pipeline for Vietnamese Services Quality Assessment	Quang-Anh N. D. et.al.	2412.09829	null
2024-12-12	OFTSR: One-Step Flow for Image Super-Resolution with Tunable Fidelity-Realism Trade-offs	Yuanzhi Zhu et.al.	2412.09465	link
2024-12-12	UFO: Enhancing Diffusion-Based Video Generation with a Uniform Frame Organizer	Delong Liu et.al.	2412.09389	link
2024-12-13	Are Conditional Latent Diffusion Models Effective for Image Restoration?	Yunchen Yuan et.al.	2412.09324	null
2024-12-12	Towards Understanding the Robustness of LLM-based Evaluations under Perturbations	Manav Chaudhary et.al.	2412.09269	null
2024-12-12	Elevating Flow-Guided Video Inpainting with Reference Generation	Suhwan Cho et.al.	2412.08975	link
2024-12-12	Reversing the Damage: A QP-Aware Transformer-Diffusion Approach for 8K Video Restoration under Codec Compression	Ali Mollaahmadi Dehaghi et.al.	2412.08912	link
2024-12-11	DeepNose: An Equivariant Convolutional Neural Network Predictive Of Human Olfactory Percepts	Sergey Shuvaev et.al.	2412.08747	null
2024-12-13	Utilizing Multi-step Loss for Single Image Reflection Removal	Abdelrahman Elnenaey et.al.	2412.08582	link
2024-12-11	PointTalk: Audio-Driven Dynamic Lip Point Cloud for 3D Gaussian-based Talking Head Synthesis	Yifan Xie et.al.	2412.08504	null
2024-12-12	Learning Flow Fields in Attention for Controllable Person Image Generation	Zijian Zhou et.al.	2412.08486	link
2024-12-11	Visible and Infrared Image Fusion Using Encoder-Decoder Network	Ferhat Can Ataman et.al.	2412.08073	link
2024-12-11	NeRF-NQA: No-Reference Quality Assessment for Scenes Generated by NeRF and Neural View Synthesis Methods	Qiang Qu et.al.	2412.08029	link
2024-12-10	Graph convolutional networks enable fast hemorrhagic stroke monitoring with electrical impedance tomography	J. Toivanen et.al.	2412.07888	null
2024-12-10	PETALface: Parameter Efficient Transfer Learning for Low-resolution Face Recognition	Kartik Narayan et.al.	2412.07771	null
2024-12-10	3DTrajMaster: Mastering 3D Trajectory for Multi-Entity Motion in Video Generation	Xiao Fu et.al.	2412.07759	null
2024-12-10	PortraitTalk: Towards Customizable One-Shot Audio-to-Talking Face Generation	Fatemeh Nazarieh et.al.	2412.07754	null
2024-12-10	Multi-Shot Character Consistency for Text-to-Video Generation	Yuval Atzmon et.al.	2412.07750	null
2024-12-11	Direct Low-Dose CT Image Reconstruction on GPU using Out-Of-Core: Precision and Quality Study	M. Chillarón et.al.	2412.07631	null
2024-12-10	OmniDocBench: Benchmarking Diverse PDF Document Parsing with Comprehensive Annotations	Linke Ouyang et.al.	2412.07626	link
2024-12-10	CoMA: Compositional Human Motion Generation with Multi-modal Agents	Shanlin Sun et.al.	2412.07320	null
2024-12-10	Backdoor Attacks against No-Reference Image Quality Assessment Models via A Scalable Trigger	Yi Yu et.al.	2412.07277	link
2024-12-10	Moderating the Generalization of Score-based Generative Model	Wan Jiang et.al.	2412.07229	null
2024-12-11	Rate-In: Information-Driven Adaptive Dropout Rates for Improved Inference-Time Uncertainty Estimation	Tal Zeevi et.al.	2412.07169	link
2024-12-10	QCResUNet: Joint Subject-level and Voxel-level Segmentation Quality Prediction	Peijie Qiu et.al.	2412.07156	link
2024-12-10	Light Field Image Quality Assessment With Auxiliary Learning Based on Depthwise and Anglewise Separable Convolutions	Qiang Qu et.al.	2412.07079	null
2024-12-11	Diff-GO $^\text{n}$ : Enhancing Diffusion Models for Goal-Oriented Communications	Suchinthaka Wanninayaka et.al.	2412.06980	null
2024-12-09	Edge-SD-SR: Low Latency and Parameter Efficient On-device Super-Resolution with Stable Diffusion via Bidirectional Conditioning	Mehdi Noroozi et.al.	2412.06978	null
2024-12-09	Ranking-aware adapter for text-driven image ordering with CLIP	Wei-Hsiang Yu et.al.	2412.06760	link
2024-12-09	AutoDCWorkflow: LLM-based Data Cleaning Workflow Auto-Generation and Benchmark	Lan Li et.al.	2412.06724	link
2024-12-10	A No-Reference Medical Image Quality Assessment Method Based on Automated Distortion Recognition Technology: Application to Preprocessing in MRI-guided Radiotherapy	Zilin Wang et.al.	2412.06599	null
2024-12-09	How Certain are Uncertainty Estimates? Three Novel Earth Observation Datasets for Benchmarking Uncertainty Quantification in Machine Learning	Yuanyuan Wang et.al.	2412.06451	null
2024-12-09	Sound2Vision: Generating Diverse Visuals from Audio through Cross-Modal Latent Alignment	Kim Sung-Bin et.al.	2412.06209	null
2024-12-09	One-shot Human Motion Transfer via Occlusion-Robust Flow Prediction and Neural Texturing	Yuzhu Ji et.al.	2412.06174	null
2024-12-09	A CT Image Denoising Method Based on Projection Domain Feature	Mengyu Sun et.al.	2412.06135	null
2024-12-08	Latent-Reframe: Enabling Camera Control for Video Diffusion Model without Training	Zhenghong Zhou et.al.	2412.06029	null
2024-12-08	Enhancing Content Representation for AR Image Quality Assessment Using Knowledge Distillation	Aymen Sekhri et.al.	2412.06003	null
2024-12-08	Nested Diffusion Models Using Hierarchical Latent Priors	Xiao Zhang et.al.	2412.05984	null
2024-12-08	Unsupervised Multi-Parameter Inverse Solving for Reducing Ring Artifacts in 3D X-Ray CBCT	Qing Wu et.al.	2412.05853	null
2024-12-08	SizeGS: Size-aware Compression of 3D Gaussians with Hierarchical Mixed Precision Quantization	Shuzhao Xie et.al.	2412.05808	null
2024-12-07	Emulating Clinical Quality Muscle B-mode Ultrasound Images from Plane Wave Images Using a Two-Stage Machine Learning Model	Reed Chen et.al.	2412.05758	link
2024-12-07	A Tiered GAN Approach for Monet-Style Image Generation	FNU Neha et.al.	2412.05724	null
2024-12-07	Temporally Compressed 3D Gaussian Splatting for Dynamic Scenes	Saqib Javed et.al.	2412.05700	null
2024-12-07	Enhancing Research Methodology and Academic Publishing: A Structured Framework for Quality and Integrity	Md. Jalil Piran et.al.	2412.05683	null
2024-12-07	Deep Reinforcement Learning-Based Resource Allocation for Hybrid Bit and Generative Semantic Communications in Space-Air-Ground Integrated Networks	Chong Huang et.al.	2412.05647	null
2024-12-06	LoRA.rar: Learning to Merge LoRAs via Hypernetworks for Subject-Style Conditioned Image Generation	Donald Shenaj et.al.	2412.05148	link
2024-12-06	Comprehensive Analysis and Improvements in Pansharpening Using Deep Learning	Mahek Kantharia et.al.	2412.04896	null
2024-12-06	Building a Family of Data Augmentation Models for Low-cost LLM Fine-tuning on the Cloud	Yuanhao Yue et.al.	2412.04871	null
2024-12-05	Motion-Guided Deep Image Prior for Cardiac MRI	Marc Vornehm et.al.	2412.04639	null
2024-12-05	MetaFormer: High-fidelity Metalens Imaging via Aberration Correcting Transformers	Byeonghyeon Lee et.al.	2412.04591	null
2024-12-05	4Real-Video: Learning Generalizable Photo-Realistic 4D Video Diffusion	Chaoyang Wang et.al.	2412.04462	null
2024-12-05	LayerFusion: Harmonized Multi-Layer Text-to-Image Generation with Generative Priors	Yusuf Dalva et.al.	2412.04460	null
2024-12-05	Multi-Subject Image Synthesis as a Generative Prior for Single-Subject PET Image Reconstruction	George Webber et.al.	2412.04324	null
2024-12-05	T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive Concepts	Ziwei Huang et.al.	2412.04300	null
2024-12-05	IF-MDM: Implicit Face Motion Diffusion Model for High-Fidelity Realtime Talking Head Generation	Sejong Yang et.al.	2412.04000	null
2024-12-05	Blind Underwater Image Restoration using Co-Operational Regressor Networks	Ozer Can Devecioglu et.al.	2412.03995	null
2024-12-05	LL-ICM: Image Compression for Low-level Machine Vision via Large Vision-Language Model	Yuan Xue et.al.	2412.03841	null
2024-12-04	Advancing Auto-Regressive Continuation for Video Frames	Ruibo Ming et.al.	2412.03758	null
2024-12-04	MV-Adapter: Multi-view Consistent Image Generation Made Easy	Zehuan Huang et.al.	2412.03632	null
2024-12-04	Style3D: Attention-guided Multi-view Style Transfer for 3D Object Generation	Bingjie Song et.al.	2412.03571	null
2024-12-04	NODE-AdvGAN: Improving the transferability and perceptual similarity of adversarial examples by dynamic-system-driven adversarial generative model	Xinheng Xie et.al.	2412.03539	null
2024-12-04	SGSST: Scaling Gaussian Splatting StyleTransfer	Bruno Galerne et.al.	2412.03371	link
2024-12-04	Is JPEG AI going to change image forensics?	Edoardo Daniele Cannas et.al.	2412.03261	link
2024-12-04	Task-driven Image Fusion with Learnable Fusion Loss	Haowen Bai et.al.	2412.03240	null
2024-12-04	Parametric Enhancement of PerceptNet: A Human-Inspired Approach for Image Quality Assessment	Jorge Vila-Tomás et.al.	2412.03210	link
2024-12-04	Unsupervised Network for Single Image Raindrop Removal	Huijiao Wang et.al.	2412.03019	null
2024-12-04	Pixel-level and Semantic-level Adjustable Super-resolution: A Dual-LoRA Approach	Lingchen Sun et.al.	2412.03017	link
2024-12-04	Partially Conditioned Patch Parallelism for Accelerated Diffusion Model Inference	XiuYu Zhang et.al.	2412.02962	null
2024-12-04	Surrogate distributed radiological sources III: quantitative distributed source reconstructions	Jayson R. Vavrek et.al.	2412.02926	null
2024-12-04	Assessing the performance of CT image denoisers using Laguerre-Gauss Channelized Hotelling Observer for lesion detection	Prabhat Kc et.al.	2412.02920	null
2024-12-03	Improving Dynamic Object Interactions in Text-to-Video Generation with AI Feedback	Hiroki Furuta et.al.	2412.02617	null
2024-12-03	High-Quality Passive Acoustic Mapping with the Cross-Correlated Angular Spectrum Method	Yi Zeng et.al.	2412.02413	null
2024-12-03	Switchable deep beamformer for high-quality and real-time passive acoustic mapping	Yi Zeng et.al.	2412.02327	null
2024-12-03	Initial Study On Improving Segmentation By Combining Preoperative CT And Intraoperative CBCT Using Synthetic Data	Maximilian E. Tschuchnig et.al.	2412.02294	null
2024-12-02	NitroFusion: High-Fidelity Single-Step Diffusion through Dynamic Adversarial Training	Dar-Yen Chen et.al.	2412.02030	null
2024-12-02	HybridMQA: Exploring Geometry-Texture Interactions for Colored Mesh Quality Assessment	Armin Shafiee Sarvestani et.al.	2412.01986	null
2024-12-02	IQA-Adapter: Exploring Knowledge Transfer from Image Quality Assessment to Diffusion-based Generative Models	Khaled Abud et.al.	2412.01794	link
2024-12-02	OmniGuard: Hybrid Manipulation Localization via Augmented Versatile Deep Image Watermarking	Xuanyu Zhang et.al.	2412.01615	null
2024-12-02	Negative Token Merging: Image-based Adversarial Feature Guidance	Jaskirat Singh et.al.	2412.01339	null
2024-12-02	Data Uncertainty-Aware Learning for Multimodal Aspect-based Sentiment Analysis	Hao Yang et.al.	2412.01249	null
2024-12-02	Schedule On the Fly: Diffusion Time Prediction for Faster and Better Image Generation	Zilyu Ye et.al.	2412.01243	null
2024-12-02	PainterNet: Adaptive Image Inpainting with Actual-Token Attention and Diverse Mask Control	Ruichen Wang et.al.	2412.01223	null
2024-12-02	Assessing GPT Model Uncertainty in Mathematical OCR Tasks via Entropy Analysis	Alexei Kaltchenko et.al.	2412.01221	link
2024-12-02	LoyalDiffusion: A Diffusion Model Guarding Against Data Replication	Chenghao Li et.al.	2412.01118	null
2024-12-02	FLOAT: Generative Motion Latent Flow Matching for Audio-driven Talking Portrait	Taekyung Ki et.al.	2412.01064	null
2024-12-02	Evaluating Automated Radiology Report Quality through Fine-Grained Phrasal Grounding of Clinical Findings	Razi Mahmood et.al.	2412.01031	null
2024-12-01	Optimal Algorithms for Augmented Testing of Discrete Distributions	Maryam Aliakbarpour et.al.	2412.00974	null
2024-12-01	Generating AI Literacy MCQs: A Multi-Agent LLM Approach	Jiayi Wang et.al.	2412.00970	null
2024-12-01	Playable Game Generation	Mingyu Yang et.al.	2412.00887	link
2024-11-30	Multi-resolution Guided 3D GANs for Medical Image Translation	Juhyung Ha et.al.	2412.00575	link
2024-11-29	INCLUDE: Evaluating Multilingual Language Understanding with Regional Knowledge	Angelika Romanou et.al.	2411.19799	null
2024-11-29	ChineseWebText 2.0: Large-Scale High-quality Chinese Web Text with Multi-dimensional and fine-grained information	Wanyue Zhang et.al.	2411.19668	link
2024-11-29	Tortho-Gaussian: Splatting True Digital Orthophoto Maps	Xin Wang et.al.	2411.19594	null
2024-11-29	Self-Supervised Denoiser Framework	Emilien Valat et.al.	2411.19593	null
2024-11-29	Contextual Checkerboard Denoise -- A Novel Neural Network-Based Approach for Classification-Aware OCT Image Denoising	Md. Touhidul Islam et.al.	2411.19549	link
2024-11-29	Subjective and Objective Quality Assessment Methods of Stereoscopic Videos with Visibility Affecting Distortions	Sria Biswas et.al.	2411.19522	null
2024-11-29	Retrieval-guided Cross-view Image Synthesis	Hongji Yang et.al.	2411.19510	null
2024-11-29	Fleximo: Towards Flexible Text-to-Human Motion Video Generation	Yuhang Zhang et.al.	2411.19459	null
2024-11-28	AMO Sampler: Enhancing Text Rendering with Overshooting	Xixi Hu et.al.	2411.19415	null
2024-11-28	3D Wasserstein generative adversarial network with dense U-Net based discriminator for preclinical fMRI denoising	Sima Soltanpour et.al.	2411.19345	null
2024-11-28	Timestep Embedding Tells: It's Time to Cache for Video Diffusion Model	Feng Liu et.al.	2411.19108	null
2024-11-28	SPAgent: Adaptive Task Decomposition and Model Selection for General Video Generation and Editing	Rong-Cheng Tu et.al.	2411.18983	null
2024-11-28	Deep Plug-and-Play HIO Approach for Phase Retrieval	Cagatay Isil et.al.	2411.18967	null
2024-12-02	AC3D: Analyzing and Improving 3D Camera Control in Video Diffusion Transformers	Sherwin Bahmani et.al.	2411.18673	null
2024-11-27	HoliSDiP: Image Super-Resolution via Holistic Semantics and Diffusion Prior	Li-Yuan Tsao et.al.	2411.18662	link
2024-11-27	Textured Gaussians for Enhanced 3D Scene Appearance Modeling	Brian Chao et.al.	2411.18625	null
2024-11-27	Uncertainty-driven Sampling for Efficient Pairwise Comparison Subjective Assessment	Shima Mohammadi et.al.	2411.18372	link
2024-11-29	HUPE: Heuristic Underwater Perceptual Enhancement with Semantic Collaborative Learning	Zengxi Zhang et.al.	2411.18296	link
2024-11-27	Deep End-to-end Adaptive k-Space Sampling, Reconstruction, and Registration for Dynamic MRI	George Yiasemis et.al.	2411.18249	null
2024-11-27	Towards Improved Objective Perceptual Audio Quality Assessment -- Part 1: A Novel Data-Driven Cognitive Model	Pablo M. Delgado et.al.	2411.18222	null
2024-11-27	KAN See Your Face	Dong Han et.al.	2411.18165	null
2024-11-27	Type-R: Automatically Retouching Typos for Text-to-Image Generation	Wataru Shimoda et.al.	2411.18159	null
2024-11-26	MapEval: Towards Unified, Robust and Efficient SLAM Map Evaluation Framework	Xiangcheng Hu et.al.	2411.17928	link
2024-11-26	SVGDreamer++: Advancing Editability and Diversity in Text-Guided SVG Generation	Ximing Xing et.al.	2411.17832	null
2024-11-26	Collaborative Decoding Makes Visual Auto-Regressive Modeling Efficient	Zigeng Chen et.al.	2411.17787	link
2024-11-27	Diffusion Autoencoders for Few-shot Image Generation in Hyperbolic Space	Lingxiao Li et.al.	2411.17784	null
2024-11-26	Perceptually Optimized Super Resolution	Volodymyr Karpenko et.al.	2411.17513	null
2024-11-26	Puzzle Similarity: A Perceptually-guided No-Reference Metric for Artifact Detection in 3D Scene Reconstructions	Nicolai Hermann et.al.	2411.17489	null
2024-11-26	Structure-Guided MR-to-CT Synthesis with Spatial and Semantic Alignments for Attenuation Correction of Whole-Body PET/MR Imaging	Jiaxu Zheng et.al.	2411.17488	null
2024-11-26	Dual-Representation Interaction Driven Image Quality Assessment with Restoration Assistance	Jingtong Yue et.al.	2411.17390	link
2024-11-26	InsightEdit: Towards Better Instruction Following for Image Editing	Yingjing Xu et.al.	2411.17323	null
2024-11-26	Reward Incremental Learning in Text-to-Image Generation	Maorong Wang et.al.	2411.17310	null
2024-11-26	Grounding-IQA: Multimodal Language Grounding Model for Image Quality Assessment	Zheng Chen et.al.	2411.17237	link
2024-11-26	AIGV-Assessor: Benchmarking and Evaluating the Perceptual Quality of Text-to-Video Generation with LMM	Jiarui Wang et.al.	2411.17221	link
2024-11-26	ChatGen: Automatic Text-to-Image Generation From FreeStyle Chatting	Chengyou Jia et.al.	2411.17176	null
2024-11-26	OSDFace: One-Step Diffusion Model for Face Restoration	Jingkai Wang et.al.	2411.17163	link
2024-11-26	Motion Free B-frame Coding for Neural Video Compression	Van Thang Nguyen et.al.	2411.17160	null
2024-11-26	4D Scaffold Gaussian Splatting for Memory Efficient Dynamic Scene Reconstruction	Woong Oh Cho et.al.	2411.17044	null
2024-11-26	TED-VITON: Transformer-Empowered Diffusion Models for Virtual Try-On	Zhenchen Wan et.al.	2411.17017	link
2024-11-25	G2SDF: Surface Reconstruction from Explicit Gaussians with Implicit SDFs	Kunyi Li et.al.	2411.16898	null
2024-11-25	Fully Automatic Deep Learning Pipeline for Whole Slide Image Quality Assessment	Falah Jabar et.al.	2411.16885	null
2024-11-25	LegoPET: Hierarchical Feature Guided Conditional Diffusion for PET Image Reconstruction	Yiran Sun et.al.	2411.16629	link
2024-11-25	Human-Activity AGV Quality Assessment: A Benchmark Dataset and an Objective Evaluation Metric	Zhichao Zhang et.al.	2411.16619	null
2024-11-25	Coherence Based Sound Speed Aberration Correction -- with clinical validation in obstetric ultrasound	Anders Emil Vrålstad et.al.	2411.16551	null
2024-11-25	Synthesising Handwritten Music with GANs: A Comprehensive Evaluation of CycleWGAN, ProGAN, and DCGAN	Elona Shatri et.al.	2411.16405	null
2024-11-25	Human-Calibrated Automated Testing and Validation of Generative Language Models	Agus Sudjianto et.al.	2411.16391	null
2024-11-25	Bounds for the maximum modulus of polynomial roots with nearly optimal worst-case overestimation	Prashant Batra et.al.	2411.16385	null
2024-11-25	Privacy-Preserving Federated Foundation Model for Generalist Ultrasound Artificial Intelligence	Yuncheng Jiang et.al.	2411.16380	null
2024-11-25	Sonic: Shifting Focus to Global Audio Perception in Portrait Animation	Xiaozhong Ji et.al.	2411.16331	null
2024-11-25	EPS: Efficient Patch Sampling for Video Overfitting in Deep Super-Resolution Model Training	Yiying Wei et.al.	2411.16312	null
2024-11-25	Weakly supervised image segmentation for defect-based grading of fresh produce	Manuel Knott et.al.	2411.16219	link
2024-11-25	VIRES: Video Instance Repainting with Sketch and Text Guidance	Shuchen Weng et.al.	2411.16199	null
2024-11-25	Image Generation Diversity Issues and How to Tame Them	Mischa Dombrowski et.al.	2411.16171	link
2024-11-25	ENCLIP: Ensembling and Clustering-Based Contrastive Language-Image Pretraining for Fashion Multimodal Search with Limited Data and Low-Quality Images	Prithviraj Purushottam Naik et.al.	2411.16096	null
2024-11-25	AI-Generated Image Quality Assessment Based on Task-Specific Prompt and Multi-Granularity Similarity	Jili Xia et.al.	2411.16087	null
2024-11-24	Distribution models of antennas in radio astronomy: Efficiency comparison of the golden spiral interferometry	Elio Quiroga Rodriguez et.al.	2411.15904	null
2024-11-24	A review on Machine Learning based User-Centric Multimedia Streaming Techniques	Monalisa Ghosh et.al.	2411.15801	null
2024-11-24	LTCF-Net: A Transformer-Enhanced Dual-Channel Fourier Framework for Low-Light Image Restoration	Gaojing Zhang et.al.	2411.15740	null
2024-11-23	SPA: Efficient User-Preference Alignment against Uncertainty in Medical Image Segmentation	Jiayuan Zhu et.al.	2411.15513	null
2024-11-23	Automatic Evaluation for Text-to-image Generation: Task-decomposed Framework, Distilled Training, and Meta-evaluation Benchmark	Rong-Cheng Tu et.al.	2411.15488	link
2024-11-22	HeadRouter: A Training-free Image Editing Framework for MM-DiTs by Adaptively Routing Attention Heads	Yu Xu et.al.	2411.15034	null
2024-11-22	FloAt: Flow Warping of Self-Attention for Clothing Animation Generation	Swasti Shreya Mishra et.al.	2411.15028	null
2024-11-22	Information Extraction from Heterogenous Documents without Ground Truth Labels using Synthetic Label Generation and Knowledge Distillation	Aniket Bhattacharyya et.al.	2411.14957	null
2024-11-22	Evaluating Vision Transformer Models for Visual Quality Control in Industrial Manufacturing	Miriam Alber et.al.	2411.14953	link
2024-11-22	Fast High-Quality Enhanced Imaging Algorithm for Layered Dielectric Targets Based on MMW MIMO-SAR System	Xu Chen et.al.	2411.14837	null
2024-11-22	BrightVAE: Luminosity Enhancement in Underexposed Endoscopic Images	Farzaneh Koohestani et.al.	2411.14663	null
2024-11-22	VQalAttent: a Transparent Speech Generation Pipeline based on Transformer-learned VQ-VAE Latent Space	Armani Rodriguez et.al.	2411.14642	null
2024-11-21	Unveiling the Hidden: A Comprehensive Evaluation of Underwater Image Enhancement and Its Impact on Object Detection	Ali Awad et.al.	2411.14626	null
2024-11-21	Optimal Transcoding Preset Selection for Live Video Streaming	Zahra Nabizadeh et.al.	2411.14613	null
2024-11-21	Roadmap on Advances in Visual and Physiological Optics	Jesús E. Gómez-Correa et.al.	2411.14606	null
2024-11-21	Night-to-Day Translation via Illumination Degradation Disentanglement	Guanzhou Lan et.al.	2411.14504	null
2024-11-21	Regional Attention for Shadow Removal	Hengxing Liu et.al.	2411.14201	link
2024-11-21	Image Compression Using Novel View Synthesis Priors	Luyuan Peng et.al.	2411.13862	null
2024-11-21	Detecting Human Artifacts from Text-to-Image Models	Kaihong Wang et.al.	2411.13842	link
2024-11-21	Robust Steganography with Boundary-Preserving Overflow Alleviation and Adaptive Error Correction	Yu Cheng et.al.	2411.13819	null
2024-11-21	Edge-Cloud Routing for Text-to-Image Model with Token-Level Multi-Metric Prediction	Zewei Xin et.al.	2411.13787	null
2024-11-20	What You See Is What Matters: A Novel Visual and Physics-Based Metric for Evaluating Video Generation Quality	Zihan Wang et.al.	2411.13609	null
2024-11-20	HF-Diff: High-Frequency Perceptual Loss and Distribution Matching for One-Step Diffusion-Based Image Super-Resolution	Shoaib Meraj Sami et.al.	2411.13548	null
2024-11-20	RTSR: A Real-Time Super-Resolution Model for AV1 Compressed Content	Yuxuan Jiang et.al.	2411.13362	null
2024-11-20	OceanLens: An Adaptive Backscatter and Edge Correction using Deep Learning Model for Enhanced Underwater Imaging	Rajini Makam et.al.	2411.13230	link
2024-11-20	ESARM: 3D Emotional Speech-to-Animation via Reward Model from Automatically-Ranked Demonstrations	Xulong Zhang et.al.	2411.13089	null
2024-11-20	LMM-driven Semantic Image-Text Coding for Ultra Low-bitrate Learned Image Compression	Shimon Murai et.al.	2411.13033	link
2024-11-19	HyperGAN-CLIP: A Unified Framework for Domain Adaptation, Image Synthesis and Manipulation	Abdul Basit Anees et.al.	2411.12832	link
2024-11-19	Mitigating Perception Bias: A Training-Free Approach to Enhance LMM for Image Quality Assessment	Siyi Pan et.al.	2411.12791	null
2024-11-19	Stochastic BIQA: Median Randomized Smoothing for Certified Blind Image Quality Assessment	Ekaterina Shumitskaya et.al.	2411.12575	null
2024-11-19	PR-ENDO: Physically Based Relightable Gaussian Splatting for Endoscopy	Joanna Kaleta et.al.	2411.12510	link
2024-11-19	A $\ell_2-\ell_p$ regulariser based model for Poisson noise removal using augmented Lagrangian method	Abdul Halim et.al.	2411.12457	null
2024-11-19	Frequency-Aware Guidance for Blind Image Restoration via Diffusion Models	Jun Xiao et.al.	2411.12450	null
2024-11-19	Acquire Precise and Comparable Fundus Image Quality Score: FTHNet and FQS Dataset	Zheng Gong et.al.	2411.12273	null
2024-11-19	Performance of Large Language Models in Technical MRI Question Answering: A Comparative Study	Alan B McMillan et.al.	2411.12238	null
2024-11-19	Tangential Randomization in Linear Bandits (TRAiL): Guaranteed Inference and Regret Bounds	Arda Güçlü et.al.	2411.12154	null
2024-11-18	FruitNinja: 3D Object Interior Texture Generation with Gaussian Splatting	Fangyu Wu et.al.	2411.12089	null
2024-11-18	Edge-Enhanced Dilated Residual Attention Network for Multimodal Medical Image Fusion	Meng Zhou et.al.	2411.11799	link
2024-11-18	Additional Tests for TV 3.0	Eduardo Peixoto et.al.	2411.11755	null
2024-11-18	Towards Degradation-Robust Reconstruction in Generalizable NeRF	Chan Ho Park et.al.	2411.11691	null
2024-11-18	CLUE-MARK: Watermarking Diffusion Models using CLWE	Kareem Shehata et.al.	2411.11434	null
2024-11-17	BVI-CR: A Multi-View Human Dataset for Volumetric Video Compression	Ge Gao et.al.	2411.11199	link
2024-11-17	Enhanced Anime Image Generation Using USE-CMHSA-GAN	J. Lu et.al.	2411.11179	null
2024-11-17	Pitch-and-Spectrum-Aware Singing Quality Assessment with Bias Correction and Model Fusion	Yu-Fei Shi et.al.	2411.11123	null
2024-11-17	MolParser: End-to-end Visual Recognition of Molecule Structures in the Wild	Xi Fang et.al.	2411.11098	null
2024-11-17	Spectral Subspace Clustering for Attributed Graphs	Xiaoyang Lin et.al.	2411.11074	link
2024-11-17	Skeleton-Guided Spatial-Temporal Feature Learning for Video-Based Visible-Infrared Person Re-Identification	Wenjia Jiang et.al.	2411.11069	null
2024-11-17	Hyperspectral Imaging-Based Grain Quality Assessment With Limited Labelled Data	Priyabrata Karmakar et.al.	2411.10924	null
2024-11-16	HJ-Ky-0.1: an Evaluation Dataset for Kyrgyz Word Embeddings	Anton Alekseev et.al.	2411.10724	link
2024-11-15	M-VAR: Decoupled Scale-wise Autoregressive Modeling for High-Quality Image Generation	Sucheng Ren et.al.	2411.10433	link
2024-11-15	On the Foundation Model for Cardiac MRI Reconstruction	Chi Zhang et.al.	2411.10403	null
2024-11-15	Modification Takes Courage: Seamless Image Stitching via Reference-Driven Inpainting	Ziqi Xie et.al.	2411.10309	link
2024-11-15	The Unreasonable Effectiveness of Guidance for Diffusion Models	Tim Kaiser et.al.	2411.10257	null
2024-11-15	Block based Adaptive Compressive Sensing with Sampling Rate Control	Kosuke Iwama et.al.	2411.10200	null
2024-11-15	Visual question answering based evaluation metrics for text-to-image generation	Mizuki Miyamoto et.al.	2411.10183	null
2024-11-15	SEAGULL: No-reference Image Quality Assessment for Regions of Interest via Vision-Language Instruction Tuning	Zewen Chen et.al.	2411.10161	link
2024-11-15	Towards Multi-View Consistent Style Transfer with One-Step Diffusion via Vision Conditioning	Yushen Zuo et.al.	2411.10130	null
2024-11-15	EveGuard: Defeating Vibration-based Side-Channel Eavesdropping with Audio Adversarial Perturbations	Jung-Woo Chang et.al.	2411.10034	null
2024-11-14	Video Denoising in Fluorescence Guided Surgery	Trevor Seets et.al.	2411.09798	null
2024-11-14	Research evaluation with ChatGPT: Is it age, country, length, or field biased?	Mike Thelwall et.al.	2411.09768	null
2024-11-14	Evaluating the Predictive Capacity of ChatGPT for Academic Peer Review Outcomes Across Multiple Platforms	Mike Thelwall et.al.	2411.09763	null
2024-11-14	MFTIQ: Multi-Flow Tracker with Independent Matching Quality Estimation	Jonas Serych et.al.	2411.09551	link
2024-11-14	GAN-Based Architecture for Low-dose Computed Tomography Imaging Denoising	Yunuo Wang et.al.	2411.09512	null
2024-11-14	Iterative tomographic reconstruction with TV prior for low-dose CBCT dental imaging	Louise Friot-Giroux et.al.	2411.09306	null
2024-11-14	LLV-FSR: Exploiting Large Language-Vision Prior for Face Super-resolution	Chenyang Wang et.al.	2411.09293	null
2024-11-14	LES-Talker: Fine-Grained Emotion Editing for Talking Head Generation in Linear Emotion Space	Guanwen Feng et.al.	2411.09268	null
2024-11-14	JoyVASA: Portrait and Animal Image Animation with Diffusion-Based Audio-Driven Facial Dynamics and Head Motion Generation	Xuyang Cao et.al.	2411.09209	link
2024-11-14	Orthogonal Linear Array based Product Beamforming for Real Time Underwater 3D Acoustical Imaging	Mimisha M Menakath et.al.	2411.09197	null
2024-11-14	Advancing Diffusion Models: Alias-Free Resampling and Enhanced Rotational Equivariance	Md Fahim Anjum et.al.	2411.09174	null
2024-11-13	Scale Contrastive Learning with Selective Attentions for Blind Image Quality Assessment	Zihao Huang et.al.	2411.09007	null
2024-11-13	Causal Explanations for Image Classifiers	Hana Chockler et.al.	2411.08875	link
2024-11-13	A novel imaging setup for hybrid radiotherapy tailored PET/MR in patients with head and neck cancer	R. M. Winter et.al.	2411.08783	null
2024-11-13	Robust Divergence Learning for Missing-Modality Segmentation	Runze Cheng et.al.	2411.08305	null
2024-11-13	Numerical Analysis of Lensless Imaging with Active Metasurfaces and Single-Pixel Detectors	Julie Belleville et.al.	2411.08282	null
2024-11-12	DuoLift-GAN:Reconstructing CT from Single-view and Biplanar X-Rays with Generative Adversarial Networks	Zhaoxi Zhang et.al.	2411.07941	null
2024-11-12	Learning Disentangled Representations for Perceptual Point Cloud Quality Assessment via Mutual Information Minimization	Ziyu Shan et.al.	2411.07936	null
2024-11-12	CT-Mamba: A Hybrid Convolutional State Space Model for Low-Dose CT Denoising	Linxuan Li et.al.	2411.07930	link
2024-11-12	Joint multi-dimensional dynamic attention and transformer for general image restoration	Huan Zhang et.al.	2411.07893	link
2024-11-12	No-Reference Point Cloud Quality Assessment via Graph Convolutional Network	Wu Chen et.al.	2411.07728	null
2024-11-12	SegQC: a segmentation network-based framework for multi-metric segmentation quality control and segmentation error detection in volumetric medical images	Bella Specktor-Fadida et.al.	2411.07601	null
2024-11-12	IR image databases generation under target intrinsic thermal variability constraints	Jerome Gilles et.al.	2411.07577	null
2024-11-12	Multi-task Feature Enhancement Network for No-Reference Image Quality Assessment	Li Yu et.al.	2411.07556	null
2024-11-12	A Novel Automatic Real-time Motion Tracking Method for Magnetic Resonance Imaging-guided Radiotherapy: Leveraging the Enhanced Tracking-Learning-Detection Framework with Automatic Segmentation	Shengqi Chen et.al.	2411.07503	null
2024-11-12	An Exploration of Parallel Imaging System for Very-low Field (50mT) MRI Scanner	Lei Yang et.al.	2411.07489	null
2024-11-11	Evaluating Detection Thresholds: The Impact of False Positives and Negatives on Super-Resolution Ultrasound Localization Microscopy	Sepideh K. Gharamaleki et.al.	2411.07426	null
2024-11-11	Exploring Variational Autoencoders for Medical Image Generation: A Comprehensive Study	Khadija Rais et.al.	2411.07348	null
2024-11-11	Artificial Intelligence-Informed Handheld Breast Ultrasound for Screening: A Systematic Review of Diagnostic Test Accuracy	Arianna Bunnell et.al.	2411.07322	null
2024-11-11	GPU-Accelerated Inverse Lithography Towards High Quality Curvy Mask Generation	Haoyu Yang et.al.	2411.07311	null
2024-11-11	A Hierarchical Compression Technique for 3D Gaussian Splatting Compression	He Huang et.al.	2411.06976	null
2024-11-11	Multi-scale Frequency Enhancement Network for Blind Image Deblurring	Yawen Xiang et.al.	2411.06893	null
2024-11-11	Wavehax: Aliasing-Free Neural Waveform Synthesis Based on 2D Convolution and Harmonic Prior for Reliable Complex Spectrogram Estimation	Reo Yoneyama et.al.	2411.06807	null
2024-11-11	Machine vision-aware quality metrics for compressed image and video assessment	Mikhail Dremin et.al.	2411.06776	null
2024-11-11	Loss-tolerant neural video codec aware congestion control for real time video communication	Zhengxu Xia et.al.	2411.06742	null
2024-11-11	360-Degree Video Super Resolution and Quality Enhancement Challenge: Methods and Results	Ahmed Telili et.al.	2411.06738	null
2024-11-11	Accelerating Low-field MRI: Compressed Sensing and AI for fast noise-robust imaging	Efrat Shimron et.al.	2411.06704	link
2024-11-10	CASC: Condition-Aware Semantic Communication with Latent Diffusion Models	Weixuan Chen et.al.	2411.06552	null
2024-11-08	A Modular Conditional Diffusion Framework for Image Reconstruction	Magauiya Zhussip et.al.	2411.05993	null
2024-11-08	Fine-Grained Reward Optimization for Machine Translation using Error Severity Mappings	Miguel Moura Ramos et.al.	2411.05986	null
2024-11-08	Dictionary Learning with Convolutional Structure for Seismic Data Denoising and Interpolation	Murad Almadani et.al.	2411.05956	null
2024-11-08	Alternative Learning Paradigms for Image Quality Transfer	Ahmed Karam Eldaly et.al.	2411.05885	null
2024-11-08	Benchmarking 3D multi-coil NC-PDNet MRI reconstruction	Asma Tanabene et.al.	2411.05883	null
2024-11-08	Evaluating Large Language Model Capability in Vietnamese Fact-Checking Data Generation	Long Truong To et.al.	2411.05641	null
2024-11-08	DeepArUco++: Improved detection of square fiducial markers in challenging lighting conditions	Rafael Berral-Soler et.al.	2411.05552	link
2024-11-08	Improving image synthesis with diffusion-negative sampling	Alakh Desai et.al.	2411.05473	null
2024-11-08	RED: Residual Estimation Diffusion for Low-Dose PET Sinogram Reconstruction	Xingyu Ai et.al.	2411.05354	null
2024-11-08	Enhancing Depth Image Estimation for Underwater Robots by Combining Image Processing and Machine Learning	Quang Truong Nguyen et.al.	2411.05344	null
2024-11-08	A Quality-Centric Framework for Generic Deepfake Detection	Wentang Song et.al.	2411.05335	null
2024-11-08	Adaptive Whole-Body PET Image Denoising Using 3D Diffusion Models with ControlNet	Boxiao Yu et.al.	2411.05302	null
2024-11-07	Quantum Imaging and Metrology with Undetected squeezed Photons: Noise Canceling and Noise Based Imaging	S. Samimi et.al.	2411.05175	null
2024-11-08	SVDQuant: Absorbing Outliers by Low-Rank Components for 4-Bit Diffusion Models	Muyang Li et.al.	2411.05007	link
2024-11-07	Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models	Weixin Liang et.al.	2411.04996	null
2024-11-07	SG-I2V: Self-Guided Trajectory Control in Image-to-Video Generation	Koichi Namekata et.al.	2411.04989	null
2024-11-07	Uncovering Hidden Subspaces in Video Diffusion Models Using Re-Identification	Mischa Dombrowski et.al.	2411.04956	null
2024-11-07	MVSplat360: Feed-Forward 360 Scene Synthesis from Sparse Views	Yuedong Chen et.al.	2411.04924	link
2024-11-07	Differentiable Gaussian Representation for Incomplete CT Reconstruction	Shaokai Wu et.al.	2411.04844	null
2024-11-07	Controlling Human Shape and Pose in Text-to-Image Diffusion Models via Domain Adaptation	Benito Buchheim et.al.	2411.04724	null
2024-11-06	Multi-Reward as Condition for Instruction-based Image Editing	Xin Gu et.al.	2411.04713	null
2024-11-06	SEE-DPO: Self Entropy Enhanced Direct Preference Optimization	Shivanshu Shekhar et.al.	2411.04712	null
2024-11-07	Generative Semantic Communications with Foundation Models: Perception-Error Analysis and Semantic-Aware Power Allocation	Chunmei Xu et.al.	2411.04575	null
2024-11-07	Bayesian Calibration of Win Rate Estimation with LLM Evaluators	Yicheng Gao et.al.	2411.04424	link
2024-11-07	A Pre-training Framework that Encodes Noise Information for Speech Quality Assessment	Subrina Sultana et.al.	2411.04379	null
2024-11-06	X-ray Single-Pixel Imaging with MPGD-based detectors	M. Simões et.al.	2411.03907	null
2024-11-06	VQA $^2$ :Visual Question Answering for Video Quality Assessment	Ziheng Jia et.al.	2411.03795	link
2024-11-06	MOS-Bench: Benchmarking Generalization Abilities of Subjective Speech Quality Assessment Models	Wen-Chin Huang et.al.	2411.03715	link
2024-11-06	Evaluating Eye Tracking Signal Quality with Real-time Gaze Interaction Simulation	Mehedi Hasan Raju et.al.	2411.03708	null
2024-11-06	Investigation of Inward-Outward Ring Permanent Magnet Array for Portable Magnetic Resonance Imaging (MRI)	Ting-Ou Liang et.al.	2411.03249	null
2024-11-05	The Impact of Medicaid Expansion on Medicare Quality Measures	Hala Algrain et.al.	2411.03140	null
2024-11-05	Investigating the Applicability of a Snapshot Computed Tomography Imaging Spectrometer for the Prediction of Brix and pH of Grapes	Mads Svanborg Peters et.al.	2411.03114	null
2024-11-05	Advances in Photoacoustic Imaging Reconstruction and Quantitative Analysis for Biomedical Applications	Lei Wang et.al.	2411.02843	null
2024-11-04	Interaction Design with Generative AI: An Empirical Study of Emerging Strategies Across the Four Phases of Design	Marie Muehlhaus et.al.	2411.02662	null
2024-11-04	Euclid: High-precision imaging astrometry and photometry from Early Release Observations. I. Internal kinematics of NGC 6397 by combining Euclid and Gaia data	M. Libralato et.al.	2411.02487	null
2024-11-02	Cross-D Conv: Cross-Dimensional Transferable Knowledge Base via Fourier Shifting Operation	Mehmet Can Yavuz et.al.	2411.02441	link
2024-11-04	Physically Based Neural Bidirectional Reflectance Distribution Function	Chenliang Zhou et.al.	2411.02347	null
2024-11-04	Diffusion-based Generative Multicasting with Intent-aware Semantic Decomposition	Xinkai Liu et.al.	2411.02334	null
2024-11-03	Degradation-Aware Residual-Conditioned Optimal Transport for Unified Image Restoration	Xiaole Tang et.al.	2411.01656	link
2024-11-03	Optical Flow Representation Alignment Mamba Diffusion Model for Medical Video Generation	Zhenbin Wang et.al.	2411.01647	null
2024-11-03	TPOT: Topology Preserving Optimal Transport in Retinal Fundus Image Enhancement	Xuanzhao Dong et.al.	2411.01403	null
2024-11-02	Interacting Large Language Model Agents. Interpretable Models and Social Learning	Adit Jain et.al.	2411.01271	null
2024-11-02	The impact of MRI image quality on statistical and predictive analysis on voxel based morphology	Felix Hoffstaedter et.al.	2411.01268	link
2024-11-02	Enhancing Diabetic Retinopathy Detection with CNN-Based Models: A Comparative Study of UNET and Stacked UNET Architectures	Ameya Uppina et.al.	2411.01251	null
2024-11-02	Real-Time Spatio-Temporal Reconstruction of Dynamic Endoscopic Scenes with 4D Gaussian Splatting	Fengze Li et.al.	2411.01218	null
2024-11-01	Evaluation Metric for Quality Control and Generative Models in Histopathology Images	Pranav Jeevan et.al.	2411.01034	null
2024-11-01	Re-thinking Richardson-Lucy without Iteration Cutoffs: Physically Motivated Bayesian Deconvolution	Zachary H. Hendrix et.al.	2411.00991	null
2024-11-01	Inter-Feature-Map Differential Coding of Surveillance Video	Kei Iino et.al.	2411.00984	null
2024-11-01	Scalable AI Framework for Defect Detection in Metal Additive Manufacturing	Duy Nhat Phan et.al.	2411.00960	null
2024-11-01	Intensity Field Decomposition for Tissue-Guided Neural Tomography	Meng-Xun Li et.al.	2411.00900	null
2024-11-01	CityGaussianV2: Efficient and Geometrically Accurate Reconstruction for Large-Scale Scenes	Yang Liu et.al.	2411.00771	null
2024-11-01	Face Anonymization Made Simple	Han-Wei Kung et.al.	2411.00762	link
2024-11-01	Demystifying the use of Compression in Virtual Production	Anil Kokaram et.al.	2411.00547	null
2024-11-01	MV-Adapter: Enhancing Underwater Instance Segmentation via Adaptive Channel Attention	Lianjun Liu et.al.	2411.00472	null
2024-10-31	IO Transformer: Evaluating SwinV2-Based Reward Models for Computer Vision	Maxwell Meyer et.al.	2411.00252	null
2024-10-31	Denoising study of Fluoroscopic Images in real time tumor tracking System based on Statistical model of noise	Yongxuan Yan et.al.	2411.00199	null
2024-10-31	Enhancing Motion in Text-to-Video Generation with Decomposed Encoding and Conditioning	Penghui Ruan et.al.	2410.24219	link
2024-10-31	AIDOVECL: AI-generated Dataset of Outpainted Vehicles for Eye-level Classification and Localization	Amir Kazemi et.al.	2410.24116	null
2024-10-31	Parameter choices in HaarPSI for IQA with medical images	Clemens Karner et.al.	2410.24098	link
2024-10-31	Advanced Predictive Quality Assessment for Ultrasonic Additive Manufacturing with Deep Learning Model	Lokendra Poudel et.al.	2410.24055	null
2024-10-31	Image Synthesis with Class-Aware Semantic Diffusion Models for Surgical Scene Segmentation	Yihang Zhou et.al.	2410.23962	null
2024-10-29	Temporal and Spatial Super Resolution with Latent Diffusion Model in Medical MRI images	Vishal Dubey et.al.	2410.23898	null
2024-10-31	Cycle-Constrained Adversarial Denoising Convolutional Network for PET Image Denoising: Multi-Dimensional Validation on Large Datasets with Reader Study and Real Low-Dose Data	Yucun Hou et.al.	2410.23628	null
2024-10-31	LBurst: Learning-Based Robotic Burst Feature Extraction for 3D Reconstruction in Low Light	Ahalya Ravendran et.al.	2410.23522	null
2024-10-30	Plug-and-play superiorization	Jon Henshaw et.al.	2410.23401	null
2024-10-30	Redundant Cross-Correlation for Drift Correction in SEM Nanoparticle Imaging	Iago Bischoff Montenegro et.al.	2410.23390	link
2024-10-30	Variable Resolution Sampling and Deep Learning Image Recovery for Accelerated Multi-Spectral MRI Near Metal Implants	Azadeh Sharafi et.al.	2410.23329	null
2024-10-30	AdaptiveISP: Learning an Adaptive Image Signal Processor for Object Detection	Yujin Wang et.al.	2410.22939	null
2024-10-30	Prune and Repaint: Content-Aware Image Retargeting for any Ratio	Feihong Shen et.al.	2410.22865	link
2024-10-30	Latent Diffusion, Implicit Amplification: Efficient Continuous-Scale Super-Resolution for Remote Sensing Images	Hanlin Wu et.al.	2410.22830	null
2024-10-30	Diffusion Beats Autoregressive: An Evaluation of Compositional Generation in Text-to-Image Models	Arash Marioriyad et.al.	2410.22775	null
2024-10-30	st-DTPM: Spatial-Temporal Guided Diffusion Transformer Probabilistic Model for Delayed Scan PET Image Prediction	Ran Hong et.al.	2410.22732	null
2024-10-30	FlowDCN: Exploring DCN-like Architectures for Fast Image Generation with Arbitrary Resolution	Shuai Wang et.al.	2410.22655	null
2024-10-31	Consistency Diffusion Bridge Models	Guande He et.al.	2410.22637	null
2024-10-29	Deep Priors for Video Quality Prediction	Siddharath Narayan Shakya et.al.	2410.22566	null
2024-10-29	Enhancing Code Annotation Reliability: Generative AI's Role in Comment Quality Assessment Models	Seetharam Killivalavan et.al.	2410.22323	null
2024-10-29	Multimodal Semantic Communication for Generative Audio-Driven Video Conferencing	Haonan Tong et.al.	2410.22112	null
2024-10-29	Data Generation for Hardware-Friendly Post-Training Quantization	Lior Dikstein et.al.	2410.22110	link
2024-10-29	Adapting Diffusion Models for Improved Prompt Compliance and Controllable Image Synthesis	Deepak Sridhar et.al.	2410.21638	link
2024-10-28	Exploring the Design Space of Diffusion Bridge Models via Stochasticity Control	Shaorong Zhang et.al.	2410.21553	null
2024-10-28	SpeechQE: Estimating the Quality of Direct Speech Translation	HyoJung Han et.al.	2410.21485	link
2024-10-28	Kandinsky 3: Text-to-Image Synthesis for Multifunctional Generative Framework	Vladimir Arkhipkin et.al.	2410.21061	link
2024-10-28	A Simple Yet Effective Corpus Construction Framework for Indonesian Grammatical Error Correction	Nankai Lin et.al.	2410.20838	link
2024-10-28	FreqMark: Invisible Image Watermarking via Frequency Based Optimization in Latent Space	Yiyang Guo et.al.	2410.20824	null
2024-10-28	Grid4D: 4D Decomposed Hash Encoding for High-fidelity Dynamic Gaussian Splatting	Jiawei Xu et.al.	2410.20815	null
2024-10-28	LoDAvatar: Hierarchical Embedding and Adaptive Levels of Detail with Gaussian Splatting for Enhanced Human Avatars	Xiaonuo Dongye et.al.	2410.20789	null
2024-10-28	CompGS: Unleashing 2D Compositionality for Compositional Text-to-3D via Dynamically Optimizing 3D Gaussians	Chongjian Ge et.al.	2410.20723	null
2024-10-28	ODGS: 3D Scene Reconstruction from Omnidirectional Images with 3D Gaussian Splattings	Suyoung Lee et.al.	2410.20686	link
2024-10-27	Normal-GS: 3D Gaussian Splatting with Normal-Involved Rendering	Meng Wei et.al.	2410.20593	null
2024-10-27	Sebica: Lightweight Spatial and Efficient Bidirectional Channel Attention Super Resolution Network	Chongxiao Liu et.al.	2410.20546	link
2024-10-27	Enhancing Community Vision Screening -- AI Driven Retinal Photography for Early Disease Detection and Patient Trust	Xiaofeng Lei et.al.	2410.20309	null
2024-10-27	GUMBEL-NERF: Representing Unseen Objects as Part-Compositional Neural Radiance Fields	Yusuke Sekikawa et.al.	2410.20306	null
2024-10-26	OAR-Weighted Dice Score: A spatially aware, radiosensitivity aware metric for target structure contour quality assessment	Lucas McCullum et.al.	2410.20243	null
2024-10-26	Cross-Platform Neural Video Coding: A Case Study	Ruhan Conceição et.al.	2410.20145	null
2024-10-26	Super-resolved virtual staining of label-free tissue using diffusion models	Yijie Zhang et.al.	2410.20073	null
2024-10-25	The Galaxy Zoo Catalogs for the Galaxy And Mass Assembly (GAMA) Survey	Benne W. Holwerda et.al.	2410.19985	null
2024-10-25	FasterCache: Training-Free Video Diffusion Model Acceleration with High Quality	Zhengyao Lv et.al.	2410.19355	null
2024-10-25	Simpler Diffusion (SiD2): 1.5 FID on ImageNet512 with pixel-space diffusion	Emiel Hoogeboom et.al.	2410.19324	null
2024-10-24	Optimising image capture for low-light widefield quantitative fluorescence microscopy	Zane Peterkovic et.al.	2410.19210	null
2024-10-24	Sort-free Gaussian Splatting via Weighted Sum Rendering	Qiqi Hou et.al.	2410.18931	null
2024-10-24	SafeBench: A Safety Evaluation Framework for Multimodal Large Language Models	Zonghao Ying et.al.	2410.18927	null
2024-10-24	Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances	Shilin Lu et.al.	2410.18775	link
2024-10-24	Advancements in Image Resolution: Super-Resolution Algorithm for Enhanced EOS-06 OCM-3 Data	Ankur Garg et.al.	2410.18690	null
2024-10-24	ODDN: Addressing Unpaired Data Challenges in Open-World Deepfake Detection on Online Social Networks	Renshuai Tao et.al.	2410.18687	null
2024-10-24	Knowledge Distillation Using Frontier Open-source LLMs: Generalizability and the Role of Synthetic Data	Anup Shirgaonkar et.al.	2410.18588	null
2024-10-24	ToolFlow: Boosting LLM Tool-Calling Through Natural and Coherent Dialogue Synthesis	Zezhong Wang et.al.	2410.18447	null
2024-10-24	FreCaS: Efficient Higher-Resolution Image Generation via Frequency-aware Cascaded Sampling	Zhengqiang Zhang et.al.	2410.18410	link
2024-10-23	Neural Cover Selection for Image Steganography	Karl Chahine et.al.	2410.18216	link
2024-10-23	In-Pixel Foreground and Contrast Enhancement Circuits with Customizable Mapping	Md Rahatul Islam Udoy et.al.	2410.18052	null
2024-10-23	Scalable Ranked Preference Optimization for Text-to-Image Generation	Shyamgopal Karthik et.al.	2410.18013	null
2024-10-23	Together We Can: Multilingual Automatic Post-Editing for Low-Resource Languages	Sourabh Deoghare et.al.	2410.17973	null
2024-10-23	Non-intrusive Speech Quality Assessment with Diffusion Models Trained on Clean Speech	Danilo de Oliveira et.al.	2410.17834	null
2024-10-23	TopoQA: a topological deep learning-based approach for protein complex structure interface quality assessment	Bingqing Han et.al.	2410.17815	null
2024-10-23	An Intelligent Agentic System for Complex Image Restoration Problems	Kaiwen Zhu et.al.	2410.17809	link
2024-10-24	Testing Deep Learning Recommender Systems Models on Synthetic GAN-Generated Datasets	Jesús Bobadilla et.al.	2410.17651	null
2024-10-25	Comprehensive Evaluation of Matrix Factorization Models for Collaborative Filtering Recommender Systems	Jesús Bobadilla et.al.	2410.17644	null
2024-10-23	Bilateral Hippocampi Segmentation in Low Field MRIs Using Mutual Feature Learning via Dual-Views	Himashi Peiris et.al.	2410.17502	link
2024-10-21	MvDrag3D: Drag-based Creative 3D Editing via Multi-view Generation-Reconstruction Priors	Honghua Chen et.al.	2410.16272	null
2024-10-21	Multispectral Texture Synthesis using RGB Convolutional Neural Networks	Sélim Ollivier et.al.	2410.16019	null
2024-10-22	Wireless Link Quality Estimation Using LSTM Model	Yuki Kanto et.al.	2410.15357	null
2024-10-19	A Survey on All-in-One Image Restoration: Taxonomy, Evaluation and Future Trends	Junjun Jiang et.al.	2410.15067	link
2024-10-18	DRACO: Differentiable Reconstruction for Arbitrary CBCT Orbits	Chengze Ye et.al.	2410.14900	link
2024-10-18	Dynamic Negative Guidance of Diffusion Models	Felix Koulischer et.al.	2410.14398	link
2024-10-18	Gaia Data Release 3: spectroscopic binary-star orbital solutions and the SB1 processing chain	E. Gosset et.al.	2410.14372	null
2024-10-18	2D-3D Deformable Image Registration of Histology Slide and Micro-CT with ML-based Initialization	Junan Chen et.al.	2410.14343	null
2024-10-18	Advanced Underwater Image Quality Enhancement via Hybrid Super-Resolution Convolutional Neural Networks and Multi-Scale Retinex-Based Defogging Techniques	Yugandhar Reddy Gogireddy et.al.	2410.14285	null
2024-10-18	Takin-ADA: Emotion Controllable Audio-Driven Animation with Canonical and Landmark Loss Optimization	Bin Lin et.al.	2410.14283	null
2024-10-18	Combining Hough Transform and Deep Learning Approaches to Reconstruct ECG Signals From Printouts	Felix Krones et.al.	2410.14185	null
2024-10-18	Unlabeled Action Quality Assessment Based on Multi-dimensional Adaptive Constrained Dynamic Time Warping	Renguang Chen et.al.	2410.14161	null
2024-10-17	Generating Signed Language Instructions in Large-Scale Dialogue Systems	Mert İnan et.al.	2410.14026	null
2024-10-17	Fluid: Scaling Autoregressive Text-to-image Generative Models with Continuous Tokens	Lijie Fan et.al.	2410.13863	null
2024-10-15	Comparison of Image Preprocessing Techniques for Vehicle License Plate Recognition Using OCR: Performance and Accuracy Evaluation	Renato Augusto Tavares et.al.	2410.13622	null
2024-10-17	L3DG: Latent 3D Gaussian Diffusion	Barbara Roessle et.al.	2410.13530	null
2024-10-17	Enhancing Crowdsourced Audio for Text-to-Speech Models	José Giraldo et.al.	2410.13357	null
2024-10-17	Active inference and deep generative modeling for cognitive ultrasound	Ruud JG van Sloun et.al.	2410.13310	null
2024-10-17	Latent Image and Video Resolution Prediction using Convolutional Neural Networks	Rittwika Kansabanik et.al.	2410.13227	null
2024-10-17	Anchored Alignment for Self-Explanations Enhancement	Luis Felipe Villa-Arenas et.al.	2410.13216	null
2024-10-17	Using RLHF to align speech enhancement approaches to mean-opinion quality scores	Anurag Kumar et.al.	2410.13182	null
2024-10-16	Super-resolving Real-world Image Illumination Enhancement: A New Dataset and A Conditional Diffusion Model	Yang Liu et.al.	2410.12961	null
2024-10-16	Embedding an Ethical Mind: Aligning Text-to-Image Synthesis via Lightweight Value Optimization	Xingqi Wang et.al.	2410.12700	link
2024-10-16	SWIM: An Attention-Only Model for Speech Quality Assessment Under Subjective Variance	Imran E Kibria et.al.	2410.12675	null
2024-10-16	MambaPainter: Neural Stroke-Based Rendering in a Single Step	Tomoya Sawada et.al.	2410.12524	link
2024-10-16	Conditional Outcome Equivalence: A Quantile Alternative to CATE	Josh Givens et.al.	2410.12454	link
2024-10-16	Triplet: Triangle Patchlet for Mesh-Based Inverse Rendering and Scene Parameters Approximation	Jiajie Yang et.al.	2410.12414	link
2024-10-14	Learnable Optimization-Based Algorithms for Low-Dose CT Reconstruction	Daisy Chen et.al.	2410.11903	null
2024-10-15	Generative Image Steganography Based on Point Cloud	Zhong Yangjie et.al.	2410.11673	null
2024-10-15	Fast Local Neural Regression for Low-Cost, Path Traced Lambertian Global Illumination	Arturo Salmi et.al.	2410.11625	null
2024-10-15	Rician Denoising Diffusion Probabilistic Models For Sodium Breast MRI Enhancement	Shuaiyu Yuan et.al.	2410.11511	null
2024-10-15	Visual-Geometric Collaborative Guidance for Affordance Learning	Hongchen Luo et.al.	2410.11363	link
2024-10-15	Evolutionary Retrofitting	Mathurin Videau et.al.	2410.11330	null
2024-10-14	Watching the Watchers: Exposing Gender Disparities in Machine Translation Quality Estimation	Emmanouil Zaranis et.al.	2410.10995	link
2024-10-14	LVD-2M: A Long-take Video Dataset with Temporally Dense Captions	Tianwei Xiong et.al.	2410.10816	link
2024-10-14	Cavia: Camera-controllable Multi-view Video Diffusion with View-Integrated Attention	Dejia Xu et.al.	2410.10774	null
2024-10-14	LISAC: Learned Coded Waveform Design for ISAC with OFDM	Chenghong Bian et.al.	2410.10711	null
2024-10-14	A Novel No-Reference Image Quality Metric For Assessing Sharpness In Satellite Imagery	Lucas Gonzalo Antonel et.al.	2410.10488	null
2024-10-14	Two-Stage Approach for Brain MR Image Synthesis: 2D Image Synthesis and 3D Refinement	Jihoon Cho et.al.	2410.10269	null
2024-10-14	Saliency Guided Optimization of Diffusion Latents	Xiwen Wang et.al.	2410.10257	null
2024-10-14	QE-EBM: Using Quality Estimators as Energy Loss for Machine Translation	Gahyun Yoo et.al.	2410.10228	null
2024-10-14	Automated Filtering of Human Feedback Data for Aligning Text-to-Image Diffusion Models	Yongjin Yang et.al.	2410.10166	link
2024-10-14	StegaINR4MIH: steganography by implicit neural representation for multi-image hiding	Weina Dong et.al.	2410.10117	link
2024-10-13	Crowd IQ -- Aggregating Opinions to Boost Performance	Michal Kosinski et.al.	2410.10004	null
2024-10-13	Combining Generative and Geometry Priors for Wide-Angle Portrait Correction	Lan Yao et.al.	2410.09911	link
2024-10-13	Two-Stage Human Verification using HandCAPTCHA and Anti-Spoofed Finger Biometrics with Feature Selection	Asish Bera et.al.	2410.09866	null
2024-10-12	Preserving Old Memories in Vivid Detail: Human-Interactive Photo Restoration Framework	Seung-Yeon Back et.al.	2410.09529	null
2024-10-12	Fine-grained subjective visual quality assessment for high-fidelity compressed images	Michela Testolina et.al.	2410.09501	link
2024-10-12	Enhancing Single Image to 3D Generation using Gaussian Splatting and Hybrid Diffusion Priors	Hritam Basak et.al.	2410.09467	null
2024-10-11	TD-Paint: Faster Diffusion Inpainting Through Time Aware Pixel Conditioning	Tsiry Mayet et.al.	2410.09306	null
2024-10-11	SceneCraft: Layout-Guided 3D Scene Generation	Xiuyu Yang et.al.	2410.09049	link
2024-10-11	Learning Interaction-aware 3D Gaussian Splatting for One-shot Hand Avatars	Xuan Huang et.al.	2410.08840	link
2024-10-11	Towards virtual painting recolouring using Vision Transformer on X-Ray Fluorescence datacubes	Alessandro Bombini et.al.	2410.08826	null
2024-10-11	A Theoretical Framework for AI-driven data quality monitoring in high-volume data environments	Nikhil Bangad et.al.	2410.08576	null
2024-10-11	Context-Aware Full Body Anonymization using Text-to-Image Diffusion Models	Pascl Zwick et.al.	2410.08551	link
2024-10-11	Quality Prediction of AI Generated Images and Videos: Emerging Trends and Opportunities	Abhijay Ghildyal et.al.	2410.08534	null
2024-10-10	Koala-36M: A Large-scale Video Dataset Improving Consistency between Fine-grained Conditions and Video Content	Qiuheng Wang et.al.	2410.08260	null
2024-10-10	Exploring ASR-Based Wav2Vec2 for Automated Speech Disorder Assessment: Insights and Analysis	Tuan Nguyen et.al.	2410.08250	null
2024-10-10	ZeroComp: Zero-shot Object Compositing from Image Intrinsics via Diffusion	Zitian Zhang et.al.	2410.08168	link
2024-10-10	Efficient Perspective-Correct 3D Gaussian Splatting Using Hybrid Transparency	Florian Hahlbohm et.al.	2410.08129	null
2024-10-10	Medical Image Quality Assessment based on Probability of Necessity and Sufficiency	Boyu Chen et.al.	2410.08118	null
2024-10-10	High-redshift LBG selection from broadband and wide photometric surveys using a Random Forest algorithm	C. Payerne et.al.	2410.08062	null
2024-10-10	Modeling User Preferences with Automatic Metrics: Creating a High-Quality Preference Dataset for Machine Translation	Sweta Agrawal et.al.	2410.07779	null
2024-10-10	Synthesizing Multi-Class Surgical Datasets with Anatomy-Aware Diffusion Models	Danush Kumar Venkatesh et.al.	2410.07753	link
2024-10-10	Multi-Facet Counterfactual Learning for Content Quality Evaluation	Jiasheng Zheng et.al.	2410.07693	null
2024-10-10	DPL: Cross-quality DeepFake Detection via Dual Progressive Learning	Dongliang Zhang et.al.	2410.07633	null
2024-10-10	Rank Aggregation in Crowdsourcing for Listwise Annotations	Wenshui Luo et.al.	2410.07538	null
2024-10-10	A 3D-Printed Table for Hybrid X-ray CT and Optical Imaging of a Live Mouse	Wenxuan Xue et.al.	2410.07517	null
2024-10-09	An undetectable watermark for generative image models	Sam Gunn et.al.	2410.07369	link
2024-10-09	Secure Video Quality Assessment Resisting Adversarial Attacks	Ao-Xiang Zhang et.al.	2410.06866	null
2024-10-09	Diff-FMT: Diffusion Models for Fluorescence Molecular Tomography	Qianqian Xue et.al.	2410.06757	null
2024-10-09	MimicTalk: Mimicking a personalized and expressive 3D talking face in minutes	Zhenhui Ye et.al.	2410.06734	null
2024-10-09	Perceptual Quality Assessment of Octree-RAHT Encoded 3D Point Clouds	Dongshuai Duan et.al.	2410.06729	link
2024-10-09	Perceptual Quality Assessment of Trisoup-Lifting Encoded 3D Point Clouds	Juncheng Long et.al.	2410.06689	link
2024-10-09	SCOREQ: Speech Quality Assessment with Contrastive Regression	Alessandro Ragano et.al.	2410.06675	link
2024-10-09	InstantIR: Blind Image Restoration with Instant Generative Reference	Jen-Yuan Huang et.al.	2410.06551	null
2024-10-08	Are Large Language Models State-of-the-art Quality Estimators for Machine Translation of User-generated Content?	Shenbin Qian et.al.	2410.06338	link
2024-10-08	Automated quality assessment using appearance-based simulations and hippocampus segmentation on low-field paediatric brain MR images	Vaanathi Sundaresan et.al.	2410.06161	link
2024-10-08	Toward Scalable Image Feature Compression: A Content-Adaptive and Diffusion-Based Approach	Sha Guo et.al.	2410.06149	null
2024-10-08	AP-LDM: Attentive and Progressive Latent Diffusion Model for Training-Free High-Resolution Image Generation	Boyuan Cao et.al.	2410.06055	link
2024-10-08	Is the MMI Criterion Necessary for Interpretability? Degenerating Non-causal Features to Plain Noise for Self-Rationalization	Wei Liu et.al.	2410.06003	link
2024-10-08	Integrating Online Learning and Connectivity Maintenance for Communication-Aware Multi-Robot Coordination	Yupeng Yang et.al.	2410.05798	link
2024-10-08	T2V-Turbo-v2: Enhancing Video Generation Model Post-Training through Data, Reward, and Conditional Guidance Design	Jiachen Li et.al.	2410.05677	null
2024-10-08	Holistic Unlearning Benchmark: A Multi-Faceted Evaluation for Text-to-Image Diffusion Model Unlearning	Saemi Moon et.al.	2410.05664	null
2024-10-08	Rethinking Reward Model Evaluation: Are We Barking up the Wrong Tree?	Xueru Wen et.al.	2410.05584	null
2024-10-07	Image Watermarks are Removable Using Controllable Regeneration from Clean Noise	Yepeng Liu et.al.	2410.05470	link
2024-10-07	SharpSLAM: 3D Object-Oriented Visual SLAM with Deblurring for Agile Drones	Denis Davletshin et.al.	2410.05405	null
2024-10-07	Towards a Modern and Lightweight Rendering Engine for Dynamic Robotic Simulations	Christopher John Allison et.al.	2410.05095	null
2024-10-07	Real-time cardiac cine MRI -- A comparison of a diffusion probabilistic model with alternative state-of-the-art image reconstruction techniques for undersampled spiral acquisitions	Oliver Schad et.al.	2410.04843	null
2024-10-07	Learning Efficient and Effective Trajectories for Differential Equation-based Image Restoration	Zhiyu Zhu et.al.	2410.04811	link
2024-10-07	Transforming Color: A Novel Image Colorization Method	Hamza Shafiq et.al.	2410.04799	null
2024-10-07	CAR: Controllable Autoregressive Modeling for Visual Generation	Ziyu Yao et.al.	2410.04671	link
2024-10-07	Federated Learning Nodes Can Reconstruct Peers' Image Data	Ethan Wilson et.al.	2410.04661	null
2024-10-06	Towards Unsupervised Blind Face Restoration using Diffusion Prior	Tianshu Kuai et.al.	2410.04618	null
2024-10-06	How Does the Disclosure of AI Assistance Affect the Perceptions of Writing?	Zhuoyan Li et.al.	2410.04545	null
2024-10-06	VideoGuide: Improving Video Diffusion Models without Training Through a Teacher's Guide	Dohun Lee et.al.	2410.04364	null
2024-10-05	Persona Knowledge-Aligned Prompt Tuning Method for Online Debate	Chunkit Chan et.al.	2410.04239	link
2024-10-05	AIM 2024 Challenge on Video Super-Resolution Quality Assessment: Methods and Results	Ivan Molodetskikh et.al.	2410.04225	null
2024-10-05	Deep Transfer Learning Based Peer Review Aggregation and Meta-review Generation for Scientific Articles	Md. Tarek Hasan et.al.	2410.04202	null
2024-10-05	Overcoming False Illusions in Real-World Face Restoration with Multi-Modal Guided Diffusion Model	Keda Tao et.al.	2410.04161	null
2024-10-05	Can the Variation of Model Weights be used as a Criterion for Self-Paced Multilingual NMT?	Àlex R. Atrio et.al.	2410.04147	null
2024-10-05	Beyond Imperfections: A Conditional Inpainting Approach for End-to-End Artifact Removal in VTON and Pose Transfer	Aref Tabatabaei et.al.	2410.04052	null
2024-10-04	LANTERN: Accelerating Visual Autoregressive Models with Relaxed Speculative Decoding	Doohyuk Jang et.al.	2410.03355	null
2024-10-04	CLOVE: Travelling Salesman's approach to hyperbolic embeddings of complex networks with communities	Sámuel G. Balogh et.al.	2410.03270	null
2024-10-04	Parallel Corpus Augmentation using Masked Language Models	Vibhuti Kumari et.al.	2410.03194	null
2024-10-04	ECHOPulse: ECG controlled echocardio-grams video generation	Yiwei Li et.al.	2410.03143	link
2024-10-03	Diffusion-based Extreme Image Compression with Compressed Feature Initialization	Zhiyuan Li et.al.	2410.02640	link
2024-10-03	An Improved Variational Method for Image Denoising	Jing-En Huang et.al.	2410.02587	null
2024-10-03	Combining Pre- and Post-Demosaicking Noise Removal for RAW Video	Marco Sánchez-Beeckman et.al.	2410.02572	null
2024-10-03	Dog-IQA: Standard-guided Zero-shot MLLM for Mix-grained Image Quality Assessment	Kai Liu et.al.	2410.02505	link
2024-10-03	Eliminating Oversaturation and Artifacts of High Guidance Scales in Diffusion Models	Seyedmorteza Sadat et.al.	2410.02416	null
2024-10-03	Morphological evaluation of subwords vocabulary used by BETO language model	Óscar García-Sierra et.al.	2410.02283	null
2024-10-03	SC-CDM: Enhancing Quality of Image Semantic Communication with a Compact Diffusion Model	Kexin Zhang et.al.	2410.02121	null
2024-10-02	DisEnvisioner: Disentangled and Enriched Visual Prompt for Customized Image Generation	Jing He et.al.	2410.02067	null
2024-10-02	Impact of White-Box Adversarial Attacks on Convolutional Neural Networks	Rakesh Podder et.al.	2410.02043	null
2024-10-02	Social Media Authentication and Combating Deepfakes using Semi-fragile Invisible Image Watermarking	Aakash Varma Nadimpalli et.al.	2410.01906	null
2024-10-02	Enhancing LLM Fine-tuning for Text-to-SQLs by SQL Quality Measurement	Shouvon Sarker et.al.	2410.01869	null
2024-10-02	ComfyGen: Prompt-Adaptive Workflows for Text-to-Image Generation	Rinon Gal et.al.	2410.01731	null
2024-10-04	HarmoniCa: Harmonizing Training and Inference for Better Feature Cache in Diffusion Transformer Acceleration	Yushi Huang et.al.	2410.01723	null
2024-10-02	Accelerating Auto-regressive Text-to-Image Generation with Training-free Speculative Jacobi Decoding	Yao Teng et.al.	2410.01699	link
2024-10-02	SAFE: Semantic Adaptive Feature Extraction with Rate Control for 6G Wireless Communications	Yuna Yan et.al.	2410.01597	null
2024-10-02	Frequency-Dependent F-Numbers Suppress Grating Lobes and Improve the Lateral Resolution in Line-by-Line Scanning	Martin F. Schiffner et.al.	2410.01593	null
2024-10-02	Imaging foundation model for universal enhancement of non-ideal measurement CT	Yuxin Liu et.al.	2410.01591	link
2024-10-02	HARMONI at ELT: tolerance analysis and expected as-build imaging performance of the infrared spectrograph	Eduard Muslimov et.al.	2410.01581	null
2024-10-02	Adaptive Radiofrequency Shimming in MRI using Reconfigurable Dielectric Materials	Paulina Šiurytė et.al.	2410.01501	null
2024-10-02	Quo Vadis RankList-based System in Face Recognition?	Xinyi Zhang et.al.	2410.01498	null
2024-10-02	Design of a custom wideband camera for MISTRAL imager-spectrograph	Eduard Muslimov et.al.	2410.01414	null
2024-10-02	CSIM: A Copula-based similarity index sensitive to local changes for Image quality assessment	Safouane El Ghazouali et.al.	2410.01411	link
2024-10-01	Generating Seamless Virtual Immunohistochemical Whole Slide Images with Content and Color Consistency	Sitong Liu et.al.	2410.01072	null
2024-10-01	LaDTalk: Latent Denoising for Synthesizing Talking Head Videos with High Frequency Details	Jian Yang et.al.	2410.00990	null
2024-10-01	Energy-Quality-aware Variable Framerate Pareto-Front for Adaptive Video Streaming	Prajit T Rajendran et.al.	2410.00849	null
2024-10-01	Maximum entropy and quantized metric models for absolute category ratings	Dietmar Saupe et.al.	2410.00817	null
2024-10-01	Basis function compression for field probe monitoring	Paul Dubovan et.al.	2410.00754	null
2024-10-01	Development of the normalization method for the first large field-of-view plastic-based PET Modular scanner	A. Coussat et.al.	2410.00669	null
2024-10-01	Contribution of soundscape appropriateness to soundscape quality assessment in space: a mediating variable affecting acoustic comfort	Xinhao Yang et.al.	2410.00667	null
2024-10-01	AutoTM 2.0: Automatic Topic Modeling Framework for Documents Analysis	Maria Khodorchenko et.al.	2410.00655	null
2024-10-01	Dynamic and Scalable Data Preparation for Object-Centric Process Mining	Lien Bosmans et.al.	2410.00596	null
2024-09-30	UIR-LoRA: Achieving Universal Image Restoration through Multiple Low-Rank Adaptation	Cheng Zhang et.al.	2409.20197	link
2024-09-30	Segmenting Wood Rot using Computer Vision Models	Roland Kammerbauer et.al.	2409.20137	null
2024-09-30	Machine Learning in Industrial Quality Control of Glass Bottle Prints	Maximilian Bundscherer et.al.	2409.20132	null
2024-09-30	Q-Bench-Video: Benchmarking the Video Quality Understanding of LMMs	Zicheng Zhang et.al.	2409.20063	null
2024-09-30	Is Preference Alignment Always the Best Option to Enhance LLM-Based Translation? An Empirical Analysis	Hippolyte Gisserot-Boukhlef et.al.	2409.20059	null
2024-10-01	UniSumEval: Towards Unified, Fine-Grained, Multi-Dimensional Summarization Evaluation for LLMs	Yuho Lee et.al.	2409.19898	link
2024-09-29	OrganiQ: Mitigating Classical Resource Bottlenecks of Quantum Generative Adversarial Networks on NISQ-Era Machines	Daniel Silver et.al.	2409.19823	null
2024-09-29	SemiDDM-Weather: A Semi-supervised Learning Framework for All-in-one Adverse Weather Removal	Fang Long et.al.	2409.19679	link
2024-09-29	Effective Diffusion Transformer Architecture for Image Super-Resolution	Kun Cheng et.al.	2409.19589	link
2024-09-29	High Quality Human Image Animation using Regional Supervision and Motion Blur Condition	Zhongcong Xu et.al.	2409.19580	null
2024-09-27	A comprehensive review and new taxonomy on superpixel segmentation	I. B. Barcelos et.al.	2409.19179	link
2024-09-27	Multimodal Pragmatic Jailbreak on Text-to-image Models	Tong Liu et.al.	2409.19149	null
2024-09-27	ReviveDiff: A Universal Diffusion Model for Restoring Images in Adverse Weather Conditions	Wenfeng Huang et.al.	2409.18932	null
2024-09-27	Unsupervised Low-light Image Enhancement with Lookup Tables and Diffusion Priors	Yunlong Lin et.al.	2409.18899	null
2024-09-27	Effectiveness of learning-based image codecs on fingerprint storage	Daniele Mari et.al.	2409.18730	link
2024-09-27	Decoding Complexity-Rate-Quality Pareto-Front for Adaptive VVC Streaming	Angeliki Katsenou et.al.	2409.18713	null
2024-09-27	Align $^2$ LLaVA: Cascaded Human and Large Language Model Preference Alignment for Multi-modal Instruction Curation	Hongzhe Huang et.al.	2409.18541	link
2024-09-27	Underwater Image Enhancement with Physical-based Denoising Diffusion Implicit Models	Nguyen Gia Bach et.al.	2409.18476	link
2024-09-27	GenesisTex2: Stable, Consistent and High-Quality Text-to-Texture Generation	Jiawei Lu et.al.	2409.18401	null
2024-09-27	SinoSynth: A Physics-based Domain Randomization Approach for Generalizable CBCT Image Enhancement	Yunkui Pang et.al.	2409.18355	link
2024-09-26	FlowTurbo: Towards Real-time Flow-Based Image Generation with Velocity Refiner	Wenliang Zhao et.al.	2409.18128	link
2024-09-26	Low Photon Number Non-Invasive Imaging Through Time-Varying Diffusers	Adrian Makowski et.al.	2409.18072	null
2024-09-26	LightAvatar: Efficient Head Avatar as Dynamic Neural Light Field	Huan Wang et.al.	2409.18057	link
2024-09-26	MARS: Multi-radio Architecture with Radio Selection using Decision Trees for emerging mesoscale CPS/IoT applications	Jothi Prasanna Shanmuga Sundaram et.al.	2409.18043	null
2024-09-26	PhoCoLens: Photorealistic and Consistent Reconstruction in Lensless Imaging	Xin Cai et.al.	2409.17996	null
2024-09-26	Resolving Multi-Condition Confusion for Finetuning-Free Personalized Image Generation	Qihan Huang et.al.	2409.17920	link
2024-09-26	Cross-lingual Human-Preference Alignment for Neural Machine Translation with Direct Quality Optimization	Kaden Uhlig et.al.	2409.17673	null
2024-09-26	FlowMAC: Conditional Flow Matching for Audio Coding at Low Bit Rates	Nicola Pia et.al.	2409.17635	null
2024-09-26	Pixel-Space Post-Training of Latent Diffusion Models	Christina Zhang et.al.	2409.17565	null
2024-09-26	Study of Subjective and Objective Quality in Super-Resolution Enhanced Broadcast Images on a Novel SR-IQA Dataset	Yongrok Kim et.al.	2409.17451	null
2024-09-25	DreamWaltz-G: Expressive 3D Gaussian Avatars from Skeleton-Guided 2D Diffusion	Yukun Huang et.al.	2409.17145	link
2024-09-25	Text2CAD: Generating Sequential CAD Models from Beginner-to-Expert Level Text Prompts	Mohammad Sadil Khan et.al.	2409.17106	link
2024-09-25	Language-oriented Semantic Communication for Image Transmission with Fine-Tuned Diffusion Model	Xinfeng Wei et.al.	2409.17104	null
2024-09-25	The effect of image quality on galaxy merger identification with deep learning	Robert W. Bickley et.al.	2409.17081	null
2024-09-25	Degradation-Guided One-Step Image Super-Resolution with Diffusion Priors	Aiping Zhang et.al.	2409.17058	link
2024-09-25	MaViLS, a Benchmark Dataset for Video-to-Slide Alignment, Assessing Baseline Accuracy with a Multimodal Alignment Algorithm Leveraging Speech, OCR, and Visual Features	Katharina Anderer et.al.	2409.16765	link
2024-09-25	Pix2Next: Leveraging Vision Foundation Models for RGB to NIR Image Translation	Youngwan Jin et.al.	2409.16706	null
2024-09-25	In which fields can ChatGPT detect journal article quality? An evaluation of REF2021 results	Mike Thelwall et.al.	2409.16695	null
2024-09-25	Morphological-consistent Diffusion Network for Ultrasound Coronal Image Enhancement	Yihao Zhou et.al.	2409.16661	null
2024-09-25	Pre-trained Language Models Return Distinguishable Probability Distributions to Unfaithfully Hallucinated Texts	Taehun Cha et.al.	2409.16658	link
2024-09-25	Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation	Siyin Wang et.al.	2409.16644	link
2024-09-25	DeformStream: Deformation-based Adaptive Volumetric Video Streaming	Boyan Li et.al.	2409.16615	null
2024-09-25	Prompt Sliders for Fine-Grained Control, Editing and Erasing of Concepts in Diffusion Models	Deepak Sridhar et.al.	2409.16535	link
2024-09-24	Low Latency Point Cloud Rendering with Learned Splatting	Yueyu Hu et.al.	2409.16504	link
2024-09-24	A Unified Hallucination Mitigation Framework for Large Vision-Language Models	Yue Chang et.al.	2409.16494	link
2024-09-24	AIM 2024 Challenge on UHD Blind Photo Quality Assessment	Vlad Hosu et.al.	2409.16271	null
2024-09-26	Enhanced Unsupervised Image-to-Image Translation Using Contrastive Learning and Histogram of Oriented Gradients	Wanchen Zhao et.al.	2409.16042	null
2024-09-24	Deep chroma compression of tone-mapped images	Xenios Milidonis et.al.	2409.16032	link
2024-09-24	VascX Models: Model Ensembles for Retinal Vascular Analysis from Color Fundus Images	Jose Vargas Quiros et.al.	2409.16016	link
2024-09-24	Semantics-Controlled Gaussian Splatting for Outdoor Scene Reconstruction and Rendering in Virtual Reality	Hannah Schieber et.al.	2409.15959	null
2024-09-24	Unsupervised dMRI Artifact Detection via Angular Resolution Enhancement and Cycle Consistency Learning	Sheng Chen et.al.	2409.15883	null
2024-09-25	Ring Artifacts Removal Based on Implicit Neural Representation of Sinogram Data	Ligen Shi et.al.	2409.15731	null
2024-09-23	Blind Localization of Early Room Reflections with Arbitrary Microphone Array	Yogev Hadadi et.al.	2409.15484	null
2024-09-23	Simplifying Triangle Meshes in the Wild	Hsueh-Ti Derek Liu et.al.	2409.15458	null
2024-09-23	MIMAFace: Face Animation via Motion-Identity Modulated Appearance Feature Learning	Yue Han et.al.	2409.15179	null
2024-09-23	Advancing Video Quality Assessment for AIGC	Xinli Yue et.al.	2409.14888	null
2024-09-23	Revisiting Video Quality Assessment from the Perspective of Generalization	Xinli Yue et.al.	2409.14847	link
2024-09-23	AIM 2024 Challenge on Video Saliency Prediction: Methods and Results	Andrey Moskalenko et.al.	2409.14827	link
2024-09-23	HiFi-Glot: Neural Formant Synthesis with Differentiable Resonant Filters	Lauri Juvela et.al.	2409.14823	null
2024-09-22	Robust Audio-Visual Speech Enhancement: Correcting Misassignments in Complex Environments with Advanced Post-Processing	Wenze Ren et.al.	2409.14554	null
2024-09-22	Improved direction of arrival estimations with a wearable microphone array for dynamic environments by reliability weighting	Daniel A. Mitchell et.al.	2409.14346	null
2024-09-22	MQM-APE: Toward High-Quality Error Annotation Predictors with Automatic Post-Editing in LLM Translation Evaluators	Qingyu Lu et.al.	2409.14335	link
2024-09-22	Quantitative and Qualitative Evaluation of NLM and Wavelet Methods in Image Enhancement	Cameron Khanpour et.al.	2409.14334	null
2024-09-21	JVID: Joint Video-Image Diffusion for Visual-Quality and Temporal-Consistency in Video Generation	Hadrien Reynaud et.al.	2409.14149	null
2024-09-21	N-Version Assessment and Enhancement of Generative AI	Marcus Kessel et.al.	2409.14071	null
2024-09-18	An Efficient Projection-Based Next-best-view Planning Framework for Reconstruction of Unknown Objects	Zhizhou Jia et.al.	2409.12096	null
2024-09-18	Dense-TSNet: Dense Connected Two-Stage Structure for Ultra-Lightweight Speech Enhancement	Zizhen Lin et.al.	2409.11725	null
2024-09-18	DAF-Net: A Dual-Branch Feature Decomposition Fusion Network with Domain Adaptive for Infrared and Visible Image Fusion	Jian Xu et.al.	2409.11642	link
2024-09-17	Noise-aware Dynamic Image Denoising and Positron Range Correction for Rubidium-82 Cardiac PET Imaging via Self-supervision	Huidong Xie et.al.	2409.11543	null
2024-09-17	Online 4D Ultrasound-Guided Robotic Tracking Enables 3D Ultrasound Localisation Microscopy with Large Tissue Displacements	Jipeng Yan et.al.	2409.11391	null
2024-09-17	Ultrasound Image Enhancement with the Variance of Diffusion Models	Yuxin Zhang et.al.	2409.11380	link
2024-09-17	Uncertainty and Prediction Quality Estimation for Semantic Segmentation via Graph Neural Networks	Edgar Heinert et.al.	2409.11373	link
2024-09-17	Edge-based Denoising Image Compression	Ryugo Morita et.al.	2409.10978	null
2024-09-17	CUNSB-RFIE: Context-aware Unpaired Neural Schrödinger Bridge in Retinal Fundus Image Enhancement	Xuanzhao Dong et.al.	2409.10966	link
2024-09-17	Towards Effective User Attribution for Latent Diffusion Models via Watermark-Informed Blending	Yongyang Pan et.al.	2409.10958	null
2024-09-17	Neural Fields for Adaptive Photoacoustic Computed Tomography	Tianao Li et.al.	2409.10876	link
2024-09-16	Investigating Training Objectives for Generative Speech Enhancement	Julius Richter et.al.	2409.10753	link
2024-09-16	Taming Diffusion Models for Image Restoration: A Review	Ziwei Luo et.al.	2409.10353	null
2024-09-16	FGR-Net:Interpretable fundus imagegradeability classification based on deepreconstruction learning	Saif Khalid et.al.	2409.10246	null
2024-09-16	RF-GML: Reference-Free Generative Machine Listener	Arijit Biswas et.al.	2409.10210	null
2024-09-16	Towards Explainable Automated Data Quality Enhancement without Domain Knowledge	Djibril Sarr et.al.	2409.10139	null
2024-09-16	2S-ODIS: Two-Stage Omni-Directional Image Synthesis by Geometric Distortion Correction	Atsuya Nakata et.al.	2409.09969	link
2024-09-15	A Global Perspective on the Past, Present, and Future of Video Streaming over Starlink	Liz Izhikevich et.al.	2409.09846	null
2024-09-15	Underwater Image Enhancement via Dehazing and Color Restoration	Chengqin Wu et.al.	2409.09779	null
2024-09-15	High Definition Map Mapping and Update: A General Overview and Future Directions	Benny Wijaya et.al.	2409.09726	null
2024-09-15	Superconducting and low temperature RF Coils for Ultra-Low-Field MRI: A Study on SNR Performance	Aditya A Bhosale et.al.	2409.09608	null
2024-09-14	Estimating Neural Orientation Distribution Fields on High Resolution Diffusion MRI Scans	Mohammed Munzer Dwedari et.al.	2409.09387	link
2024-09-13	Emerging Reliance Behaviors in Human-AI Text Generation: Hallucinations, Data Quality Assessment, and Cognitive Forcing Functions	Zahra Ashktorab et.al.	2409.08937	null
2024-09-13	Confocal Raman Microscopy with Adaptive Optics	J. D. Munoz-Bolanos et.al.	2409.08725	null
2024-09-13	Joint image reconstruction and segmentation of real-time cardiac MRI in free-breathing using a model based on disentangled representation learning	Tobias Wech et.al.	2409.08619	null
2024-09-13	DiffFAS: Face Anti-Spoofing via Generative Diffusion Models	Xinxu Ge et.al.	2409.08572	link
2024-09-13	CasDyF-Net: Image Dehazing via Cascaded Dynamic Filters	Wang Yinglong et.al.	2409.08510	link
2024-09-12	OpenACE: An Open Benchmark for Evaluating Audio Coding Performance	Jozef Coldenhoff et.al.	2409.08374	link
2024-09-12	Expansive Supervision for Neural Radiance Field	Weixiang Zhang et.al.	2409.08056	null
2024-09-12	OCTAMamba: A State-Space Model Approach for Precision OCTA Vasculature Segmentation	Shun Zou et.al.	2409.08000	link
2024-09-14	Exploring Kolmogorov-Arnold networks for realistic image sharpness assessment	Shaode Yu et.al.	2409.07762	null
2024-09-11	Foundation Models Boost Low-Level Perceptual Similarity Metrics	Abhijay Ghildyal et.al.	2409.07650	link
2024-09-11	Machine Learning and Constraint Programming for Efficient Healthcare Scheduling	Aymen Ben Said et.al.	2409.07547	null
2024-09-11	FreeEnhance: Tuning-Free Image Enhancement via Content-Consistent Noising-and-Denoising Process	Yang Luo et.al.	2409.07451	null
2024-09-11	EMOdiffhead: Continuously Emotional Control in Talking Head Generation via Diffusion	Jian Zhang et.al.	2409.07255	link
2024-09-12	3DGCQA: A Quality Assessment Database for 3D AI-Generated Contents	Yingjie Zhou et.al.	2409.07236	link
2024-09-11	Phantom-based gradient waveform measurements with compensated variable-prephasing: Description and application to EPI at 7T	Hannah Scholten et.al.	2409.07203	null
2024-09-11	Attention Down-Sampling Transformer, Relative Ranking and Self-Consistency for Blind Image Quality Assessment	Mohammed Alsaafin et.al.	2409.07115	link
2024-09-11	CPSample: Classifier Protected Sampling for Guarding Training Data During Diffusion	Joshua Kazdan et.al.	2409.07025	null
2024-09-11	AdvLogo: Adversarial Patch Attack against Object Detectors based on Diffusion Models	Boming Miao et.al.	2409.07002	null
2024-09-10	ExIQA: Explainable Image Quality Assessment Using Distortion Attributes	Sepehr Kazemi Ranjbar et.al.	2409.06853	null
2024-09-10	Universal End-to-End Neural Network for Lossy Image Compression	Bouzid Arezki et.al.	2409.06586	null
2024-09-10	Three-dimensional generative adversarial networks for turbulent flow estimation from wall measurements	Antonio Cuéllar et.al.	2409.06548	null
2024-09-11	AMNS: Attention-Weighted Selective Mask and Noise Label Suppression for Text-to-Image Person Retrieval	Runqing Zhang et.al.	2409.06385	null
2024-09-10	Multi-Weather Image Restoration via Histogram-Based Transformer Feature Enhancement	Yang Wen et.al.	2409.06334	null
2024-09-10	DeWinder: Single-Channel Wind Noise Reduction using Ultrasound Sensing	Kuang Yuan et.al.	2409.06137	null
2024-09-09	Enhancing Cross-Modality Synthesis: Subvolume Merging for MRI-to-CT Conversion	Fuxin Fan et.al.	2409.05982	null
2024-09-09	SynMorph: Generating Synthetic Face Morphing Dataset with Mated Samples	Haoyu Zhang et.al.	2409.05595	null
2024-09-09	Efficient Quality Estimation of True Random Bit-streams	Cesare Caratozzolo et.al.	2409.05543	null
2024-09-09	Exploring Rich Subjective Quality Information for Image Quality Assessment in the Wild	Xiongkuo Min et.al.	2409.05540	null
2024-09-09	A Taxonomy of Miscompressions: Preparing Image Forensics for Neural Compression	Nora Hofer et.al.	2409.05490	null
2024-09-09	Boosting CLIP Adaptation for Image Quality Assessment via Meta-Prompt Learning and Gradient Regularization	Xudong Li et.al.	2409.05381	null
2024-09-09	PersonaTalk: Bring Attention to Your Persona in Visual Dubbing	Longhao Zhang et.al.	2409.05379	null
2024-09-09	BigCodec: Pushing the Limits of Low-Bitrate Neural Speech Codec	Detai Xin et.al.	2409.05377	link
2024-09-09	Adaptive Offloading and Enhancement for Low-Light Video Analytics on Mobile Devices	Yuanyi He et.al.	2409.05297	null
2024-09-08	Ultron: Enabling Temporal Geometry Compression of 3D Mesh Sequences using Temporal Correspondence and Mesh Deformation	Haichao Zhu et.al.	2409.05151	null
2024-09-07	Plug-and-Hide: Provable and Adjustable Diffusion Generative Steganography	Jiahao Zhu et.al.	2409.04878	null
2024-09-07	Metadata augmented deep neural networks for wild animal classification	Aslak Tøn et.al.	2409.04825	link
2024-09-11	Fisheye-GS: Lightweight and Extensible Gaussian Splatting Module for Fisheye Cameras	Zimu Liao et.al.	2409.04751	link
2024-09-06	Whole Heart Perfusion with High-Multiband Simultaneous Multislice Imaging via Linear Phase Modulated Extended Field of View (SMILE)	Shen Zhao et.al.	2409.04353	link
2024-09-06	Design and Characterization of MRI-compatible Plastic Ultrasonic Motor	Zhanyue Zhao et.al.	2409.04006	null
2024-09-06	Bi-modality Images Transfer with a Discrete Process Matching Method	Zhe Xiong et.al.	2409.03977	null
2024-09-03	Applications and Advances of Artificial Intelligence in Music Generation:A Review	Yanxu Chen et.al.	2409.03715	null
2024-09-05	Enabling Practical and Privacy-Preserving Image Processing	Chao Wang et.al.	2409.03568	null
2024-09-05	Use of triplet loss for facial restoration in low-resolution images	Sebastian Pulgar et.al.	2409.03530	null
2024-09-05	Improving Uncertainty-Error Correspondence in Deep Bayesian Medical Image Segmentation	Prerak Mody et.al.	2409.03470	link
2024-09-05	Multiple weather images restoration using the task transformer and adaptive mixup strategy	Yang Wen et.al.	2409.03249	null
2024-09-05	Perceptual-Distortion Balanced Image Super-Resolution is a Multi-Objective Optimization Problem	Qiwen Zhu et.al.	2409.03179	link
2024-09-05	Large Étendue 3D Holographic Display with Content-adpative Dynamic Fourier Modulation	Brian Chao et.al.	2409.03143	null
2024-09-04	Incorporating dense metric depth into neural 3D representations for view synthesis and relighting	Arkadeep Narayan Chaudhury et.al.	2409.03061	null
2024-09-04	Rate-Adaptive Generative Semantic Communication Using Conditional Diffusion Models	Pujing Yang et.al.	2409.02597	null
2024-09-04	Coral Model Generation from Single Images for Virtual Reality Applications	Jie Fu et.al.	2409.02376	null
2024-09-04	Image Registration with Averaging Network and Edge-Based Loss for Low-SNR Cardiac MRI	Xuan Lei et.al.	2409.02348	null
2024-09-03	Coaching a Robotic Sonographer: Learning Robotic Ultrasound with Sparse Expert's Feedback	Deepak Raina et.al.	2409.02337	null
2024-09-03	Unveiling Deep Shadows: A Survey on Image and Video Shadow Detection, Removal, and Generation in the Era of Deep Learning	Xiaowei Hu et.al.	2409.02108	link
2024-09-03	AllWeatherNet:Unified Image enhancement for autonomous driving under adverse weather and lowlight-conditions	Chenghao Qian et.al.	2409.02045	link
2024-09-03	Map-Assisted Remote-Sensing Image Compression at Extremely Low Bitrates	Yixuan Ye et.al.	2409.01935	link
2024-09-03	UWStereo: A Large Synthetic Dataset for Underwater Stereo Matching	Qingxuan Lv et.al.	2409.01782	null
2024-09-03	Boron Isotope Effects on Raman Scattering in Bulk BN, BP, and BAs: A Density-Functional Theory Study	Nima Ghafari Cherati et.al.	2409.01671	null
2024-09-03	GaussianPU: A Hybrid 2D-3D Upsampling Framework for Enhancing Color Point Clouds via 3D Gaussian Splatting	Zixuan Guo et.al.	2409.01581	null
2024-09-03	Learning Task-Specific Sampling Strategy for Sparse-View CT Reconstruction	Liutao Yang et.al.	2409.01544	null
2024-09-03	Long-Range Biometric Identification in Real World Scenarios: A Comprehensive Evaluation Framework Based on Missions	Deniz Aykac et.al.	2409.01540	null
2024-09-02	Real-Time Multi-Scene Visibility Enhancement for Promoting Navigational Safety of Vessels Under Complex Weather Conditions	Ryan Wen Liu et.al.	2409.01500	link
2024-09-02	Spectron: Target Speaker Extraction using Conditional Transformer with Adversarial Refinement	Tathagata Bandyopadhyay et.al.	2409.01352	link
2024-09-02	A Roadmap to Holographic Focused Ultrasound Approaches to Generate Thermal Patterns	Ceren Cengiz et.al.	2409.01323	null
2024-09-02	Investigation of the spatial resolution of PET imaging system measuring polarization-correlated Compton events	Ana Marija Kožuljević et.al.	2409.01238	null
2024-09-02	MobileIQA: Exploiting Mobile-level Diverse Opinion Network For No-Reference Image Quality Assessment Using Knowledge Distillation	Zewen Chen et.al.	2409.01212	link
2024-09-02	Generating Synthetic Satellite Imagery for Rare Objects: An Empirical Comparison of Models and Metrics	Tuong Vy Nguyen et.al.	2409.01138	null
2024-09-02	Rapid GPU-Based Pangenome Graph Layout	Jiajie Li et.al.	2409.00876	null
2024-09-01	An Optimized Binning and Probabilistic Slice Sharing Algorithm for Motion Correction in Abdominal DW-MRI	Michelle Su et.al.	2409.00798	null
2024-08-30	Subspace Diffusion Posterior Sampling for Travel-Time Tomography	Xiang Cao et.al.	2408.17333	null
2024-08-30	Image-Perfect Imperfections: Safety, Bias, and Authenticity in the Shadow of Text-To-Image Model Evolution	Yixin Wu et.al.	2408.17285	null
2024-08-30	LAR-IQA: A Lightweight, Accurate, and Robust No-Reference Image Quality Assessment Model	Nasim Jamshidi Avanaki et.al.	2408.17057	link
2024-08-30	Efficient Camera Exposure Control for Visual Odometry via Deep Reinforcement Learning	Shuyang Zhang et.al.	2408.17005	link
2024-08-29	Legacy Learning Using Few-Shot Font Generation Models for Automatic Text Design in Metaverse Content: Cases Studies in Korean and Chinese	Younghwi Kim et.al.	2408.16900	null
2024-08-29	The Continuous Electron Beam Accelerator Facility at 12 GeV	P. A. Adderley et.al.	2408.16880	null
2024-08-29	MSLIQA: Enhancing Learning Representations for Image Quality Assessment through Multi-Scale Learning	Nasim Jamshidi Avanaki et.al.	2408.16879	null
2024-09-04	Auto-resolving atomic structure at van der Waal interfaces using a generative model	Wenqiang Huang et.al.	2408.16802	link
2024-09-02	RLCP: A Reinforcement Learning-based Copyright Protection Method for Text-to-Image Diffusion Model	Zhuan Shi et.al.	2408.16634	null
2024-09-02	A Deep-Learning-Based Label-free No-Reference Image Quality Assessment Metric: Application in Sodium MRI Denoising	Shuaiyu Yuan et.al.	2408.16481	null
2024-08-29	LMT-GP: Combined Latent Mean-Teacher and Gaussian Process for Semi-supervised Low-light Image Enhancement	Ye Yu et.al.	2408.16235	link
2024-08-28	TEDRA: Text-based Editing of Dynamic and Photoreal Actors	Basavaraj Sunagad et.al.	2408.15995	null
2024-08-28	Segmentation-guided Layer-wise Image Vectorization with Gradient Fills	Hengyu Zhou et.al.	2408.15741	link
2024-08-28	Merging and Splitting Diffusion Paths for Semantically Coherent Panoramas	Fabio Quattrini et.al.	2408.15660	link
2024-08-28	Avoiding Generative Model Writer's Block With Embedding Nudging	Ali Zand et.al.	2408.15450	null
2024-09-02	Pitfalls and Outlooks in Using COMET	Vilém Zouhar et.al.	2408.15366	link
2024-08-27	Histo-Diffusion: A Diffusion Super-Resolution Method for Digital Pathology with Comprehensive Quality Assessment	Xuan Xu et.al.	2408.15218	null
2024-08-27	CLIP-AGIQA: Boosting the Performance of AI-Generated Image Quality Assessment with CLIP	Zhenchen Tang et.al.	2408.15098	null
2024-08-27	Towards Real-world Event-guided Low-light Video Enhancement and Deblurring	Taewoo Kim et.al.	2408.14916	link
2024-08-27	Alfie: Democratising RGBA Image Generation With No $$$	Fabio Quattrini et.al.	2408.14826	link
2024-08-27	Sequential-Scanning Dual-Energy CT Imaging Using High Temporal Resolution Image Reconstruction and Error-Compensated Material Basis Image Generation	Qiaoxin Li et.al.	2408.14754	null
2024-08-26	Gallery-Aware Uncertainty Estimation For Open-Set Face Recognition	Leonid Erlygin et.al.	2408.14229	null
2024-08-27	SwiftBrush v2: Make Your One-step Diffusion Model Better Than Its Teacher	Trung Dao et.al.	2408.14176	link
2024-08-27	Improving Water Quality Time-Series Prediction in Hong Kong using Sentinel-2 MSI Data and Google Earth Engine Cloud Computing	Rohin Sood et.al.	2408.14010	null
2024-08-26	LMM-VQA: Advancing Video Quality Assessment with Large Multimodal Models	Qihang Ge et.al.	2408.14008	null
2024-08-25	Draw Like an Artist: Complex Scene Generation with Diffusion Model via Composition, Painting, and Retouching	Minghao Liu et.al.	2408.13858	null
2024-08-25	Guardians of the Machine Translation Meta-Evaluation: Sentinel Metrics Fall In!	Stefano Perrella et.al.	2408.13831	link
2024-08-24	G3DST: Generalizing 3D Style Transfer with Neural Radiance Fields across Scenes and Styles	Adil Meric et.al.	2408.13508	null
2024-08-23	ReCon: Reconfiguring Analog Rydberg Atom Quantum Computers for Quantum Generative Adversarial Networks	Nicholas S. DiBrita et.al.	2408.13389	link
2024-08-23	Re-evaluation of Face Anti-spoofing Algorithm in Post COVID-19 Era Using Mask Based Occlusion Attack	Vaibhav Sundharam et.al.	2408.13251	null
2024-08-23	ResSR: A Residual Approach to Super-Resolving Multispectral Images	Haley Duba-Sullivan et.al.	2408.13225	link
2024-08-23	A density ratio framework for evaluating the utility of synthetic data	Thom Benjamin Volker et.al.	2408.13167	null
2024-08-23	When Diffusion MRI Meets Diffusion Model: A Novel Deep Generative Model for Diffusion MRI Generation	Xi Zhu et.al.	2408.12897	null
2024-08-22	Variable Stars in M31 Stellar Clusters from the Panchromatic Hubble Andromeda Treasury	Richard Smith et.al.	2408.12765	null
2024-08-22	Visual Verity in AI-Generated Imagery: Computational Metrics and Human-Centric Analysis	Memoona Aziz et.al.	2408.12762	null
2024-08-22	Unlocking Intrinsic Fairness in Stable Diffusion	Eunji Kim et.al.	2408.12692	null
2024-08-22	Developing vocal system impaired patient-aimed voice quality assessment approach using ASR representation-included multiple features	Shaoxiang Dang et.al.	2408.12279	null
2024-08-21	MBSS-T1: Model-Based Self-Supervised Motion Correction for Robust Cardiac T1 Mapping	Eyal Hanania et.al.	2408.11992	link
2024-08-21	AIM 2024 Challenge on Compressed Video Quality Assessment: Methods and Results	Maksim Smirnov et.al.	2408.11982	link
2024-08-21	Estimating Contribution Quality in Online Deliberations Using a Large Language Model	Lodewijk Gelauff et.al.	2408.11936	null
2024-08-21	FRAP: Faithful and Realistic Text-to-Image Generation with Adaptive Prompt Weighting	Liyao Jiang et.al.	2408.11706	null
2024-08-21	Interpretable Long-term Action Quality Assessment	Xu Dong et.al.	2408.11687	link
2024-08-21	E-Bench: Subjective-Aligned Benchmark Suite for Text-Driven Video Editing Quality Assessment	Shangkun Sun et.al.	2408.11481	link
2024-08-21	Fairness measures for biometric quality assessment	André Dörsch et.al.	2408.11392	null
2024-08-21	Gender Bias Evaluation in Text-to-image Generation: A Survey	Yankun Wu et.al.	2408.11358	null
2024-08-21	Image Score: Learning and Evaluating Human Preferences for Mercari Search	Chingis Oinar et.al.	2408.11349	null
2024-08-21	High-quality imaging of large areas through path-difference ptychography	Jizhe Cui et.al.	2408.11332	null
2024-08-21	Optimizing Transmit Field Inhomogeneity of Parallel RF Transmit Design in 7T MRI using Deep Learning	Zhengyi Lu et.al.	2408.11323	null
2024-08-21	Transfer Learning and the Early Estimation of Single-Photon Source Quality using Machine Learning Methods	David Jacob Kedziora et.al.	2408.11322	link
2024-08-20	Compress Guidance in Conditional Diffusion Sampling	Anh-Dung Dinh et.al.	2408.11194	null
2024-08-20	Prompt-Guided Image-Adaptive Neural Implicit Lookup Tables for Interpretable Image Enhancement	Satoshi Kosugi et.al.	2408.11055	link
2024-08-20	Denoising Plane Wave Ultrasound Images Using Diffusion Probabilistic Models	Hojat Asgariandehkordi et.al.	2408.10987	null
2024-08-20	Influence of Medical Foreign Bodies on Dark-Field Chest Radiographs: First experiences	Lennard Kaster et.al.	2408.10855	null
2024-08-19	Kubrick: Multimodal Agent Collaborations for Synthetic Video Generation	Liu He et.al.	2408.10453	null
2024-08-19	Perceptual Depth Quality Assessment of Stereoscopic Omnidirectional Images	Wei Zhou et.al.	2408.10134	null
2024-08-19	Sliced Maximal Information Coefficient: A Training-Free Approach for Image Quality Assessment Enhancement	Kang Xiao et.al.	2408.09920	link
2024-08-19	Anim-Director: A Large Multimodal Model Powered Agent for Controllable Animation Video Generation	Yunxin Li et.al.	2408.09787	link
2024-08-21	Reconstruct Spine CT from Biplanar X-Rays via Diffusion Learning	Zhi Qiao et.al.	2408.09731	null
2024-08-18	FD2Talk: Towards Generalized Talking Head Generation with Facial Decoupled Diffusion Model	Ziyu Yao et.al.	2408.09384	null
2024-08-17	Optimal Strip Attitude Command of Earth Observation Satellite using Differential Dynamic Programming	Seungyeop Han et.al.	2408.09244	null
2024-08-16	Explore Cross-Codec Quality-Rate Convex Hulls Relation for Adaptive Streaming	Masoumeh Farhadi Nia et.al.	2408.09044	null
2024-08-16	Evaluating the Evaluator: Measuring LLMs' Adherence to Task Evaluation Instructions	Bhuvanashree Murugadoss et.al.	2408.08781	null
2024-08-16	Speckle Noise Analysis for Synthetic Aperture Radar (SAR) Space Data	Sanjjushri Varshini R et.al.	2408.08774	null
2024-08-16	Tell Codec What Worth Compressing: Semantically Disentangled Image Coding for Machine with LMMs	Jinming Liu et.al.	2408.08575	null
2024-08-16	Visual-Friendly Concept Protection via Selective Adversarial Perturbations	Xiaoyue Mi et.al.	2408.08518	link
2024-08-16	Achieving Complex Image Edits via Function Aggregation with Diffusion Models	Mohammadreza Samadi et.al.	2408.08495	null
2024-08-15	Level Up Your Tutorials: VLMs for Game Tutorials Quality Assessment	Daniele Rege Cambrin et.al.	2408.08396	link
2024-08-15	METR: Image Watermarking with Large Number of Unique Messages	Alexander Varlamov et.al.	2408.08340	link
2024-08-15	Accelerated Image-Aware Generative Diffusion Modeling	Tanmay Asthana et.al.	2408.08306	null
2024-08-15	Rethinking Medical Anomaly Detection in Brain MRI: An Image Quality Assessment Perspective	Zixuan Pan et.al.	2408.08228	link
2024-08-15	When Video Coding Meets Multimodal Large Language Models: A Unified Paradigm for Video Coding	Pingping Zhang et.al.	2408.08093	null
2024-08-15	KGV: Integrating Large Language Models with Knowledge Graphs for Cyber Threat Intelligence Credibility Assessment	Zongzong Wu et.al.	2408.08088	null
2024-08-15	Conditional Brownian Bridge Diffusion Model for VHR SAR to Optical Image Translation	Seon-Hoon Kim et.al.	2408.07947	link
2024-08-15	MobileMEF: Fast and Efficient Method for Multi-Exposure Fusion	Lucas Nedel Kirsten et.al.	2408.07932	link
2024-08-14	New Curriculum, New Chance -- Retrieval Augmented Generation for Lesson Planning in Ugandan Secondary Schools. Prototype Quality Evaluation	Simon Kloker et.al.	2408.07542	null
2024-08-14	Unsupervised Blind Joint Dereverberation and Room Acoustics Estimation with Diffusion Models	Jean-Marie Lemercier et.al.	2408.07472	null
2024-08-14	DPSNN: Spiking Neural Network for Low-Latency Streaming Speech Enhancement	Tao Sun et.al.	2408.07388	null
2024-08-13	Direction of Arrival Correction through Speech Quality Feedback	Caleb Rascon et.al.	2408.07234	link
2024-08-13	SeLoRA: Self-Expanding Low-Rank Adaptation of Latent Diffusion Model for Medical Image Synthesis	Yuchen Mao et.al.	2408.07196	null
2024-08-13	BVI-UGC: A Video Quality Database for User-Generated Content Transcoding	Zihao Qi et.al.	2408.07171	null
2024-08-13	Efficient Deep Model-Based Optoacoustic Image Reconstruction	Christoph Dehner et.al.	2408.07109	null
2024-08-13	Subjective and Objective Quality Assessment of Rendered Human Avatar Videos in Virtual Reality	Yu-Chih Chen et.al.	2408.07041	null
2024-08-13	Feature-Preserving Rate-Distortion Optimization in Image Coding for Machines	Samuel Fernández Menduiña et.al.	2408.07028	null
2024-08-13	Low-Bitwidth Floating Point Quantization for Efficient High-Quality Diffusion Models	Cheng Chen et.al.	2408.06995	null
2024-08-13	Evaluating Research Quality with Large Language Models: An Analysis of ChatGPT's Effectiveness with Different Settings and Inputs	Mike Thelwall et.al.	2408.06752	null
2024-08-13	Hybrid SD: Edge-Cloud Collaborative Inference for Stable Diffusion Models	Chenqian Yan et.al.	2408.06646	null
2024-08-13	Potamoi: Accelerating Neural Rendering via a Unified Streaming Architecture	Yu Feng et.al.	2408.06608	null
2024-08-13	HDRGS: High Dynamic Range Gaussian Splatting	Jiahao Wu et.al.	2408.06543	link
2024-08-12	FoVNet: Configurable Field-of-View Speech Enhancement with Low Computation and Distortion for Smart Glasses	Zhongweiyang Xu et.al.	2408.06468	null
2024-08-12	Palantir: Towards Efficient Super Resolution for Ultra-high-definition Live Streaming	Xinqi Jin et.al.	2408.06152	link
2024-08-12	A-BDD: Leveraging Data Augmentations for Safe Autonomous Driving in Adverse Weather and Lighting	Felix Assion et.al.	2408.06071	null
2024-08-12	DiagESC: Dialogue Synthesis for Integrating Depression Diagnosis into Emotional Support Conversation	Seungyeon Seo et.al.	2408.06044	link
2024-08-12	A Sharpness Based Loss Function for Removing Out-of-Focus Blur	Uditangshu Aurangabadkar et.al.	2408.06014	link
2024-08-12	A Simple Early Exiting Framework for Accelerated Sampling in Diffusion Models	Taehong Moon et.al.	2408.05927	link
2024-08-12	Creating Arabic LLM Prompts at Scale	Abdelrahman El-Sheikh et.al.	2408.05882	null
2024-08-11	LaWa: Using Latent Space for In-Generation Image Watermarking	Ahmad Rezaei et.al.	2408.05868	null
2024-08-14	Iterative Improvement of an Additively Regularized Topic Model	Alex Gorbulev et.al.	2408.05840	null
2024-08-11	SSL: A Self-similarity Loss for Improving Generative Image Super-resolution	Du Chen et.al.	2408.05713	link
2024-08-11	Efficient Diffusion Transformer with Step-wise Dynamic Attention Mediators	Yifan Pu et.al.	2408.05710	link
2024-08-11	Evaluating BM3D and NBNet: A Comprehensive Study of Image Denoising Across Multiple Datasets	Ghazal Kaviani et.al.	2408.05697	null
2024-08-09	CBCT scatter correction with dual-layer flat-panel detector	Xin Zhang et.al.	2408.04943	null
2024-08-09	Self-augmented Gaussian Splatting with Structure-aware Masks for Sparse-view 3D Reconstruction	Lingbei Meng et.al.	2408.04831	null
2024-08-08	DaedalusData: Exploration, Knowledge Externalization and Labeling of Particles in Medical Manufacturing -- A Design Study	Alexander Wyss et.al.	2408.04749	null
2024-08-08	Sampling for View Synthesis: From Local Light Field Fusion to Neural Radiance Fields and Beyond	Ravi Ramamoorthi et.al.	2408.04586	null
2024-08-11	Synchronous Multi-modal Semantic Communication System with Packet-level Coding	Yun Tian et.al.	2408.04535	null
2024-08-08	Robustness investigation of quality measures for the assessment of machine learning models	Thomas Most et.al.	2408.04391	null
2024-08-08	SG-JND: Semantic-Guided Just Noticeable Distortion Predictor For Image Compression	Linhan Cao et.al.	2408.04273	null
2024-08-08	LLDif: Diffusion Models for Low-light Emotion Recognition	Zhifeng Wang et.al.	2408.04235	null
2024-08-07	Performance and Non-adversarial Robustness of the Segment Anything Model 2 in Surgical Video Segmentation	Yiqing Shen et.al.	2408.04098	null
2024-08-07	Machine Learning-Based Reward-Driven Tuning of Scanning Probe Microscopy: Towards Fully Automated Microscopy	Yu Liu et.al.	2408.04055	null
2024-08-07	Global-Local Progressive Integration Network for Blind Image Quality Assessment	Xiaoqi Wang et.al.	2408.03885	link
2024-08-07	Compact 3D Gaussian Splatting for Static and Dynamic Radiance Fields	Joo Chan Lee et.al.	2408.03822	null
2024-08-07	Soft-Hard Attention U-Net Model and Benchmark Dataset for Multiscale Image Shadow Removal	Eirini Cholopoulou et.al.	2408.03734	null
2024-08-07	Monitoring of Hermit Crabs Using drone-captured imagery and Deep Learning based Super-Resolution Reconstruction and Improved YOLOv8	Fan Zhao et.al.	2408.03559	null
2024-08-07	D2Styler: Advancing Arbitrary Style Transfer with Discrete Diffusion Methods	Onkar Susladkar et.al.	2408.03558	link
2024-08-07	PRTGS: Precomputed Radiance Transfer of Gaussian Splats for Real-Time High-Quality Relighting	Yijia Guo et.al.	2408.03538	null
2024-08-06	Image Quality Transfer of Diffusion MRI Guided By High-Resolution Structural MRI	Alp G. Cicimen et.al.	2408.03216	null
2024-08-06	Iterative CT Reconstruction via Latent Variable Optimization of Shallow Diffusion Models	Sho Ozaki et.al.	2408.03156	null
2024-08-05	VidGen-1M: A Large-Scale Dataset for Text-to-video Generation	Zhiyu Tan et.al.	2408.02629	null
2024-08-05	Cascading Refinement Video Denoising with Uncertainty Adaptivity	Xinyuan Yu et.al.	2408.02284	null
2024-08-04	PanoFree: Tuning-Free Holistic Multi-view Image Generation with Cross-view Self-Guidance	Aoming Liu et.al.	2408.02157	null
2024-08-06	RICA2: Rubric-Informed, Calibrated Assessment of Actions	Abrar Majeedi et.al.	2408.02138	link
2024-08-04	View-consistent Object Removal in Radiance Fields	Yiren Lu et.al.	2408.02100	null
2024-08-04	Constructing Per-Shot Bitrate Ladders using Visual Information Fidelity	Krishna Srikar Durbha et.al.	2408.01932	null
2024-08-03	Landmark-guided Diffusion Model for High-fidelity and Temporally Coherent Talking Head Generation	Jintao Tan et.al.	2408.01732	null
2024-08-03	JambaTalk: Speech-Driven 3D Talking Head Generation Based on Hybrid Transformer-Mamba Model	Farzaneh Jafari et.al.	2408.01627	null
2024-08-02	Guardians of Image Quality: Benchmarking Defenses Against Adversarial Attacks on Image Quality Metrics	Alexander Gushchin et.al.	2408.01541	link
2024-08-02	Underwater Object Detection Enhancement via Channel Stabilization	Muhammad Ali et.al.	2408.01293	link
2024-08-02	Wave-Mamba: Wavelet State Space Model for Ultra-High-Definition Low-Light Image Enhancement	Wenbin Zou et.al.	2408.01276	link
2024-08-02	Reality Fusion: Robust Real-time Immersive Mobile Robot Teleoperation with Volumetric Visual Data Fusion	Ke Li et.al.	2408.01225	link
2024-08-02	Validation of an Analysability Model in Hybrid Quantum Software	Díaz-Muñoz Ana et.al.	2408.01105	null
2024-08-06	FBSDiff: Plug-and-Play Frequency Band Substitution of Diffusion Features for Highly Controllable Text-Driven Image Translation	Xiang Gao et.al.	2408.00998	link
2024-08-01	SF3D: Stable Fast 3D Mesh Reconstruction with UV-unwrapping and Illumination Disentanglement	Mark Boss et.al.	2408.00653	null
2024-08-01	Regional quality estimation for echocardiography using deep learning	Gilles Van De Vyver et.al.	2408.00591	link
2024-08-01	Image Super-Resolution with Taylor Expansion Approximation and Large Field Reception	Jiancong Feng et.al.	2408.00470	null
2024-08-01	RDP: Ranked Differential Privacy for Facial Feature Protection in Multiscale Sparsified Subspace	Lu Ou et.al.	2408.00294	null
2024-07-31	Generative Diffusion Model for Seismic Imaging Improvement of Sparsely Acquired Data and Uncertainty Quantification	Xingchen Shi et.al.	2407.21683	null
2024-07-31	Benchmarking AIGC Video Quality Assessment: A Dataset and Unified Model	Zhichao Zhang et.al.	2407.21408	null
2024-07-31	An all-sky catalogue of stellar reddening values	E. Paunzen et.al.	2407.21373	null
2024-07-31	ESIQA: Perceptual Quality Assessment of Vision-Pro-based Egocentric Spatial Images	Xilei Zhu et.al.	2407.21363	null
2024-08-01	Outlier Detection in Large Radiological Datasets using UMAP	Mohammad Tariqul Islam et.al.	2407.21263	link
2024-07-30	MP-You: A Web-based MPI Simulation Tool	The-Vinh Tran-Luu et.al.	2407.21155	null
2024-07-30	Simultaneous Multi-Slice Diffusion Imaging using Navigator-free Multishot Spiral Acquisition	Yuancheng Jiang et.al.	2407.20904	null
2024-07-30	Highly Efficient No-reference 4K Video Quality Assessment with Full-Pixel Covering Sampling and Training Strategy	Xiaoheng Tan et.al.	2407.20766	null
2024-07-30	Questionnaires for Everyone: Streamlining Cross-Cultural Questionnaire Adaptation with GPT-Based Translation Quality Evaluation	Otso Haavisto et.al.	2407.20608	link
2024-07-29	Mean Opinion Score as a New Metric for User-Evaluation of XAI Methods	Hyeon Yu et.al.	2407.20427	null
2024-07-29	Sun Off, Lights On: Photorealistic Monocular Nighttime Simulation for Robust Semantic Perception	Konstantinos Tzevelekakis et.al.	2407.20336	null
2024-07-29	DDAP: Dual-Domain Anti-Personalization against Text-to-Image Diffusion Models	Jing Yang et.al.	2407.20141	null
2024-07-29	HeadsetOff: Enabling Photorealistic Video Conferencing on Economical VR Headsets	Yili Jin et.al.	2407.19988	null
2024-07-29	Noise-Resilient Unsupervised Graph Representation Learning via Multi-Hop Feature Quality Estimation	Shiyuan Li et.al.	2407.19944	null
2024-07-29	FreeLong: Training-Free Long Video Generation with SpectralBlend Temporal Attention	Yu Lu et.al.	2407.19918	null
2024-07-29	ALEN: A Dual-Approach for Uniform and Non-Uniform Low-Light Image Enhancement	Ezequiel Perez-Zarate et.al.	2407.19708	link
2024-07-29	UNQA: Unified No-Reference Quality Assessment for Audio, Image, Video, and Audio-Visual Content	Yuqin Cao et.al.	2407.19704	null
2024-07-29	Semi-Supervised Teacher-Reference-Student Architecture for Action Quality Assessment	Wulian Yun et.al.	2407.19675	null
2024-07-28	X-Fake: Juggling Utility Evaluation and Explanation of Simulated SAR Images	Zhongling Huang et.al.	2407.19436	null
2024-07-27	Sewer Image Super-Resolution with Depth Priors and Its Lightweight Network	Gang Pan et.al.	2407.19271	null
2024-07-27	Towards Clean-Label Backdoor Attacks in the Physical World	Thinh Dao et.al.	2407.19203	null
2024-07-26	Regularized Multi-Decoder Ensemble for an Error-Aware Scene Representation Network	Tianyu Xiong et.al.	2407.19082	null
2024-07-26	Correcting for objective sample refractive index mismatch in extended field of view selective plane illumination microscopy	Steven J. Sheppard et.al.	2407.18862	null
2024-07-25	Joint RGB-Spectral Decomposition Model Guided Image Enhancement in Mobile Photography	Kailai Zhou et.al.	2407.17996	link
2024-07-29	Invariance of deep image quality metrics to affine transformations	Nuria Alabau-Bosque et.al.	2407.17927	link
2024-07-25	Artificial Immunofluorescence in a Flash: Rapid Synthetic Imaging from Brightfield Through Residual Diffusion	Xiaodan Xing et.al.	2407.17882	null
2024-07-24	Final Alignment and Image Quality Test for the Acquisition and Guiding System of SOXS	J. A. Araiza-Duran et.al.	2407.17382	null
2024-07-24	SOXS NIR: Optomechanical integration and alignment, optical performance verification before full instrument assembly	M. Genoni et.al.	2407.17244	null
2024-07-24	Q-Ground: Image Quality Grounding with Large Multi-modality Models	Chaofeng Chen et.al.	2407.17035	link
2024-07-24	3DAttGAN: A 3D Attention-based Generative Adversarial Network for Joint Space-Time Video Super-Resolution	Congrui Fu et.al.	2407.16965	link
2024-07-24	SAR to Optical Image Translation with Color Supervised Diffusion Model	Xinyu Bai et.al.	2407.16921	null
2024-07-23	QPT V2: Masked Image Modeling Advances Visual Scoring	Qizhi Xie et.al.	2407.16541	link
2024-07-23	ToDER: Towards Colonoscopy Depth Estimation and Reconstruction with Geometry Constraint Adaptation	Zhenhua Wu et.al.	2407.16508	null
2024-07-23	On Differentially Private 3D Medical Image Synthesis with Controllable Latent Diffusion Models	Deniz Daum et.al.	2407.16405	link
2024-07-23	Improving multidimensional projection quality with user-specific metrics and optimal scaling	Maniru Ibrahim et.al.	2407.16328	null
2024-07-23	A new visual quality metric for Evaluating the performance of multidimensional projections	Maniru Ibrahim et.al.	2407.16309	null
2024-07-23	Integrating Meshes and 3D Gaussians for Indoor Scene Reconstruction with SAM Mask Guidance	Jiyeop Kim et.al.	2407.16173	null
2024-07-23	Fréchet Video Motion Distance: A Metric for Evaluating Motion Consistency in Videos	Jiahe Liu et.al.	2407.16124	link
2024-07-22	Enhancing Cell Instance Segmentation in Scanning Electron Microscopy Images via a Deep Contour Closing Operator	Florian Robert et.al.	2407.15817	null
2024-07-22	SS-SFR: Synthetic Scenes Spatial Frequency Response on Virtual KITTI and Degraded Automotive Simulations for Object Detection	Daniel Jakab et.al.	2407.15646	null
2024-07-22	Experimenting with Adaptive Bitrate Algorithms for Virtual Reality Streaming over Wi-Fi	Ferran Maura et.al.	2407.15614	link
2024-07-22	SpotDiffusion: A Fast Approach For Seamless Panorama Generation Over Time	Stanislav Frolov et.al.	2407.15507	link
2024-07-22	Enhancement of 3D Gaussian Splatting using Raw Mesh for Photorealistic Recreation of Architectures	Ruizhe Wang et.al.	2407.15435	null
2024-07-21	Assessing Sample Quality via the Latent Space of Generative Models	Jingyi Xu et.al.	2407.15171	link
2024-07-20	Non-Reference Quality Assessment for Medical Imaging: Application to Synthetic Brain MRIs	Karl Van Eeden Risager et.al.	2407.14994	null
2024-07-20	Deep Learning CT Image Restoration using System Blur and Noise Models	Yijie Yuan et.al.	2407.14983	null
2024-07-20	GreenStableYolo: Optimizing Inference Time and Image Quality of Text-to-Image Generation	Jingzhi Gong et.al.	2407.14982	link
2024-07-20	Dual High-Order Total Variation Model for Underwater Image Restoration	Yuemei Li et.al.	2407.14868	link
2024-07-20	CBCTLiTS: A Synthetic, Paired CBCT/CT Dataset For Segmentation And Style Transfer	Maximilian E. Tschuchnig et.al.	2407.14853	null
2024-07-20	Realistic Surgical Image Dataset Generation Based On 3D Gaussian Splatting	Tianle Zeng et.al.	2407.14846	null
2024-07-20	Difflare: Removing Image Lens Flare with Latent Diffusion Model	Tianwen Zhou et.al.	2407.14746	link
2024-07-20	Polarimetric compressed sensing with hollow, self-assembled diffractive films	Ji Feng et.al.	2407.14722	null
2024-07-19	A Minibatch Alternating Projections Algorithm for Robust and Efficient Magnitude Least-Squares RF Pulse Design in MRI	Jonathan B. Martin et.al.	2407.14696	link
2024-07-19	A Benchmark for Gaussian Splatting Compression and Quality Assessment Study	Qi Yang et.al.	2407.14197	link
2024-07-19	Shape and Style GAN-based Multispectral Data Augmentation for Crop/Weed Segmentation in Precision Farming	Mulham Fawakherji et.al.	2407.14119	null
2024-07-19	DirectL: Efficient Radiance Fields Rendering for 3D Light Field Displays	Zongyuan Yang et.al.	2407.14053	null
2024-07-19	Personalized Privacy Protection Mask Against Unauthorized Facial Recognition	Ka-Ho Chow et.al.	2407.13975	link
2024-07-18	Streetscapes: Large-scale Consistent Street View Generation Using Autoregressive Video Diffusion	Boyang Deng et.al.	2407.13759	null
2024-07-18	A Novel Freeform Slicer IFU for the Magellan InfraRed Multi-Object Spectrograph (MIRMOS)	Maren Cosens et.al.	2407.13747	null
2024-07-18	HazeCLIP: Towards Language Guided Real-World Image Dehazing	Ruiyi Wang et.al.	2407.13719	link
2024-07-18	Removing cloud shadows from ground-based solar imagery	Amal Chaoui et.al.	2407.13379	null
2024-07-18	Any Image Restoration with Efficient Automatic Degradation Adaptation	Bin Ren et.al.	2407.13372	link
2024-07-18	Heterogeneous Clinical Trial Outcomes via Multi-Output Gaussian Processes	Owen Thomas et.al.	2407.13283	null
2024-07-18	Research on Image Super-Resolution Reconstruction Mechanism based on Convolutional Neural Network	Hao Yan et.al.	2407.13211	null
2024-07-18	Learned HDR Image Compression for Perceptually Optimal Storage and Display	Peibei Cao et.al.	2407.13179	null
2024-07-18	Image Inpainting Models are Effective Tools for Instruction-guided Image Editing	Xuan Ju et.al.	2407.13139	null
2024-07-18	Enhanced Denoising of OCT Images Using Residual U-Net: A Cross-Modality Approach on PSOCT and ASOCT for Clinical Diagnostics	Akkidas Noel Prakasha et.al.	2407.13090	null
2024-07-17	Hallucination Index: An Image Quality Metric for Generative Reconstruction Models	Matthew Tivnan et.al.	2407.12780	null
2024-07-17	CoSIGN: Few-Step Guidance of ConSIstency Model to Solve General INverse Problems	Jiankun Zhao et.al.	2407.12676	link
2024-07-17	High Frequency Matters: Uncertainty Guided Image Compression with Wavelet Diffusion	Juan Song et.al.	2407.12538	link
2024-07-17	Fast Context-Based Low-Light Image Enhancement via Neural Implicit Representations	Tomáš Chobola et.al.	2407.12511	link
2024-07-17	Enhancing Film Grain Coding in VVC: Improving Encoding Quality and Efficiency	Vignesh V Menon et.al.	2407.12465	null
2024-07-17	Voltage-Controlled Magnetoelectric Devices for Neuromorphic Diffusion Process	Yang Cheng et.al.	2407.12261	null
2024-07-16	Semantic Communication for the Internet of Sounds: Architecture, Design Principles, and Challenges	Chengsi Liang et.al.	2407.12203	null
2024-07-16	Neural Passage Quality Estimation for Static Pruning	Xuejun Chang et.al.	2407.12170	link
2024-07-16	MVG-Splatting: Multi-View Guided Gaussian Splatting with Adaptive Quantile-Based Geometric Consistency Densification	Zhuoxiao Li et.al.	2407.11840	null
2024-07-16	LoFTI: Localization and Factuality Transfer to Indian Locales	Sona Elza Simon et.al.	2407.11833	link
2024-07-16	XEdgeAI: A Human-centered Industrial Inspection Framework with Data-centric Explainable Edge AI Approach	Truong Thanh Hung Nguyen et.al.	2407.11771	link
2024-07-16	ITI-IQA: a Toolbox for Heterogeneous Univariate and Multivariate Missing Data Imputation Quality Assessment	Pedro Pons-Suñer et.al.	2407.11767	null
2024-07-16	**Magnetogram-to-Magnetogram: Generativ

Name		Name	Last commit message	Last commit date
Latest commit History 2,433 Commits
.github		.github
assets		assets
docs		docs
.gitignore		.gitignore
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
LICENSE		LICENSE
README.md		README.md
config.yaml		config.yaml
daily_arxiv.py		daily_arxiv.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Updated on 2025.04.12

Point Cloud Compression

Compression

Quality Assessment

About

Releases

Packages

Languages

License

lidq92/arxiv-daily

Folders and files

Latest commit

History

Repository files navigation

Updated on 2025.04.12

Point Cloud Compression

Compression

Quality Assessment

About

Topics

Resources

License

Code of conduct

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages