Selected Publications

Harold H. Chen, Disen Lan, Wen-Jie Shu, Qingyang Liu, Zihan Wang, Sirui Chen, Wenkai Cheng, Kanghao Chen, Hongfei Zhang, Zixin Zhang, Rongjin Guo, Yu Cheng, Ying-Cong Chen. TiViBench: Benchmarking Think-in-Video Reasoning for Video Generative Models. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2026.

PDF Cite Code Project

Tianshuo Xu, Kai Wang, Zhifei Chen, Leyi Wu, Tianshui Wen, Fei Chao, Ying-Cong Chen. UniCalli: A Unified Diffusion Framework for Column-Level Generation and Recognition of Chinese Calligraphy. International Conference on Learning Representations (ICLR), 2026.

PDF Cite Code Project

Jiazhou Zhou, Qing Jiang, Kanghao Chen, Lutao Jiang, Yuanhuiyi Lyu, Ying-Cong Chen, Lei Zhang. T-Rex-Omni: Integrating Negative Visual Prompt in Generic Object Detection. AAAI Conference on Artificial Intelligence (AAAI), 2026.

Baijiong Lin, Weisen Jiang, Feiyang Ye, Yu Zhang, Pengguang Chen, Ying-Cong Chen, Shu Liu, Ivor W. Tsang, James T. Kwok. Dual-balancing for multi-task learning. Neural Networks, 2026.

Zhifei Chen, Tianshuo Xu, Leyi Wu, Luozhou Wang, Dongyu Yan, Zihan You, Wenting Luo, Guo Zhang, Ying-Cong Chen. STANCE: Motion Coherent Video Generation Via Sparse-to-Dense Anchored Encoding. arXiv preprint arXiv:2510.14588, 2025.

PDF Cite Code Project

Zhifei Chen, Tianshuo Xu, Wenhang Ge, Leyi Wu, Dongyu Yan, Jing He, Luozhou Wang, Lu Zeng, Shunsi Zhang, Ying-Cong Chen. Uni-Renderer: Unifying Rendering and Inverse Rendering Via Dual Stream Diffusion. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025.

Wenhang Ge, Jiawei Feng, Guibao Shen, Ying-Cong Chen. Uni-IR: One Stage is Enough for Ambiguity-Reduced Inverse Rendering. Pacific Graphics, 2025.

Luozhou Wang, Yijun Li, Zhifei Chen, Jui-Hsien Wang, Zhifei Zhang, He Zhang, Zhe Lin, Ying-Cong Chen. TransPixeler: Advancing Text-to-Video Generation with Transparency. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025.

Ke Ma, Jiaqi Tang, Bin Guo, Fan Dang, Sicong Liu, Zhui Zhu, Lei Wu, Cheng Fang, Ying-Cong Chen, Zhiwen Yu, Yunhao Liu. SURGEON: Memory-Adaptive Fully Test-Time Adaptation via Dynamic Activation Sparsity. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025.

Yang Li, Jinglu Wang, Lei Chu, Xiao Li, Shiu-Hong Kao, Ying-Cong Chen, Yan Lu. StreamGS: Online Generalizable Gaussian Splatting Reconstruction for Unposed Image Streams. IEEE/CVF International Conference on Computer Vision (ICCV), 2025.

Shuai Yang, Yuying Ge, Yang Li, Yukang Chen, Yixiao Ge, Ying Shan, Ying-Cong Chen. SEED-Story: Multimodal Long Story Generation with Large Language Model. IEEE/CVF International Conference on Computer Vision Workshops (ICCVW), 2025.

Guibao Shen, Luozhou Wang, Jiantao Lin, Wenhang Ge, Chaozhe Zhang, Xin Tao, Yuan Zhang, Pengfei Wan, Zhongyuan Wang, Guangyong Chen, Yijun Li, Ying-Cong Chen. Scene Graph Guided Generation: Enable Accurate Relations Generation in Text-to-Image Models via Textural Rectification. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 2025.

Tongyan Hua, Lutao Jiang, Ying-Cong Chen, Wufan Zhao. Sat2City: 3D City Generation from A Single Satellite Image with Cascaded Latent Diffusion. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 2025.

Hao Lu, Yuting Zhang, Jiaqi Tang, Bowen Fu, Wenhang Ge, Wei Wei, Kaishun Wu, Ying-Cong Chen. RhythmGuassian: Repurposing Generalizable Gaussian Model For Remote Physiological Measurement. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV) (Highlight), 2025.

Zhen Yang, Guibao Shen, Liang Hou, Mushui Liu, Luozhou Wang, Xin Tao, Pengfei Wan, Di Zhang, Ying-Cong Chen. RectifiedHR: Enable Efficient High-Resolution Image Generation via Energy Rectification. arXiv preprint arXiv:2503.02537, 2025.

Wenhang Ge, Jiantao Lin, Guibao Shen, Jiawei Feng, Tao Hu, Xinli Xu, Ying-Cong Chen. PRM: Photometric Stereo based Large Reconstruction Model. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV) (Highlight), 2025.

Xiaojie Xu, Xinli Xu, Sirui Chen, Haoyu Chen, Fan Zhang, Ying-Cong Chen. PreGenie: An Agentic Framework for High-quality Visual Presentation Generation. Empirical Methods in Natural Language Processing (EMNLP), 2025.

Haoyu Chen, Xiaojie Xu, Wenbo Li, Jingjing Ren, Tian Ye, Songhua Liu, Ying-Cong Chen, Lei Zhu, Xinchao Wang. POSTA: A Go-to Framework for Customized Artistic Poster Generation. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025.

Baijiong Lin, Weisen Jiang, Yuancheng Xu, Hao Chen, Ying-Cong Chen. PARM: Multi-Objective Test-Time Alignment via Preference-Aware Autoregressive Reward Model. Proceedings of the International Conference on Machine Learning (ICML), 2025.

Yehang Zhang, Xinli Xu, Xiaojie Xu, Doudou ZHANG, Li Liu, Ying-Cong Chen. Orchestrating Audio: Multi-Agent Framework for Long-Video Audio Synthesis. Empirical Methods in Natural Language Processing (EMNLP), 2025.

Baijiong Lin, Weisen Jiang, Pengguang Chen, Shu Liu, Ying-Cong Chen. MTMamba++: Enhancing Multi-Task Dense Scene Understanding via Mamba-Based Decoders. IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025.

Luozhou Wang, Ziyang Mai, Guibao Shen, Yixun Liang, Xin Tao, Pengfei Wan, Di Zhang, Yijun Li, Ying-Cong Chen. Motion inversion for video customization. SIGGRAPH 2025, 2025.

PDF Cite Code Project

Hao He, Yixun Liang, Luozhou Wang, Yuanhao Cai, Xinli Xu, Haoxiang Guo, Xiang Wen, Ying-Cong Chen. LucidFusion: Reconstructing 3D Gaussians with Arbitrary Unposed Images. Computer Graphics Forum (Pacific Graphics), 2025.

PDF Cite Code Project

Jing He, Haodong Li, Wei Yin, Yixun Liang, Leheng Li, Kaiqiang Zhou, Hongbo Zhang, Bingbing Liu, Ying-Cong Chen. Lotus: Diffusion-based visual foundation model for high-quality dense prediction. International Conference on Learning Representations (ICLR), 2025, 2025.

PDF Cite Code Project

Jingsong Zhu, Yuhan Cheng, Sixu He, Ying-Cong Chen, Hao Chen. Large Language Models for Transforming Healthcare: A Perspective on DeepSeek‐R1. MedComm – Future Medicine, 2025.

Jiantao Lin, Xin Yang, Meixi Chen, Yingjie Xu, Dongyu Yan, Leyi Wu, Xinli Xu, Lie Xu, Shunsi Zhang, Ying-Cong Chen. Kiss3DGen: Repurposing Image Diffusion Models for 3D Asset Generation. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025.

Xinli Xu, Wenhang Ge, Dicong Qiu, Zhifei Chen, Dongyu Yan, Zhuoyun Liu, Haoyu Zhao, Hanfeng Zhao, Shunsi Zhang, Junwei Liang, Ying-Cong Chen. GaussianProperty: Integrating Physical Properties to 3D Gaussians with LMMs. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 2025.

Xinli Xu, Wenhang Ge, Jiantao Lin, Jiawei Feng, Lie Xu, Hanfeng Zhao, Shunsi Zhang, Ying-Cong Chen. exGen: Flexible Multi-View Generation from Text and Image Inputs. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 2025.

Kanghao Chen, Zixin Zhang, Guoqiang Liang, Lutao Jiang, Zeyu Wang, Ying-Cong Chen. Event-Guided Consistent Video Enhancement with Modality-Adaptive Diffusion Pipeline. Thirty-Ninth Annual Conference on Neural Information Processing Systems (NeurIPS), 2025.

Hao Lu, Tianshuo Xu, Wenzhao Zheng, Yunpeng Zhang, Wei Zhan, Dalong Du, Masayoshi Tomizuka, Kurt Keutzer, Ying-Cong Chen. DrivingRecon: Large 4D Gaussian Reconstruction Model For Autonomous Driving. Thirty-Ninth Annual Conference on Neural Information Processing Systems (NeurIPS), 2025.

Xinyi Zhou, Guibao Shen, Ying-Cong Chen, Guangyong Chen, Pheng Ann Heng. DivPro: diverse protein sequence design with direct structure recovery guidance. Bioinformatics, 2025.

Jing He, Haodong Li, Yongzhe Hu, Guibao Shen, Yingjie Cai, Weichao Qiu, Ying-Cong Chen. DisEnvisioner: Disentangled and Enriched Visual Prompt for Customized Image Generation. International Conference on Learning Representations (ICLR), 2025.

Litao Guo, Xinli Xu, Luozhou Wang, Jiantao Lin, Jinsong Zhou, Zixin Zhang, Bolan Su, Ying-Cong Chen. ComfyMind: Toward General-Purpose Generation via Tree-Based Planning and Reactive Feedback. Thirty-Ninth Annual Conference on Neural Information Processing Systems (NeurIPS), 2025.

Bowen Fu, Wei Wei, Jiaqi Tang, Jiangtao Nie, Yanyu Ye, Xiaogang Xu, Ying-Cong Chen, Lei Zhang. Co-Painter: Fine-Grained Controllable Image Stylization via Implicit Decoupling and Adaptive Injection. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 2025.

Leheng Li, Weichao Qiu, Xu Yan, Jing He, Kaiqiang Zhou, Yingjie Cai, Qing Lian, Bingbing Liu, Ying-Cong Chen. OmniBooth: Learning Latent Control for Image Synthesis with Multi-modal Instruction. arXiv preprint arXiv:2410.04932, 2024.

PDF Cite Code Project

Luozhou Wang, Guibao Shen, Wenhang Ge, Guangyong Chen, Yijun Li, Ying-Cong Chen. Text-Anchored Score Composition: Tackling Condition Misalignment in Text-to-Image Diffusion Models. Proceedings of the European conference on computer vision (ECCV), 2024.

Baijiong Lin, Weisen Jiang, Pengguang Chen, Yu Zhang, Shu Liu, Ying-Cong Chen. MTMamba: Enhancing Multi-Task Dense Scene Understanding by Mamba-Based Decoders. Proceedings of the European conference on computer vision (ECCV), 2024.

Shuai Yang, Zhifei Chen, Pengguang Chen, Xi Fang, Yixun Liang, Shu Liu, Ying-Cong Chen. Defect Spectrum: A Granular Look of Large-scale Defect Datasets with Rich Semantics. Proceedings of the European conference on computer vision (ECCV), 2024.

Haodong Li, Hao Lu, Ying-Cong Chen. Bi-TTA: Bidirectional Test-Time Adapter for Remote Physiological Measurement. Proceedings of the European conference on computer vision (ECCV), 2024.

Jiaqi Tang, Hao Lu, Xiaogang Xu, Ruizheng Wu, Sixing Hu, Tong Zhang, Tsz Wa Cheng, Ming Ge, Ying-Cong Chen, Fugee Tsung. An Incremental Unified Framework for Small Defect Inspection. Proceedings of the European conference on computer vision (ECCV), 2024.

Xiyu Wang, Baijiong Lin, Daochang Liu, Ying-Cong Chen, Chang Xu. Bridging Data Gaps in Diffusion Models with Adversarial Noise-Based Transfer Learning. International Conference on Machine Learning (ICML), 2024.

Yixun Liang, Xin Yang, Jiantao Lin, Haodong Li, Xiaogang Xu, Ying-Cong Chen. LucidDreamer: Towards High-Fidelity Text-to-3D Generation via Interval Score Matching. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), (Spotlight, Top 2.81%), 2024.

Lin Song, Yukang Chen, Shuai Yang, Xiaohan Ding, Yixiao Ge, Ying-Cong Chen, Ying Shan. Low-Rank Approximation for Sparse Attention in Multi-Modal LLMs. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2024.

Jiaqi Tang, Ruizheng Wu, Xiaogang Xu, Sixing Hu, Ying-Cong Chen. Learning to Remove Wrinkled Transparent Film with Polarized Prior. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2024.

Yang Li, Ruizheng Wu, Jiyong Li, Ying-Cong Chen. GNeRP: Gaussian-guided Neural Reconstruction of Reflective Objects with Noisy Polarization Priors. International Conference on Learning Representations (ICLR), 2024.

PDF Cite Code Project

Shuai Yang, Yukang Chen, Luozhou Wang, Shu Liu, Ying-Cong Chen. Denoising Diffusion Step-aware Models. International Conference on Learning Representations (ICLR), 2024.

Weiyu Sun, Xinyu Zhang, Hao Lu, Ying-Cong Chen, Ting Wang, Jinghui Chen, Lu Lin. Backdoor Contrastive Learning via Bi-level Trigger Optimization. International Conference on Learning Representations (ICLR), 2024.

Yixun Liang, Hao He, Shishi Xiao, Hao Lu, Ying-Cong Chen. MantraNet: Label Name is Mantra: Unifying Point Cloud Segmentation across Heterogeneous Datasets. Computer Graphics Forum (Pacific Graphics), 2024.

Leheng Li, Qing Lian, Ying-Cong Chen. Adv3D: Generating 3D Adversarial Examples for 3D Object Detection in Driving Scenarios with NeRF. IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2024.

PDF Cite Code Project

Yixun Liang, Hao He, Ying-Cong Chen. Rethinking Rendering in Generalizable Neural Surface Reconstruction: A Learning-based Solution. Thirty-seventh Conference on Neural Information Processing Systems (NeurIPS), 2023.

PDF Cite Code Project

Wenhang Ge, Tao Hu, Haoyu Zhao, Shu Liu, Ying-Cong Chen. Ref-NeuS: Ambiguity-Reduced Neural Implicit Surface Learning for Multi-View Reconstruction with Reflection. Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2023.

PDF Cite Code Project

Luozhou Wang, Shuai Yang, Shu Liu, Ying-Cong Chen. Not All Steps are Created Equal: Selective Diffusion Distillation for Image Manipulation. In Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2023.

Xin Yang, Xiaogang Xu, Ying-Cong Chen. Photo-Realistic Out-of-domain GAN inversion via Invertibility Decomposition. In Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2023.

Leheng Li, Qing Lian, Luozhou Wang, Ningning Ma, Ying-Cong Chen. Lift3D: Synthesize 3D Training Data by Lifting 2D GAN to 3D Generative Radiance Field. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2023.

Hao Lu, Zitong Yu, Xuesong Niu, Ying-Cong Chen. Neuron Structure Modeling for Generalizable Remote Physiological Measurement. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2023.

Chenyang Qi, Xin Yang, Ka Leong Chang, Ying-Cong Chen, Qifeng Chen. Real-time 6K Image Rescaling with Rate-distortion Optimization. IEEE/CVF Computer Vision and Pattern Recognition Conference (CVPR), 2023.

Hao He, Yixun Liang, Shishi Xiao, Jierun Chen, Ying-Cong Chen. CP-NeRF: Conditionally Parameterized Neural Radiance Fields for Cross-scene Novel View Synthesis. Computer Graphics Forum (Pacific Graphics), 2023.

PDF Cite Project

Yuzhe Yang, Yuan Yuan, Guo Zhang, Hao Wang, Ying-Cong Chen, Yingcheng Liu, Christopher Tarolli, Daniel Crepeau, Jan Bukartyk, Mithri Junna, Aleksandar Videnovic, Terry Ellis, Melissa Lipford, Ray Dorsey, Dina Katabi. Artificial intelligence-enabled detection and assessment of Parkinson’s disease using nocturnal breathing signals. Nature Medicine, 2022.

PDF Cite Project Poster

Qing Lian, Yanbo Xu, Weilong Yao, Ying-Cong Chen, Tong Zhang. Semi-supervised Monocular 3D Object Detection by Multi-view Consistency. Proceedings of the European conference on computer vision (ECCV), 2022.

Di Chang, Aljaz Bozic, Tong Zhang, Qingsong Yan, Ying-Cong Chen, Sabine Susstrunk, Matthias Niebner. RC-MVSNet: Unsupervised Multi-View Stereo with Neural Rendering. Proceedings of the European conference on computer vision (ECCV), 2022.

PDF Cite Code Project

Xin Lai, Zhuotao Tian, Xiaogang Xu, Ying-Cong Chen, Shu Liu, Hengshuang Zhao, Liwei Wang, Jiaya Jia. DecoupleNet: Decoupled Network for Domain Adaptive Semantic Segmentation. Proceedings of the European conference on computer vision (ECCV), 2022.

Chang-Bin Zhang, Jia-Wen Xiao, Xialei Liu, Ying-Cong Chen, Ming-Ming Cheng. Representation Compensation Networks for Continual Semantic Segmentation. In Computer Vision and Pattern Recognition (CVPR), 2022.

Yi Wang, Lu Qi, Ying-Cong Chen, Xiangyu Zhang, Jiaya Jia. SC-GAN: Image Synthesis via Semantic Composition. In Proceedings of the IEEE International Conference on Computer Vision, 2021.

Jinrui Yang, Jiawei Zhang, Fufu Yu, Xinyang Zhang, Mengdan Zhang, Xin Sun, Ying-Cong Chen, Wei-Shi Zheng. Learning to Know Where to See: A Visibility-Aware Approach for Occluded Person Re-identification. In Proceedings of the IEEE International Conference on Computer Vision, 2021.

Xiaogang Xu, Ying-Cong Chen, Xin Tao, Jiaya Jia. Text-Guided Human Image Manipulation via Image-Text Shared Space. In IEEE Transation on Pattern Analysis and Machine Intelligence, 2021.

Lu Qi, Yi Wang, Yukang Chen, Ying-Cong Chen, Xiangyu Zhang, Jian Sun, Jiaya Jia. PointINS: Point-based instance segmentation. In IEEE Transation on Pattern Analysis and Machine Intelligence, 2021.

Yuzhe Yang, Kaiwen Zha, Ying-Cong Chen, Hao Wang, Dina Katabi. Delving into Deep Imbalanced Regression. In International Conference on Machine Learning (Long Talk, Acceptance Rate: 3%), 2021.

PDF Cite Code Project post

Yi Wang, Ying-Cong Chen, Xin Tao, Jiaya Jia. VCNet: A Robust Approach to Blind Image Inpainting. In European Conference on Computer Vision, 2020.

Ying-Cong Chen, Jiaya Jia. Homomorphic Interpolation Network for Unpaired Image-to-image Translation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020.

PDF Cite Code Video

Ying-Cong Chen, Xiaogang Xu, Jiaya Jia. Domain Adaptive Image-to-image Translation. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2020.

Yi Wang, Ying-Cong Chen, Xiangyu Zhang, Jian Sun, Jiaya Jia. Attentive normalization for conditional image generation. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (Oral, Acceptance Rate: 5.7%), 2020.

Xiaogang Xu, Ying-Cong Chen, Jiaya Jia. View Independent Generative Adversarial Network for Novel View Synthesis. Proceedings of the IEEE International Conference on Computer Vision (Oral, Acceptance Rate: 2.1%), 2019.

Ying-Cong Chen, Xiaohui Shen, Zhe Lin, Xin Lu, I Pao, Jiaya Jia, Others. Semantic component decomposition for face attribute manipulation. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2019.

Ying-Cong Chen, Xiaogang Xu, Zhuotao Tian, Jiaya Jia. Homomorphic latent space interpolation for unpaired image-to-image translation. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (Oral, Acceptance Rate: 5.6%), 2019.

PDF Cite Code Video

Ying-Cong Chen, Xiatian Zhu, Wei-Shi Zheng, Jianhuang Lai. Person Re-Identification by Camera Correlation Aware Feature Augmentation. In IEEE Transation on Pattern Analysis and Machine Intelligence (ESI highly cited paper), 2018.

PDF Cite Project

Ying-Cong Chen, Huaijia Lin, Michelle Shu, Ruiyu Li, Xin Tao, Xiaoyong Shen, Yangang Ye, Jiaya Jia. Facelet-bank for fast portrait manipulation. Proceedings of the IEEE conference on computer vision and pattern recognition, 2018.

PDF Cite Code Video

Ying-Cong Chen, Xiaoyong Shen, Jiaya Jia. Makeup-go: Blind reversion of portrait edit. Proceedings of the IEEE International Conference on Computer Vision (Oral, Accepance Rate: Acceptance Rate: 2.09%), 2017.

Shangxuan Wu, Ying-Cong Chen, Xiang Li, An-Cong Wu, Jin-Jie You, Wei-Shi Zheng. An enhanced deep feature representation for person re-identification. IEEE winter conference on applications of computer vision (WACV), 2016.

Ying-Cong Chen, Wei-Shi Zheng, Jian-Huang Lai, Pong C Yuen. An asymmetric distance model for cross-view feature mapping in person reidentification. In IEEE transactions on circuits and systems for video technology, 2016.

PDF Cite Code Feature

Ying-Cong Chen, Wei-Shi Zheng, Jianhuang Lai. Mirror representation for modeling view-specific transform in person re-identification. Proceedings of the International Conference on Artificial Intelligence, 2015.

PDF Cite Code Feature