PARM: Multi-Objective Test-Time Alignment via Preference-Aware Autoregressive Reward Model

Jan 1, 2025·

Baijiong Lin

,

Weisen Jiang

,

Yuancheng Xu

,

Hao Chen

Ying-Cong Chen

Ying-Cong Chen

· 0 min read

Type

Publication

Proceedings of the International Conference on Machine Learning (ICML)

Last updated on Mar 19, 2026

Ying-Cong Chen

Authors

Assistant Professor

← Orchestrating Audio: Multi-Agent Framework for Long-Video Audio Synthesis Jan 1, 2025

POSTA: A Go-to Framework for Customized Artistic Poster Generation Jan 1, 2025 →