🏷️ Post-Training Steering

1 articles about 'Post-Training Steering'

New Breakthrough in Offline Reinforcement Learning: Flexible Steering Even After Policy Freezing

2026-04-29 research 👁 10

A latest arXiv paper proposes a deploy-time adaptation framework for offline reinforcement learning based on Product-of-…