🏷️ Intrinsic Reward

1 articles about 'Intrinsic Reward'

Entropy Centroids as Intrinsic Rewards: A New Paradigm for Test-Time Compute Scaling

2026-04-30 research 👁 10

A latest arXiv paper proposes the "Entropy Centroids" method, which scales LLM computation at test time without external…