한마디로: (1) uncertainty로 vision encoder attention temperature를 바꾸고, (2) uncertainty로 action decoding을 greedy(top-1)에서 sampling으로 바꾼다.무엇을 해결하고 싶은가목표: Vision-Language-Action (VLA) model이 test time에 마주치는 perceptual ambiguity(유사한 distractor, 시야 혼란)와 action multimodality(여러 행동 후보 공존) 상황에서, 추가 training / verifier / multi-pass inference 없이 더 robust하게 동작하게 만드는 것이다.핵심 문제의식: 기존 VLA inference는 (1) vision enc..