Всегда нужно тестировать и лучше всего на реальных пользователях. Чтобы обновление прошло менее болезненно, сначала тестируют на небольшой выборке пользователей и после анализа изменения маштабируют дальше.
Вообще-то могут. Никаких технических ограничений для этого нет. Скорее всего, вы столкнулись с a/b тестированием, когда новый функционал показывают только части аудитории.