Две группы могут иметь одинаковое среднее, но быть совершенно разными. Поэтому, кроме центра, измеряют разброс. Простейшая мера — размах: разность между максимумом и минимумом. Ряд 49, 50, 51 и ряд 0, 50, 100 имеют одинаковое среднее 50, но размах 2 против 100.
Более устойчивая мера — стандартное отклонение: оно показывает, насколько в среднем значения отклоняются от среднего. Чем оно больше, тем «шире» разброс. Точную формулу учить не обязательно, важна идея: маленькое отклонение — данные кучные и предсказуемые, большое — разбросанные.
Для перекошенных данных удобны перцентили. 25-й перцентиль — значение, ниже которого лежит четверть данных; 50-й перцентиль — это медиана; 90-й перцентиль показывает «почти максимум» без влияния единичных выбросов. Перцентили часто используют для времени отклика сервисов: «90% запросов быстрее 200 мс».