Мера разнообразия. Достаточно и хорошо параметризованный процесс

Пусть задана некоторая величина V множеством своих значений V = {vi}.

Назовем распределением величины V строку si(V), состоящую из элементов vi. Множество распределений величины V обозначим за S(V) = {si(V)}. Условимся, что S(V) не содержит пустой строки.

Введем понятие меры разнообразия M распределения si(V), обозначаемую как M (si(V)). В общем случае, когда распределение не задано, будем писать M(s).

Интуитивно меру разнообразия будем понимать как числовую характеристику распределения, которая возрастает при увеличении разнообразия значений V и их количества вхождений в строку si(V), и убывает в случае его уменьшения.

Формализуем некоторые необходимые свойства меры:
1) мера M принимает неотрицательные значения: M(s) >= 0;
2) для множества S(V) распределений величины V существует значение меры Mmin, такое, что значение меры любого распределения M(si(V)) из этого множества больше или равно Mmin. Назовем Mmin нижней границей меры M распределений S величины V и будем обозначать, как Mmin(S(V)).

Распределение si(V) будем называть достаточно разнообразным, если его мера разнообразия M(si(V)) строго больше нижней границы, то есть M(si(V)) > Mmin (S(V))

Распределение si(V) будем называть более разнообразным, чем sj(V) (или говорить, что si(V) разнообразнее sj(V)), если M(si(V)) > M (sj(V)).
Введем понятие процесса. Будем говорить, что процесс P задан, если заданы:
1) множество значений X = {xi} его параметра;
2) выходная величина V;
3) отображение X на S(V).

То есть процесс P ставит в соответствие каждому значению своего параметра некоторое распределение величины V: P(xi) = si(V).

Сопоставим каждому распределению, которое генерирует процесс, то есть значениям P(xi) для каждого xi из X, меру M(P(xi)) = M(si(V)), составив из этих значений строку U(P). Из приведенного выше определения следует, что строка U(P) -- это распределение величины M(s), то есть распределение значений меры.

Процесс P называется достаточно параметризованным по мере M, если распределение U(P) достаточно разнообразно.

Будем говорить, что процесс P1 лучше параметризован по мере M, чем P2, если U(P1) разнообразнее U(P2).
Для случая, когда S(V) ограничено (то есть задано явно), введём понятие верхней границы Mmax меры M множества распределений S(V) : Mmax (S(V)). Аналогично нижней границе, она определяется, как значение меры Mmax, такое, что значение меры любого распределения M(si(V)) из S(V) меньше или равно Mmax.

Распределение si(V) будем назвать максимально разнообразным, если его мера разнообразия M(si(V)) строго равна верхней границе, то есть M(si(V)) = Mmax (S(V))

Процесс P называется хорошо параметризованным по мере M, если распределение U(P) максимально разнообразно.
Неформально говоря, достаточно параметризованный процесс порождает распределения разной степени разнообразия. Процесс, не являющийся достаточно параметризованным, может сильно зависеть от параметра, то есть порождать разные распределения при разных значениях параметра, но при этом все эти распределения имеют одинаковую меру разнообразия. Главный смысл введенных понятий -- в возможности количественно сравнивать процессы между собой, определяя, какой из них более параметризованный. Таким образом, хорошо параметризованный процесс -- это максимально разнообразный из всех возможных достаточно параметризованных процессов при выбранной мере и ограничениях на её множество распределений.

Возможность количественного сравнения процессов -- это базовый инструмент для построения новых, более параметризованных процессов.
Автор: Грудина Илья Алексеевич
Опубликовано: 28.01.2023