Начало > Архив > Година LVI, 2013/5

ВЕРИГИ НА МАРКОВ И ПРИЛОЖЕНИЕТО ИМ В GOOGLE

Евгения Стоименова

Professor DSc in Mathematics
Institute of Mathematics and Informatics – BAS
Acad. G. Bonchev Street bl. 8
1113 Sofia Bulgaria
http://www.math.bas.bg/~jeni/

Година LVI, 2013/5 стр. 426 - 443 Изтегли PDF

Резюме. В тази статия се разглежда поведението на физически системи, които се развиват във времето. Моделите са стохастични и се представят с марковски вериги с краен брой състояния и постоянни вероятности за преход. Материалът е достъпен за ученици от средния курс. Базовите знания по вероятности от средния курс съществено помагат за разбирането на идеите. Използват се още алгебрични действия с вектори и матрици, които не затрудняват ученици с повишени интереси към информатиката. Текстът се основава на лекции, проведени от автора на Лятната изследователска школа на УчИМИ 2013.

Ключови думи: Markov chain, web page ranking, PageRank

1. Марковска верига, състояния, вероятности за преход

Веригите на Марков се използват за моделиране на последователни случайни събития, чието реализиране зависи от предишните настъпили събития. Да си представим една физическа система, която има \(n\) на брой състояния и във всеки един момент тя се намира само в едно от тези състояния. Системата преминава от едно състояние в друго по случаен начин. В \(n\)-тия момент на наблюдение системата се намира в състояние, което зависи от редицата от предишни състояния на системата. Да предположим, че състоянието в \(n\)-тия момент зависи само от това, в кое състояние е била системата в предишния (\(n-1\) )-ви момент. Такава последователност от случайни събития образува марковска верига.

Исторически бележки. Веригите на Марков носят името на руския математик Андрей Марков (\(1856-1922\) ), който първи започва да ги изучава (Марков, 1906). Прилагането им в интернет технологиите съществено повлия на развитието и структурата на интернет.

Схема на музея

Пример. Нощен пазач обхожда музей по случаен начин. При преход от зала в зала той избира изход равновероятно. Да се представи графично движението на пазача и да се пресметнат вероятностите за преходи между залите.

Да анализираме примера. Във всеки един момент пазачът се намира в едно от трите състояния: пазачът е в състояние 1, ако се намира в зала \(A\); в състояние 2, ако е в зала \(B\) и в състояние 3, ако се намира в зала \(C\). (Номерирането не е от значение и тук е съответно на реда \(A-B-C\) ). Ако пазачът се намира в състояние 1 в даден момент, то вероятността да премине в състояние 2 за един ход е \(1 / 2\) и в състояние 3 също \(1 / 2\), тъй като има два равновероятни изхода от зала \(A\). Записваме

\[ p_{12}=1 / 2, \quad p_{13}=1 / 2, \]

за да означим тези вероятности. С други думи, с \(p_{i j}\) означаваме вероятността за преход от състояние \(i\) в състояние \(j\) за един ход.

Да пресметнем вероятностите за преход до останалите зали: вероятността за преход от състояние 2 до състояние 1 е \(p_{21}=1 / 3\), от състояние 2 до състояние 3 е \(p_{23}=2 / 3\); вероятността за преход от състояние 3 до състояние \(1, p_{31}=1 / 3\); от състояние 3 до състояние \(2, p_{32}=2 / 3\). Представени в таблица, преходните вероятности са:

където нулите съответстват на вероятност 0 за оставане в същата зала за един ход. Можем да представим схемата на преходите и чрез граф по следния начин (Фиг. 1).

Фигура 1. Схема на преходите в музея

Възлите на графа представляват залите (състоянията). Върховете са свързани, ако има преход между съответните зали. Стрелките означават посоките на преход и са надписани със съответните вероятности за преход.

1.1. Марковска верига

Дефиниция. Марковска верига е случаен процес, представен като физическа система, която във всеки даден момент \(t=1,2,3\),. .. се намира в едно от краен (или изброим брой) състояния. На всяка стъпка, определена с \(t\), системата преминава от едно състояние в друго по случаен начин, като вероятността за преход не зависи от \(t\), а само от състоянието, в което се намира системата.

Вероятността \(p_{i j}\) за преход от състояние \(i\) в състояние \(j\) се нарича преходна вероятност.

Марковската верига се характеризира с преходна матрица, съдържаща преходните вероятности за всички състояния. Елементът (\(i, j\) ) на матрицата съдържа вероятността \(p_{i j}\) за преход от състояние \(i\) в състояние \(j\). Така всеки ред на матрицата съдържа вероятностите за преход от едно фиксирано състояние до всички състояния (включително настоящето) на системата.

(0.1) \[ \left(\begin{array}{cccc} p_{11} & p_{12} & \cdots & p_{1 k} \\ p_{21} & p_{22} & \cdots & p_{2 k} \\ \vdots & \vdots & \ddots & \vdots \\ p_{k 1} & p_{k 2} & \cdots & p_{k k} \end{array}\right) \]

Очевидно матрицата е квадратна с размер \(k \times k\), където \(k\) е броят на състоянията на системата.

Преходната матрица от примера с музея има вида:

(0.2) \[ \left(\begin{array}{ccc} 0 & 1 / 2 & 1 / 2 \\ 1 / 3 & 0 & 2 / 3 \\ 1 / 3 & 2 / 3 & 0 \end{array}\right) \]

Да отбележим някои от свойствата на преходната матрица:

(i) всички числа \(p_{i j}\) са между 0 и 1;

(ii) сумите на числата по редове е 1;

(iii) за всяко \(j\) съществува i такова, че \(p_{i j} \gt 0\).

Марковската верига трябва да има начално състояние, с което да започне редицата. То се представя с вектор с дължина, равна на броя на състоянията на системата, в който има една единица, съответна на състоянието, в което се намира системата, и нули на всички останали позиции. В примера пазачът тръгва от състояние 1 (зала \(A\) ), съответно началният вектор е \(q=\left(\begin{array}{llll}1 & 0 & 0 & 0\end{array}\right)\).

В някои случаи веригата може да започне от различни състояния с определени вероятности . Началното състояние се задава с вектор от вероятности \(q=\left(q_{1} q_{2} \ldots q_{\mathrm{k}}\right)\), където \(q_{\mathrm{i}}\) е вероятността системата да се намира в състояние \(i\) първоначално. Тъй като \(q\) е вероятностен вектор, всички стойности са между 0 и 1 (включително) и \(q_{1}+q_{2}+\ldots q_{\mathrm{k}}=1\). Този случай описва някои реални приложения и ще го разгледаме в Пример 2.

1.2. Преходни вероятности за два хода

Да направим някои пресмятания в примера. Първо да намерим вероятностите след 2 прехода пазачът да се намира в зала \(A, B\) или \(C\). Да предположим, че първоначално пазачът се намира в зала \(A\). Следвайки възможните преходи, след 1 ход той ще се намира в зала \(B\) с вероятност \(1 / 2\) или в зала \(C\) също с вероятност \(1 / 2\) (Фиг. 1). От зала \(B\) той може да продължи в зала \(A\) с вероятност \(1 / 3\) или в зала \(C\) с вероятност \(2 / 3\). Аналогично от зала \(C\) той може да продължи в зала \(A\) с вероятност \(2 / 3\) или в зала \(A\) с вероятност \(1 / 3\). Това последователно движение може да се изобрази с дървовидната диаграма на Фиг. 2.

Фигура 2. Схема на вероятностите за преходи от зала A

Вероятностите за различните преходи от зала A намираме, като умножим вероятностите по дървото

\[ \begin{aligned} & P(A \rightarrow B \rightarrow A)=(1 / 2)(1 / 3)=1 / 6 \\ & P(A \rightarrow B \rightarrow C)=(1 / 2)(2 / 3)=1 / 3 \\ & P(A \rightarrow C \rightarrow B)=(1 / 2)(2 / 3)=1 / 3 \\ & P(A \rightarrow C \rightarrow A)=(1 / 2)(1 / 3)=1 / 6 \end{aligned} \]

Сега да пресметнем вероятностите за преход до зали \(A, B\) или \(C\) за 2 хода при останалите начални позиции - от зала \(B\) и от зала \(C\). Проследявайки дървото на фигурата вдясно, намираме последователно:

Тръгвайки от зала \(B\),

\(P(B \rightarrow A \rightarrow B)=(1 / 3)(1 / 2)=1 / 6\)

\(P(B \rightarrow A \rightarrow C)=(1 / 3)(1 / 2)=1 / 3\)

\(P(B \rightarrow C \rightarrow B)=(2 / 3)(2 / 3)=4 / 9\)

\(P(B \rightarrow C \rightarrow A)=(2 / 3)(1 / 3)=2 / 9\)

Тръгвайки от зала \(C\),

\(P(C \rightarrow A \rightarrow B)=(1 / 3)(1 / 2)=1 / 6\)

\(P(C \rightarrow A \rightarrow C)=(1 / 3)(1 / 2)=1 / 6\)

\(P(C \rightarrow B \rightarrow A)=(2 / 3)(1 / 3)=2 / 9\)

\(P(C \rightarrow B \rightarrow C)=(2 / 3)(2 / 3)=4 / 9\)

Така намираме, че вероятности за достигане на зали \(A, B\) или \(C\) за 2 хода при начална позиция \(A\) са:

\(P(A \mid A)=P(A \rightarrow B \rightarrow A)+P(A \rightarrow C \rightarrow A)=1 / 6+1 / 6=1 / 3\)

\(P(B \mid A)=P(A \rightarrow C \rightarrow B)=1 / 3\)

\(P(C \mid A)=P(A \rightarrow B \rightarrow C)=1 / 3\).

Вероятностите за достигане на зали \(A, B\) или \(C\) за 2 хода при начална позиция \(B\) ca:

\(P(A \mid B)=P(B \rightarrow C \rightarrow A)=2 / 9\)

\(P(B \mid B)=P(B \rightarrow A \rightarrow B)+P(B \rightarrow C \rightarrow B)=1 / 6+4 / 9=11 / 18\)

\(P(C \mid B)=P(B \rightarrow A \rightarrow C)=1 / 6\).

Вероятностите за достигане на зали \(A, B\) или \(C\) за 2 хода при начална позиция \(C\) ca:

\(P(A \mid C)=P(C \rightarrow B \rightarrow A)=2 / 9\)

\(P(B \mid C)=P(C \rightarrow A \rightarrow B)=1 / 6\)

\(P(C \mid C)=P(C \rightarrow A \rightarrow C)+P(C \rightarrow B \rightarrow C)=1 / 6+4 / 9=11 / 18\)

Дървовидните диаграми са удобни за пресмятане на условна вероятност, каквито са настоящите (Waner & Costenoble, 2011; Grinstead & Snell, 1997).

Да построим преходната матрица на веригата за 2 хода:

Ще покажем, че:

\[ \left(\begin{array}{ccc} 1 / 3 & 1 / 3 & 1 / 3 \\ 2 / 9 & 11 / 18 & 1 / 6 \\ 2 / 9 & 1 / 6 & 11 / 18 \end{array}\right)=\left(\begin{array}{ccc} 0 & 1 / 2 & 1 / 2 \\ 1 / 3 & 0 & 2 / 3 \\ 1 / 3 & 2 / 3 & 0 \end{array}\right)\left(\begin{array}{ccc} 0 & 1 / 2 & 1 / 2 \\ 1 / 3 & 0 & 2 / 3 \\ 1 / 3 & 2 / 3 & 0 \end{array}\right)=P^{2} . \]

Ако означим с \(p_{13}(2)\) вероятността за преход от състояние 1 в състояние 3 за 2 хода, то

\[ \begin{aligned} p_{13}(2) & =p_{11} \cdot p_{13}+p_{12} \cdot p_{23}+p_{13} \cdot p_{33} \\ & =(1 / 3) \cdot 0+(2 / 3) \cdot(1 / 3)+0 \cdot(1 / 3) \\ & =2 / 9=P(A \mid C) \end{aligned} \] където числата \(p_{i j}\) са елементи от преходната матрица \(P\) за 1 ход, определена с (2). По правилото за умножение на матрици елемента \((1,3)\) на преходната матрица за 2 хода се е получил като произведение на третия ред на \(P\) с първия й стълб.

Забележка: използването на вектори и матрици не излиза от рамките на простите алгебрични действия събиране на матрици, умножение на матрица с число, умножение на две матрици. Съответно трябва да се имат предвид асоциативност при събиране и умножение и липсата на комутативност при умножение на матрици.

1.3. Преходни вероятности за повече от два хода

Да видим как се определят вероятностите за преход до зали \(A, B\) или \(C\) за 3 и повече хода при различните начални позиции. Намираме ги като произведение на преходната матрица за два хода с преходната матрица за един ход (тези и следващите умножения на матрици е за препоръчване да се правят с подходящи софтуерни функции).

\[ P^{3}=P^{2} \cdot P=\left(\begin{array}{ccc} 1 / 3 & 1 / 3 & 1 / 3 \\ 2 / 9 & 11 / 18 & 1 / 6 \\ 2 / 9 & 1 / 6 & 11 / 18 \end{array}\right) \cdot\left(\begin{array}{ccc} 0 & 1 / 2 & 1 / 2 \\ 1 / 3 & 0 & 2 / 3 \\ 1 / 3 & 2 / 3 & 0 \end{array}\right)=\left(\begin{array}{lll} 0.22 & 0.39 & 0.39 \\ 0.26 & 0.22 & 0.52 \\ 0.26 & 0.52 & 0.22 \end{array}\right) . \]

С последователни умножения намираме следващите преходни матрици за 4, 5 и т. н. хода.

\[ \begin{gathered} P^{5}=P^{4} \cdot P=\left(\begin{array}{rrr} 0.2469136 & 0.3765432 & 0.3765432 \\ 0.2510288 & 0.3086420 & 0.440329 \\ 0.2510288 & 0.4403292 & 0.3086420 \end{array}\right) \\ P^{10}=\left(\begin{array}{lll} 0.2499958 & 0.3750021 & 0.3750021 \\ 0.2500014 & 0.3692188 & 0.3807798 \\ 0.2500014 & 0.3807798 & 0.3692188 \end{array}\right) \\ P^{20}=\left(\begin{array}{lll} 0.25 & 0.3750000 & 0.3750000 \\ 0.25 & 0.3748998 & 0.3751002 \\ 0.25 & 0.3751002 & 0.3748998 \end{array}\right) \end{gathered} \]

Теорема 1. Елементът (\(i, j\) ) на матрицата \(P^{n}\) съдържа вероятността \(p_{i j}(n)\) за преход от състояние \(i\) в състояние \(j\) за \(n\) прехода.

\[ P^{n}=\begin{gathered} \\ 1 \\ \vdots \\ i \\ \vdots \\ k \end{gathered}\left(\begin{array}{cccccc} 1 & \ldots & j & \ldots & \ldots & k \\ p_{11}(n) & \ldots & \ldots & \ldots & p_{1 k}(n) \\ \vdots & & & & \vdots \\ \ldots & \ldots & p_{i j}(n) & & \ldots & \ldots \\ \vdots & & & & \vdots & \\ p_{k 1}(n) & \ldots & \ldots & \ldots & p_{k k}(n) \end{array}\right) . \]

Какво се случва с преходната матрица, когато броят на преходите расте неограничено? В примера за музея виждаме, че редовете на матрицата \(\mathrm{P}^{20}\) са почти еднакви. Това означава, че при голям брой преходи вероятността за достигане на състояние \(j\) от състояние \(i\) е една и съща, независимо от началното състояние. С други думи, веригата „забравя“ откъде е тръгнала, когато \(n\) е голямо. Добре е да знаем, че това не е вярно за всяка марковска система.

2. Състояние на марковска система след 1, 2 и повече хода

Ще разгледаме пример, в който повече от един обект извършват движение в марковска система.

Пример 2. (Atherton, 2006) \({ }^{1}\) Таксиметрова компания извършва превози в 3 района: Northside, Downtown и Southside. Копанията разполага с 3 паркинга за нощуване на такситата – по един във всеки район. Компанията е установила, че:

– 50% от такситата, тръгващи сутрин от Northside, остават вечер в Northside, \(20 \%\) пристигат в Downtown, а \(30 \%\) пристигат в Southside;

– \(10 \%\) от такситата, тръгващи сутрин от Downtown, пристигат вечер в Northside, 40% остават в Downtown, а 50% пристигат в Southside;

– 30% от такситата, тръгващи сутрин от Southside, пристигат вечер в Northside, 30% пристигат в Downtown, а 40% остават в Southside.

Компанията трябва да планира размерите на паркингите, така че да побират (без много излишна площ) такситата, които остават вечер във всеки един от трите района.

Решение: нека началното разпределение на такситата в града \(\mathrm{e}: 20 \%\) в район Northside, 50% в Downtown, а 30% в Southside. Това означава, че вероятността случайно избрано такси да е в район Northside е 0.2, да е в район Downtown е 0.5 и да е в район Southside – 0.3.

Очевидно редицата от ежедневните преходи на едно такси образува марковска верига. Схемата на преходите на Фиг. 3 отразява условията на задачата.

Фигура 3. Схема на преходите на такситата

Преходните вероятности са записани в преходната матрица:

\[ \left(\begin{array}{lll} 0.5 & 0.2 & 0.3 \\ 0.1 & 0.4 & 0.5 \\ 0.3 & 0.3 & 0.4 \end{array}\right) \]

Началният (вероятностен) вектор на марковската верига е

\[ q_{0}=\left(\begin{array}{lll} 0.20 & 0.50 & 0.30 \end{array}\right) . \]

Използвайки началното разпределение, ще пресметнем процента на такситата във всеки регион след определен брой хода.

2.1. Състояние след \(\mathbf{1}\) ход

Като използваме началното разпределение и преходната матрица, можем да намерим разпределението на такситата след един ход. Например да пресметнем колко таксита са в Downtown след 1 ход:

\[ 0.20 P(N D)+0.50 P(D D)+0.30 P(S D)=0.20 \cdot(0.2)+0.50(0.4)+0.30(0.3)=0.33 . \]

Това означава, че след първия ден \(33 \%\) от такситата са в Downtown. Това число се получава и от произведението на втория ред на преходната матрица с вектора \(q_{0}\) :

\[ \left(\begin{array}{lll} 0.20 & 0.50 & 0.30 \end{array}\right) \cdot\left(\begin{array}{lll} 0.5 & 0.2 & 0.3 \\ 0.1 & 0.4 & 0.5 \\ 0.3 & 0.3 & 0.4 \end{array}\right)=\left(\begin{array}{lll} \cdot & 0.33 & \cdot \end{array}\right) \]

Можем да намерим процента на такситата в Northside и Southside, като умножим първия ред на \(q_{0}\) с \(P\) и третия ред на \(q_{0}\) с \(P\), съответно. Така разпределение на такситата след един ден, \(q_{1}\) се определя чрез:

\[ q_{1}=q_{0} P=\left(\begin{array}{lll} 0.20 & 0.50 & 0.30 \end{array}\right) \cdot\left(\begin{array}{lll} 0.5 & 0.2 & 0.3 \\ 0.1 & 0.4 & 0.5 \\ 0.3 & 0.3 & 0.4 \end{array}\right)=\left(\begin{array}{lll} 0.24 & 0.33 & 0.43 \end{array}\right) . \]

Следователно вероятността едно такси да е в Northside е 24%, вероятността да е в Downtown е 33% и вероятността да е в Southside е 43%.

2.2. Състояние след няколко хода

Да намерим как са разпределени такситата след 2 хода.

\[ \begin{aligned} q_{2} & =q_{1} P=\left(\begin{array}{lll} q_{0} P \end{array}\right) P=q_{0} P^{2} \\ & =\left(\begin{array}{lll} 0.20 & 0.50 & 0.30 \end{array}\right) \cdot\left(\begin{array}{ccc} 0.36 & 0.27 & 0.37 \\ 0.24 & 0.33 & 0.43 \\ 0.3 & 0.3 & 0.4 \end{array}\right) \\ & =\left(\begin{array}{lll} 0.282 & 0.309 & 0.409 \end{array}\right) . \end{aligned} \]

Аналогично можем да намерим разпределението след 3 хода:

\[ q_{3}=q_{2} P=\left(q_{0} P\right) P^{2}=q_{0} P^{3} \] и след 4 прехода:

\[ \begin{aligned} q_{2} & =q_{3} P=q_{0} P^{3} \\ & =\left(\begin{array}{lll} 0.20 & 0.50 & 0.30 \end{array}\right) \cdot\left(\begin{array}{ccc} 0.3054 & 0.2973 & 0.3973 \\ 0.2946 & 0.3027 & 0.4027 \\ 0.3 & 0.3 & 0.4 \end{array}\right) \\ & =\left(\begin{array}{lll} 0.29838 & 0.30081 & 0.40081 \end{array}\right) \end{aligned} \]

Намираме разпределението след \(n\) хода посредством уравнението:

(0.3) \[ q_{n}=q_{0} P^{n} \]

2.3. Дългосрочно поведение на марковската верига

Прилагайки формулата (3), получаваме разпределението на такситата след 5 хода:

\[ q_{5}=q_{0} P^{5}=\left(\begin{array}{lll} 0.299514 & 0.300243 & 0.400243 \end{array}\right) ; \] след 10 хода:

\[ q_{10}=q_{0} P^{10}=\left(\begin{array}{lll} 0.299998819 & 0.3000005905 & 0.4000005905 \end{array}\right) \] след 20 хода:

\[ q_{20}=q_{0} P^{20}=\left(\begin{array}{lll} 0.3 & 0.3 & 0.4 \end{array}\right) ; \] и след 30 хода:

\[ q_{30}=q_{0} P^{30}=\left(\begin{array}{lll} 0.3 & 0.3 & 0.4 \end{array}\right) \]

Изглежда, че векторът на състоянията клони към вектора \[ q_{*}=\left(\begin{array}{lll} 0.3 & 0.3 & 0.4 \end{array}\right) . \]

Този вектор наричаме граничен вектор на разпределението, или гранично разпределение.

При дадени преходна матрица \(P\) и начално състояние \(q\) граничното разпределение се получи чрез последователното пресмятане

\[ q_{n+1}=q_{n} P=\left(q_{n-1} P\right) P=\left(q_{n-2} P\right) P^{2}=\cdots=q_{0} P^{n} \] като за достатъчно голямо \(n\) получихме

\[ q_{n+1}=q_{n} \text { и следователно } q_{n}=q_{n} P . \]

Когато броят на ходовете расте неограничено (при \(n \rightarrow \infty\) ), е възможно да достигнем граничен вектор \(\pi=\left(\pi_{1} \ldots \pi_{k}\right)\), за който е изпълнено

\[ \pi=\pi \mathrm{P} . \]

Този граничен вектор е и стационарен, тъй като разпределението не се променя при умножение с преходната матрица. Това означава, че разпределението не се променя от преход на преход. Елементите на стационарния вектор представляват вероятностите системата да е в различните състояния след продължителни преходи и не зависи от началното състояние.

В примера за таксиметрова компания: тъй като \(q_{*}=\left(\begin{array}{lll}0.3 & 0.3 & 0.4\end{array}\right)\) е стационарен вектор, ако \(30 \%\) от такситата са в Northside, \(30 \%\) са в Downtown и \(40 \%\) са в Southside, то това съотношение ще бъде същото и след 1 ден. Всяко отделно такси може да се е преместило от един район в друг, но след много превози (преходи) съотношението в районите ще остане постоянно. Тъй като различните начални състояния не влияят на стационарното разпределение, те може да влияят на времето за достигането му.

2.4. Намиране на стационарно разпределение

Теорема 2: За стохастична матрица стационарен вектор винаги съществува.

Това твърдение оставяме без доказателство на този етап.

За да се намери стационарно разпределение \(\pi\) на една марковска верига с преходна матрица

\[ P=\left(\begin{array}{ccc} p_{11} & \cdots & p_{1 k} \\ \vdots & \ddots & \vdots \\ p_{k 1} & & p_{k k} \end{array}\right) \] трябва да се реши матричното уравнение \(\pi P=\pi\), което, записано подробно, е

\[ \left(\begin{array}{lll} \pi_{1} & \ldots & \pi_{k} \end{array}\right) \cdot\left(\begin{array}{ccc} p_{11} & \cdots & p_{1 k} \\ \vdots & \ddots & \vdots \\ p_{k 1} & & p_{k k} \end{array}\right)=\left(\begin{array}{lll} \pi_{1} & \ldots & \pi_{k} \end{array}\right), \] където броят на неизвестните \(\pi_{1}, \pi_{1}, \ldots, \pi_{k}\) е колкото са състоянията на марковската система. Това означава да се реши следната система от линейни уравнения:

\[ \left| \begin{aligned} & \pi_{1}+\pi_{2}+\ldots+\pi_{k}=1 \\ & \pi_{1} p_{11}+\pi_{2} p_{21}+\ldots+\pi_{k} p_{k 1}=\pi_{1} \\ & \pi_{2} p_{12}+\pi_{2} p_{22}+\ldots+\pi_{k} p_{k 2}=\pi_{2} \\ & \quad \ldots \\ & \pi_{k} p_{1 k}+\pi_{2} p_{2 k}+\ldots+\pi_{k} p_{k k}=\pi_{3} . \end{aligned}\right. \]

В примера с таксиметровата компания стационарният вектор \(\pi=\left(\pi_{1}, \pi_{1}, \pi_{3}\right)\) удовлетворява:

\[ \left(\begin{array}{lll} \pi_{1} & \ldots & \pi_{3} \end{array}\right) \cdot\left(\begin{array}{lll} 0.5 & 0.2 & 0.3 \\ 0.1 & 0.4 & 0.5 \\ 0.3 & 0.3 & 0.4 \end{array}\right)=\left(\begin{array}{lll} \pi_{1} & \ldots & \pi_{3} \end{array}\right) \]

Това е еквивалентно на системата от линейни уравнения:

\[ \left\lvert\, \begin{aligned} & \pi_{1}+\pi_{2}+\pi_{3}=1 \\ & 0.5 \pi_{1}+0.1 \pi_{2}+0.3 \pi_{3}=\pi_{1} \\ & 0.2 \pi_{2}+0.4 \pi_{2}+0.3 \pi_{3}=\pi_{22} \\ & 0.3 \pi_{3}+0.5 \pi_{2}+0.4 \pi_{3}=\pi_{3} \end{aligned}\right. \]

Заместваме \(\pi_{1}=1-\pi_{2}-\pi_{3}\) в първите две уравнения

\[ \left\lvert\, \begin{aligned} & -0.5_{1}+0.6 \pi_{2}+0.8 \pi_{3}=0 \\ & 0.2-0.6 \pi_{2}+0.3 \pi_{3}=0 \end{aligned}\right. \] и получаваме

\[ \pi_{2}=0.3, \quad \quad \pi_{3}=0.4, \quad \quad \pi_{1}=0.3 . \]

Забележка: прави впечатление, че в системата за стационарния вектор уравненията са с едно повече от неизвестните, имаме допълнително условие за сумата на елементите да дава 1. Това не преопределя системата, т. к. (може да се види в примера) едно от уравненията се получава като комбинация на другите две.

3. Регулярна марковска верига

Възникват естествени въпроси за съществуване и единственост на стационарното разпределение.

1. Винаги ли съществува стационарно разпределение?

Отговорът е „Да“ и ще го оставим без доказателството на този етап.

2. В примера за таксиметрова компания: започнахме от разпределение \(q_{0}\) и видяхме, че \(q_{0} P^{n}\) се приближава до \(q *\) когато \(n\) става достатъчно голямо. Дали това е така винаги?

Отговорът е „Това е вярно, ако марковската верига е регулярна“. (Дефиницията е по-долу.)

3. Кога можем да кажем, че една марковска верига клони към единствен стационарен вектор, независимо от началните условия?

Дефиниция 2. Една стохастична матрица се нарича регулярна, ако за някоя нейна степен нито един от елементите ѝ не е нула.

Да отбележим, че за да е регулярна марковската верига, не е задължително всички елементи на преходната матрица да са ненулеви. След като всички стойности на матрицата са между 0 и 1 и строго положителни, то всички следващи степени на матрицата ще имат тези свойства и сходимостта е гарантирана.

Дефиниция 3. Марковската верига се нарича регулярна, ако нейната преходна матрица е регулярна.

Не всички марковски вериги имат единствен стационарен вектор, към който клони редицата.

Фигура 4. Нерегулярна марковска верига

В зависимост от началното състояние някои марковски вериги могат да имат различни стационарни вектори. Това се вижда на примера на Фиг. 4. Ако веригата започне от някое от състоянията \(1,2,3\) или 4, тя никога няма да достигне останалите състояния и обратно, ако веригата започне от някое от състоянията 6, 7 или 8, тя рано или късно ще завърши в състояние 8. Такива вериги не са регулярни.

Теорема 3. Ако марковската верига е регулярна, то тя има само едно стационарно разпределение.

Последователните степени на преходната матрица образуват редица от матрици, която клони към една определена матрица \(P^{*}\). Тази стационарна матрица има смисъл на преходна матрица за всички преходи от известно място нататък.

Теорема 4. Ако марковската верига е регулярна, то стационарната матрица има едни и същи редове, които съвпадат със стационарно разпределение \(\pi=\left(\pi_{1} \ldots \pi_{k}\right)\).

Няма да разглеждаме нерегулярни марковски вериги, въпреки че те са многобройни и със значими приложения през миналия век. Ще споменем само поглъщащата марковска верига. Такава верига има едно или повече поглъщащи състояния. При достигане на такова състояние системата остава там завинаги (Фиг. 4, състояние 8). С други думи, вероятността да напуснем това състояние е 0.

Тук ще разгледаме най-значимото съвременно приложение на регулярните марковските вериги – подреждането на списъка от намерените резултати на една интернет търсачка.

4. PageRank на Google

Създателите на интернет търсачките трябва да удовлетворят три основни групи клиенти: търсещите информация (които искат полезни резултати); рекламодателите (които искат връзка към рекламата си); и доставчиците на страници с рекламно място (които искат да максимизират приходите от реклама). Редът, в който се съставя списъкът от намерените страници, е съществена част при проектирането на една интернет търсачка.

Алгоритъмът на Google подрежда списъка от намерените страници съобразно вероятностите те да бъдат посетени от потребител, който „сърфира“ в мрежата, като избира по случаен начин хипервръзка от страницата, в която се намира. Значимостта (рангът) на една страница е отражение на поведението на потребителите на WWW и е равен на вероятността тя да се бъде посетена при случайно сърфиране. Един начин за изчисляване на ранговете на уеб страници е описан от Стоименова (2012).

Да анализираме условията на задачата. Нека броят на всички страници в мрежата е \(N\). От един връх \(i\) към връх \(j\) се задава стрелка, ако в страницата \(i\) има хипервръзка към страницата \(j\). Движението (сърфирането) се извършва от един връх до друг само ако има стрелка в тази посока. Да си представим, че сърфистът избира с равна вероятност една от всичките връзки в страницата, в която се намира. Дефинираме матрицата на хипервръзките:

\[ Q_{i j}= \begin{cases}1 / L(i), & \text { ако от страница i има връзка към странича } j \\ 0, & \text { в останалите случаи. }\end{cases} \] където \(L_{(i)}\) е общият брой на излизащите връзки от страницата \(i\).

За простота нека \(Q_{i i} \gt 0\) за всички \(i\). Това означава, че има връзка от страницата към себе си. Следователно \(Q\) може да се разглежда като преходна матрица на марковска верига на случайно сърфиране, където страниците представляват състоянията на марковската система. Ако предположим, че веригата е регулярна, то съществува стационарно вероятностно разпределение (\(\pi_{1} \ldots \pi_{N}\) ) за посещение на състоянията (страниците). Така \(\pi_{i}\) е пропорционално на времето, което сърфистът посещава състоянието \(i\). Колкото по-голямо е \(\pi_{i}\), толкова по-значима е страницата. Следователно значимостта на страницата \(i\) се дефинира с \(\pi_{i}\).

Реалната уеб мрежа не е регулярна и е възможно сърфистът да попадне в страница, от която не излизат връзки. За да се избегнат такива ситуации, преходната матрица се модифицира по следния начин:

\[ P=\alpha\left(\begin{array}{cccc} Q_{11} & Q_{12} & \ldots & Q_{1 N} \\ Q_{21} & Q_{22} & \ldots & Q_{2 N} \\ \vdots & \vdots & \ddots & \vdots \\ Q_{N 1} & Q_{N 2} & \ldots & Q_{N N} \end{array}\right)+\tfrac{1-\alpha}{N}\left(\begin{array}{cccc} 1 & 1 & \ldots & 1 \\ 1 & 1 & \ldots & 1 \\ \vdots & \vdots & \ddots & \vdots \\ 1 & 1 & \ldots & 1 \end{array}\right) \] където \(0 \lt \alpha \lt 1\).

С други думи, сърфистът с вероятност \(\alpha / L_{(i)}\) избира една от връзките в страницата, в която се намира, ако \(L_{(i)} \gt 0\), и с вероятност \((1-\alpha) / N\) преминава в произволна страница от мрежата. Идеята на алгоритъма е, че: (i) страниците във всяка мрежа от \(N\) страници имат вътрешна значимост (\(1-\alpha\) ) / \(N\); (ii) ако една страница \(i\) има значимост \(\pi_{i}\), то тя отдава значимост \(\alpha \pi_{i}\), като я разделя поравно между страниците, които цитира.

Да отбележим, че преходната матрица на случайното сърфиране е регулярна, тъй като всичките й елементи са положителни. Множителите \(\alpha\) и (\(1-\alpha\) ) са необходими, за да си осигурим това свойство. За регулярна марковска верига съществува единствен стационарен вектор, удовлетворяващ \(\pi P=\pi\). Стационарните вероятности показват каква част от времето прекарва сърфистът в различните страници. Така, ако \(\pi_{i} \gt \pi_{j}\), то страницата \(i\) е по-значима от страницата \(j\) и нейният ранг трябва да е по-висок.

Значимостта на страницата \(i\) се определя като решение на системата линейни уравнения:

\[ \left(\begin{array}{llll} \pi_{1} & \pi_{2} & \cdots & \pi_{N} \end{array}\right)=\alpha\left(\begin{array}{llll} \pi_{1} & \pi_{2} & \cdots & \pi_{N} \end{array}\right)\left(\begin{array}{cccc} Q_{11} & Q_{12} & \cdots & Q_{1 N} \\ Q_{21} & Q_{22} & \cdots & Q_{1 N} \\ \vdots & \vdots & \ddots & \vdots \\ Q_{N 1} & Q_{N 2} & \cdots & Q_{N N} \end{array}\right)+\tfrac{1-\alpha}{N}\left(\begin{array}{llll} 1 & 1 & 1 & 1 \end{array}\right) \text {, } \]

Тъй като \[ \sum_{i=1}^{N} \pi_{i}=1, \] това е еквивалентно на \(\left(\begin{array}{llll}\pi_{1} & \pi_{2} & \cdots & \pi_{N}\end{array}\right)=\alpha\left(\begin{array}{llll}\pi_{1} & \pi_{2} & \cdots & \pi_{N}\end{array}\right) P\).

Решението на системата \(\pi P=\pi\) е същността на алгоритъма за подреждане на Google, наречен PageRank. В този вид алгоритъмът е описан в книгата на Ching и Ng (2006), оригиналният алгоритъм може да се види в статиите на Brin & Page (1998) и Page et al. (1998). На теория не е толкова трудно да се оцени \(\pi\), тъй като \(P^{\mathrm{n}}\) клони много бързо към своята граница

\[ \Pi=\pi_{1} 1=\left(\begin{array}{cccc} \pi_{1} & \pi_{2} & \ldots & \pi_{N} \\ \pi_{1} & \pi_{2} & \ldots & \pi_{N} \\ \vdots & \vdots & \ddots & \vdots \\ \pi_{1} & \pi_{2} & \ldots & \pi_{N} \end{array}\right) \]

Пример 3. Разглеждаме мрежа от 3 уеб страници, 1, 2 и 3, със следните хипервръзки:

\(1 \rightarrow 1,1 \rightarrow 2,1 \rightarrow 3\)

\(2 \rightarrow 1,2 \rightarrow 2\)

\(3 \rightarrow 2,3 \rightarrow 3\)

Определете PageRank на страниците.

Решение: преходната матрица на тази марковска верига е \[ Q=\left(\begin{array}{ccc} 1 / 3 & 1 / 3 & 1 / 3 \\ 1 / 2 & 1 / 2 & 0 \\ 0 & 1 / 2 & 1 / 2 \end{array}\right) \]

Стационарният вектор на разпределението

\[ \pi=\left(\begin{array}{lll} \pi_{1} & \pi_{2} & \pi_{3} \end{array}\right) \] удовлетворява уравненията

\[ \pi=\pi Q \text { и } \pi_{1}+\pi_{2}+\pi_{3}=1 . \]

Като решим системата линейни уравнения, получаваме:

\[ \pi=\left(\begin{array}{lll} \pi_{1} & \pi_{2} & \pi_{3} \end{array}\right)=\left(\begin{array}{lll} \tfrac{3}{9} & \tfrac{4}{9} & \tfrac{2}{9} \end{array}\right) \]

Разбира се, реалната мрежа от уеб страници съдържа милиарди страници и съответно преходната матрица е с невероятна размерност, за да може така просто да се изчисляват ранговете.

Да видим как Google използва стационарния вектор.

Пример 4. (Atherton, 2006) Да разгледаме мрежата от 6 страници на Фиг. 5.

Фигура 5. Мрежа от 6 страници

Ще използваме тук наготово ранговете, определени чрез описания алгоритъм, а на читателя предлагаме да ги изчисли за упражнение. Стационарният вектор е \[ \pi=\left(\begin{array}{llllll} 0.2066 & 0.1770 & 0.1773 & 0.1770 & 0.1314 & 0.1309 \end{array}\right) . \]

Нека си представим, че потребителят търси по ключови думи keyword1 и keyword2. Търсачката проверява в базата данни на Google с ключови думи, където за всяка ключова дума има списък от всички страници, в които тя се среща. Да предположим, че в базата данни се намира:

keyword1: page 2, page 5, page 6

keyword2: page 2, page 3

...

Резултатът от търсенето ще са страниците \(\{2,3,5,6\}\). Следва сравнение на ранговете на тези страници, определени от PageRank, и подреждането им по важност. Ранговете на тези страници са \(\pi_{2}=0.1770, \pi_{3}=0.1773, \pi_{5}=0.1314\) и \(\pi_{6}=0.1309\). Следователно подреждането на страниците по ранг е:

page 3 > page 2 > page 5 > page 6.

В този ред са резултатите за потребителя. При ново търсене търсачката отново се обръща към в базата данни и извежда нов релевантен списък.

Справка с уебсайта на Google показва, че и досега PageRank е „сърцето на нашия софтуер“. Трябва да се знае още, че PageRank не е единственият критерий, който Google използва за определяне на значимостта на уеб страниците. В действителност в момента алгоритъмът за подреждане е доста по-сложен и е търговска тайна.

БЕЛЕЖКИ

1. Atherton, R. (2006). A look at Markov chains and their use in Google.

http://www.math.iastate.edu/thesisarchive/MSM/AthertonRMSMSS05.pdf (последен достъп на 11.08.2013).

ЛИТЕРАТУРА

Марков, А. А. (1906). Распространение закона больших чисел на величины, зависящие друг от друга. Известия Физико-математического общества при Казанском университете, 2-я серия, том 15, ст. 135 – 156.

Стоименова, Е. (2012). Случайно сърфиране в Интернет. Maтематика и информатика, година LV, кн. 3, 225 – 237.

Brin, S. and L. Page (1998). The anatomy of a large-scale hypertextual web search engine. Computer Networks and ISDN Systems, 30(1-7):107 – 117.

Ching, W.K., Ng, M. K. (2006), Markov chains. Models, algorithms and applications.

Grinstead, C. M., Snell, J. L. (1997). Introduction to probability. Americam mathematical Society.

Page L., S. Brin, R. Motwani, T. Winograd (1998). The PageRank citation ranking: bringing order to the web. Technical report. Stanford Digital Library Technologies Project.

Waner, S., S. Costenoble, (2011). Finite mathematics. (Chapter 7 Probability, Sec. 7.7 Markov systems.)

Свързани статии

СЛУЧАЙНО СЪРФИРАНЕ В ИНТЕРНЕТ

Година LVI, 2013/5 Архив

стр. 426 - 443 Изтегли PDF