Въпроси на преподаването
АБРАХАМ ВАЛД И СТАТИСТИЧЕСКИТЕ ИЗСЛЕДВАНИЯ ВЪРХУ САМОЛЕТНИТЕ БРОНИ
Резюме. Настоящата работа е посветена на изследванията на Абрахам Валд върху вероятността за оцеляване на самолет с даден брой поражения и на фолклорните легенди за неговата роля. Ние даваме ново обяснение на извеждането на базовото уравнение на Абрахам Валд и на основанията му за избор на допускания, които правят това извеждане възможно. Описваме подробно процеса на извеждане, за да осветим ролята на интуицията при статистическите изследвания и кога не бива да се доверява ученият на нея. Обръщаме внимание на ролята на оценките на интервалите при изчисляване на приблизителни стойности за липсващи данни. Осветляваме ролята на допусканията в процеса на научно изследване и методологията за тяхното добавяне и постепенно смекчаване.
Ключови думи: история; Валд; статистика; евристика; вероятности; епистемология
Абрахам Валд
Математикът Абрахам Валд е роден на 31 октомври 1902 г. в румънския град Клуж-Напока, който тогава се намирал в Австро-Унгарската империя. Той не получил формално образование и бил образован у дома от своите родители. Причината за това била, че семейството било силно религиозно, а според еврейската традиция събота, който бил официален учебен ден тогава, бил ден за почивка. Въпреки това младежът получил солидно образование. През 1928 г. завършил Клужкия университет ,,Бабеш-Боляй“ (тогава университет ,,Фердинанд I“) с математика, а през 1931 г. защитил докторска степен по математика във Виенския университет. Заради дискриминация срещу евреите в междувоенна Австрия не могъл да стане университетски преподавател. През 1938 г. Германия анексирала Австрия и математикът бил принуден да бяга. Установил се със семейството си в САЩ и започнал работа в комисията ,,Колс“ за изследване на икономиката. През Втората световна война приложил своите теоретични познания за статистиката на практика.
През 1950 г. бил поканен от правителството на Индия да проведе няколко лекции в страната. Той посетил Индийския статистически институт в Калкута и планирал да отиде на Индийския научен конгрес в Бангалор през януари 1951 г., но загинал в самолетна катастрофа над горския масив Нилигри в Южна Индия на 13 декември 1950 г.
Легендата разказва:
Тъй като за военовъздушните сили на САЩ било важно да установят къде да добавят допълнително броня на своите самолети, за да намалят загубите, а не можели да добавят навсякъде, тъй като било скъпо и неефективно, те се обърнали към Валд. Валд приложил метода на така наречения Survivorship bias, който е логическата грешка да се разглеждат случаите на преминалите през дадена селекция и на тяхна основа да се изготвя статистиката, а неуспелите да минат през селекцията да не се разглеждат, тъй като обикновено не е ясна причината за техния неуспех и не могат да бъдат забелязани.
Когато самолети се завръщали от бойна мисия (фиг.1), Валд проучвал къде са ударени от снаряди. Той вярвал, че вражеските артилеристи стрелят на случаен принцип.
Фигура 1. Местата, на които са уцелени завърналите се самолети1)
Ако дадено място е било тежко засегнато, той смятал, че на това място не трябва да се поставя броня, тъй като щом самолетът се е завърнал, то няма нужда там да се поставя броня. Където обаче нямало следи от снаряди, Валд препоръчвал да се сложи броня, тъй като, ако това място е било засегнато, самолетът е щял да бъде свален. Свалените самолети не се проучвали, тъй като не били налични за изследване – намирали се на вражеска територия или под вода. Изследването на Валд се оказало ключово и след него загубите на самолети били намалени. Така Валд превърнал грешката в нещо полезно.
Всъщност, както (Mangel and Samaniego, 1984), предадено от (Bil Casselman, 2016) показва, истината е малко по-различна. Валд изобретява т.нар. секвеционен анализ (sequential analysis) и спомага за подобряване качеството на производството на американско оръжие, което е голям негов принос в статистиката и войната. Изследването, което той прави върху завърналите се американски самолети, е малко по-различно от предаденото в легендата. Той търси да изчисли вероятностите един самолет да оцелее, след като вече е бил ударен един, два или повече пъти. За всеки брой попадения вероятността е различна. Проблемът, който Валд решава, е как да се изчислят граници за тези вероятности, при положение че нямаме никакви данни за самолетите, които не са се върнали. Той намира начин да оцени щетите по самолетите, които не са се върнали – изключителна магия от теория на вероятностите.
Други прояви на евристика на наличността
Този принцип (според фолклора) бил приложен и през Първата световна война, когато полевите болници и лазарети били залети от британски войници с рани по главата, носещи шлемове Броди. Командването мислело да смени шлемовете с други, но статистиците го посъветвали да не го прави, тъй като фактът, че са стигнали до болницата, а не са били убити на място, показва, че шлемовете са ефективни. Ако от 10 простреляни в главата умират 9 без шлем, а с шлем умира 1 и са ранени 6 души, това показва, че шлемът работи, но болниците се пълнят с ранени войници. Заради това тези шлемове останали на служба и се използвали до началото на Втората световна война.
Въпреки ползите от употребата му не бива да се забравя, че Survivorship bias е логическа грешка. Антиваксърите (хората, които са против ваксините) твърдят, че няма нужда и смисъл от задължителните ваксинации срещу опасни и смъртоносни болести, като едра шарка, полиомелит и туберкулоза, тъй като в момента са рядко срещани. Те обаче (съзнателно или не) забравят, че тези болести са редки, тъй като всички или поне повечето от хората са ваксинирани срещу тях. ,,Е“ да, ама в (някоя слаборазвита страна) повечето не са ваксинирани и не са измрели“, биха възразили противниците на ваксинирането. Хората не са измрели, но въпреки това починалите от тези болести са повече и те не са включени в статистиката. По същия начин в ранните фази на епидемията от COVID-19 държавите в Азия и Европа затвориха училищата и много малко деца се заразиха. Това накара дори някои статистици да заключат, че децата много трудно се заразяват и не пренасят болестта – нещо, което се опроверга по-късно с изследвания и реални данни за заразените деца в САЩ и Южна Корея.
Фигура 2. Шлем Броди
Друг пример са хората, които твърдейки, че цигарите или алкохолът не са толкова вредни, казват: ,,Леля ми/баба ми/чичо ми пушеха/пиха, но доживяха до 88-годишна възраст“. Доказано е, че хората, които, водейки нездравословен начин на живот, достигат до преклонна възраст, са малко и повечето умират рано. Въпреки това случаите на починали рано пушачи и/или алкохолици не се разглеждат, а малцинството случаи се представя като мнозинство. Друг пример дава Насим Талеб в книгата си „Надхитрени от случайността“ (Taleb, 2005). В даден инвестиционен фонд пристига трейдър, който има пет последователни успешни години и печели стотици милиони за компанията, но на шестата година се проваля и губи повече, отколкото е спечелил до момента, с което тя остава на нетна загуба от него. Как е възможно това? Насим Талеб дава прост пример.
Нека предположим, че трейдърът успява само благодарение на късмета, с вероятност за успешна година от \(50 \%\). Вероятността за пет поредни години е произведение \(\tfrac{1}{2}^{5}\) или \(\tfrac{1}{32} \approx 3 \%\). Тя изглежда малка, но всичко зависи от извадката. На борсите работят десетки хиляди души. Ако хиляда от тях разчитат изцяло на шанса, средно \(\tfrac{1000}{32}=31.25\), ще успяват пет поредни години. Шефовете виждат един-единствен човек, но не и цялата извадка и си мислят, че е много малко вероятно един мошеник да ги лъже толкова години поред (Kahneman, 2013).
Магията на Валд
Интересен е начинът, по който Валд пресмята броя на свалените и оцелелите самолети. Той използва следния подход, който тук даваме с конкретен пример, взет от (Mangel and Samaniego, 1984), предадено от (Bil Casselman, 2016). Ползвайки група от 400 самолета, той обозначил всичките 400 машини с \(N\). От 400 самолета се завърнали 380. Те били обозначени с \(S\) и представлявали \(95 \%\) от общия брой самолети. Свалените самолети \(L\) са 20 на брой, съставляват \(5 \%\) от общия брой самолети L. С S0 се отбелязват завърналите се без дупки от снаряди самолети. Те са 320 и са 80 процента от цялата група. С една дупка са 32 самолета (8%) от групата. С две дупки са 20 самолета, или 5 процента от самолетите. С 4 и 5 дупки са по два самолета, съответно \(0,5 \%\) (табл.1).
Таблица 1. Числен пример за работата на Валд
Валд приема, че всички свалени самолети са свалени от вражески огън, а не от технически повреди. С \(L_{i}\) се отбелязват свалените с даден брой попадения самолети, означен с \(i . L_{1}\) са самолетите, свалени с едно попадение, \(L_{2}-\) с \(2, L_{3}-\) с 3, и т.н. Общият брой свалени или загубени самолети (lost) (1) е сборът от всички категории на загубени самолети – с едно попадение, с две, с три и т.н. Броят на всички загубени самолети е разликата между първоначалния (общ) брой \(N\) и крайния брой на завърналите се самолети \(S\) :
(1)\[ L=\sum_{i} L_{i}=N-S \]
Също както загубените самолети, така и общият брой и броят на завърналите се могат да се разделят на категории по броя попадения, който имат. Във всяка категория (например самолети с 5 попадения) броят на загубените \(L_{i}\) и броят на завърналите се самолети \(S_{i}\) заедно дават общия брой самолети в тази категория (2):
(2)\[ L_{i}+S_{i}=N_{i} \]
Разделянето на самолетите по категории може да се направи по много начини. Ако искаме например да разделим самолетите на две групи – една група с брой попадения \(h\) под някаква стойност \(h=i N_{h \lt i}\) и втора група самолети с поне толкова попадения \(h \geq i N_{h \geq i}\). Групата на самолетите с поне \(i\) попадения е обединение на групите от самолети с 0 попадения, с 1 попадение, с 2 попадения с \(i-1\) попадения. В нашия пример можем да групираме самолетите на две групи по много начини, един от които е: самолети с поне 1 попадение \(N_{h \geq 1}\) и самолети без попадения \(N_{h \lt 1}\). Броят на самолетите с поне едно попадение е сбор от този на самолетите с \(1,2,3,4\) и 5 попадения, а броят на самолетите с поне \(i\) попадения е сбор на броя самолети с \(i+1, i+2, i+3\) и т.н. попадения (3):
(3)\[ N_{h \geq i}=\sum_{j \geq i} N_{j} \]
Сборът от двете групи ще даде общия брой (4), както и да разделим на две групи различните категории самолети:
(4)\[ N_{h \lt i}+N_{h \geq i}=N \]
Като знаем броя на завърналите се с \(i\) попадения самолети \(S_{i}\) и броя на падналите с \(i\) попадения \(L_{i}\), разбираме общия брой на всички самолети (независимо дали изгубени, или не) в тази категория:
(5)\[ S_{i}+L_{i}=N_{i} \]
Целта на Валд е да разбере колко самолета са паднали с 1 попадение, колко с 2 и т.н., т.е. да намери всяко \(L_{i}\) или поне да оцени този брой – да го постави в някакъв интервал, в който той попада с висока вероятност – доверителен интервал. Това е трудна, ако не и невъзможна задача с директен подход, тъй като това са ненаблюдаеми и непознаваеми количества. Това, което може да се направи, е да се намерят оценки за вероятностите за падане на самолети на \(i\)-тото попадение, при условие че не са паднали по-рано. С \(p_{i}\) се обозначава условната вероятност на самолета да падне на \(i\)-тото попадение, след като преди това е оцелял \(i-1\) попадения. Например:
\(p_{1}\) е вероятност самолетът да е паднал при първото попадение, \(p_{2}-\) при второто попадение, след като е оцелял на първото, \(p_{3}\)– при третото попадение, след като е оцелял на второто, и т.н.
Валд тук прави едно опростяване – приема, че всеки самолет с даден брой попадения има равен шанс да падне, така вероятността става просто съотношение на благоприятни събития към общ брой възможни събития (6):
(6)\[ p_{i}=\tfrac{L_{i}}{N_{h \geq i}} \]
Числителят на дробта е броят загубени самолети с \(i\) попадения, а знаменателят є е общият брой самолети (загубени и върнати) с поне \(i\) на брой попадения. Защо в знаменател е \(N_{h \geq i}\), а не само \(N_{i}\) ? Защото всички самолети, които биха могли да паднат на \(i\)-тото попадение, имат \(i\) попадения. Самолетите с 3 попадения са тези с 3 попадения, с 4 попадения, с 5 попадения – всяко число съдържа предишното. Получилите 6 попадения са имали възможността да паднат на 3-тото. Оттам всички самолети с поне \(i\) на брой попадения формират множеството на всички благоприятни събития, към които трябва да съотнесем реално случилите се. По същия начин пресмятаме вероятността, когато хвърлим зар, да се падне нечетно число – 3 благоприятни събития (1, 3 или 5)
от 6 възможни \(-p_{n=2 k+1}=\tfrac{3}{6}\). Изразът (6) е началната точка на нашето изследване. За момента в него нямаме известни променливи. Трябва да го преобразуваме, за да намалим неизвестните и да обвържем намирането на дадено \(L_{i}\) с известни към момента променливи. Това означава по възможност \(L_{i}\) да зависи от \(L_{i-1}\), с което да по-лучим рекурсия, с която можем да изчислим броя на загубените самолети например с 5 попадения от броя на загубените 4, а тях от броя на загубените с 3 и така до началото – загубените самолети без попадения – брой, който може да се оцени на база на техническите им характеристики, без да имаме нужда да знаем как са били обстрелвани, и да зависим от непознаваеми величини. Затова преобразуваме:
(7a)\[ \begin{gathered} p_{i}=\tfrac{L_{i}}{N_{h \geq i}}=\tfrac{L_{i}}{\sum_{j \geq i} N_{j}} \\ L_{i}=p_{i}\left(\sum_{j \geq i} N_{j}\right)=p_{i}\left(N-\sum_{j \lt i} N_{j}\right) \end{gathered} \]
В (7б) обърнахме индексите – вместо да търсим сбора на всички самолети с поне \(i\) попадения, използваме разликата между общия брой самолети и тези с по-малко от \(i\), което е същото нещо. Това преобразуване ни позволява обаче да направим зависимост между загубените самолети с даден брой попадения и загубените самолети с по-малко попадения:
(7в)\[ L_{i}=p_{i}\left(N-\sum_{j \lt i} N_{j}\right)=p_{i}\left(N-\sum_{j \lt i} S_{j}-\sum_{j \lt i} L_{j}\right) \]
В (7в) вече има само две група неизвестни (върналите се самолети по категории и общият брой самолети са дадени). Една от тях са падналите самолети от различни категории (различен брой попадения), при които има рекурсивна зависимост – за да сметнем например \(L_{5}\), трябва да знаем \(L_{0}, L_{1} \ldots L_{4}\). Така можем да се върнем една стъпка назад и сега, за да сметнем \(L_{4}\), трябва да знаем \(L_{0}\), \(L_{1} \ldots L_{3}\). Накрая стигаме до \(L_{1}\), който зависи само от \(L_{0}\). Валд прави допускане, че самолетите падат само от вражески огън, с което опростява изчислението \(L_{0}=0\). Това ни позволява да изчислим всички \(L_{i}\) последователно.
(7г)\[ \begin{aligned} & L_{1}=p_{i}\left(N-S_{0}\right) \\ & L_{2}=p_{2}\left(N-S_{0}-S_{1}-L_{1}\right) \\ & L_{3}=p_{3}\left(N-S_{0}-S_{1}-S_{2}-L_{1}-L_{2}\right) \ldots \end{aligned} \]
Остава само един проблем – не знаем вероятностите \(p_{i}\) и няма как да ги узнаем директно. Абрахам Валд е работил, за да получи оценки за техните стойности. В задачи от теория на вероятностите, когато е трудно и сложно да се оцени вероятността да се случи едно събитие, превключваме на вероятността то да НЕ се случи, тъй като те заедно дават 1:
(8)\[ P(A)+P(\bar{A})=1 \]
Вероятността да се случи едно събитие или да не се случи, е 1, тъй като няма трета възможност. Това е законът за изключеното трето tertium non datur – Садам Хюсеин или е жив, или е мъртъв. В известен смисъл двете вероятности (на събитието и неговото несбъдване) са обвързани – когато едната се смята много сложно, тъй като е комбинация от много други събития, другата се смята много просто. Затова образуваме вероятността самолетът да НЕ падне на \(i\)-тото попадение, т.е. да оцелее, до \(i\) включително (9a):
(9a)\[ \begin{gathered} q_{i}=1-p_{i} \\ q_{i}=1-\tfrac{L_{i}}{N_{h \geq i}}=\tfrac{N_{h \geq i}-L_{i}}{N_{h \geq i}} \end{gathered} \]
(9в)\[ q_{i} N_{h \geq i}=N_{h \geq i}-L_{i} \]
Тук търсим отново рекурсивна зависимост, но за общия брой самолети с повече от \(i\) попадения, която да не включва изгубените самолети, за да имаме само един тип неизвестни. Затова трябва да преобразуваме разликата в (9в), така че да участват върналите се самолети вместо изгубените. Как може да стане това? Общият брой самолети над дадено ниво на попадения \(N_{h \geq i}\) е сбор на броя загубени самолети над това ниво и броя върнали се (\(9 г\) ):
(9г)\[ N_{h \geq i}=S_{h \geq i}+L_{h \geq i} \]
Броят завърнали се самолети с поне \(i\) попадения \(S_{h \geq i}\) е сбор от различни категории самолети също както общият брой (3). Можем да използваме това, за да направим рекурсивна връзка между \(N_{h \geq i}\) и \(N_{h \geq i+1}\), в която участват вероятностите \(q_{i}\), която да ни позволи да ги изчислим всяка от предишната. За да го направим, трябва да отделим самолетите с най-малкия брой попадения в (\(9 г\) ):
(9д)\[ N_{h \geq i}=S_{h \geq i}+L_{h \geq i}=S_{i}+L_{i}+S_{h \geq i+1}+L_{h \geq i+1}=S_{i}+L_{i}+N_{h \geq i+1} \]
Това ни позволява да преобразуваме (9в) в удобна за нас форма:
(9е)\[ q_{i} N_{h \geq i}=N_{h \geq i}-L_{i}=S_{i}+L_{i}+N_{h \geq i+1}-L_{i}=S_{i}+N_{h \geq i+1} \]
В уравнение (9е) имаме рекурсия също както в (7в) и отново две неизвестни. Нужни са ни допълнителни допускания, за да можем да решим задачата. Едно от тези допускания, направени от Валд, е, че има горна граница на броя попадения, които един самолет може да получи – в нашия пример това са 5 удара. Продължителността на престрелката, скоростта на летене и други фактори поставят тази граница както за падналите, така и за върналите се самолети. Опростяването в случая е, че тази граница \(n\), за която \(N_{h \gt n}=0\), е една и съща за падналите и върналите се самолети, което противоречи на здравия разум, който ни казва, че падналите самолети би трябвало да имат средно повече попадения от завърналите се. Въпреки всичко това и други неинтуитивни допускания са позволили на Валд да изчисли добри оценки за вероятностите \(q_{i}\). Ако той бе допуснал разлика в тази граница, това би въвело още едно непознаваемо количество, свързано с липсващите самолети, нуждаещо се от оценяване, с което задачата би станала много по-трудна. С тази граница се получава лесна рекурсия, тъй като когато \(i=n\), (9е) се опростява до:
(9ж)\[ q_{n} N_{h \geq n}=S_{n}+N_{h \geq n+1}=S_{n} \]
Самото (9е) може да се преобразува така, че да изрази рекурентната връзка, която търсим:
(9з)\[ N_{h \geq i}=\tfrac{S_{i}}{q_{i}}+\tfrac{N_{h \geq i+1}}{q_{i}} \]
Тази формула, макар и рекурсивна, отново не ни дава директен начин да изчислим вероятностите \(q_{i}\). От тези количества \(N_{h \geq i}\) (общ брой самолети с поне \(i\) попадения) в почти всички участват паднали самолети с определен брой попадения, които са неизвестни величини. Единственото количество, което ни е известно, е общият брой самолети, събиращ всички категории
(9и)\[ N=N_{h \geq 0} \]
Силата на математиката се корени в абстрактното мислене и способността да се манипулират символи – когато не можем да използваме рекурсията, за да изчислим директно, можем да я използваме, за да изведем изчислим израз. За целта тръгваме от началото (9ж) и заместваме последователно в рекурсията \((93)\) с изрази (символни низове):
(10а)\[ \begin{gathered} N_{h \geq n}=\tfrac{S_{n}}{q_{n}} \\ N_{h \geq n-1}=\tfrac{S_{n-1}}{q_{n-1}}+\tfrac{N_{h \geq n}}{q_{n}}=\tfrac{S_{n-1}}{q_{n-1}}+\tfrac{S_{n}}{q_{n-1} q_{n}} \\ N_{h \geq n-2}=\tfrac{S_{n-2}}{q_{n-2}}+\tfrac{N_{h \geq n-1}}{q_{n}}=\tfrac{S_{n-2}}{q_{n-2}}+\tfrac{1}{q_{n-2}}\left(\tfrac{S_{n-1}}{q_{n-1}}+\tfrac{S_{n}}{q_{n-1} q_{n}}\right)=\tfrac{S_{n-2}}{q_{n-2}}+\tfrac{S_{n-1}}{q_{n-2} q_{n-1}}+\tfrac{S_{n}}{q_{n-2} q_{n-1} q_{n}} \\ N_{h \geq 0}=N=S_{0}+\tfrac{S_{1}}{q_{1}}+\tfrac{S_{2}}{q_{1} q_{2}}+\cdots+\tfrac{S_{n}}{q_{1} q_{2 \ldots} q_{n}} \end{gathered} \]
Уравнение (10) е формулата на Валд, с която той изчислява вероятностите за оцеляване. То може да се нормира, като вместо брой се използват съотношения:
(10б)\[ \begin{gathered} N-S_{0}=\tfrac{S_{1}}{q_{1}}+\tfrac{S_{2}}{q_{1} q_{2}}+\cdots+\tfrac{S_{n}}{q_{1} q_{2 \ldots} q_{n}} \\ \tfrac{N-S_{0}}{N}=\tfrac{s_{1}}{q_{1}}+\tfrac{s_{2}}{q_{1} q_{2}}+\cdots+\tfrac{s_{n}}{q_{1} q_{2 \ldots} q_{n}}, S_{i}=\tfrac{s_{i}}{N} \\ 1-s_{0}=\tfrac{s_{1}}{q_{1}}+\tfrac{s_{2}}{q_{1} q_{2}}+\cdots+\tfrac{s_{n}}{q_{1} q_{2 \ldots} q_{n}} \end{gathered} \]
Тук имаме едно уравнение с \(n\) променливи, което не може да се реши, ако те са независими. Валд прави второ допускане, което е неинтуитивно. Здравият разум ни казва, че всяко попадение върху самолета намалява вероятността той да оцелее, т.е.
(11)\[ q_{1} \geq q_{2} \geq q_{n} \]
Според (Casselman, 2016) Валд приема, че вероятността за оцеляване не намалява с увеличаване на броя попадения, което е една възможна интерпретация на заместването на всички тези вероятности с една-единствена (12):
(12)\[ q_{1} q_{2 \ldots} q_{i}=q^{i} \]
Това е т.нар. средно геометрично, дошло от „Елементи“ на Евклид. Заместването на тези произведения с една усреднена вероятност на дадена степен може да се интерпретира и по друг, по-разумен начин – вероятностите са близки една до друга – един допълнителен удар не променя скокообразно вероятността за оцеляване. Средно геометричното „наказва“ големите отклонения на данните, което филтрира систематични грешки при изчисляване. То е най-подходящо при пресмятане средна стойност на произведения на съотношения. С това допускане уравнението се опростява до такова с една неизвестна и може да се реши числено или аналитично:
(10б)\[ 1-s_{0}=\tfrac{s_{1}}{q}+\tfrac{s_{2}}{q^{2}}+\cdots+\tfrac{s_{n}}{q^{n}} \]
В конкретния пример вероятността за оцеляване на първото попадение е \(q=0.85\), а за оцеляване на 5-ото попадение е \(q^{5}=0.444\). Грешките от изчисление тук се умножават, поради което по-точните оценки са за вероятностите за оцеляване с по-малко попадения, най-точна е при \(q=q_{1}\). Оттук пресмятането на вероятностите за сваляне на самолети на \(i\)-тото попадение, при условие че са оцелели на \(i-1\), е тривиално (9а), а с тях можем да оценим броя на загубените самолети по брой попадения (7в).
Заключение
Работата на Абрахам Валд по шансовете за оцеляване на самолети при престрелки не се изчерпва с това уравнение, то е началото на дълго изследване, резюмирано в (Mangel & Samaniego, 1984), състоящо се в получаване на граници, в които вероятностите за сваляне на самолетите варират. Границите са необходими, тъй като има няколко ключови допускания, за да се получи уравнение за непознаваеми величини (10б). Изчисляването на стойности за такива величини носи много по-малко информация, отколкото границите, в които те могат да варират. Това е начална фаза на едно изследване. Всяко истинско научно изследване, свързано с данни, започва от прости ситуации с множество допускания. При успех допусканията биват разхлабвани едно по едно и в последователни стъпки уравненията се усложняват и стават по-точни и приложими. Това е целият път на физиката – от уравненията на Нютон за точки с маса, през неговото доказателство за привличането на сфери с маса (Tomov et.al, 2019). Валд действително се е занимавал и с връзката между местоположението на пораженията върху самолетите и вероятностите за тяхното завръщане, но това е само малка част от неговия съществен принос. В (табл.2) са показани резултати от неговия анализ за вероятността за оцеляване от едно попадение според мястото на поражение.
Таблица 2. Вероятност за оцеляване при едно попадение
Изводите за конструкторите са ясни дори само от това изчисление – разликата между вероятността за оцеляване при поражение на двигателя и всички други части на самолета е съществена, а те са близки помежду си. Това е достатъчна информация за взимане на решение при управление на риска (Taleb, 2020). Известната история за Валд е по-скоро вярна, но е много малка част от направеното от него и звучи много по-просто, отколкото е действителното емпирично изследване, както всяка друга фолклорна история, свързана с учени и техните изследвания.
БЕЛЕЖКИ
1. източник: https://en.wikipedia.org/wiki/Survivorship_bias#/media/ File:Survivorship-bias.png
ИЗТОЧНИЦИ
http://www.ams.org/publicoutreach/feature-column/fc-2016-06
https://www.researchgate.net/publication/254286514_Abraham_Wald’s_Work_ on_Aircraft_Survivability
https://nauka.bg/bgnauka-matematika/
REFERENCES
Bill Casselman, The Legend of Abraham Wald, 2016, American Mathematical Society,
D. Kahneman, Thinking, Fast and Slow, Farrar, Straus and Giroux; 1st edition (April 2, 2013).
M. Mangel, F.J. Samaniego, Abraham Wald’s Work on Aircraft Survivability, 1984. Journal of The American Statistical Association – J AMER STATIST ASSN. 79. 259-267. 10.1080/01621459.1984.10478038.
N.N.Taleb, Fooled by Randomness: The Hidden Role of Chance in Life and in the Markets (Incerto), Random House Trade Paperbacks; Updated edition (August 23, 2005).
N.N. Taleb, Statistical consequences of fat tails, Real World Preasymptotics, Epistemology, and Applications (Technical Incerto), STEM Academic Press; Illustrated edition (June 30, 2020), ISBN-10: 1544508050.
L. Tomov et. al, Istoriya na matematikata, Balgarska nauka, November 2019, pp 183, ISSN: 1314-1031.