Delta 1/2024

Czy Newton wiedział? Statystyczna tajemnica skrzyni Pyx

Afiliacja: Instytut Podstaw Informatyki PAN, Wydział Matematyki i Nauk Informacyjnych, Politechnika Warszawska

Pyxem (the Pyx) nazwano w średniowiecznej Anglii skrzynię, do której odkładano egzemplarze monet wytłoczonych przez londyńską Mennicę (The Mint) w celu późniejszej ich inspekcji (Trial of the Pyx). Nazwa wywodzi się od greckiego słowa pyxus, oznaczającego właśnie skrzynię. Pierwsza publiczna inspekcja skrzyni odbyła się w 1248 roku, a z 1279 roku pochodzi zachowany edykt Edwarda I opisujący całą procedurę. Do połowy XIX wieku Mennica była instytucją niezależną od Korony i funkcjonowała na podstawie kontraktu z monarchą (Mint Indenture). Kontrakt specyfikował zobowiązania Mennicy i wynagrodzenie jej pracowników za bicie monet. Przewidywał on tłoczenie monet o określonej jakości i wadze z kruszcu dostarczanego przez króla. Co ciekawe i ważne dla tej historii, prawo dostarczania złota w celu bicia monet przysługiwało, za opłatą, kupcom będącym importerami złota lub złotych monet (np. francuskich luidorów czy niderlandzkich guldenów). W celu weryfikacji jakości monet codziennie jeden losowo wybrany z produkcji egzemplarz trafiał do Pyxa. Zbiorcza inspekcja monet zgromadzonych w skrzyni była przeprowadzana w nieregularnych odstępach czasowych, co 2–4 lata, a często dopiero wtedy, gdy skrzynia była pełna. Sama inspekcja była dokonywana przez reprezentantów niezależnej od króla gildii złotników, w obecności monarchy lub jego przedstawiciela. Jeśli zakończyła się pomyślnie, całą kontrolę wieńczyła, przypuszczalnie daleka od wegetariańskiej, uczta.

Sam proces bicia (tłoczenia) monet był skomplikowany technologicznie i wymagał od tłoczących dużej umiejętności i wprawy. Jak pisze John Craig [1], niewielu z nich było tak zręcznych, żeby zachować wszystkie swoje palce w nieskończoność.

Sprawdzanie jakości monet. Proces kontroli jakości monet obejmował kontrolę próby złota (procentowej zawartości kruszcu w monecie) oraz kontrolę ich wagi. Kontrola wagi polegała na sprawdzeniu, czy łączna waga monet w skrzyni mieści się w dopuszczalnych granicach dla takiej ich liczby. Jakie były te dopuszczalne granice? Omówimy to na przykładzie złotych gwinei, które były emitowane od XVII wieku do początku XIX. Na potrzeby tego artykułu określmy tolerancję jako maksymalną dopuszczalną odchyłkę (w górę lub w dół) od nominalnej wagi. Nominalna waga jednej gwinei wynosiła 129 ziaren (grains). Dopuszczalna tolerancja na złotych gwineach o łącznej nominalnej wadze 1 funta (chodzi tu o tzw. funt jubilerski, troy pound) wynosiła 40 ziaren, to znaczy ich faktyczna waga nie mogła być większa od 5800 ziaren i mniejsza od 5720 ziaren . Tolerancja zwiększała się liniowo w zależności od łącznej nominalnej wagi monet w skrzyni, tak więc jeśli w skrzyni były monety o nominalnej wadze 87 funtów , to tolerancja dla tej wagi wynosiła \(87\times 40 = 3480\) ziaren.

1 funt jubilerski = 5760 ziaren = 373,24172 grama.

1 ziarno = 0,06479891 grama.

W 1848 roku tolerancję zmniejszono do 12 ziaren na funcie.

Z jednego funta 22-karatowego złota (zawierającego 91,67 procent czystego złota) bito 44,5 gwinei.

W początkowym okresie kontroli skrzyni Pyx wynik pozytywny nie oznaczał bynajmniej końca całego procesu. Mianowicie, w przypadku pozytywnego wyniku kontroli, ale wskazującego na to, że średni ciężar monety był poniżej ustalonej wagi, różnica w wadze dla całości produkcji mennicy od poprzedniej kontroli musiała być zwrócona do skarbca królewskiego. Później tej praktyki zaniechano (być może dlatego, żeby posada kierującego Mennicą była jeszcze bardziej intratna). Jak się dalej okaże, była to dla Korony bardzo zła decyzja. Aby dokładnie uzasadnić, dlaczego, przydadzą nam się pewne podstawowe pojęcia i fakty z rachunku prawdopodobieństwa. Czytelnicy, którzy są zaznajomieni z tą dziedziną – lub nie są szczególnie zainteresowani częścią techniczną – mogą śmiało kontynuować lekturę za wzorem \(\eqref{crucial}\).

image

Jak powinna zmieniać się tolerancja? Przypomnijmy kluczową dla odpowiedzi na to pytanie koncepcję statystycznej niezależności. Mówimy, że dwa zdarzenia losowe \(A\)\(B\) mające niezerowe prawdopodobieństwa wystąpienia są niezależne, jeśli zaobserwowanie jednego z tych zdarzeń nie zmienia oceny prawdopodobieństwa zajścia drugiego. W terminach prawdopodobieństwa warunkowego \(\mathbb{P}(A|B):= \mathbb{P}(A\cap B)/\mathbb{P}(B)\) wyraża się to jako \[\mathbb{P}(A|B) =\mathbb{P}(A).\] Po przemnożeniu obu stron drugiej równości przez \(\mathbb{P}(B)>0\) jest to równoważne równości \(\mathbb{P}(A\cap B)= \mathbb{P}(A)\cdot \mathbb{P}(B).\) Ciąg zdarzeń losowych składa się ze zdarzeń parami niezależnych, jeśli dowolne dwa zdarzenia w tym ciągu są niezależne.

Pojęcie niezależności parami jest nieco słabsze od własności, że wszystkie te zdarzenia są niezależne.

Dla zmiennych losowych \(X\)\(Y\) ich niezależność oznacza, że zdarzenia polegające na przyjęciu wartości z dowolnie określonych zbiorów są niezależne, to znaczy \(\mathbb{P}(X\in C, Y\in D)\) \(= \mathbb{P}(X\in C)\cdot \mathbb{P}(Y\in D).\) Można się teraz domyślić, jak zdefiniujemy niezależność parami ciągu zmiennych losowych \(X_1,\ldots, X_n\): oznacza to po prostu, że dowolne dwie zmienne losowe w tym ciągu są niezależne.

Przypomnijmy teraz dwie podstawowe charakterystyki zmiennych losowych. Pierwsza z nich to wartość oczekiwana: dla zmiennych, które mogą przyjąć skończenie wiele wartości \(a_1,\ldots,a_N,\) jest to suma tych wartości przemnożonych przez prawdopodobieństwo ich uzyskania, tzn. \[\mathbb{E}X = \sum_{i=1}^N \mathbb{P}(X=a_i) \cdot a_i.\] Zgodnie z prawem wielkich liczb średnia wartość ciągu niezależnych zmiennych losowych o tym samym rozkładzie prawdopodobieństwa zbiega do wartości oczekiwanej pojedynczej zmiennej – temu wartość oczekiwana zawdzięcza swoją nazwę.

Druga z istotnych dla nas wielkości to wariancja, czyli wartość oczekiwana kwadratu odstępstwa od wartości oczekiwanej: \[\operatorname{Var}X= \mathbb{E}\big(X-\mathbb{E}X\big)^2.\]

Zgodnie z nierównością Markowa dla zmiennej losowej \(X\) przyjmującej wartości nieujemne i dowolnej dodatniej liczby rzeczywistej \(a\) zachodzi \({\mathbb{P}(X>a)\leq \frac{\mathbb{E}X}{ a}}\) (krótki dowód poniżej).

\( a\mathbb{P}(X>a)=\sum_{i\colon a_i>a} a\cdot \mathbb{P}(X=a_i)\) \(< \sum_{i\colon a_i>a} a_i\cdot \mathbb{P}(X=a_i)\leq \mathbb{E}X\)

Podstawiając pod \(X\) zmienną \((X-\mathbb{E}X)^2,\) dostajemy nierówność Czebyszewa: \(\mathbb{P}\big((X-\mathbb{E}X)^2>a\big)\leq \frac{\operatorname{Var}X}{a},\) którą możemy przepisać (podstawiając \(\sigma_X = \sqrt{\operatorname{Var}X}\)\(c=\sqrt{a}/\sigma_X\)) w postaci: \[\mathbb{P}\big(|X-\mathbb{E}X|>c \cdot \sigma_X\big) < \frac{1}{c^2}.\] To oszacowanie jest bardzo zgrubne, stanowi jednak proste uzasadnienie tego, że \(\sigma_X\) (nazywane odchyleniem standardowym) jest dobrą ,,jednostką” tolerancji – widzimy, że prawdopodobieństwo odstępstwa zmiennej od jej wartości oczekiwanej o wielokrotność \(\sigma_X\) maleje co najmniej tak, jak kwadrat współczynnika wielokrotności.

Przyjrzyjmy się teraz, co można powiedzieć o wariancji sumy zmiennych losowych. Zauważmy, że jeśli \(X\)\(Y\) są niezależne i przyjmują odpowiednio wartości \(a_i\) (\(i\leq N\)) oraz \(b_j\) (\(j\leq M\)), to \[\begin{aligned} \mathbb{E}XY &= \sum_{i,j}\mathbb{P}(X=a_i, Y=b_j)a_ib_j =\\&= \sum_{i,j}\mathbb{P}(X=a_i)\mathbb{P}(Y=b_j)a_ib_j= \\ &= \sum_i~\mathbb{P}(X=a_i)a_i\cdot \sum_j \mathbb{P}(Y=b_j)b_j= \mathbb{E}X\cdot \mathbb{E}Y . \end{aligned}\] Z powyższej własności wynika ważna własność wartości oczekiwanej iloczynu scentrowanych (czyli pomniejszonych o ich wartość oczekiwaną) zmiennych losowych \(X-\mathbb{E}X\)\(Y-\mathbb{E}Y.\) Scentrowanie sprawia, że zmienna, jaką w rezultacie otrzymamy, ma zerową wartość oczekiwaną. Ponadto (łatwy dowód pozostawiamy do samodzielnego przeprowadzenia ) niezależność zmiennych losowych pociąga za sobą niezależność ich scentrowanych wersji. Stosując teraz ostatnią równość do zmiennych scentrowanych \(X-\mathbb{E}X\)\(Y-\mathbb{E}Y,\) dostaniemy: \[\begin{aligned} \label{cov0} \mathbb{E}[(X-\mathbb{E}X)(Y-\mathbb{E}Y)]&=\mathbb{E}(X-\mathbb{E}X) \cdot \mathbb{E}(Y-\mathbb{E}Y)=\\&=0\cdot 0=0. \end{aligned}\] Ostatecznie dla niezależnych zmiennych losowych \(X,Y\) \[\begin{gathered} \operatorname{Var}(X+Y) =\mathbb{E}\big((X-\mathbb{E}X)+(Y-\mathbb{E}Y)\big)^2=\\ \begin{aligned} &=\mathbb{E}(X-\mathbb{E}X)^2+\mathbb{E}(Y-\mathbb{E}Y)^2+2\mathbb{E}(X-\mathbb{E}X)(Y-\mathbb{E}Y)=\\&=\operatorname{Var}X+\operatorname{Var}Y \end{aligned}\ \ \end{gathered}\] (niejawnie skorzystaliśmy z prostego, acz wielce pożytecznego faktu, że wartość oczekiwana sumy zmiennych losowych to suma wartości oczekiwanych tych zmiennych). Podobnie możemy uzasadnić analogiczną równość dla sumy większej liczby niezależnych składników.

W naszej historii zmienna \(X_i\) oznaczać będzie wagę (z dokładnością do jednego ziarna) \(i\)-tej monety w skrzyni Pyx. Rozsądnym założeniem jest przyjęcie, że waga \(i\)-tej monety nie zależy od wagi żadnej innej monety w skrzyni, czyli że wagi monet są parami niezależne.

Obliczmy teraz wariancję łącznej wagi monet w Pyxie. Niech \(S_n=\sum_{i=1}^n X_i\) będzie łączną wagą monet w skrzyni. Jak wcześniej pokazaliśmy, \[\begin{aligned} \operatorname{Var}S_n=\sum_{i=1}^n {\rm Var}(X_i). \end{aligned}\] Niech \(\sigma^2_n=\operatorname{Var}S_n.\) Jeśli przyjmiemy założenie, że rozkłady wag monet się nie różnią, to z ostatniej równości wynika, że \[\label{crucial} \sigma_n^2 =n \sigma_1^2,\ \textrm{czyli}\ \sigma_n=\sqrt{n}\sigma_1. \tag{$\star$}\] Uzasadniliśmy zatem istotną dla naszych rozważań własność: jeśli za miarę zmienności zmiennej losowej przyjmiemy jej odchylenie standardowe, to odchylenie standardowe sumy \(n\) parami niezależnych zmiennych losowych o tym samym rozkładzie jest równe odchyleniu standardowemu pojedynczej zmiennej przemnożonemu przez pierwiastek z liczby zmiennych.

Czytelnicy bardziej obyci z rachunkiem prawdopodobieństwa doskonale zdają sobie sprawę z tego, że w kontekście sumy niezależnych zmiennych losowych o tym samym rozkładzie odchylenie standardowe staje się idealną miarą tolerancji w tym sensie, że na mocy Centralnego Twierdzenia Granicznego \[\lim_{n\to\infty} \mathbb{P}(|S_n-\mathbb{E}S_n|>c\cdot \sigma_n) = 2\big(1-\Phi(c)\big),\] gdzie \(\Phi\) jest dystrybuantą rozkładu normalnego. Zachodzi ponadto: \[1-\Phi(c) \leq \frac{1}{c\sqrt{2\pi}}e^{-\frac{c^2}{2}},\] co pokazuje, jak bardzo zgrubne jest w tej sytuacji wcześniejsze oszacowanie wykorzystujące nierówność Czebyszewa.

Co z tego wynika?

Konsekwencje naszych rozważań dla tolerancji obowiązujących Mennicę trudno przeoczyć. Granice tolerancji w procedurze kontroli Pyxa były ustawiane za bardzo liberalnie, co powodowało w szczególności, że konsekwentnie wybijając monety o tej samej, mniejszej niż nominalna wadze, można było i tak zmieścić się w granicach tolerancji; przejść przez inspekcję i zachować posadę. Dla przykładu załóżmy, że dopuszczalna tolerancja na wadze jednej hipotetycznej monety wynosi 1 ziarno. Wtedy na partii 100 monet dopuszczalna tolerancja (zgodnie z wytycznymi kontroli Pyx) wynosi 100 ziaren. Jednak zgodnie z naszymi ustaleniami ta tolerancja powinna być rzędu \(\sqrt{100}=10\) ziaren! Zmniejszając wagę pojedynczej monety o 9/10 ziarna, mieścimy się ciągle w granicach tolerancji, gdyż strata na wadze wynosiła \({(9/10)\times 100 = 90}\) ziaren, co nawet po dodaniu \({\sqrt{100} = 10}\) ziaren, czyli ,,właściwej” tolerancji, nie przekracza zadanego pułapu 100 ziaren.

Dlaczego ustalenie zbyt liberalnych granic tolerancji było groźne? Jeśli monety były zbyt lekkie i wchodziły do obiegu, to po pierwsze, korzystała na tym Mennica (przypomnijmy: Mennica była niezależna od Korony), a po drugie obniżało to zaufanie do pieniądza – gwinea powinna być tyle warta, ile kruszec, z którego została wybita. Jeśli monety były zbyt ciężkie, co było wychwytywane przez złotników, to traciła na tym Korona, a zyskiwali złotnicy. Monety były pozbawiane nadmiarowej części kruszcu przez spiłowanie, następnie po przetopieniu wracały do Mennicy do ponownego wybicia z nich monet. O tym, że proceder ten był dosyć powszechny, świadczy fakt, że zbyt ciężkie monety poddane temu procesowi doczekały się swojej własnej nazwy: ,,powracające gwinee” ( come-again-guineas). Jeśli zestawimy to z faktem, że inspekcja skrzyni dotycząca wagi tylko dwukrotnie (i to w obu przypadkach przed 1550 r.) zakończyła się werdyktem negatywnym, możemy wnioskować, że monety w obiegu ,,nie trzymające wagi” mogły być zjawiskiem powszechnym, w każdym razie do momentu, gdy kierowanie Mennicą objął Izaak Newton. Jednakże umyślne zaniżanie wagi złotych monet przez trzymanie się dolnej granicy tolerancji wytykano w parlamencie brytyjskim – co może nie jest zaskakujące – Francuzom…

Izaak Newton jako kierujący Mennicą. Newton był związany z Mennicą przez ponad 30 lat, najpierw piastując funkcję nadzorcy (Warden), a później, od roku 1699 aż do śmierci w roku 1727, kierującego Mennicą (Master of the Mint). W odróżnieniu od wielu swoich poprzedników, którzy traktowali to stanowisko wyłącznie jako źródło dodatkowych dochodów, Newton bardzo zaangażował się w działalność Mennicy i doprowadził do znacznego poprawienia efektywności procesu tłoczenia monet. W rezultacie zjawisko przetapiania zbyt ciężkich monet i powtórnego ich bicia z uzyskanego kruszcu zostało bardzo ograniczone. Nas interesuje jednak pytanie, czy Newton zdawał sobie sprawę, że tolerancja wagi monet sprawdzana podczas kontroli Pyxa i wynosząca za jego czasów 40 ziaren na funt jest zbyt liberalna?

W kontrakcie Newton miał również wpisane ściganie i wszczynanie postępowań wobec fałszerzy monet. Tego obowiązku Newton bardzo nie lubił i prosił króla o zwolnienie go z niego.

Mimo ogromnej dbałości o jakość bitych monet Newton nie uniknął oskarżenia o zaniżanie próby złota. Stało się to podczas kontroli Pyxa w 1710 roku. Newton przekonująco argumentował, że powodem tego była zbyt wysoka zawartość złota w referencyjnym stopie (trial plate), która wynosiła 91,71 procenta zamiast wymaganych 91,66 procenta.

Dwa fakty są interesujące w tym kontekście. Fakt pierwszy: Newton, choć sam zbytnio nie interesował się losowością, znał dobrze Abrahama de Moivre’a, jednego z ,,ojców” rachunku prawdopodobieństwa, i mógł z nim rozmawiać o tej kwestii. Wynik Jakuba Bernoulliego, opublikowany w jego Ars Conjectandi, mówiący o tym, jak prawdopodobne jest odchylenie frakcji orłów od 1/2 w wielokrotnym rzucie monetą, podane w terminach odchylenia standardowego dla frakcji, był de Moivre’owi, jeśli nie Newtonowi, doskonale znany. Drugi fakt to informacja, że w chwili śmierci Newton był bogatym człowiekiem, choć nie zaliczał się do takich przed zostaniem kierującym Mennicą, co nasuwa pytanie, czy wzbogacenie Newtona nie było związane z wykorzystaniem jego wiedzy o zbyt liberalnej tolerancji dla wagi monet. Należy tu jednocześnie podkreślić, że jako kierujący Mennicą pobierał sowite wynagrodzenie.

Historycy statystyki są zgodni co do twierdzącej odpowiedzi na postawione pytanie: Newton musiał sobie zdawać sprawę, że tolerancje wyznaczone w inspekcji Pyxa nie wymuszają pożądanej wagi pojedynczej monety i dlatego przedsięwziął działania mające na celu ulepszenie procesu bicia monet. Niestety, nie ma jednak żadnych konkretnych dowodów na to, że Newton wiedział, że zmienność sumy skaluje się proporcjonalnie do pierwiastka z liczby składników. Pośrednim argumentem w tych rozważaniach, który przytaczamy za S. Stiglerem [2], może być jedynie przeprowadzona przez Newtona analiza średniej długości trwania rządów monarchów poczyniona na podstawie analizy 12 dynastii, od czasów Judei do współczesnej mu Francji. Doprowadziła ona do konkluzji, że przeciętna długość rządów wynosiła od 18 do 20 lat [3]. Co ciekawe, Newton podaje przedziałową ocenę długości rządów, a nie średnią wyliczoną z danych (wynosząca 19,1 roku). Co więcej, wynosząca jeden rok odchyłka od średniej i prowadząca w przybliżeniu do uzyskanego przez Newtona przedziału zgadza się niemal dokładnie z odchyleniem standardowym policzonym z danych, podzielonym przez pierwiastek z liczby obserwacji. Niestety samego wyliczenia prowadzącego do wartości odchyłki Newton nie podaje.

Jeśli Newton wiedział, to dlaczego nie starał się zmienić kryteriów kontroli skrzyni Pyx? Powód jest oczywisty – nie było to w jego interesie. Przypuszczalnie nie było to również w interesie króla, któremu zależało na podtrzymaniu zaufania do znajdujących się w obiegu monet.

Jeszcze o tolerancji

Istotną kwestią jest również to, jak ustalono tolerancję dla partii o ciężarze 1 funta. W 1850 roku na polecenie Izby Gmin zważono 10 tysięcy złotych suwerenów. Okazało się, że rozkład wagi tych monet był w przybliżeniu normalny, a dokładnie 454 z nich były nienormatywne, to znaczy za lekkie lub za ciężkie względem tolerancji dla 1 funta monet (w 1848 roku zmniejszonej do 12 ziaren na funt) po jej liniowej transformacji na dopuszczalny ciężar jednej monety. Tak więc frakcja nienormatywnych monet wynosiła \(454/10\,000\approx 0{,}05.\) Oznacza to, że tolerancja dla jednej monety była wyznaczona bardzo rozsądnie: odpowiadała małemu prawdopodobieństwu jej przekroczenia przez jedną, losowo wybraną, monetę. Natomiast problem pojawia się, gdy prawidłową tolerancję dla jednej monety liniowo przekształcimy na tolerancję dla partii monet o wadze jednego funta.

Złoty suweren to złota moneta o wartości jednego funta będąca w obiegu od 1817 roku.

Zamiast podsumowania

Wiedza, że tolerancja w inspekcji Pyxa jest zbyt liberalna, była przypuszczalnie dostępna zarówno większości kierujących Mennicą, jak i zlecających kontrolę monarchom. Paradoksalnie, mogło to być na rękę jednym i drugim. Kierującemu Mennicą pozwalała spać spokojnie – bez strachu, że zostanie odwołany i, być może, dawała możliwość uzyskiwania korzyści finansowych w wyniku bicia nieco lżejszej monety. Królowi, bo zapewniała bardzo potrzebne zaufanie społeczne do pieniądza. Być może, na co jednak nie ma żadnych dowodów, monarcha mógł wpływać na kierującego Mennicą, żeby bił nieco lżejszą monetę.

Na koniec warto dodać, że sam proces kontroli skrzyni Pyx jest jednym z pierwszych, jeśli nie pierwszym, w historii przykładem dokonywanej systematycznie statystycznej kontroli jakości.

Literatura

  • [1]   Craig J., Newton at the Mint, Cambridge, 1946.

  • [2]   Stigler S., Statistics on the table, Harvard University Press, 1999.

  • [3]   Newton I., Chronology of Ancient Kingdoms Amended, 1728.