Delta 11/2025

Matematyczne sekrety systemu bonus-malus

Afiliacja: Wydział Matematyki Stosowanej, Politechnika Śląska

Wyobraźmy sobie, że każdy nasz manewr za kierownicą jest obserwowany przez niewidzialnego sędziego. Ten sędzia nie śpi, nie ocenia emocji, nie ma litości. Zapisuje każdy rok bezszkodowej jazdy jako zasługę i każdy wypadek jako przewinienie. Tym sędzią jest system bonus-malus – mechanizm, który decyduje, jak wysoko ubezpieczyciel wyceni związane z nami „ryzyko”. Początki wspomnianego systemu sięgają połowy XX wieku. Pierwsze rozwiązania pojawiły się we Francji i w Niemczech, a wkrótce system zyskał popularność w innych krajach. Jego celem było nagradzanie kierowców za bezszkodową jazdę (bonus) i karanie za szkody (malus). W Polsce system pojawił się w latach 90. Firmy zaczęły wprowadzać zniżki za lata bez szkód i zwyżki za wypadki, motywując kierowców do bezpiecznej jazdy. Dziś dzięki technologii mechanizm ewoluuje, co nie zmienia faktu, że jego tajemnice są bezapelacyjnie oparte na matematycznej formalizacji łańcuchów Markowa.

Podstawowe założenia systemu są całkowicie zgodne ze zdrowym rozsądkiem – ten, kto generuje większe koszty dla ubezpieczalni, powinien płacić więcej. Nietrudno jednak skonstruować zachowujący pozory matematycznej poprawności argument przeciwko stosowaniu takiego rozwiązania. Kierowca, który doprowadził w danym roku do wypadku, mógłby zwrócić uwagę, że fakt ten nie czyni go bardziej podatnym na wypadek w przyszłych latach, czemu więc miałby płacić za ubezpieczenie więcej niż w przeszłości? To trochę jak z rzucaniem monetą – jeśli rzuciłem trzy razy i za każdym razem wypadł orzeł, to – jeśli tylko moneta jest uczciwa – szansa na wypadnięcie orła w kolejnym rzucie wynosi niezmiennie 50%. No właśnie – jeśli tylko moneta jest uczciwa! A co, jeśli nie możemy tego przyjąć za pewnik?

image

W kontekście ubezpieczeń dobrą ilustracją będzie tu następujące zadanie, którego warianty często pojawiają się w szkole na lekcjach z rachunku prawdopodobieństwa. W dużej firmie transportowej zatrudniającej kierowców ciężarówek postanowiono wprowadzić system motywacyjny oparty na bezszkodowej jeździe. Firma uznała, że jej pracownicy dzielą się na dwie kategorie – kierowcy o niskim (30%) ryzyku spowodowania szkody w danym roku oraz kierowcy o ryzyku wysokim, równym 40%. Zakłada się ponadto, że w ogólnej populacji kierowców ciężarówek ostrożniejsi stanowią 80%. Poznajemy kierowcę Andrzeja, który w tym roku miał drobną stłuczkę na parkingu – w jaki sposób informacja ta wpływa na oszacowanie prawdopodobieństwa, że mimo to jest on ostrożnym kierowcą? Oczywiście odpowiednim narzędziem jest w tej sytuacji wzór Bayesa, zgodnie z którym szukane prawdopodobieństwo warunkowe to: \[\mathbb P(\textrm{ostrożny}|\textrm{wypadek}) =\] \[\frac{\mathbb P(\textrm{wypadek}|\textrm{ostrożny})\mathbb P(\textrm{ostrożny})}{ \mathbb P(\textrm{wypadek}|\textrm{ostrożny})\mathbb P(\textrm{ostrożny})\!+\! \mathbb P(\textrm{wypadek}|\textrm{ryzykant})\mathbb P(\textrm{ryzykant}) }\] \[= \frac{30\%\cdot 80\%}{30\%\cdot 80\%+40\%\cdot 20\%}=75\%.\] Analogiczny rachunek dla kierowcy Piotra, który w poprzednim roku nie miał żadnego wypadku, pozwala stwierdzić, że warunkowe prawdopodobieństwo jego przynależności do grupy kierowców ostrożnych to około 82%. Zatem nie ma sprzeczności w tym, że choć zakładamy, że Piotr ma rokrocznie to samo prawdopodobieństwo spowodowania wypadku, to fakt, iż nie miał go w tym roku, zwiększa nasze oszacowanie owego prawdopodobieństwa.

Powyższy przykład dawał jedynie matematyczną motywację dla wprowadzenia systemu bonusmalus. Jego dokładniejsza analiza ilościowa opiera się na łańcuchach Markowa. Chodzi tu o rodzinę zmiennych losowych, uporządkowaną w czasie, w której tylko bezpośrednia przeszłość ma wpływ na przyszłe zmienne. Mówiąc precyzyjnie, dyskretny łańcuch Markowa (o skończonej przestrzeni stanów \(\Omega=\{0,1,2,\dots,K\}\)) to ciąg zmiennych losowych \(X_n\) o wartościach w \(\Omega,\) spełniający \[\mathbb P(X_{n+1}=i_{n+1}|X_n=i_n,\dots,X_0=i_0)= \mathbb P(X_{n+1}=i_{n+1}|X_n=i_n){}\] dla wszystkich \(n=0,1,\dots\) oraz \(i_0,\dots,i_{n+1}\in \Omega.\) Jeśli prawa strona powyższej równości nie zależy od \(n\) (dla ustalonych wartości \(i_{n}\)\(i_{n+1}\)), mówimy, że łańcuch Markowa jest jednorodny. Jego dynamikę można wówczas opisać za pomocą liczb: \[p_{i,j}=\mathbb P(X_{n+1}=j|X_n=i), i,j\in \Omega,\] które razem tworzą tzw. macierz przejścia. Rozważmy teraz system bonus-malus, w którym kierowca danego pojazdu płaci składkę \(S_1,\) jeżeli zgłosił szkodę w ciągu ostatnich dwóch lat, w przeciwnym razie płaci niższą składkę \(S_2.\) Istotne są zatem dla nas trzy stany: pierwszy – szkoda wystąpiła w ostatnim roku, drugi – szkoda wystąpiła tylko w przedostatnim roku, oraz trzeci – brak szkód w przeciągu dwóch lat. Jeśli założymy, że dany kierowca ma w każdym roku prawdopodobieństwo spowodowania szkody równe \(p,\) to odpowiednia macierz przejścia będzie wyglądać następująco: \[\mathbf{P}=\begin{bmatrix} p & 1-p & 0, \\ p & 0 & 1-p, \\ p & 0 & 1-p. \end{bmatrix}\] Klasycznym pytaniem dotyczącym łańcuchów Markowa jest określenie ich rozkładu stacjonarnego. Jest to graniczna częstotliwość przebywania w poszczególnych stanach w odległym horyzoncie czasowym. Mając daną macierz przejścia \(\mathbf{A}=[a_{ij}]_{i,j\leq K},\) rozkład stacjonarny \(\pi=(\pi_1,\ldots,\pi_K)\) można wyznaczyć z układu równań: \[\sum_{i=1}^n a_{ij}\pi_i = \pi_j\ \ \ \textrm{dla $j=1,2,\ldots,K,$}\] z dodanym warunkiem \(\pi_1+\ldots+\pi_K = 1.\) W przypadku wyżej określonej macierzy \(\mathbf{P}\) równania przybierają postać: \[\begin{cases} p(\pi_1+\pi_2+\pi_3)=\pi_1 \\ (1-p)\pi_1=\pi_2 \\ (1-p)(\pi_2+\pi_3)=\pi_3 \end{cases}.\] Biorąc pod uwagę \(\pi_1+\pi_2+\pi_3=1,\) dostajemy z pierwszego równania \(\pi_1=p,\) zatem z drugiego \(\pi_2= p(1-p)\) i z ostatniego \(\pi_3=(1-p)^2.\)

O łańcuchach Markowa można było przeczytać na przykład w \(\Delta^{3}_{07}\) czy \(\Delta^{9}_{13}\).

O rozkładach stacjonarnych można było przeczytać w Delcie, na przykład \(\Delta^{12}_{13}\), \(\Delta^{11}_{19}\).

Zauważmy, że ten konkretny łańcuch od samego początku znajduje się w rozkładzie stacjonarnym: szanse na bycie w poszczególnych stanach po pierwszych dwóch (a także dowolnych \(N\)) latach ubezpieczenia to właśnie odpowiednio \(p,\) \(p(1-p)\) oraz \((1-p)^2.\) W tym przypadku nasza analiza mogłaby zatem być prostsza, jednak wprowadzony język łańcuchów Markowa staje się nieodzowny w bardziej skomplikowanych systemach bonus-malus.

Zastosujemy teraz wyżej wprowadzone pojęcia do rozwiązania następującego zadania optymalizacyjnego. W ramach wprowadzenia zauważmy, że niewątpliwą korzyścią dla firm ubezpieczeniowych ze stosowania systemu bonus-malus jest zniechęcanie ubezpieczonych do zgłaszania szkód. Spójrzmy teraz na tę kwestię od strony ubezpieczonego, który postanowił zgłaszać tylko te szkody, które przekroczyły pewien próg \(w.\) Dąży przy tym do takiego wyboru parametru \(w,\) aby zminimalizować oczekiwaną wartość łącznych kosztów – sumy składki i kosztu własnego. Musimy jeszcze założyć coś o (losowej) wysokości szkody. Dla uproszczenia obliczeń przyjmijmy, że jej wartość \(X\) ma rozkład jednostajny na przedziale \([0,M],\) co oznacza, że szansa na to, że pojedyncza szkoda przekroczy wartość \(v\) z przedziału \([0,M],\) to \(1-v/M.\) Ponieważ ubezpieczony nie planuje zmieniać ubezpieczalni przez dłuższy czas, postanowił dokonać optymalizacji przy założeniu, że związany z jego historią szkodowości łańcuch Markowa osiągnął rozkład stacjonarny.

Zauważmy, że strategia ubezpieczonego sprawia, że we wcześniej przedstawionej macierzy przejścia \(\mathbf{P}\) zamiast \(p\) pojawia się prawdopodobieństwo jednoczesnego wystąpienia i zgłoszenia szkody, czyli \(p(1-w/M).\) Dla uproszczenia napisów przyjmujemy dalej \(w'=w/M.\)

Zgodnie z wcześniejszymi rozważaniami rozkład stacjonarny jest zatem równy: \[\begin{cases} \pi_1=p(1-w'), \\ \pi_2=p(1-w')\big(1-p(1-w')\big), \\ \pi_3=\big(1-p(1-w')\big)^2. \end{cases}\] Całkowity oczekiwany koszt składa się z wartości oczekiwanej składki: \[\pi_1 S_1+\pi_2 S_1 + \pi_3 S_2 = S_1 - (S_1-S_2)\big(1-p(1-w')\big)^2,\] oraz wartości oczekiwanej kosztu pokrywania szkód z własnej kieszeni. Szansa na wystąpienie szkody to \(p,\) szansa na to, że jest ona mniejsza od \(w,\) to \(w/M,\) a jeśli już wystąpiła i jest mniejsza od \(w,\) to jej wartość oczekiwana (przy założeniu rozkładu jednostajnego) to \(w/2.\) Dlatego szukana wartość oczekiwana to \(pw^2/(2M) .\) Ostatecznie ubezpieczony chce zminimalizować względem \(w\in [0,M]\) wielkość \[S_1 - (S_1-S_2)\big(1-p(1-w/M)\big)^2 + pw^2/(2M).\] Jest to trójmian kwadratowy względem \(w,\) którego wartość minimalna jest osiągana dla \[w^* = \frac{2(S_1-S_2)(1-p)pM}{pM-2(S_1-S_2)p^2}.\] O ile tylko wartość ta leży w przedziale \([0,M],\) jest ona szukanym, optymalnym progiem. Wstawiając dla przykładu konkretne wartości \(p=0{,}1,\) \(S_1 = 1100,\) \(S_2=900\) oraz \(M=20\,000\) otrzymamy \(w^*\approx 360{,}72.\)

Warto podkreślić, że łańcuchy Markowa znajdują szerokie i praktyczne zastosowanie w wielu dziedzinach, takich jak teoria kolejek, analiza systemów ubezpieczeniowych, ekonomia czy biologia. Przykładem może być modelowanie ewolucji populacji, gdzie przejścia między różnymi stanami (np. liczebnością gatunków) w zależności od czynników takich, jak mutacje, selekcja naturalna czy migracje. Łańcuchy Markowa wykorzystywane są także w analizie procesów transkrypcji genów czy w badaniach nad rozprzestrzenianiem się mutacji genetycznych w populacjach, co jest kluczowe w genetyce i genomice. Stanowią nieocenione narzędzie w modelowaniu zjawisk stochastycznych.