Delta 7/2025

O znanych i lubianych nierównościach (w niecodziennych okolicznościach)

Afiliacja: Wydział Matematyki i Informatyki, Uniwersytet Jagielloński

,,Szok! Piosenkarz X zmienił fryzurę. Musisz to zobaczyć!”. ,,Mamy to! Aktorka Y sfotografowana bez makijażu. Wygląda niesamowicie!”. Tego typu tytuły coraz częściej spotykamy w Internecie. Okazuje się, że zwiększają one tak zwaną klikalność. Pokazują także nasze zainteresowanie zmianami, choćby i powierzchownymi. W tym tekście, idąc za modą, wprowadzimy pewną modyfikację do klasycznych nierówności matematycznych i przeanalizujemy, co z niej wynika.

Czytelnik obeznany z literaturą nierównościową z pewnością zauważył, że gros tychże wyników zaczyna się mniej więcej tak: Niech \(x_1,\ldots, x_n\) będą dodatnimi… Otóż wszelkie nierówności pomiędzy średnimi (oraz wiele, wiele innych) zachodzą wyłącznie dla liczb nieujemnych. No właśnie…

W tym tekście anonsowana modyfikacja będzie polegać na zamianie liczb dodatnich na pewną klasę macierzy – ograniczymy się tylko do macierzy wymiaru \(2\) na \(2.\) Ale jak porównać dwie macierze? – zapyta pewnie Czytelnik. Po kolei.

Macierzą nazywamy tabliczkę wypełnioną liczbami, np. \(\begin{pmatrix} 2 & 1 \\ -1 & 3 \end{pmatrix}.\)

Zacznijmy od podstawowych operacji i własności. Mając dwie macierze: \(A=\begin{psmallmatrix} a_{11}&a_{12}\\ a_{21}&a_{22} \end{psmallmatrix}\) oraz \(B=\begin{psmallmatrix} b_{11}&b_{12}\\ b_{21}&b_{22} \end{psmallmatrix},\) można je dodać (bądź odjąć) komórka po komórce, czyli symbolicznie: \[A~\pm B:=\begin{pmatrix} a_{11}\pm b_{11} & a_{12}\pm b_{12} \\ a_{21}\pm b_{21} & a_{22}\pm b_{22} \end{pmatrix}.\] Mnożenie jest nieco trudniejsze. Stosowny wzór wygląda następująco: \[A~\cdot B=\begin{pmatrix} a_{11}b_{11}+a_{12}b_{21} & a_{11}b_{12}+a_{12}b_{22} \\ a_{21}b_{11}+a_{22}b_{21} & a_{21}b_{12}+a_{22}b_{22} \end{pmatrix}.\] A nie lepiej wymnażać komórka po komórce? – zapyta Czytelnik. Otóż takie, a nie inne reguły gry narzuca nam dział matematyki o nazwie algebra liniowa.

Reguła dla mnożenia jest następująca: aby dostać element na pozycji \((i,j),\) mnożymy skalarnie \(i\)-ty wiersz \(A\) z \(j\)-tą kolumną \(B.\) Uwaga: mnożenie nie musi być przemienne:
\(\begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}\begin{pmatrix} 0 & 0 \\ 1 & 0 \end{pmatrix}=\begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix},\) ale \(\begin{pmatrix} 0 & 0 \\ 1 & 0 \end{pmatrix}\begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}=\begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix}.\)

W algebrze liniowej macierz \(A\) interpretujemy jako odwzorowanie liniowe z \(\mathbb R^2\) w \(\mathbb R^2,\) które przekształca wektor \((x, y)\) w wektor \((a_{11}x+a_{12}y, a_{21}x+a_{22}y).\) Wtedy zdefiniowane tutaj mnożenie macierzy odpowiada składaniu odpowiadających im odwzorowań.

Mamy już trzy z czterech podstawowych działań arytmetycznych. Co z dzieleniem? Tak samo jak w przypadku liczb, nie zawsze da się je wykonać. Warunkiem koniecznym i wystarczającym istnienia macierzy odwrotnej do macierzy \(A=\begin{psmallmatrix} a_{11}&a_{12}\\ a_{21}&a_{22} \end{psmallmatrix}\) jest, by wyznacznik macierzy \(A,\) dany wzorem \({\det A := a_{11}a_{22}-a_{12}a_{22}},\) był niezerowy. Wtedy \[A^{-1} = \frac{1}{\det A} \begin{pmatrix} a_{22} & -a_{12} \\ -a_{21} & a_{11} \end{pmatrix}\] (mnożenie macierzy przez liczbę wykonujemy, mnożąc każdą komórkę przez tę liczbę).

Jak łatwo zauważyć, \(AA^{-1}=A^{-1}A=\begin{psmallmatrix} 1&0\\ 0&1 \end{psmallmatrix} =: I.\) Macierz \(I\) odgrywa w naszym świecie rolę jedynki, pomnożenie przez nią (z każdej strony) nic nie zmienia.

Dla miłośników tekstów zawierających mądre słowa: oznacza to, że macierze \(2\) na \(2\) tworzą pierścień z jedynką.

No dobrze, ale póki co mamy samą algebrę. Gdzie tu nierówności? Aby przejść już do meritum, będziemy rozpatrywać wyłącznie macierze symetryczne, czyli takie \(A,\) dla których \(a_{12}=a_{21}.\)

W świecie macierzy jest tak jak i w naszym: kamery skierowane są tylko w kierunku nielicznego grona celebrytów…

Definicja: Mówimy, że symetryczna macierz \(A\) jest dodatnio określona (i piszemy \(A>0\)), jeżeli \(a_{11}+a_{22} > 0\) oraz \(\det A > 0.\)

Mówimy, że macierz jest nieujemnie określona (i piszemy \(A\geq 0\)), gdy w powyższej definicji nierówności ostre \(>\) zamienimy na nieostre \(\geq.\) Ogólniej mamy \(A>B,\) gdy \(A-B>0,\) oraz \(A\geq B,\) gdy \(A-B\geq 0.\)

Inny (równoważny) sposób zdefiniowania nierówności \(A>0\) wykorzystuje tzw. formy kwadratowe: \(A\geq 0\) wtedy i tylko wtedy, gdy forma kwadratowa związana z \(A,\) czyli przekształcenie \(\mathbb R^2 \to\mathbb R\) dane wzorem \[\mathbb R^2 \ni (x_1,x_2) \longmapsto a_{11} x_1 x_1 + a_{12} x_1 x_2 + a_{21} x_2 x_1 + a_{22} x_2 x_2 =: Q_A(x_1,x_2) \in \mathbb R{}\]

Korzystając z symetrii \(A,\) wzór na \(Q_A(x,y)\) można zapisać oszczędniej jako \(a_{11} x_1^2 + 2 a_{12} x_1 x_2 + a_{22} x_2^2,\) ale wzór przywołany w tekście czytelniej wskazuje na związek z formą dwuliniową: \(a_{11} x_1 y_1 + a_{12} x_1 y_2 + a_{21} x_2 y_1 + a_{22} x_2 y_2.\)

spełnia dla każdego \((x_1,x_2) \in \mathbb R^2\) nierówność \(Q_A(x_1,x_2) \ge 0.\) Jeżeli ponadto równość zachodzi tylko dla \((x_1,x_2) = (0,0),\) to \(A>0.\) Łatwo stąd wywnioskować, że suma dodatnio określonych macierzy jest dodatnia.

Jak Czytelnik zapewne zauważył, dodatnia określoność jest niezwykle podobna do własności iloczynu skalarnego. Można więc powiedzieć, że \(A>0,\) o ile \(A\) zadaje uogólniony iloczyn skalarny na \(\mathbb R^2.\) Sprawdzenie równoważności definicji \(A>0\) pozostawiamy Czytelnikowi.

W praktyce przydatny jest następujący standardowy zestaw faktów z algebry liniowej, który Czytelnik Zaciekawiony może potraktować jako ambitne zadanie:

Zestaw faktów

1. Dla dowolnej macierzy symetrycznej \(A\) wymiaru \(2\) na \(2\) istnieje kąt \(\alpha\in[0,2\pi)\) oraz takie liczby \(A_1,\) \(A_2,\) że \(A\) ma przedstawienie \[A= \begin{pmatrix} \cos\alpha & -\sin\alpha \\ \sin\alpha & \cos\alpha \end{pmatrix} \begin{pmatrix} A_1 & 0 \\ 0 & A_2 \end{pmatrix} \begin{pmatrix} \cos\alpha & \sin\alpha \\ -\sin\alpha & \cos\alpha \end{pmatrix}.\] Ta groźnie wyglądająca formułka mówi nam, że \(A\) jest diagonalna z dokładnością do obrotu.

2. Zachodzi \(A>0\) wtedy i tylko wtedy, gdy we wzorze powyżej \(A_1,A_2 > 0.\) Podobnie \(A\geq 0\) wtedy i tylko wtedy, gdy \(A_1,A_2 \geq 0.\)

3. Dla dowolnego wielomianu \(p(x)\) zachodzi \[p(A)= \begin{pmatrix} \cos\alpha & -\sin\alpha \\ \sin\alpha & \cos\alpha\end{pmatrix}\begin{pmatrix} p(A_1) & 0 \\ 0 & p(A_2) \end{pmatrix} \begin{pmatrix} \cos\alpha & \sin\alpha \\ -\sin\alpha & \cos\alpha \end{pmatrix},\] przy czym wartość \(p(A)\) definiujemy, wstawiając macierz \(A\) w miejsce zmiennej \(x\) i zwyczajne mnożenie zamieniając na mnożenie macierzy. Uff, dość już definicji! Przejdźmy do czegoś konkretnego. Zastanówmy się, wzorując się na liczbach, czy dla dowolnej macierzy symetrycznej \(2\) na \(2\) zachodzi \(A^2\geq 0.\) Można to sprawdzić z definicji (Czytelnik zechce potraktować to jako kolejne ćwiczenie) lub skorzystać z podanych faktów. Mianowicie, biorąc rozkład \(A\) podany powyżej, otrzymujemy \[A^2= \begin{pmatrix} \cos\alpha & -\sin\alpha \\ \sin\alpha & \cos\alpha\end{pmatrix}\begin{pmatrix} A_1^2 & 0 \\ 0 & A_2^2\end{pmatrix} \begin{pmatrix} \cos\alpha & \sin\alpha \\ -\sin\alpha & \cos\alpha \end{pmatrix}.\] Skoro więc wyrazy na przekątnej macierzy pośrodku są nieujemne jako kwadraty, to mamy \(A^2\geq0.\)

Ogólniej, dla funkcji \(f\) o wartościach rzeczywistych macierz \(f(A)\) definiujemy wzorem znajdującym się w tekście obok, o ile tylko \(A_1\) oraz \(A_2\) należą do dziedziny \(f.\)

A jak będzie z \(e^A\)? Czy zawsze zachodzi \(e^A\geq 0\)? TAK, z tego samego powodu! A czy \(\ln(A) \geq 0,\) o ile \(A -\begin{psmallmatrix} 1&0\\0&1 \end{psmallmatrix} \geq 0\)? Odpowiedź znowu jest pozytywna, ale po drodze trzeba skorzystać z równości zachodzącej dla każdego kąta \(\alpha\) \[\begin{pmatrix} \cos\alpha & -\sin\alpha \\ \sin\alpha & \cos\alpha\end{pmatrix}\begin{pmatrix} 1 & 0 \\ 0 & 1\end{pmatrix} \begin{pmatrix} \cos\alpha & \sin\alpha \\ -\sin\alpha & \cos\alpha \end{pmatrix}=\begin{pmatrix} 1 & 0 \\0&1 \end{pmatrix}.\] Wygląda na to, że półtorej strony dotychczasowych modyfikacji doprowadziło tylko do znanych nam z analizy nierówności. Trochę to nudne… ale nie poddajemy się! Weźmy na warsztat odpowiednik znanej liczbowej nierówności \(A^2\geq B^2,\) o ile \(A\geq B\geq 0.\) Czy jest ona prawdziwa? Otóż… NIE! Weźmy \(A=\begin{psmallmatrix} 1&1\\ 1&2025 \end{psmallmatrix},\) \(B=\begin{psmallmatrix} 0&0\\ 0&2024 \end{psmallmatrix}.\) Wtedy \[A-B=\begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}\geq 0, \ \ \ \text{ale} \ \ \ A^2-B^2=\begin{pmatrix} 2 & 2026 \\ 2026 & 4050 \end{pmatrix}\ngeq 0,\] bo \(2 \cdot 4050 - 2026^2\) jest (bardzo) ujemne.

Oznacza to, że \(A \longmapsto A^2\) nie jest funkcją monotonicznie rosnącą dla macierzy nieujemnie określonych. A jak to wygląda dla innych potęg? Częściowej odpowiedzi na to pytanie dostarcza nierówność Löwnera–Heinza: \[\forall \ p\in (0, 1], \ \ \ A\geq B\geq 0 \ \ \ \Longrightarrow \ \ \ A^p\geq B^p.\] Nierówność Löwnera–Heinza nie posiada (znanego mi) krótkiego i jednocześnie elementarnego dowodu. Główna trudność wynika oczywiście z tego, że kąt \(\alpha\) dla \(A\) i odpowiedni kąt dla \(B\) nie muszą być tożsame.

Przejdźmy wreszcie do deseru, czyli do klasycznych nierówności pomiędzy średnimi. Czy na przykład dla \(A, B \geq 0\) zachodzi \[\tfrac12 (A+B) \leq \sqrt{\tfrac12(A^2+B^2)} \ \text{\large ?}\] Policzmy: \[\tfrac12(A^2+B^2)-(\tfrac12(A+B))^2 = \tfrac14(A^2+B^2-AB-BA) = \tfrac14(A-B)^2 \geq 0\] i nierówność Löwnera–Heinza dla \(p = \frac12\) da nam (pozytywną) odpowiedź.

image

A jak będzie z nierównością pomiędzy średnią arytmetyczną a średnią harmoniczną? Pytamy o nierówność \[\forall \ A,B\geq 0, \ \ \ 2(A^{-1}+B^{-1})^{-1}\leq \tfrac12 (A+B).\] Okazuje się, że również i ta nierówność jest prawdziwa. Aby to wykazać, potrzebujemy następującego wzoru: \[Q_{(A^{-1}+B^{-1})^{-1}}(z_1,z_2) = \min \big\lbrace Q_A(x_1,x_2) + Q_B(y_1,y_2) \big\rbrace,\] gdzie minimum brane jest po wszystkich możliwych wektorach \((x_1,x_2),\) \((y_1,y_2)\) spełniających \((x_1,x_2) + (y_1,y_2) = (z_1,z_2).\) Uzbrojeni w tę tajemną wiedzę zauważmy, że wystarczy pokazać nierówność \[\forall \ (z_1,z_2), \ \ \ Q_{4(A^{-1}+B^{-1})^{-1}}(z_1,z_2) \le Q_{(A+B)}(z_1,z_2).\] Ale rozkładając \((z_1,z_2)\) jako sumę \(\frac 12 (z_1,z_2) + \frac 12 (z_1,z_2),\) dostaniemy \[Q_{4(A^{-1}+B^{-1})^{-1}}(z_1,z_2) \le Q_A(z_1,z_2) + Q_B(z_1,z_2) = Q_{A+B}(z_1,z_2),\] co kończy dowód.

Warto też zastanowić się nad sytuacją jednowymiarową: jaka jest najmniejsza wartość funkcji \(f(x)=ax^2 + b(1-x)^2\) dla dodatnich \(a\) oraz \(b\)?

Na koniec ciekawostka (a właściwie to ploteczka): znana nam celebrytka w krainie nierówności – średnia geometryczna – jest niezwykle kapryśna w naszym nowym świecie. Problem polega na tym, że iloczyn \(AB\) dwóch symetrycznych macierzy wcale symetryczny być nie musi.

Dla przykładu: iloczyn \(\begin{pmatrix} 1 & 1 \\ 1 & 2 \end{pmatrix}\begin{pmatrix} 2 & 1 \\ 1 & 1 \end{pmatrix}=\begin{pmatrix} 3 & 2 \\ 4 & 3 \end{pmatrix}\)
nie jest symetryczny.

Problem ten można rozwiązać na różne sposoby, dostając różne średnie geometryczne. Jednym ze sposobów jest wzięcie \[\exp \left( \frac{\ln A+\ln B}{2} \right).\] Da nam to macierz symetryczną (dlaczego?), niestety z pewnymi mankamentami. Okazuje się, że najlepszym wyborem (dla \(A,B > 0\)) jest średnia \[A\sharp B := A^{1/2}(A^{-1/2}BA^{-1/2})^{1/2}A^{1/2}.\] Ten wzór, uczciwie pisząc, nie wygląda elegancko – na pocieszenie warto wspomnieć, że dla trzech czy więcej macierzy ich średnia geometryczna wygląda dużo, dużo gorzej… Za to brak urody nadrabia innymi walorami, np. zachodzą jakże oczekiwane nierówności: \[2(A^{-1}+B^{-1})^{-1} \leq A\sharp B \leq \tfrac12 (A+B).\] Informacje o tym i o wielu innych wynikach dotyczących analizy na macierzach Czytelnik znajdzie w książce F. Hiai, D. Petz: Introduction to Matrix Analysis and Applications. Życzę miłej dalszej lektury!