Delta 3/2024

Twierdzenie Motzkina

Jedną z największych różnic pomiędzy matematykami współczesnymi a tymi sprzed stuleci jest wąska specjalizacja tych pierwszych. Z biografii gigantów, takich jak Euler, Gauss czy Riemann, jasno wyłania się obraz matematyków wszechstronnych, zajmujących się wszystkimi dziedzinami ówczesnej królowej nauk. Ich następcy, oczywiście z pewnymi chwalebnymi (lecz jakże rzadkimi) wyjątkami, są tak wąsko wyspecjalizowani, że często nie potrafią zrozumieć wyników swoich kolegów z innych dziedzin.

Częściowo z tego powodu w matematyce współczesnej bardzo poczesne miejsce zajmują teorie, w których wykorzystuje się narzędzia z różnych dziedzin. Przykładem znanym ze szkoły są funkcje wypukłe, które można scharakteryzować geometrycznie, ale także, zakładając odpowiednią regularność, w sposób czysto analityczny – druga pochodna takiej funkcji musi być wszędzie nieujemna.

W tekście tym przedstawione zostanie twierdzenie dotyczące tak zwanej funkcji odległości, które także wiąże wypukłość z pewnymi faktami z analizy matematycznej. Tym razem jednak głównym aktorem będzie pierwsza pochodna zamiast drugiej. Oto i główne danie w menu:

Twierdzenie (Motzkina). Niech K będzie domkniętym podzbiorem płaszczyzny, a dK funkcją mierzącą odległość od zbioru K: dK(p)=min{pq | qK}      (zob. rys. 1). Wówczas zbiór K jest wypukły wtedy i tylko wtedy, gdy funkcja odległości dK jest różniczkowalna na dopełnieniu K, czyli na zbiorze R2K.

Jest to dość niezwykły fakt wiążący geometrię K z regularnością dK. Otóż na oko wydawać się może, że za regularność funkcji dK powinna odpowiadać gładkość brzegu K, a nie geometryczny kształt. Zanim jednak zagłębimy się w meandry tegoż twierdzenia, starannie wyjaśnijmy wszystkie pojęcia, aby nie było nieporozumień. Polecam również lekturę artykułu Michała Miśkiewicza z Δ242 pt. Babo, babo, udaj się.

Na początek przypomnijmy, czym jest domkniętość: intuicyjnie zbiory domknięte to te, które zawierają swój brzeg (pełna definicja widnieje obok). Do czego przyda nam się to pojęcie? Zobaczymy za chwilę.

Wytrawny Czytelnik spostrzeże w definicji funkcji dK pewną subtelność: czemu niby wartość minimum musiałaby istnieć, skoro bierzemy ją po zbiorze, który wcale skończony być nie musi? Otóż właśnie tu interweniuje (po raz pierwszy) domkniętość – jeżeli weźmiemy ciąg punktów qj z K, które prawie realizują minimum i są coraz bliżej tego celu, to okaże się, że pewien podciąg punktów qj będzie zbieżny do jakiegoś punktu q^K. Okazuje się, że q^ będzie realizować minimum! Szczegóły tego rozumowania pozostawiamy Ambitnym Czytelnikom jako ciekawe ćwiczenie.

Funkcję odległości definiuje się w miarę prosto, niestety gorzej jest z jej jawnym wyliczeniem. Na przykład dla koła domkniętego Br((0,0)) da się to zrobić stosunkowo łatwo i wzór wygląda następująco: dBr((0,0))(p)={0dla pBr((0,0));prw przeciwnym przypadku. Ambitnemu Czytelnikowi pozostawiamy wyliczenie dK dla ciekawszych geometrycznych obiektów, choćby kwadratu [1,1]2, który wymaga już rozpatrzenia większej liczby przypadków (rys. 2).

Musimy także przypomnieć pojęcie różniczkowalności dla funkcji wielu zmiennych. Niestety, znany Czytelnikowi wzór f(p)=limh0f(p+h)f(p)h nie da się zastosować, gdyż w przypadku wielu zmiennych parametr h byłby wektorem, zaś przez wektory dzielić nie wolno! Zmodyfikujmy więc nieco definicję:

Definicja. Funkcję f:R2R nazywamy różniczkowalną w punkcie p=(p1,p2), jeżeli istnieją stałe a1,a2 takie, że limh12+h220|f((p1+h1,p2+h2))f((p1,p2))a1h1a2h2|h=0. Funkcję nazywamy różniczkowalną na zbiorze U, jeżeli jest ona różniczkowalna w każdym punkcie zbioru U. Stałe a1,a2 (oczywiście zależne od punktu p!) nazywamy pochodnymi cząstkowymi f w p i piszemy a1=fx1(p), a2=fx2(p).

Czy jest jakaś intuicja stojąca za tą, trochę zagmatwaną, definicją? Czytelnik zechce zauważyć, że płaszczyzna x3=f((p1,p2))+a1(x1p1)+a2(x2p2)R3 będzie wtedy spełniać rolę stycznej do wykresu f w punkcie (p1,p2). Tak więc różniczkowalność w danym punkcie jest równoważna istnieniu płaszczyzny stycznej do wykresu.

Staranne wyliczenie dla dBr((0,0)) pozwala stwierdzić, że na okręgu {x2+y2=r2} funkcja dBr((0,0)) nie jest różniczkowalna, natomiast jest różniczkowalna w dopełnieniu. Jeżeli Czytelnik uporał się z wyznaczeniem d[1,1]2, to zechce zauważyć, że brak gładkości na brzegu [1,1]2 nie wpływa, wbrew intuicji, na różniczkowalność d[1,1]2 w dopełnieniu!

Jesteśmy już gotowi do wyjaśnienia sobie, dlaczego geometria i analiza wiążą się w twierdzeniu Motzkina. Jak to w matematyce często bywa, powiązanie dwóch pozornie nieskorelowanych faktów najczęściej odbywa się poprzez przeformułowanie ich w nieco innym języku. Zacznijmy od strony geometrycznej:

Lemat. Zbiór K na płaszczyźnie jest wypukły wtedy i tylko wtedy, gdy dla dowolnego punktu p z dopełnienia istnieje dokładnie jeden punkt qK najbliższy punktowi p.

Jedna część lematu jest trywialna: jeżeli q1q2 są dwoma punktami z K (jednocześnie) najbliższymi do pewnego punktu p, to odcinek [q1,q2] miałby kłopoty z wciśnięciem się do (wypukłego!) zbioru K (rys. 3).

W drugą stronę jest ciekawiej. Przypuśćmy, że K nie jest wypukły, i weźmy dwa punkty q1,q2K, dla których odcinek [q1,q2] nie jest zawarty w K. Przecięcie odcinka [q1,q2] z K może być skomplikowane, niemniej dzięki domkniętości K znajdziemy mniejszy odcinek [l1,l2] zawarty w [q1,q2], którego końce leżą w K, ale wnętrze jest już rozłączne z K.

– To wtedy środek odcinka (l1,l2) da nam punkt p o dwóch najbliższych punktach do K! – może wykrzyknąć Czytelnik. Niestety nie jest to do końca poprawne, bo punkt p może mieć najbliższego towarzysza z K gdzieś jeszcze bliżej…

Bez straty ogólności umówmy się, że tak wybrany punkt p jest początkiem układu współrzędnych. Jako że należy on do dopełnienia (domkniętego) zbioru K, to pewna kula Bρ((0,0)) o środku w p=(0,0) jest rozłączna z K. Rozpatrzmy teraz rodzinę kół F={Br((x,y)) | Bρ((0,0))Br((x,y)), Br((x,y))K=}, czyli rodzinę kół zawierających Bρ((0,0)), ale nadal rozłącznych z K. Wiemy już, że jest ona niepusta. Wybierzmy teraz z rodziny F koło o największym promieniu – nazwijmy je Br0(w) (rys. 4). Oczywiście na okręgu brzegowym koła Br0(w) musi być pewien punkt yK. Wykażemy, że nie jest on jedyny. Przypuśćmy więc przeciwnie i przesuńmy koło Br0(w) o ε>0 w kierunku yw. Jeżeli ε dobierzemy wystarczająco małe, to przesunięte koło będzie rozłączne z K. Jeśli ponadto nadal zawiera Bρ((0,0)), to wystarczy je teraz nadmuchać (delikatnie – bez obawy, że pęknie, może jednak dotknąć K…), i dostaniemy sprzeczność z maksymalnością r0. W ogólnym przypadku to dodatkowe założenie może nie być spełnione, bo koło Bρ((0,0)) może dotykać brzegu Br0(w) w jakimś punkcie z – wówczas wystarczy nieznacznie poprawić procedurę i kierunek przesuwania zmienić z yw na yz.

Powyższy dowód jest nieco zagmatwany – można go znaleźć na przykład w książce Hörmandera [H, Th. 2.1.30]. Być może Czytelnik znajdzie prostszy? W każdym razie mamy już opis geometryczny za pomocą odległości – pozostaje analiza. Poniższy lemat zakończy dowód twierdzenia Motzkina:

Lemat. Niech K będzie domkniętym podzbiorem płaszczyzny. Funkcja dK jest różniczkowalna w punkcie pR2K wtedy i tylko wtedy, gdy najbliższy do p punkt zbioru K jest wyznaczony jednoznacznie.

Dowód przeprowadzimy dla dK2 (czyli kwadratu odległości od K) zamiast dla dK, gdyż bez kwadratu musielibyśmy się uporać z różniczkowaniem pierwiastków, co nie jest zbyt przyjemne. Na szczęście, dla funkcji dodatnich (a taka jest dK na R2K) różniczkowalność funkcji jest równoważna różniczkowalności jej kwadratu.

Także i tym razem mamy do wykazania dwie implikacje, przy czym jedna z nich jest bardzo łatwa. Przypuśćmy, że dK jest funkcją różniczkowalną w punkcie p i niech q będzie najbliższym do p punktem z K. Chcemy wykazać, że q jest wyznaczony jednoznacznie. Do tego celu skonstruujmy funkcję f(w):=wq2dK2(w)=(w1q1)2+(w2q2)2dK2(w). Jest to funkcja nieujemna (dlaczego?), a dodatkowo zeruje się ona w p, czyli ma w p minimum lokalne. Dla różniczkowalnych funkcji jednej zmiennej oznacza to zerowanie się pochodnej. A jak jest w przypadku dwóch (lub wielu) zmiennych? Przypomnijmy interpretację za pomocą płaszczyzny stycznej – w punkcie minimum płaszczyzna ta musi być pozioma, co w języku analizy oznacza, że pochodne cząstkowe są zerowe: fx1(p)=0, fx2(p)=0. Bezpośrednim rachunkiem sprawdzamy, że te równości można zapisać następująco: 2(p1q1)=dK2x1(p);   2(p2q2)=dK2x2(p). Te wzory jednoznacznie wyznaczają punkt q=(q1,q2).

I tym razem w drugą stronę jest ciekawiej. Przyda nam się także trochę notacji: przez p,q oznaczmy iloczyn skalarny p=(p1,p2) oraz q=(q1,q2) (traktowanych jako wektory na płaszczyźnie), czyli p1q1+p2q2; zauważmy, że p2=p,p. Będziemy pisać, że jakieś wyrażenie l(h) jest o(h) (czytamy: o małe od h) jeżeli limh12+h220l(h)h=0.

Niech więc dla ustalonego pR2K punkt q będzie jedynym najbliższym z K. Dowód pierwszej implikacji mówi nam, że jeśli funkcja dK2 jest różniczkowalna w p, to jej pochodnymi cząstkowymi są 2(p1q1) i 2(p2q2). Pozostaje nam więc podstawić te wartości do definicji i sprawdzić zbieżność odpowiedniego ilorazu. Przy użyciu naszej notacji zbieżność ta wyraża się następująco: wyrażenie dK2(p+h)dK2(p)2pq,h jest o(h).

Do dzieła! Funkcja dK jest ciągła, a więc jeżeli wektor h jest wystarczająco krótki, to punkt p+h po pierwsze będzie w R2K, a po drugie będzie istniał (niekoniecznie jedyny!) punkt qhK najbliższy do p+h, przy czym qh musi zbiegać do q, gdy h12+h220 (wyjaśnienie tych szczegółów pozostawiamy Czytelnikowi jako ćwiczenie). Dopełniając do kwadratu, otrzymujemy: dK2(p+h)dK2(p)2pq,h=p+hqh2pq22pq,h==h2o(h)+p+hqh2p+hq20o(h), co jest połową naszej tezy. Powyżej h2 jest ,,książkowym” przykładem wyrazu o(h), natomiast nierówność p+hq2p+hqh2 wynika z określenia punktu qh. Z podobnych względów prawdziwa jest nierówność pqh2pq2, która przyda się, jeśli skorzystamy z tej samej tożsamości, ale inaczej: ()=h2o(h)+pqh2pq20+2h,qqho(h)o(h). Tym razem pojawił się dodatkowy wyraz, ograniczony w module przez 2hqqh, a więc również postaci o(h). Okazuje się w ten sposób, że dK2(p+h)dK2(p)2pq,h jest szacowane z obu stron przez o(h), czyli samo jest wręcz postaci o(h). To kończy dowód różniczkowalności dK2 w p.

Zamiast zakończenia. W dowodzie Twierdzenia Motzkina było wiele zwrotów akcji, rozumowań nie wprost czy też trickowych obserwacji. Współczesna matematyka pełna jest podobnych rozumowań i dlatego też jest niezwykle ciekawa.