Jedną z największych różnic pomiędzy matematykami współczesnymi a tymi sprzed stuleci jest wąska specjalizacja tych pierwszych. Z biografii gigantów, takich jak Euler, Gauss czy Riemann, jasno wyłania się obraz matematyków wszechstronnych, zajmujących się wszystkimi dziedzinami ówczesnej królowej nauk.
Ich następcy, oczywiście z pewnymi chwalebnymi (lecz jakże rzadkimi) wyjątkami, są tak wąsko wyspecjalizowani, że często nie potrafią zrozumieć wyników swoich kolegów z innych dziedzin.
Częściowo z tego powodu w matematyce współczesnej bardzo poczesne miejsce zajmują teorie, w których wykorzystuje się narzędzia z różnych dziedzin. Przykładem znanym ze szkoły są funkcje wypukłe, które można scharakteryzować geometrycznie,
ale także, zakładając odpowiednią regularność, w sposób czysto analityczny – druga pochodna takiej funkcji musi być wszędzie nieujemna.
W tekście tym przedstawione zostanie twierdzenie dotyczące tak zwanej funkcji odległości, które także wiąże wypukłość z pewnymi faktami z analizy matematycznej. Tym razem jednak głównym aktorem będzie pierwsza pochodna zamiast drugiej. Oto i główne danie w menu:
Twierdzenie (Motzkina).
Niech będzie domkniętym podzbiorem płaszczyzny, a funkcją mierzącą odległość od zbioru :
Wówczas zbiór jest wypukły wtedy i tylko wtedy, gdy funkcja odległości jest różniczkowalna na dopełnieniu czyli na zbiorze
Jest to dość niezwykły fakt wiążący geometrię z regularnością Otóż na oko wydawać się może, że za regularność funkcji powinna odpowiadać gładkość brzegu a nie geometryczny kształt. Zanim jednak zagłębimy się w meandry tegoż twierdzenia, starannie wyjaśnijmy wszystkie pojęcia, aby nie było nieporozumień. Polecam również lekturę artykułu Michała Miśkiewicza z pt. Babo, babo, udaj się.
Na początek przypomnijmy, czym jest domkniętość:
intuicyjnie zbiory domknięte to te, które zawierają swój brzeg (pełna definicja widnieje obok). Do czego przyda nam się to pojęcie? Zobaczymy za chwilę.
Wytrawny Czytelnik spostrzeże w definicji funkcji pewną subtelność: czemu niby wartość minimum musiałaby istnieć, skoro bierzemy ją po zbiorze, który wcale skończony być nie musi? Otóż właśnie tu interweniuje (po raz pierwszy) domkniętość – jeżeli weźmiemy ciąg punktów z które prawie realizują minimum i są coraz bliżej tego celu, to okaże się, że pewien podciąg punktów będzie zbieżny
do jakiegoś punktu Okazuje się, że będzie realizować minimum! Szczegóły tego rozumowania pozostawiamy Ambitnym Czytelnikom jako ciekawe ćwiczenie.
Funkcję odległości definiuje się w miarę prosto,
niestety gorzej jest z jej jawnym wyliczeniem. Na przykład dla koła domkniętego
da się to zrobić stosunkowo łatwo i wzór wygląda następująco:
Ambitnemu Czytelnikowi pozostawiamy wyliczenie dla ciekawszych geometrycznych obiektów, choćby kwadratu który wymaga już rozpatrzenia większej liczby przypadków (rys. 2).
Musimy także przypomnieć pojęcie różniczkowalności dla funkcji wielu zmiennych. Niestety, znany Czytelnikowi wzór
nie da się zastosować,
gdyż w przypadku wielu zmiennych parametr byłby wektorem, zaś przez wektory dzielić nie wolno! Zmodyfikujmy więc nieco definicję:
Definicja.
Funkcję nazywamy różniczkowalną w punkcie jeżeli istnieją stałe takie, że
Funkcję nazywamy różniczkowalną na zbiorze jeżeli jest ona różniczkowalna w każdym punkcie zbioru Stałe (oczywiście zależne od punktu !) nazywamy pochodnymi cząstkowymi w i piszemy
Czy jest jakaś intuicja stojąca za tą, trochę zagmatwaną, definicją? Czytelnik zechce zauważyć, że płaszczyzna
w będzie wtedy spełniać rolę stycznej do wykresu w punkcie Tak więc różniczkowalność w danym punkcie jest równoważna istnieniu płaszczyzny stycznej do wykresu.
Staranne wyliczenie
dla pozwala stwierdzić, że na okręgu funkcja nie jest różniczkowalna, natomiast jest różniczkowalna w dopełnieniu. Jeżeli Czytelnik uporał się z wyznaczeniem to zechce zauważyć, że brak gładkości na brzegu nie wpływa, wbrew intuicji, na różniczkowalność w dopełnieniu!
Jesteśmy już gotowi do wyjaśnienia sobie, dlaczego geometria i analiza wiążą się w twierdzeniu Motzkina. Jak to w matematyce często bywa, powiązanie dwóch pozornie nieskorelowanych faktów najczęściej odbywa się poprzez przeformułowanie ich w nieco innym języku. Zacznijmy od strony geometrycznej:
Lemat.
Zbiór na płaszczyźnie jest wypukły wtedy i tylko wtedy, gdy dla dowolnego punktu z dopełnienia istnieje dokładnie jeden punkt najbliższy punktowi
Jedna część lematu jest trywialna:
jeżeli są dwoma punktami z (jednocześnie) najbliższymi do pewnego punktu to odcinek miałby kłopoty z wciśnięciem się do (wypukłego!) zbioru (rys. 3).
W drugą stronę jest ciekawiej. Przypuśćmy, że nie jest wypukły, i weźmy dwa punkty dla których odcinek nie jest zawarty w Przecięcie odcinka z może być skomplikowane,
niemniej dzięki domkniętości znajdziemy mniejszy odcinek zawarty w którego końce leżą w ale wnętrze jest już rozłączne z
– To wtedy środek odcinka da nam punkt o dwóch najbliższych punktach do ! – może wykrzyknąć Czytelnik. Niestety nie jest to do końca poprawne, bo punkt
może mieć najbliższego towarzysza z gdzieś jeszcze bliżej…
Bez straty ogólności umówmy się, że tak wybrany punkt jest początkiem układu współrzędnych. Jako że należy on do dopełnienia (domkniętego) zbioru to pewna kula o środku w jest rozłączna z
Rozpatrzmy teraz rodzinę kół
czyli rodzinę kół zawierających ale nadal rozłącznych z
Wiemy już, że jest ona niepusta.
Wybierzmy teraz z rodziny koło o największym promieniu – nazwijmy je (rys. 4).
Oczywiście na okręgu brzegowym koła musi być pewien punkt Wykażemy, że nie jest on jedyny. Przypuśćmy więc przeciwnie i przesuńmy koło o w kierunku
Jeżeli dobierzemy wystarczająco małe, to przesunięte koło będzie rozłączne z
Jeśli ponadto nadal zawiera to wystarczy je teraz nadmuchać (delikatnie – bez obawy, że pęknie, może jednak dotknąć …),
i dostaniemy sprzeczność z maksymalnością W ogólnym przypadku to dodatkowe założenie może nie być spełnione, bo koło może dotykać brzegu w jakimś punkcie – wówczas wystarczy nieznacznie poprawić procedurę i kierunek przesuwania zmienić z na ◻
Powyższy dowód jest nieco zagmatwany – można go znaleźć na przykład w książce Hörmandera [H, Th. 2.1.30]. Być może Czytelnik znajdzie prostszy?
W każdym razie mamy już opis geometryczny za pomocą odległości – pozostaje analiza. Poniższy lemat zakończy dowód twierdzenia Motzkina:
Lemat.
Niech będzie domkniętym podzbiorem płaszczyzny. Funkcja jest różniczkowalna w punkcie wtedy i tylko wtedy, gdy najbliższy do punkt zbioru jest wyznaczony jednoznacznie.
Dowód przeprowadzimy dla (czyli kwadratu odległości od ) zamiast dla gdyż bez kwadratu musielibyśmy się uporać z różniczkowaniem pierwiastków, co nie jest zbyt przyjemne. Na szczęście, dla funkcji dodatnich (a taka jest na ) różniczkowalność funkcji jest równoważna różniczkowalności jej kwadratu.
Także i tym razem mamy do wykazania dwie implikacje, przy czym jedna z nich jest bardzo łatwa. Przypuśćmy, że jest funkcją różniczkowalną w punkcie i niech będzie najbliższym do punktem z Chcemy wykazać, że jest wyznaczony jednoznacznie. Do tego celu skonstruujmy funkcję
Jest to funkcja nieujemna (dlaczego?), a dodatkowo zeruje się ona w czyli ma w minimum lokalne. Dla różniczkowalnych funkcji jednej zmiennej oznacza to zerowanie się pochodnej. A jak jest w przypadku dwóch (lub wielu) zmiennych? Przypomnijmy interpretację za pomocą płaszczyzny stycznej – w punkcie minimum płaszczyzna ta musi być pozioma, co w języku analizy oznacza, że pochodne cząstkowe są zerowe: Bezpośrednim rachunkiem sprawdzamy, że te równości można zapisać następująco:
Te wzory jednoznacznie wyznaczają punkt
I tym razem w drugą stronę jest ciekawiej. Przyda nam się także trochę notacji: przez oznaczmy iloczyn skalarny oraz (traktowanych jako wektory na płaszczyźnie), czyli ; zauważmy, że Będziemy pisać, że jakieś wyrażenie jest (czytamy: o małe od ) jeżeli
Niech więc dla ustalonego punkt będzie jedynym najbliższym z Dowód pierwszej implikacji mówi nam, że jeśli funkcja jest różniczkowalna w to jej pochodnymi cząstkowymi są i Pozostaje nam więc podstawić te wartości do definicji i sprawdzić zbieżność odpowiedniego ilorazu. Przy użyciu naszej notacji zbieżność ta wyraża się następująco: wyrażenie jest
Do dzieła!
Funkcja jest ciągła, a więc jeżeli wektor jest wystarczająco krótki, to punkt po pierwsze będzie w a po drugie będzie istniał (niekoniecznie jedyny!) punkt najbliższy do przy czym musi zbiegać do gdy (wyjaśnienie tych szczegółów pozostawiamy Czytelnikowi jako ćwiczenie).
Dopełniając do kwadratu, otrzymujemy:
co jest połową naszej tezy. Powyżej jest ,,książkowym” przykładem wyrazu natomiast nierówność wynika z określenia punktu Z podobnych względów prawdziwa jest nierówność która przyda się, jeśli skorzystamy z tej samej tożsamości, ale inaczej:
Tym razem pojawił się dodatkowy wyraz, ograniczony w module przez a więc również postaci Okazuje się w ten sposób, że jest szacowane z obu stron przez czyli samo jest wręcz postaci To kończy dowód różniczkowalności w
Zamiast zakończenia. W dowodzie Twierdzenia Motzkina było wiele zwrotów akcji, rozumowań nie wprost czy też trickowych obserwacji. Współczesna matematyka pełna jest podobnych rozumowań i dlatego też jest niezwykle ciekawa.