Delta 7/2024

Hiperboliczna geometria przestrzeni kół

W Internecie łatwo można znaleźć quizy, których rozwiązanie pozwala odpowiedzieć na ważne pytania: z którą księżniczką Disneya mogę się utożsamiać?, które warzywo najlepiej mnie opisuje?, do którego z czterech domów Hogwartu pasuję? Postanowiłem dodać swoje trzy grosze, pytając Czytelników Delty o geometrię przestrzeni kół. Rzecz jest subiektywna, więc nie ma złych odpowiedzi. Zdajmy się więc na Tiarę Przydziału!

W poniższych pytaniach przez d(P,Q) należy rozumieć odległość między kołami P i Q. Z podanych odpowiedzi wybieramy tę, która według nas najlepiej opisuje sytuację na rysunkach niżej. O przydziale decyduje wybrany symbol; może się okazać, że pasuje więcej niż jeden dom.

Pytanie 1

image

  1. d(A,B)=d(C,D)

  2. d(A,B)=2d(C,D)

  3. inna odpowiedź

Pytanie 2

image

  • d(E,F)=d(F,G)

  • d(E,F)=2d(F,G)

  • obie powyższe odpowiedzi, gdyż d(E,F)=0=d(F,G)

  • inna odpowiedź

Sprawdź swój wynik!

Hufflepuff! Twoje rozumienie odległości między kołami trudno uchwycić poprzez proste zależności, ale na pewno okaże się ono przydatne w momencie, w którym świat magii będzie tego najbardziej potrzebował. Tak trzymaj!

Gryffindor! Bardzo możliwe, że przez odległość d(P,Q) rozumiesz długość najkrótszego odcinka łączącego jakiś punkt uP z jakimś punktem vQ (rys. 1). Wtedy d(A,B)=2, d(C,D)=1, natomiast dowolne dwie przecinające się koła są w zerowej odległości. Brawo! Pamiętaj tylko, że tak określona odległość nie jest metryką, czyli nie mierzy, jak bardzo dwa koła się różnią – dwa koła mogą się różnić diametralnie, a nadal być odległe o 0.

Ravenclaw! Niewykluczone, że Twoje rozumienie d(P,Q) pokrywa się z odległością zdefiniowaną przez Felixa Hausdorffa (1868–1942). Mierzysz, o ile trzeba powiększyć koło P, żeby pochłonęło Q, potem odwrotnie – o ile należy powiększyć Q – a na koniec wybierasz większą z tych dwóch wielkości (rys. 2). Wtedy d(A,B)=6, d(C,D)=3 oraz d(E,F)=2, d(F,G)=1. Świetnie!

Dzięki opisanej tu metryce Hausdorffa można mierzyć odległość między rozmaitymi zbiorami, ale w przypadku kół łatwo ją wyrazić jawnym wzorem. Jeśli dane są koła P=B(p,r1) i Q=B(q,r2) (p,q to ich środki, a r1,r2 – promienie), to widać, że najmniejsze koło o środku w p i zawierające Q ma promień |pq|+r2; koło P trzeba więc powiększyć o |pq|+r2r1 (lub 0, jeśli ta liczba jest ujemna). Podobnie koło Q trzeba powiększyć o max(0,|pq|+r1r2), jako większą z tych liczb otrzymujemy więc d(P,Q)=|pq|+|r1r2|.

Pojęcie odległości (bardziej fachowo: metryki) pozwala myśleć o zbiorze wszystkich kół na płaszczyźnie jako o przestrzeni, a o kołach jako o jej punktach. Jest jasne, że odległość Hausdorffa d(P,Q) jest zerowa jedynie wtedy, gdy koła P i Q są identyczne; spełniona jest też nierówność trójkąta: d(P,Q)d(P,S)+d(S,Q) dla wszystkich P,Q,S (zad. 1). Te własności powodują, że d można śmiało wykorzystywać do opisu geometrii przestrzeni kół.

Okazuje się, że jest to geometria dobrze nam znana. Przyporządkujmy mianowicie kołu B(p,r)R2 (o środku w p=(p1,p2)) trójkę liczb (p1,p2,r), a więc punkt w górnej połowie przestrzeni R3. Pomijając jeden wymiar, możemy wtedy reprezentować przestrzeń kół jak na rysunku 3. Możemy też zilustrować wybraną metrykę, wybierając punkt P (czyli jakieś koło) i promień R>0, a następnie rysując obszar odpowiadający wszystkim punktom-kołom odległym od P o najwyżej R (rys. 4). Jak wspomniałem, na rysunku brakuje jednego wymiaru, a w rzeczywistości taki obszar ma kształt podwójnego stożka. Jeśli jednak chcieć interpretować dosłownie rysunki 3 i 4, to są one reprezentacją przestrzeni odcinków postaci (pr,p+r)R z metryką Hausdorffa; odcinki takie są jednowymiarowym odpowiednikiem kół.

Tutaj należy nadmienić, że odcinki w R, koła w R2, kule w R3 oraz obszary jak te z rysunku 4 obejmujemy wspólną nazwą kul. W każdym z przypadków mamy bowiem do czynienia ze zbiorem wszystkich punktów odległych od zadanego punktu p o najwyżej r – zmianie ulega jedynie sens słów punktodległość.

Zanim przejdziemy do ostatniej możliwości, wspomnijmy o tak zwanej odległości euklidesowej: d(P,Q)=|pq|2+|r1r2|2 dla P=B(p,r1), Q=B(q,r2). Choć różni się ona od odległości Hausdorffa, to są one porównywalne (jedna nigdy nie przekracza dwukrotności drugiej) i obie prowadzą do udzielenia dwóch odpowiedzi . Geometria związana z odległością euklidesową jest za to dużo bogatsza; z tego też powodu używamy jej na co dzień.

Slytherin! Najwyraźniej uznajesz, że zastosowanie jednokładności nie zmienia odległości między kołami. Jeśli więc koła C,D tworzą konfigurację taką jak A,B, tylko w dwa razy mniejszej skali, to są w tej samej odległości; podobnie mają się E,F do F,G. W wielu problemach geometrycznych taki punkt widzenia się opłaca, wszak wszelkie jakościowe zależności – rozłączność, zawieranie, styczność dwóch kół etc. – nie zależą od skali. Jak przekonuje Stephen Semmes, idea ta jest też pożyteczna w analizie matematycznej. Jesteś w dobrym towarzystwie!

Interesująca nas metryka nie jest tak łatwa w opisie, ale jak się przekonamy, zawiera w sobie klucz do Komnaty Tajemnic – geometrii hiperbolicznej.

O metryce Ślizgonów.

Żeby ją znaleźć, spróbujmy przeformułować metrykę Hausdorffa w sposób niezmienniczy ze względu na skalowanie: zamiast patrzeć, o ile trzeba powiększyć koło P dla pokrycia Q, zbadamy, ilukrotnie trzeba je powiększyć. Jeśli jak poprzednio przyjmiemy P=B(p,r1), Q=B(q,r2), to tym czynnikiem jest α1=|pq|+r2r1; symetrycznie określamy α2 jako skalę powiększenia Q. Wydaje się naturalne, że za odległość przyjmuje się większą z liczb α1,α2, ale wynik takiej operacji jest zawsze nie mniejszy od 1, nawet gdy P=Q. Sytuację można poprawić na różne sposoby, na przykład od max(α1,α2) odejmując jedynkę, jednak zobaczymy, że najlepiej jest wziąć logarytm (powiedzmy, że naturalny). Prowadzi to do następującej metryki: ()d(P,Q)=log(|pq|+max(r1,r2)min(r1,r2))=log(1+|pq|+|r1r2|min(r1,r2)). Geometria opisana odległością zdefiniowaną wyżej nosi nazwę geometrii hiperbolicznej. W pozostałej części artykułu przyjrzymy się jej bliżej.

Odnotujmy na początek, że d(A,B)=log(3)=d(C,D) oraz d(E,F)=log(2)=d(F,G), co potwierdza wybór dwóch . Ogólną ilustrację wybranej metryki widzimy na rysunku 5. Nie powinno nas dziwić, że zaznaczone obszary (,,kule”) nie dochodzą do prostej r=0. Prosta ta jest ,,nieskończenie daleko” z punktu widzenia naszej metryki. Dlatego też, chociaż modelem przestrzeni kół jest dla nas półprzestrzeń – lub półpłaszczyzna, jeśli badamy przypadek jednowymiarowy – to interesująca nas przestrzeń jest nazywana przestrzenią hiperboliczną, a wymiar niżej – płaszczyzną hiperboliczną. Czytelnikowi polecam samodzielnie poeksperymentować z pomocą komputera i zaobserwować, jakie kształty da się otrzymać, rozważając obszary jak na rysunku 5. Warto też sprawdzić, że spełniona jest nierówność trójkąta (zad. 2).

Rzut oka na geodezyjne.

Rozważmy następujący problem: dla kół P,Q z rysunku 6 (o promieniu 1 i środkach odległych o 12) wskazać koła S1,S2 w taki sposób, by długość łamanej [P,S1,S2,Q] – mierzona jako suma odległości między kolejnymi wierzchołkami łamanej – była najmniejsza. Na rysunku 6 od razu widać narzucające się rozwiązanie: za S1,S2 przyjmujemy koła jednostkowe położone w równych odstępach między P,Q; na półpłaszczyźnie ilustrującej przestrzeń kół odpowiada to ,,prostej” łamanej. Jej łączna długość to 3log(1+4), czyli log(125).

Ale da się lepiej! Optymalnym rozwiązaniem okazują się koła o tych samych środkach, ale promieniu 2 (rys. 7). Taka łamana ma długość 2log(4+2)+log(4+22), czyli log(108). To oczywiście nieznacznie mniej, jednak łatwo znaleźć bardziej jaskrawe przykłady. Gdyby koła P,Q rozsunąć na odległość d>12, to optymalnym rozwiązaniem są koła S1,S2 o promieniu d/6 położone w równych odstępach; dla dużych d daje to łamaną niemal 32-krotnie krótszą niż ta ,,prosta”. Gdybyśmy natomiast nasze zadanie zmienili, każąc szukać łamanej o większej liczbie wierzchołków, to zauważylibyśmy przepaść między rozwiązaniem ,,prostym” a optymalnym.

Standardowa metryka hiperboliczna.

Jest wiele przykładów pozwalających uzmysłowić sobie różnicę między geometrią euklidesową a hiperboliczną; jeden można znaleźć na marginesie. Większość z nich wymaga jednak bardziej wyrafinowanej metryki niż ta opisana wzorem (), którą od teraz dla odróżnienia będziemy oznaczać przez d.

Tę ,,lepszą” metrykę opiszę w oparciu o analogię optyczną. Oderwijmy się od przestrzeni kół i rozważmy światło rozchodzące się w półpłaszczyźnie y>0 (choć tę samą konstrukcję można powtórzyć w dowolnym wymiarze). Jeśli przyjmiemy, że jego prędkość jest stała i wszędzie wynosi 1, to czas, w którym światło pokonuje daną krzywą, jest po prostu długością tej krzywej. Pokonując drogę z punktu p do q, światło zgodnie z zasadą Fermata ,,wybiera” najszybszą drogę, czyli odcinek łączący te punkty, i zabiera mu to |pq| czasu – jest to metryka euklidesowa. Wyobraźmy teraz sobie, że półpłaszczyzna y>0 jest wypełniona niejednorodnym ośrodkiem, a w punkcie (x,y) światło ma prędkość y. Wtedy najszybsza droga z punktu do punktu, nazywana krzywą geodezyjną, zazwyczaj nie prowadzi po odcinku (rys. 9). Czas potrzebny na dotarcie z p do q oznaczymy przez dH(p,q) i to jest właśnie standardowa metryka hiperboliczna. Da się ją wyrazić wzorem: dH(p,q)=log(|pq|+|pq||pq||pq|),   gdzie (x,y)=(x,y). Do metryki d ma się mniej więcej tak, jak metryka euklidesowa ma się do tej danej wzorem |x1x2|+|y1y2|. Są one porównywalne – wyniki pomiarów dHd różnią się najwyżej dwukrotnie – ale dH ma szereg przewag. Kule w tej metryce – czyli obszary analogiczne do tych z rysunków 4 i 5 – mają gładki kształt, a dokładnie są kołami (rys. 8). Łatwo wykaże to Czytelnik znający okręgi Apoloniusza (zob. DeltoidΔ131). Krzywe geodezyjne przyjmują kształt pionowych półprostych oraz półokręgów o średnicy leżącej na osi x (rys. 9) – to z kolei Czytelnik może wyprowadzić z prawa załamania światła. Kształt geodezyjnych nie powinien zaskakiwać, bo światło ,,omija” obszar niższej prędkości. Jednocześnie wyjaśnia on fenomen zakrzywienia optymalnych łamanych, który widzieliśmy wcześniej.

Po wizycie w Komnacie Tajemnic Czytelnik jest dobrze przygotowany, by samodzielnie zgłębiać dalsze tajniki geometrii hiperbolicznej. Oczywiście warto zacząć od Delty – pod hasłami płaszczyzna hiperboliczna czy też Bolyai–Łobaczewskiego – ale możliwe jest też doświadczenie tej geometrii niejako od środka, poprzez gry komputerowe oparte na geometrii hiperbolicznej: HyperRogueHyperbolica.

Afiliacja: Wydział Matematyki, Informatyki i Mechaniki UW

image
Rys. 1. Według typowego Gryfona powyższe koła są odległe o 3, gdyż taką długość ma najkrótszy odcinek je łączący

image
Rys. 2. Żeby lewe koło pokryło prawe, trzeba zwiększyć promień o 3, natomiast żeby prawe pokryło lewe – aż 5. Według Krukonów koła te są więc odległe o 5

Zadanie 1. Uzasadnić, że jeśli B(p1,r1)B(p2,r2+a) oraz B(p2,r2)B(p3,r3+b), to B(p1,r1)B(p3,r3+a+b). Wywnioskować, że nierówność trójkąta jest spełniona dla metryki Hausdorffa.

image
Rys. 3. Punkt P reprezentuje pewne koło, a obszar zaznaczony powyżej niego odpowiada wszystkim kołom zawierającym P. Podobnie punkt Q to koło o dwukrotnie mniejszym promieniu niż P, a obszar poniżej to wszystkie koła zawierające się w Q

image
Rys. 4. Zaznaczono wszystkie koła odległe (w metryce Hausdorffa) od P o najwyżej r oraz te odległe od Q o najwyżej 2r

Więcej o pożytkach z rozpatrywania odległości niezależnej od skali:
Stephen Semmes, Metric Spaces and Mappings Seen at Many Scales, str. 401–404 załącznika B w:
Michaił Gromow, Metric Structures for Riemannian and Non-Riemannian Spaces, Birkhäuser, 2007.

image
Rys. 5. Zaznaczono koła odległe (w metryce opisanej wzorem ()) od P o najwyżej 0,4 oraz te odległe od Q o najwyżej 1,2

Zadanie 2. Uzasadnić, że jeśli α,β1, B(p1,r1)B(p2,αr2) oraz B(p2,r2)B(p3,βr3), to B(p1,r1)B(p3,αβr3). Wywnioskować, że nierówność trójkąta jest spełniona dla metryki (). image
Rys. 6. Środki kół jednostkowych P,Q są odległe o 12. Zaproponowana łamana łącząca P i Q ma długość log(125)

image
Rys. 7. Najkrótsza trzyczęściowa łamana łącząca P i Q ma długość log(108). Wykorzystuje ona koła o tych samych środkach co poprzednio, ale dwukrotnie większym promieniu

Przykład. Jeśli ustalimy koło X i rozważymy wszystkie koła odległe od niego o R, to da się wśród nich znaleźć (dla dużych R) około eR kół wzajemnie odległych o co najmniej 1. Warto to zestawić z geometrią euklidesową, w której okrąg o promieniu R ma długość 2πR, więc punktów oddzielonych o 1 jest jedynie około R.

Opisaną obok analogię optyczną wymyślił w 1696 roku Johann Bernoulli. Wykorzystał ją do znalezienia kształtu brachistochrony, przyjmując prędkość światła w (x,y) proporcjonalną do y. Rozwiązanie to można zobaczyć na kanale 3Blue1Brown na YouTubie:
The Brachistochrone, with Steven Strogatz, youtu.be/Cld0p3a43fU.

image
Rys. 8. Kule w metryce dH: o środku p i promieniu 0,4; o środku q i promieniu 1,2. Warto odnotować, że są podobne kształtem i rozmiarem do kul w metryce d (rys. 5)

image
Rys. 9. Krzywe geodezyjne prowadzą z punktu p do q i s