Delta 5/2025

Dane kierunkowe

Afiliacja: Wydział Matematyki i Nauk Informacyjnych, Politechnika Warszawska

W wielu dziedzinach nauki można wskazać sytuacje, w których pomiary mają postać kierunków lub kątów – zarówno w dwóch, jak i w trzech wymiarach. Przykładowo, biolog może być zainteresowany badaniem kierunków sezonowego przemieszczania się ptaków wędrujących lub niektórych gatunków ryb (np. łososia) bądź kierunkami migracji zwierząt wywołanych określonymi bodźcami środowiskowymi. Geolodzy mierzą kierunki uskoków, spękań oraz szczelin w skałach w celu określenia przebiegu deformacji tektonicznych, rozkładu naprężeń czy orientacji warstw skalnych. Ortopedę oceniającego stan pacjenta powracającego do zdrowia po kontuzji interesuje kąt zgięcia kolana. Natomiast ekolodzy mierzą dominujący kierunek wiatru na danym obszarze, by wyciągnąć wnioski dotyczące rozprzestrzeniania się zanieczyszczeń.

Wnioskowanie na podstawie danych tego typu, określanych mianem danych kierunkowych , wymaga stosowania metod i modeli różniących się od standardowych sposobów analizy danych jednowymiarowych lub wielowymiarowych, jakie znamy z klasycznych podręczników statystyki. W niniejszym artykule zaprezentujemy kilka przykładowych problemów, które pozwolą dostrzec specyfikę danych kierunkowych.

Dane kierunkowe na płaszczyźnie przyjęło się przedstawiać jako punkty leżące na okręgu jednostkowym lub, równoważnie, za pomocą kąta, w związku z czym tego typu dane określa się czasem mianem danych kołowych lub cyrkularnych (ang. circular data ).

Pierwszym krokiem analizy danych jest zwykle próba ich zwięzłego opisu, a w szczególności wyznaczenie podstawowych charakterystyk liczbowych dostępnego zbioru obserwacji, takich jak wartość ,,typowa” (przeciętna, średnia) czy też miara rozrzutu. Nie inaczej jest w przypadku danych kierunkowych. Zacznijmy od wyznaczenia średniego (centralnego, preferowanego) kierunku dla danego zbioru obserwacji.

Przykład 1. Wyobraźmy sobie dwa klucze ptaków lecące w kierunkach \(P_1\) i \(P_2,\) wskazanych na rysunku 1. Załóżmy, przyjmując standardowy sposób określania kątów w matematyce (tzn. z kierunkiem wschodnim jako kierunkiem zerowym i zwiększaniem kąta przeciwnie do ruchu wskazówek zegara), że owe dwa klucze ptaków leciały pod kątem \(10^\circ\)\(350^\circ.\) Gdyby uśrednić zaobserwowane kierunki lotu ptaków za pomocą średniej arytmetycznej, otrzymalibyśmy w wyniku \(\frac{1}{2} (10^\circ + 350^\circ) = 180^\circ,\) czyli kierunek zachodni (zaznaczony na rys. 1), podczas gdy nasze obserwacje ewidentnie wskazują na wschód. Nietrudno zauważyć, że gdyby kąty określał przyrodnik, przyzwyczajony do przypisywania im wartości zgodnie z ruchem wskazówek zegara, począwszy od północy, to według niego mielibyśmy do czynienia z kluczami lecącymi pod kątem \(80^\circ\)\(100^\circ,\) i średnia arytmetyczna wskazałaby \(90^\circ,\) czyli spodziewany kierunek wschodni (rys. 2). Z niniejszego przykładu nie należy jednak pochopnie wysnuwać wniosku, że przyrodnicy lepiej określają średni kierunek lotu ptaków niż matematycy. Gdyby bowiem punkty \(P_1\)\(P_2\) zostały obrócone o  \(90^\circ\) przeciwnie do ruchu wskazówek zegara, to średnia arytmetyczna wyznaczona przez matematyka wyniosłaby \(90^\circ,\) wskazując kierunek zgodny z intuicją, w przeciwieństwie do przyrodnika, który otrzymałby wskazanie na południe.

image

Rys. 1

image

Rys. 2

W rozważanej sytuacji łatwo jest ocenić, który wynik wydaje się poprawny, a który jest ewidentnie sprzeczny z oczekiwaniem. Ogólnie rzecz biorąc, sytuacja nie musi być aż tak oczywista, co pokażemy w kolejnym przykładzie.

Przykład 2. Na rysunku 3 zaznaczono kierunki poruszania się czterech żółwi po wykluciu się z jajek. Załóżmy, że i tym razem chcielibyśmy wyznaczyć średni kierunek poruszania się żółwi. Jeśli przyjąć ,,matematyczny” sposób określania kątów, to owe cztery żółwiki wędrowałyby w kierunkach: \(20^\circ,\) \(150^\circ,\) \(220^\circ\)\(330^\circ,\) które po podstawieniu do wzoru na średnią arytmetyczną wskazałyby \(180^\circ,\) tj. kierunek zachodni. Gdyby ostatnie dwa kierunki określić kątami ujemnymi, tzn. \(-140^\circ\) i \(-30^\circ,\) to średnia przyjęłaby wartość \(0^\circ,\) odpowiadającą kierunkowi wschodniemu. Jednocześnie, gdyby kąty określał przyrodnik – zgodnie z ruchem wskazówek zegara, począwszy od północy, to według niego mielibyśmy do czynienia z następującymi obserwacjami: \(70^\circ,\) \(120^\circ,\) \(230^\circ\) i \(300^\circ,\) które po podstawieniu do wzoru na średnią arytmetyczną dałyby \(180^\circ,\) czyli wynik wskazujący tym razem kierunek południowy. A gdyby nasz przyrodnik wyraził dwie ostatnie obserwacje za pomocą ujemnych wartości kąta, tzn. \(-130^\circ\)\(-60^\circ,\) to średnia arytmetyczna byłaby równa \(0^\circ,\) wskazując północ.

image

Rys. 3

Mamy nadzieję, iż przytoczone dwa przykłady przekonały Czytelników, że średnia arytmetyczna, mimo swoich wielu dobrych własności, nie nadaje się do uśredniania danych kierunkowych: nie tylko dlatego, że daje nieraz wyniki sprzeczne z intuicją, ale również z tego powodu, że jej wskazania są uwarunkowane przyjętym arbitralnie punktem odniesienia (kierunek zerowy) oraz sposobem nadawania wartości kątom. Zastanówmy się zatem, jak wyznaczać ,,typowy” (średni, przeciętny) kierunek?

O zaletach i wadach różnych rodzajów średnich pisaliśmy w  \(\Delta^{12}_{2014}\) .

Jak widać, dane kierunkowe (na płaszczyźnie) mogą być reprezentowane jako punkty na okręgu lub jako kąty. Pozycja każdej obserwacji może być więc jednoznacznie określona przez dwie współrzędne. I można to zrobić np. na następujące dwa sposoby. Przyjmując układ współrzędnych prostokątnych wyznaczonych przez dwie prostopadłe osie \(X\)\(Y,\) z początkiem w punkcie \(O\) (tj. w środku okręgu), usytuowanie danego punktu \(P\) zapiszemy jako \(P=P(x,y),\) gdzie \(x\)\(y\) będą rzutami prostokątnymi tego punktu, odpowiednio, na osie \(X\)\(Y.\) Zarazem miejsce położenia punktu \(P\) można określić w tzw. współrzędnych biegunowych, podając jego odległość \(r\) od środka okręgu (tzw. promień wodzący) oraz kąt \(\alpha\) między odcinkiem \(OP\) a wybraną osią (z reguły osią \(X\) ) . Obie reprezentacje są wzajemnie równoważne, tzn. współrzędne biegunowe można przekształcić na prostokątne i na odwrót (por. rys. 4). W szczególności, znając współrzędne biegunowe punktu \(P=P(r, \alpha),\) gdzie \(r>0,\) \(\alpha\in [0, 2\pi),\) współrzędne prostokątne tego punktu wyznaczamy ze wzorów \[\begin{cases} x = r\cos\alpha, \\ y = r\sin\alpha. \end{cases}\] Z kolei dla punktu \(P\) o współrzędnych prostokątnych \((x,y)\) promień wodzący tego punktu dostajemy z twierdzenia Pitagorasa, otrzymując \(r = \sqrt{x^2 + y^2},\) natomiast wartość kąta \(\alpha\) wyznaczamy z odpowiednio dostosowanej funkcji arcus tangens.

W szczególnym przypadku, gdy rozważany punkt pokrywa się z początkiem układu, tj. \(r = 0,\) kierunek \(\alpha\) nie jest zdefiniowany.

image

Rys. 4. Współrzędne prostokątne i biegunowe

W analizie danych kierunkowych wygodnie jest czasem postrzegać daną obserwację jako wektor o początku w punkcie \(O\) i końcu w punkcie \(P\) lub, w układzie biegunowym, jako parę uporządkowaną \((r, \alpha).\) A ponieważ w analizie danych kierunkowych interesuje nas kierunek, a nie długość wektora, więc przyjmujemy, że rozważane wektory mają długość jednostkową (czyli \(r = 1\) ). Tym samym przekształcenie współrzędnych biegunowych na prostokątne wyraża się następująco: \((1,\alpha) \iff (x=\cos\alpha, y=\sin\alpha).\)

Powróćmy teraz do zagadnienia uśredniania danych kierunkowych. Załóżmy, że mamy do czynienia z  \(n\) -elementową próbką danych kierunkowych \(P_1,\ldots,P_n.\) W świetle tego, co powiedziano powyżej, możemy myśleć o tych obserwacjach jak o zbiorze odpowiadających im kątów \(\alpha_1,\ldots,\alpha_n.\) Po przekształceniu współrzędnych z biegunowych na prostokątne naszą próbkę będziemy mogli zapisać w postaci \((\cos\alpha_1, \sin\alpha_1),\ldots,(\cos\alpha_n, \sin\alpha_n).\)

Utwórzmy teraz nowy wektor o współrzędnych otrzymanych przez uśrednienie, odpowiednio, pierwszych i drugich współrzędnych wektorów tworzących naszą próbkę. Tym sposobem otrzymamy tzw. wektor średni o współrzędnych \[(\overline{x},\overline{y}) = \bigg( \frac{1}{n}\sum_{i=1}^n \cos\alpha_i, \frac{1}{n}\sum_{i=1}^n \sin\alpha_i \bigg). \label{eq:ws}\tag{$\star$}\] Jest to oczywiście środek ciężkości wielokąta o wierzchołkach w punktach \((\cos\alpha_1, \sin\alpha_1),\ldots,(\cos\alpha_n, \sin\alpha_n).\) Średnią kołową \(\overline{\alpha}\) definiujemy teraz jako kątową współrzędną biegunową wektora \((\overline{x},\overline{y}).\) Oznacza to również, że jeśli \((\overline{x},\overline{y})=(0,0),\) to średnia kołowa nie jest dobrze zdefiniowana (i jest tak tylko w tym przypadku).

Przykład 2 (c.d.). Przekonajmy się, jaki wynik otrzymalibyśmy, podstawiając dane z przykładu 2. Przypomnijmy, że nasza próbka składa się z czterech punktów opisanych kątami: \(20^\circ,\) \(150^\circ,\) \(220^\circ\)\(330^\circ.\) W pierwszym kroku przekształcamy współrzędne obserwacji z biegunowych na prostokątne i dostajemy \[\begin{aligned} \big( \cos(20^\circ), \sin(20^\circ) \big) & \approx (0.94, 0.34), \\ \big( \cos(150^\circ), \sin(150^\circ) \big) & \approx (-0.87, 0.5), \\ \big( \cos(220^\circ), \sin(220^\circ) \big) & \approx (-0.76, -0.64), \\ \big( \cos(330^\circ), \sin(330^\circ) \big) & \approx (0.87, -0.5). \end{aligned}\] Otrzymane w poprzednim kroku wartości podstawiamy do wzoru \(\eqref{eq:ws}\) na współrzędne wektora średniego: \((\overline{x},\overline{y}) \approx (0{,}043, -0{,}075).\) Ponieważ \(\overline{x}>0\) oraz \(\overline{y}<0,\) więc kierunek tego wektora możemy wyznaczyć następująco: \[\overline{\alpha} = 2\pi - \arctan\left(\frac{|\overline{y}|}{\overline{x}}\right) =300^\circ\] Naszą próbkę wraz z wyznaczonym kierunkiem średnim (zaznaczonym kolorem czerwonym) pokazuje rysunek 5.

image

Rys. 5. Kierunki poruszania się żółwi i wyznaczona średnia kołowa \(\overline{\alpha}.\) Biały punkt odpowiada punktowi \((\overline{x},\overline{y}),\) czyli środkowi ciężkości wielokąta \(P_1P_2P_3P_4\)

Polecamy Czytelnikowi zastanowienie się, dlaczego w tym wypadku średnia kołowa wynosi dokładnie \(300^\circ.\)

W kontekście kłopotów omawianych w przykładach 1 i 2 warto byłoby przekonać się, czy średnia kołowa dla danego zestawu danych zależy od wyboru kąta zerowego lub od przyjętego kierunku obrotu.

Twierdzenie 1 . Średnia kołowa \(\overline{\alpha}\) wyznaczona na podstawie obserwacji kierunkowych danych kątami \((\alpha_1,\ldots,\alpha_n)\) ma następujące własności:

  1. jeśli \(\alpha_i=\alpha_0\) dla \(i=1,\ldots,n,\) to \(\overline{\alpha} = \alpha_0,\)

  2. dla dowolnego \(C\) średnia kątowa \(\overline{\alpha}'\) zbioru obserwacji \((\alpha_1+C,\ldots,\alpha_n+C)\) jest równa \(\overline{\alpha}+C,\)

  3. średnia kątowa \(\overline{\alpha}'\) zbioru obserwacji \((\alpha'_1,\ldots,\alpha'_n),\) gdzie \(\alpha'_i = 2\pi - \alpha_i,\) jest równa \(2\pi - \overline{\alpha}.\)

image

Rys. 6. Oryginalne dane kierunkowe oznaczone są na szaro, a dane po obróceniu o kąt \(C\) – kolorem. Wektor średni również ulega obróceniu o kąt \(C,\) więc o tyle zmienia się średnia kołowa

Zanim przejdziemy do uzasadnienia powyższego twierdzenia, zastanówmy się nad interpretacją poszczególnych własności (a)–(c). Pierwsza z nich to idempotencja typowa dla funkcji uśredniających, w myśl której średnia wyznaczona dla zbioru identycznych wartości jest równa tejże wartości. Własność (b) mówi, że średnia kołowa jest ekwiwariantna względem przesunięcia, tzn. że jeśli wszystkie kąty w zbiorze danych zostaną przesunięte o pewną stałą wartość \(C,\) to średnia kątowa \(\overline{\alpha}\) również zostanie przesunięta o tę samą wartość  \(C,\) a tym samym średnia kołowa nie zależy od wyboru kąta zerowego. Wreszcie wartość (c) oznacza, że średnia kołowa jest ekwiwariantna względem zmiany kierunku obrotu przyjętego do określania wartości kąta.

image

Rys. 7

Przejdźmy do uzasadnienia. Własność (a) jest oczywista i wynika wprost z idempotencji średniej arytmetycznej. Pozostałe własności są naturalną konsekwencją zachowania się środka ciężkości przy zastosowaniu podstawowych przekształceń geometrycznych. Punkt (b) wynika z tego, że po obróceniu wszystkich wektorów jednostkowych tworzących próbkę o dany kąt \(C\) wokół początku układu współrzędnych, wektor średni (czyli środek ciężkości wyznaczonego przez te wektory wielokąta) ulegnie temu samemu obrotowi (rys. 6). Punkt (c) ma dokładnie tę samą interpretację, przy czym tutaj zamiast obrotu rozpatrujemy odbicie symetryczne względem osi \(OX\) (rys. 7).

Należy zaznaczyć, że własności opisane w twierdzeniu 1 posiada również średnia arytmetyczna liczb rzeczywistych. Jednak średnia kołowa nie posiada pewnych własności średniej arytmetycznej. Przykładowo, w przypadku \(n\) obserwacji rozłożonych równomiernie na prostej ich średnia arytmetyczna jest równa wartości środkowej obserwacji, gdy \(n\) jest nieparzyste, lub średniej arytmetycznej z dwóch środkowych obserwacji, gdy \(n\) jest parzyste. Tymczasem dla zbioru obserwacji rozłożonych równomiernie na okręgu średnia kołowa nie istnieje, gdyż ze względu na symetrię konfiguracji wektor średni jest wektorem zerowym.

Porównując niektóre własności średniej arytmetycznej i średniej kołowej, warto przywołać pewną cechę, dzięki której średnia arytmetyczna jest postrzegana jako wielkość dobrze reprezentująca dany zbiór obserwacji na prostej. Otóż, jak wiadomo, średnia arytmetyczna minimalizuje sumę kwadratów różnic od poszczególnych obserwacji. W prosty sposób wynika to z następującej tożsamości: \[\sum_{i=1}^n (x_i - a)^2= \sum_{i=1}^n ( x_i-\overline{x} )^2 + n(\overline{x}-a)^2, \textrm{ gdzie $\overline{x}=\frac{1}{n}\sum_{i=1}^n x_i,$}\] której weryfikację pozostawiamy Czytelnikom. Czy tego typu związek istnieje dla danych kierunkowych i średniej kołowej? Okazuje się, że tak, tyle że kwadrat odległości euklidesowej trzeba zastąpić przez tzw. odległość kosinusową , daną wzorem \(d(\alpha,\beta)=1-\cos(\alpha-\beta).\) Prawdziwe jest bowiem następujące twierdzenie:

Odległość kosinusowa \(d(\alpha,\beta)\) przyjmuje najmniejszą wartość równą 0 tylko, jeśli \(\alpha=\beta.\) Należy jednak zaznaczyć, że odległość kosinusowa nie spełnia nierówności trójkąta, nie jest zatem odległością w ogólnym, matematycznym rozumieniu.

Twierdzenie 2 . Niech \(\overline{\alpha}\) będzie średnią kołową wyznaczoną na podstawie obserwacji kierunkowych danych kątami \((\alpha_1,\ldots,\alpha_n).\) Wówczas \[\overline{\alpha} = \operatorname{arg\,min}_{\beta\in [0,2\pi)} \sum_{i=1}^n \big[ 1 -\cos (\alpha_i - \beta) \big].\]

Uzasadnienie, wykorzystujące równość \(\cos(\alpha-\beta)=\cos\alpha\cos\beta+\sin\alpha\sin\beta\) oraz podstawowy rachunek różniczkowy, ponownie pozostawiamy Czytelnikom.

Do tej pory koncentrowaliśmy się na średniej kołowej, czyli kierunku wektora średniego \((\overline{x},\overline{y}).\) Rozważmy teraz jego długość \(R=\sqrt{\overline{x}^2+\overline{y}^2}.\) Okazuje się, że ma ona ciekawą interpretację, stanowiąc przydatny miernik skoncentrowania danych wokół średniej kątowej. Jak już zauważyliśmy, w przypadku danych rozłożonych równomiernie na okręgu mamy \(R=0,\) co nie dziwi, gdyż w tym przypadku nie istnieje średnia kołowa, a więc trudno byłoby oczekiwać skoncentrowania obserwacji wokół tej średniej. Z kolei dla zbioru identycznych wartości otrzymujemy \(R=1,\) czyli maksymalną możliwą wartość tego parametru, co również nie dziwi, bowiem wszystkie obserwacje są równe średniej kołowej. Dla przypadków pośrednich między całkowitą koncentracją wokół średniej kołowej a brakiem owej koncentracji wielkość \(R\) przyjmuje wartości z przedziału \((0,1).\) Przykładowo, dla danych z przykładu 1 mamy \(R=0{,}9848,\) co potwierdza ich duże skoncentrowanie wokół kierunku średniego, zaś dla obserwacji z przykładu 2 otrzymujemy \(R=0{,}0875,\) co oznacza bardzo małą koncentrację wokół średniej kołowej.

W analizie danych kierunkowych wykorzystuje się również wielkość \[V = 1-R,\] będącą miarą rozrzutu, która jest traktowana jako odpowiednik wariancji próbkowej i bywa nazywana wariancją kołową . W przeciwieństwie do klasycznej wariancji próbkowej \(V\) jest miarą unormowaną , tzn. taką, której największa możliwa wartość to 1, przy czym wartości \(V\) bliskie zeru oznaczają małe rozproszenie, podczas gdy wartości bliskie 1 świadczą o dużym rozrzucie obserwacji.

Na zakończenie dodajmy, że poruszone w niniejszym artykule zagadnienia dotyczą jedynie wstępnego opisu danych kierunkowych, których dalsza i bardziej zaawansowana analiza pozwala wyciągać ogólne wnioski na podstawie dostępnych obserwacji. Ale to jest już materiał na odrębną opowieść.