Załączniki: Materiały uzupełniające artykuł
Dlaczego elektrony nie spadają na jądra atomowe? – to pytanie było jednym z ważniejszych zagadnień fizyki XX wieku. Jak wiadomo, elektrony mają ładunek ujemny, zaś jądra atomowe (dzięki protonom) ładunek dodatni, więc zgodnie z prawem Coulomba bardzo chętnie się przyciągają, a jednak nie łączą się i nie tworzą (w bardzo spektakularny sposób) neutronów. Jedną z prób odpowiedzi na pytanie, dlaczego tak się dzieje, był zaproponowany przez Ernesta Rutherforda, a udoskonalony i rozpowszechniony przez Nielsa Bohra „model planetarny”, według którego elektrony krążyły wokół jądra niczym planety wokół Słońca. Niestety ta propozycja była wadliwa z następującego powodu: ładunek, okrążając jądro, podlega sile dośrodkowej, a więc porusza się z przyspieszeniem, co zgodnie z prawem Larmora oznacza, że musi promieniować, tzn. przerabiać energię na fotony. Co najciekawsze, Niels Bohr był w pełni świadom tego problemu, ponieważ Joseph Larmor opublikował swój wzór wiążący emisję promieniowania z przyspieszeniem ładunku pod koniec XIX wieku, a więc kilkanaście lat wcześniej. Aby rozwiązać ten problem, Bohr dodał następujący postulat: owszem, przyspieszane elektrony promieniują, ale wokół jądra atomowego istnieją „specjalne” orbity, na których elektron pozostaje stabilny i nie promieniuje, natomiast gdy zmienia tę orbitę, to musi albo wypromieniować energię równą różnicy energii odpowiadającym orbitom (gdy przechodzi z wyższej orbity na niższą), albo zaabsorbować energię równą wspomnianej różnicy (gdy przechodzi z niższej orbity na wyższą). Tym sposobem zostało upieczonych kilka pieczeni na jednym ogniu. Po pierwsze, domknięto model planetarny atomu, uwzględniając istnienie jedynie określonych, stabilnych orbit elektronów – co zresztą Bohr już wcześniej przeczuwał. Po drugie, w pewnym sensie udało się pogodzić ten model z opisanym przez Einsteina efektem fotoelektrycznym, który dotyczył przekazywania energii elektronom poprzez oświetlanie ich światłem. Wszystko pięknie i ładnie, ale czy powyższe obserwacje i założenia dają się włożyć w jakieś matematyczne ramy i czy możliwe jest uzyskanie tych samych rezultatów „na papierze”? Był to dość poważny problem, który udało się rozwiązać za pomocą nowo powstałej gałęzi fizyki: mechaniki kwantowej, której formalizm jest ściśle związany z również świeżo upieczoną analizą funkcjonalną – warto wspomnieć, że jednym z ojców tej ostatniej był wybitny polski matematyk Stefan Banach. Co więcej, rozwój mechaniki kwantowej był motywacją do rozwoju wielu aspektów analizy funkcjonalnej, np. teorii operatorów.
Dla wyjaśnienia, jak cały ten problem wygląda z teoretycznego punktu widzenia, trzeba parę słów napisać o samej mechanice kwantowej. Otóż w mikroświecie bardzo trudno jest mówić np. o położeniu, dlatego używa się pojęcia prawdopodobieństwa znalezienia danej cząstki w danym miejscu. Informacja o prawdopodobieństwie zakodowana jest w tzw. funkcji falowej. Właściwą funkcję opisującą dany układ fizyczny znajduje się, rozwiązując równanie Schrödingera. Niestety nie jest to wcale takie proste, niemniej w przypadku atomu wodoru, którego jądro jest po prostu protonem, daje się ten problem rozwiązać ściśle. Znalezione w ten sposób rozwiązania (funkcje falowe) numerowane są liczbami naturalnymi i odpowiadają pewnym wyróżnionym (dyskretnym) poziomom energetycznym. Funkcje te opisują więc coś w rodzaju wyróżnionych orbit (zwanych orbitalami). Na tym można by skończyć cały wywód, ale okazuje się, że sprawa jest o wiele ciekawsza. Przede wszystkim dlatego, że tylko dla atomu wodoru równanie Schrödingera daje się analitycznie rozwiązać, gdyż dołożenie dodatkowych protonów i elektronów (by opisać choćby atom helu, który ma dwa protony i dwa elektrony) diametralnie komplikuje całą sytuację, zatem trzeba spróbować ugryźć ten problem inaczej. Jak już było wspomniane, w przypadku atomu wodoru mamy dopuszczalne orbity i odpowiadające im energie, a dokładniej, im niższa orbita, tym niższa energia. Warto wspomnieć, że wartość tych energii jest ujemna, co odpowiada za fakt „związania” elektronu z jądrem. Pierwszej orbicie odpowiada energia \(E_1=-13{,}6 \,{\rm eV },\) natomiast \(n\)-tej orbicie odpowiada energia \(E_n=E_1/n^2.\) Czyli w miarę wzrostu \(n\) energia zbliża się do zera. Oznacza to, że gdyby elektronowi będącemu na pierwszej orbicie dostarczyć energię \(+13{,}6 \,{\rm eV }\) (lub większą), to stałby się swobodny (lub „uciekłby”) i pozostałoby samo jądro. Z punktu widzenia problemu stabilności atomów najistotniejszy jest fakt istnienia skończonej minimalnej energii \(E_1,\) nazywanej energią stanu podstawowego. Właśnie ten aspekt jest kluczowy w opisie bardziej skomplikowanych układów, gdy niemożliwe jest ścisłe wyznaczenie rozwiązania, natomiast daje się stwierdzić, że energia nie może być mniejsza od pewnej skończonej wartości. Istnienie takiego ograniczenia gwarantuje istnienie stanu podstawowego, co nierozerwalnie wiąże się z tym, że elektrony nie mogą zejść niżej i spaść na jądro atomowe.
Rozwiązanie równania Schrödingera dla atomu wodoru znajduje się w każdym podręczniku wprowadzającym do mechaniki kwantowej, np. R.L. Liboff, Wstęp do Mechaniki Kwantowej, Wydawnictwo Naukowe PWN, Warszawa 1987.
Jednostka ,,\({\rm eV}\)” oznacza „elektronowolt”, czyli wartość energii, jaką uzyskałby pojedynczy elektron przyspieszony napięciem jednego wolta.
Zjawisko „wyrywania” elektronów z atomów nazywa się „elektryzowaniem” lub „jonizacją”. Uwalnianie elektronów z sieci krystalicznej poprzez świecenie, czyli de facto dostarczanie energii za pomocą fotonów, to właśnie wspomniany wcześniej efekt fotoelektryczny.
Dalsza część tego artykułu będzie poświęcona matematycznemu sformułowaniu problemu stabilności materii i szczególnie polecamy ją osobom znającym podstawy mechaniki kwantowej i analizy matematycznej, aczkolwiek osoby niewtajemniczone również zachęcamy do zapoznania się z tym zagadnieniem.
Czytelników zainteresowanych matematycznymi niuansami tego problemu zachęcamy do zapoznania się z dodatkowymi materiałami, które udostępniamy na stronie
deltami.edu.pl
Opisane są tam pewne dodatkowe szczegóły, które pozwolą na większe uściślenie naszych rozważań.
W mechanice kwantowej stan układu jest opisany wspomnianą wcześniej funkcją falową \(\psi = \psi(x,y,z)\) (w dalszej części będziemy pomijać zapis argumentów) o wartościach w liczbach zespolonych. Kwadrat modułu tej funkcji jest rozkładem prawdopodobieństwa znalezienia elektronu. Całka z tego rozkładu po całej przestrzeni musi być równa jeden, stąd żądanie, aby funkcja falowa spełniała równanie: \[\tag{1} \label{norm} \|\psi\|_2=\bigg[ \int_{\mathbb R^3} |\psi|^2 \, \text{d}x \text{d}y\text{d}z\bigg]^{1/2}= 1,\] \(\|\psi\|_2\) nazywamy normą funkcji \(\psi,\) przestrzeń wszystkich funkcji o skończonej normie oznaczamy \(L^2(\mathbb R^3).\) Nadmienimy tutaj, że taka norma jest szczególnym przypadkiem normy \(\|\psi\|_p,\) w której to funkcja \(\psi\) jest całkowana z potęgą \(p,\) a z wyniku wyciągany jest pierwiastek \(p\)-tego stopnia, dla \(p\) niekoniecznie równego \(2.\) Lada chwila zobaczymy, że takie normy dla odpowiednio wybranych wartości \(p\) będą bardzo użyteczne.
Przestrzeń wszystkich funkcji o skończonej normie to zbiór wszystkich możliwych stanów układu kwantowego. W mechanice kwantowej mówimy o operatorach na tej przestrzeni i ich wartościach oczekiwanych. Mierzalnym wielkościom fizycznym w rozpatrywanym układzie (obserwablom) odpowiadają tzw. operatory hermitowskie na tej przestrzeni. Bez wnikania w szczegóły, do naszych rozważań wystarczy wiedzieć, że wartość oczekiwana operatora hermitowskiego jest zawsze liczbą rzeczywistą (pomimo tego, że funkcje falowe mają wartości zespolone). Wartość oczekiwaną możemy uważać za uśrednioną wartość wielu pomiarów tej samej wielkości w tym samym stanie układu. Szczególnie będzie nas interesowała wartość średnia energii, czyli wartość oczekiwana operatora energii \(H\) zwanego hamiltonianem. Najbardziej powszechną jego postacią jest \[\tag{2} H = T + V\, , \label{ham}\] gdzie \(T\) jest energią kinetyczną, z kolei \(V\) jest energią potencjalną. W przypadku atomu wodoru jest to potencjał Coulomba: \[\tag{3} V = -\frac{\alpha}{r}\, , \label{VC}\] gdzie \(r = \sqrt{x^2 + y^2 + z^2},\) zaś \(\alpha\) to dodatnia stała o jednostce \(\rm[J\cdot m].\)
Operator \(A\) działa na funkcję falową i w wyniku zwraca również funkcję falową. Wartość oczekiwana operatora \(A\) na funkcji \(\psi\) jest zdefiniowana jako: \[\langle A \rangle_\psi=\int_{\mathbb{R}^3}\overline{\psi}A\psi\, \text{d}x \text{d}y\text{d}z.\]
Dla zaspokojenia ciekawości Czytelnika Dociekliwego dodamy, że \(T = -\frac{\hbar^2}{2m}\Delta,\) gdzie \(\Delta\) oznacza laplasjan, \(\hbar\) to zredukowana stała Plancka, zaś \(m\) jest stałą o wymiarze masy.
Rzecz jasna znalezienie konkretnej wartości infimum zdefiniowanego w \(\eqref{GSE}\) to problem znacznie trudniejszy niż wykazanie jego istnienia. Znajdowanie tego typu infimów to ważny temat badawczy współczesnej analizy funkcjonalnej.
Możemy teraz matematycznie sformułować problem stabilności materii: pytamy, czy energia, zdefiniowana jako wartość oczekiwana hamiltonianu w stanie \(\psi\) (oznaczana jako \(\langle H \rangle_{\psi}\)), jest ograniczona z dołu. Równoważnie możemy zapytać, czy posiada skończone infimum, zwane też kresem dolnym: \[\tag{4} \label{GSE} E_0 = \inf_{\psi} \langle H \rangle_{\psi} > -\infty\, .\] Okazuje się, że odpowiedź na to pytanie, a nawet na nieco ogólniejsze (tzn. dla szerszej klasy potencjałów niż potencjał Coulomba \(\eqref{VC}\)), jest twierdząca i można ją uzasadnić już za pomocą kilku narzędzi prezentowanych podczas niektórych kursów z analizy matematycznej, co pokażemy poniżej.
Zgodnie ze wzorem \(\eqref{ham}\) możemy rozdzielić wartość oczekiwaną \(\langle H \rangle_\psi\) na część kinetyczną i potencjalną jako \[\tag{5} \langle H \rangle_\psi = \langle T \rangle_\psi + \langle V \rangle_\psi.{}\] Faktem jest, że energia kinetyczna jest nieujemna, co oznacza, że główna przeszkoda w rozwiązaniu problemu dotyczy energii potencjalnej. Analiza upraszcza się jeszcze bardziej, ponieważ każdy potencjał możemy rozdzielić na część dodatnią \(V_+\) i ujemną \(V_-\) w następujący sposób: \[V= V_+ + (-V_-)\, ,\] gdzie \(V_+\) i \(V_-\) są funkcjami nieujemnymi. Nie będzie wielkim zaskoczeniem stwierdzenie, że energia pochodząca od \(V_+\) jest nieujemna, co oznacza, że zasadnicza część problemu ogranicza się do badania wartości oczekiwanej odpowiadającej części ujemnej potencjału \(\langle V_-\rangle_{\psi}.\)
Bardziej konkretnie, można sprawdzić, że \(\langle H \rangle_\psi = \int_{\mathbb{R}^3}\left(\frac{\hbar^2}{2m}\, |\nabla \psi|^2 + V |\psi|^2 \right) \, \text{d}x \text{d}y\text{d}z.\) To wyrażenie dla „dostatecznie porządnych” (czyli spełniających pewne warunki) potencjałów jest dobrze określone dla funkcji \(\psi\) należącej do przestrzeni Sobolewa \(H^1(\mathbb R^3).\)
Jak już było wspomniane, energia kinetyczna jest nieujemna, jednak możemy uzyskać bardzo specyficzne i użyteczne jej oszacowanie, wykorzystując nierówność Sobolewa. W efekcie dostajemy oszacowanie \[\langle T \rangle_\psi \ge c \|\psi\|^2_6,\] gdzie \(c > 0\) jest pewną stałą, zaś \(\|\psi\|_6\) znowu oznacza normę funkcji \(\psi,\) lecz inną niż poprzednio rozważana norma \(\|\psi\|_2.\) Musimy więc znaleźć sposób, żeby oszacować wartość oczekiwaną ujemnej części potencjału tak, aby również i w tym oszacowaniu pojawiła się norma \(\|\psi\|_6.\) Z pomocą przychodzi nam nierówność Höldera. Dzięki niej otrzymujemy oszacowanie \[\langle V_-\rangle_\psi \le \|V_-\|_{3/2}\|\psi\|_6^2,\] a więc oszacowanie z taką normą funkcji \(\psi,\) jaką chcieliśmy. Aby wykorzystać powyższą nierówność, musimy jednak wiedzieć, że norma \(\|V_-\|_{3/2}\) jest skończona, co nie jest prawdą dla wielu potencjałów. Co gorsza, nie jest to prawdą dla wspomnianego przez nas potencjału Coulomba \(\eqref{VC}\), więc powyższe rozważania nie pozwalają uzasadnić stabilności nawet atomu wodoru. Musimy więc działać sprytniej.
W wymiarze \(d=3\) nierówność Sobolewa głosi, że \(\|\nabla \psi\|_2 \ge C \|\psi\|_6\) dla pewnej stałej \(C > 0.\)
Nierówność Höldera mówi nam, że \(\|fg\|_1 \le \|f\|_p\|g\|_q\) dla \(p\) i \(q\) spełniających \(1/p + 1/q = 1.\) Tutaj wybieramy \(p = 3/2\) i \({q = 3}.\)
Remedium na tę bolączkę okazuje się następująca sztuczka, która, co ciekawe, pozwoli znacząco zredukować założenie o funkcji \(V_-.\) Załóżmy mianowicie, że funkcja \(V_-\) może być przedstawiona jako suma: \[\label{V_1+V_2} V_- = V_1 + V_2 \, ,\] gdzie \(V_1\) ma skończoną normę \(\|V_1\|_{3/2},\) a funkcja \(V_2\) jest ograniczona przez pewną stałą \(M > 0.\) Potencjał Coulomba \(\eqref{VC}\) daje się przedstawić w powyższej postaci, co można sprawdzić, biorąc \(V_1\) jako część tego potencjału leżącą w otoczeniu zera, a jako \(V_2\) dopełnienie tej części. Co więcej, powyższy rozkład funkcji \(V_-\) można wykonać tak, że norma \(\|V_1\|_{3/2}\) będzie tak mała, jak tylko chcemy. Odbędzie się to kosztem oszacowania stałej ograniczającej funkcję \(V_2,\) lecz dla naszego problemu nie będzie to stanowiło przeszkody w jego rozwiązaniu. W ostatecznym rozrachunku, biorąc normę \(\|V_1\|_{3/2}\) mniejszą niż stała \(c\) w oszacowaniu energii kinetycznej, otrzymujemy nierówność: \[\langle H \rangle_\psi \ge \langle T \rangle_\psi - \langle V_- \rangle_\psi \ge (c - \|V_1\|_{3/2})\|\psi\|_6^2 - M \ge -M,\] a zatem \(E_0 \geq -M.\) Tym sposobem dowód stabilności materii został zakończony.
Dla potencjału Coulomba rozkład ([V_1+V_2]) o żądanych własnościach dostajemy, biorąc dostatecznie mały wycinek przestrzeni wokół zera. Dla ogólnego potencjału możemy odwołać się do twierdzenia o zbieżności zmajoryzowanej.
Warto nadmienić, że z matematycznego punktu widzenia istnienie skończonego infimum \(E_0\) wcale nie implikuje istnienia konkretnej funkcji falowej związanej z tą energią! Może okazać się, że jest cała rodzina rozwiązań, dla których występuje ta sama energia (stan zdegenerowany), lub że takie rozwiązanie w ogóle nie istnieje, a znalezione infimum pełni rolę wartości granicznej.
Powyższe rachunki dotyczyły dość prostych modeli materii, jak choćby atomu wodoru. Pozostaje pytanie, czy można procedurę badania stabilności materii uogólnić do bardziej skomplikowanych układów, jak atomy inne niż wodór (gdzie trzeba uwzględnić odpychanie się elektronów), kryształy (gdzie pojawia się więcej jąder atomowych), a nawet materii relatywistycznej (gdzie energia ma bardziej skomplikowaną formułę). Okazuje się, że jest to możliwe, niemniej trzeba wprowadzić bardziej egzotyczne narzędzia matematyczne i bardziej zawiłe nierówności, o czym autorzy mają nadzieję opowiedzieć w niedalekiej przyszłości.