2. Über einen Satz
der Wahrscheinlichkeitsrechnung und seine
Anwendung in der Strahlungstheorie;
von A. Einstein und L. Hopf.

----------

§ 1. Das physikalische Problem als Ausgangspunkt.

Will man in der Theorie der Temperaturstrahlung irgend
eine Wirkung der Strahlung berechnen, etwa die auf einen
Oszillator wirkende Kraft, so verwendet man dazu stets als
analytischen Ausdruck für die elektrische oder magnetische
Kraft Fouriersche Reihen der allgemeinen Gestalt

 sum               -t                t-
   nA n sin 2 p nT  + Bn  cos 2 p n T .

Hierbei ist das Problem gleich auf einen bestimmten Raum-
punkt spezialisiert, was für das Folgende ohne Bedeutung
ist, t bedeutet die variable Zeit, T die sehr große Zeitdauer,
für welche die Entwickelung gilt. Bei der Berechnung irgend-
welcher Mittelwerte -- und nur solche kommen in der Strahlungs-
theorie überhaupt vor -- nimmt man die einzelnen Koeffi-
zienten An, Bn als unabhängig voneinander an, man setzt voraus,
daß jeder Koeffizient unabhängig von den Zahlenwerten der
anderen das Gauss sche Fehlergesetz befolge, so daß die
Wahrscheinlichkeit1) dW einer Kombination von Werten A n, Bn
sich aus den Wahrscheinlichkeiten der einzelnen Koeffizienten
einfach als Produkt darstellen müsse.

d W  = WA   .WA   ... WB   .WB   ... dA1 ... dB1 ...
          1      2       1     2
(1)

Da bekanntlich die Strahlungslehre, so wie sie exakt aus
den allgemein anerkannten Fundamenten der Elektrizitäts-
----------

1) Unter ,,Wahrscheinlichkeit eines Koeffizienten“ ist offenbar
folgendes zu verstehen: Wir denken uns die elektrische Kraft in sehr
vielen Zeitmomenten in Fourier sche Reihen entwickelt. Derjenige
Bruchteil dieser Entwickelungen, bei welchem ein Koeffizient in einem
bestimmten Wertbereich liegt, ist die Wahrscheinlichkeit dieses Wert-
bereiches des betreffenden Koeffizienten.

theorie und der statistischen Mechanik folgt, in unlösbare Wider-
sprüche mit der Erfahrung führt, liegt es nahe, dieser ein-
fachen Annahme der Unabhängigkeit zu mißtrauen und ihr die
Schuld an den Mißerfolgen der Strahlungstheorie zuzuschreiben.

Im folgenden soll nun gezeigt werden, daß dieser Ausweg
unmöglich ist, daß sich vielmehr das physikalische Problem
auf ein rein mathematisches zurückführen läßt, das zum
statistischen Gesetze (1) führt.

Betrachten wir nämlich die aus einer bestimmten Rich-
tung herkommende1) Strahlung, so hat diese gewiß einen höheren
Grad von Ordnung, als die gesamte in einem Punkte wirkende
Strahlung. Die Strahlung aus einer bestimmten Richtung
können wir aber immer noch auffassen als von sehr vielen
Emissionszentren herrührend, d. h. wir können die Fläche,
welche die Strahlung aussendet, noch in sehr viele unabhängig
voneinander ausstrahlende Flächenelemente zerlegen; denn der
Entfernung dieser Fläche vom Aufpunkt sind ja keine Grenzen
gesteckt, also auch nicht ihrer gesamten Ausdehnung. In
diese von den einzelnen Flächenelementen herrührenden Strah-
lungselemente führen wir wieder ein höheres Ordnungsprinzip
ein, indem wir diese Strahlungselemente alle als von gleicher
Form und nur durch eine zeitliche Phase verschieden auf-
fassen; mathematisch gesprochen: die Koeffizienten der Fourier-
schen Reihen, welche die Strahlung der einzelnen Flächenele-
mente darstellen, seien für alle Flächenelemente dieselben, nur
der Anfangspunkt der Zeit von Element zu Element verschie-
den. Können wir Gleichung (1) unter Zugrundelegung dieser
Ordnungsprinzipien beweisen, so gilt sie a fortiori für den
Fall, daß man diese Ordnungsprinzipien fallen läßt. Be-
zeichnet der Index s das einzelne Flächenelement, so erhält
die dort ausgesandte Strahlung die Form:

 sum                 t---ts-
  (n) an sin 2p n   T   .

Die gesamte von uns betrachtete Strahlung wird also dar-
gestellt durch die Doppelsummen:

            (                                                )
 sum s   sum n a    sin 2p n t-cos 2 pn ts - cos 2p n t-sin 2p n ts  .
          n            T          T             T          T
(2)

----------

1) genauer; ,,einem bestimmten Elementarwinkel dx entsprechende“
Annalen der Physik. IV. Folge. 38.

Vergleichung von (2) und (1) führt also zu den Ausdrücken:

             sum            ts
{  An =  an   s cos 2 pn T  ,
             sum            ts
   Bn =  an    n sin 2 pn -- ,
                         T
(3)

n ist eine sehr große Zahl, ts kann jeden Wert zwischen 0
und T annehmen, die einzelnen Summanden

cos 2p n ts  bzw.   sin 2 pn ts
         T                  T

liegen also regellos zwischen -1 und +1 verteilt und sind
gleich wahrscheinlich positiv wie negativ. Können wir für
eine Kombination von Summen solcher Größen allgemein die
Gültigkeit unserer Gleichung (1) nachweisen, so ist damit auch
die Unmöglichkeit erwiesen, irgend ein Ordnungsprinzip in die
im leeren Raum sich ausbreitende Strahlung einzuführen.

§ 2. Formulierung des allgemeinen mathematischen Problems.

Wir stellen uns also folgendes mathematische Problem:
Gegeben ist eine sehr große Anzahl von Elementen, deren
Zahlenwerte a ein bekanntes statistisches Gesetz befolgen
(entsprechend den ts). Von jedem dieser Zahlenwerte werden
gewisse Funktionen f1 (a) f2 (a)... gebildet (entsprechend
                         )
sin 2 p n ts-n .cos 2p n ts
         T             T. Diese Funktionen müssen wir
noch einer Einschränkung unterwerfen: Es ergibt sich nämlich
aus der Wahrscheinlichkeit, daß eine der Größen a zwischen
a + da liegt, ein statistisches Gesetz für die f; die Wahr-
scheinlichkeit f(f) df, daß f einen Zahlenwert zwischen f
und f + df habe, sei nun stets eine solche Funktion, daß der
Mittelwert

      + integral  oo 
f-=     f f (f) df =  0.

    - oo

(Es ist leicht einzusehen, daß unsere Funktionen sin und cos
wirklich diese Voraussetzung erfüllen; denn wenn jeder Wert
von ts zwischen 0 und T gleich wahrscheinlich ist, verschwinden
die Mittelwerte sin 2 p nts
--
T und ---------ts-)
cos 2 p n-- .
          T

Wir fassen nun eine (sehr große) Anzahl Z solcher Ele-
mente a zu einem System zusammen. Zu einem derartigen
System gehören bestimmte Summen

 sum                sum 
    (Z)f1(a),       (Z)f2(a) ...

(entsprechend den Koeffizienten An/ an, Bn/ an). Wir stellen
uns die Aufgabe, das statistische Gesetz zu ermitteln, welches
eine Kombination dieser Summen befolgt.

Zunächst müssen wir über einen prinzipiellen Punkt Klar-
heit schaffen:

Das statistische Gesetz, das die Summen  sum selbst be-
folgen, wird gar nicht von der Anzahl Z der Elemente un-
abhängig sein. Das können wir leicht an dem einfachen
Spezialfall sehen, daß f(a) nur die Werte +1 und -1 an-
nehmen könne. Dann ist offenbar:

 sum           sum 
   (Z+1) =    (Z)± 1

und

 sum ------    sum ----
    2    =     2 +  1.
   (Z+1)      (Z)

Der quadratische Mittelwert der Summe wächst also pro-
portional mit der Anzahl der Elemente. Wollen wir also zu
einem von Z unabhängigen statistischen Gesetze gelangen, so
dürfen wir nicht die  sum betrachten, sondern, da  sum 2/ Z kon-
stant bleibt, die Größen

       sum 
     ----
S =   V~ --.
       Z

§ 3. Statistisches Gesetz der einzelnen S.

Ehe wir nun eine Kombination aller Größen

        sum 
S(n) = --(Z) V~ fn(a)-
             Z

untersuchen, wollen wir das Wahrscheinlichkeitsgesetz einer
einzelnen solchen Größe aufstellen.

Wir betrachten eine Vielheit von N-Systemen der oben
definierten Art. Zu jedem System gehört ein Zahlenwert S.
Diese Größen befolgen wegen der statistischen Verteilung der a
ein gewisses Wahrscheinlichkeitsgesetz, so daß die Anzahl der
Systeme, deren Zahlenwert zwischen S und S + dS liegt:

dN  = F  (S) d S .
(4)

Fügen wir nun zu den aus Z-Elementen bestehenden Systemen
noch je ein weiteres Element, d. h. gehen wir von SZ zu SZ+1
über, so werden die einzelnen Glieder unserer Vielheit ihren
Zahlenwert ändern und in ein anderes Gebiet dS einrücken.
Wenn es trotzdem möglich sein soll, zu einem von Z unab-
hängigen statistischen Gesetz zu gelangen, so darf sich bei
diesem Übergang die Anzahl dN nicht ändern. Es muß also
in ein bestimmtes (in unserem einfachsten Fall eindimensionales)
Gebiet dS die gleiche Anzahl von Systemen ein- wie austreten.
Bezeichnet P die Zahl der Systeme, welche vom Übergang
von Z zu Z + 1 Elementen einen gewissen Zahlenwert S0 durch-
schreiten und zwar sowohl der Größe wie der Richtung nach,
so muß:

divP  = 0,
(5)

also

d P
----=  0
d S

und, da ja P für S =  oo jedenfalls gleich 0 sein muß, auch

P = 0 .
(6)

Nun ist:

          sum                   V~ -------
           (Z+1)f (a)            Z       f(a)
S(Z+1) = -- V~ -------- = S(Z)   ------+  V~ ------ ,
             Z +  1            Z + 1     Z  + 1

oder, da Z eine sehr große Zahl sein soll:

                S(Z)   f(a)-
S(Z+1) = S(Z)-  2Z  +   V~ -- .
                         Z
(7)

Die Anzahl P setzt sich also aus zwei Teilen zusammen,
einem P1, der vom Summanden -S/ 2 Z und einem P2, der
von f(a)/  V~ --
  Z herrührt.

P1 enthält alle diejenigen S, welche in einem positiven
Abstand <= S0/2 Z vom Werte S0 gelegen waren; und zwar
durchschreiten diese Glieder S0 in negativer Richtung. Ihre
Anzahl ist, da S0/ 2 Z eine sehr kleine Zahl ist, bis auf un-
endlich kleine Größen höherer Ordnung:

P  = - -S0-F (S ) .
 1     2 Z     0
(8)

Zur Anzahl P2 kommt ein Beitrag aus jeder beliebigen posi-
tiven und negativen Entfernung D von S0, und zwar ein

positiver oder negativer Beitrag, je nachdem D negativ oder
positiv ist. In der Entfernung D ist die Anzahl dN gegeben
durch

F (S0 + D) dS =  F (S0 + D) d D ,

oder, da doch nur kleine Werte von D ins Gewicht fallen, durch

{            (    )   }
               dF--
  F (S0) + D   dD       dD  .
                    S0

Von dieser Anzahl durchqueren alle diejenigen den Wert S0
in positiver Richtung, die, von einem negativen D herkommend,
ein so großes f(a) haben, daß

f(a)
 V~ --->=  |D | ,
  Z

also die Anzahl

  + integral o o 

    f (f )df .
-D V~ Z-

In der negativen Richtung geht analog die Anzahl

   V ~ -
 -D integral   Z
    f (f) df .

- oo

So wird:

              {                     }
        integral 0                 (d F )       integral + oo 
P2 =      dD   F  (S0) + D   ----          f (f)d f
                            d D   S0     V~ -
     -  oo                             - D V~ -Z
       integral  oo   {            (    )   } - integral D Z
                          d-F-
   -    dD   F  (S0) + D   d D           f (f)d f .
     0                          S0  -  oo

Durch partielle Integration geht dies über in:

         integral 0   {                 (    )   }   (       )
                            D2-   dF--           V ~ --   V~ --
P2 = -    d D   D .F (S0) +  2    dD       f  - D   Z  .  Z
       - oo                              S0
        integral  oo    {               2(     )  }   (        )
     -    dD   D  .F (S ) + D--  d-F-      f  - D V~ Z-  . V~ Z-.
                       0     2   d D   S
       0                               0

Da nun nach Voraussetzung

  + integral  oo 
    f f(f )df =  0

- oo

wird, wenn wir D V~ --
  Z = f als Variable einführen:

            1  (d F )    integral + oo 
   P 2 = - ----  ----      f 2f (f)d f
{          2Z    dD   S0
               (    )   - oo 
           -1--  dF--    --2
       = - 2 Z   dD     .f  .
                      S0
(9)

(8) und (9) in (6) eingesetzt, ergeben die Differentialgleichung:

      ---d F
S F + f 2----=  0,
         d S

deren Lösung:

            - S22
F  = const.e  2f ,
(10)

das Gausssche Fehlergesetz ausspricht.

§ 4. Statistisches Gesetz einer Kombination aller S(n).

Wir dehnen nun die Betrachtungen des vorigen Paragraphen
vom eindimensionalen Fall auf den beliebig vieler Dimen-
sionen aus. Wir haben diesmal eine Kombination von vielen
Größen S(n) zu betrachten. Die Anzahl der in einem un-
endlich kleinen Gebiete dS(1) dS(2)... liegenden Systeme sei:

         (  (1)   (2)  )    (1)   (2)
d N  = F  S   , S   ... dS   d S   ...
(11)

Wieder fordern wir, daß dN sich nicht ändern soll, wenn wir
von S(Z) (n) zu S(Z+1) (n) übergehen, wieder führt dies zu der Diffe-
rentialgleichung (5)

div P = 0 .

Nur hat die Anzahl P in unserem jetzigen Fall Komponenten
in jeder Richtung S(1), S(2)..., die wir mit P(1), P(2)... be-
zeichnen wollen. (5) nimmt also die Gestalt an

        (n)
 sum    @-P---
   n @ S(n) = 0.

Zwischen S(Z) (n) und S(Z+1) (n) besteht, wie früher Gleichung (7),
daher bleiben die Betrachtungen des vorigen Paragraphen
vollkommen gültig zur Berechnung der einzelnen P(n). Es
wird also

                ---@ F
P(n) = S(n)F +  f2n------
                  @ S(n)

Wir können diesen Ausdruck noch vereinfachen, indem wir
alle fn2 als gleich annehmen. Dies kommt ersichtlich nur
darauf hinaus, daß wir die einzelnen Funktionen fn mit passen-
den Konstanten multipliziert denken. (Im speziellen Fall
unserer sin und cos ist diese vereinfachende Annahme von
selbst erfüllt.)

So erhalten wir schließlich für die Funktion F die Diffe-
rentialgleichung:

 sum      @   (         --- @ F )
   n ---(n)  S(n)F  + f2----(n)   = 0.
     @ S               @ S
(12)

Zur Lösung dieser Differentialgleichung führt uns die Be-
trachtung des über den ganzen Raum erstreckten Integrals:

     integral      sum n1 { (        ---      )2}
       -1    n    S(n)F + f 2-@ F--    d S(1) ...dS(n1)
       F   0                 @ S(n)
{     integral  n1  { (                 ) (                 )}
        sum         (n)     -2-@-F--     (n)  --2@-log-F--      (1)      (n1)
  =       n    S   F +  f @ S(n)    S   + f   @ S(n)    d S   ...dS    .
        0
(13)

Nun ist aber:

   integral   sum n1 { (        --- @ F  )     }
        n    S(n)F + f 2---(n)  S(n)  dS(1)...d S(n1)
      0                 @ S
   integral  (    sum n1            sum n1            )
=      F    nS(n)2 + f2-   n S(n)-@-F--  dS(1)...d S(n1),
                                 @ S(n)
          0              0

oder wenn wir den zweiten Summanden partiell integrieren
und bedenken, daß im Unendlichen F = 0 sein muß,

        (                   )
    integral      sum n1   (n)2  ---         (1)      (n )
=    F      n S    - f 2 .n1  dS   ...d S  1 .
           0

Dieser Ausdruck verschwindet aber, weil

 integral 
   F S(n)2d S(1)...d S(n1)

nichts anderes ist, als der im letzten Paragraphen abgeleitete
Mittelwert S(n)2, falls nur ein einziges S betrachtet wird; für
diesen folgt aus Gleichung (10)

---  ---
S2 = f2 .

Andererseits wird durch partielle Integration:

         { (                  )           }
    integral   sum       (n)    --- @ F    ---@ log F       (1)      (n )
             S  F  + f2 ---(n)  f2 ----(n)--  dS   ...d S  1
    integral              (     @ S(         @ S      )}
     --2       sum     --@---   (n)    -2--@-F--      (1)      (n1)
=    f  log F       @ S(n)  S   F + f  @ S(n)   d S   ...d S    ,

was nach Gleichung (12) ebenfalls verschwindet.

Somit ist erwiesen, daß das Integral (13) verschwindet;
dies ist aber wegen des quadratischen Charakters des Inte-
granden nur möglich, wenn überall für jedes n gilt:

        ---
S(n)F + f 2-@-F-- = 0.
           @ S(n)
(14)

So gelangen wir also für F zu einem statistischen Gesetz,
welches in bezug auf jedes S(n) mit dem Gaussschen Fehler-
gesetz identisch ist:

                2       2
            - S(21f)2- - S(22f)2-
F =  const.e     .e      .
(15)

Die Wahrscheinlichkeit einer Kombination von Werten S(n)
setzt sich also einfach als Produkt aus den Wahrscheinlich-
keiten der einzelnen S(n) zusammen.

Es ist klar, daß, wenn für S(1), S(2)... die Gleichung (15)
gilt, dieselbe Gleichung für eine Kombination von Größen

S(n)'= a  S(n)
         n

erfüllt ist. In diesem Falle tritt statt f2 die Größe a p2 f2
in die Exponenten ein. Von der Art der S(n)' sind aber die
Koeffizienten A n, Bn unseres physikalischen Problems; und
zwar ist

  (n)      An
S    = --V ~ ---,
       an   Z

also

a  =  a  V~  Z-
  n    n

zu setzen.

Somit ist auch die Gültigkeit der Gleichung (1) und die
Unmöglichkeit erwiesen, eine wahrscheinlichkeits-theoretische
Beziehung zwischen den Koeffizienten der die Temperatur-
strahlung darstellenden Fourierreihe aufzustellen.

(Eingegangen 29. August 1910.)

----------