Teorema de extinción de Ewald y Oseen

De testwiki
Ir a la navegación Ir a la búsqueda

En óptica, el teorema de extinción de Ewald y Oseen, a veces denominado simplemente teorema de extinción, es un postulado que subyace a la comprensión común de fenómenos lumínicos como la dispersión (así como de la refracción, la reflexión y la difracción). Lleva el nombre de Paul Ewald y de Carl Wilhelm Oseen, quienes demostraron el teorema en medios cristalinos e isotrópicos, respectivamente, en 1916 y 1915.[1] Originalmente, el teorema se aplicaba a la dispersión de objetos dieléctricos isotrópicos en el espacio libre. El alcance del teorema se amplió enormemente para abarcar una amplia variedad de medios bianisotrópicos.[2]

Visión general

Una parte importante de la teoría de la física óptica es comenzar con la física microscópica (el comportamiento de los átomos y electrones) y utilizarla para "deducir" las familiares leyes macroscópicas de la óptica. En particular, existe una conexión entre cómo funciona el índice de refracción y de dónde proviene, a partir de la física microscópica. El teorema de extinción de Ewald-Oseen es una parte de esa deducción (al igual que la ecuación de Clausius-Mossoti y otras).

Cuando la luz que viaja en el vacío entra en un medio transparente como el vidrio, la luz se ralentiza, tal y como indica su índice de refracción. Aunque este hecho es conocido y familiar, en realidad es bastante extraño y sorprendente cuando se piensa en ello microscópicamente. Después de todo, según el principio de superposición, la luz en el cristal es una superposición de:

  • La onda de luz original, y
  • Las ondas de luz emitidas por los electrones oscilantes en el vidrio.

(la luz es un campo electromagnético oscilante que empuja los electrones hacia adelante y hacia atrás, emitiendo radiación dipolar).

Individualmente, cada una de estas ondas viaja a la velocidad de la luz en el vacío, no a la velocidad (más lenta) de la luz en el vidrio. Sin embargo, cuando se suman las ondas, sorprendentemente crean solamente una onda que viaja a menor velocidad.

El teorema de extinción de Ewald-Oseen dice que la luz emitida por los átomos tiene una componente que viaja a la velocidad de la luz en el vacío, lo que anula (extingue) exactamente la onda de luz original. Además, la luz emitida por los átomos tiene una componente que parece una onda que viaja a la velocidad más lenta de la luz en el vidrio. En total, la única onda en el cristal es la onda lenta, consistente con lo que se espera de la óptica básica.

Se puede encontrar una descripción más completa en el texto Classical Optics and its Applications, de Masud Mansuripur.[3] Por otro lado, la obra Principles of Optics, de Born y Wolf, incluye una demostración del teorema clásico,[1] y la de su extensión ha sido presentada por Akhlesh Lakhtakia.[2]

Obtención de las ecuaciones de Maxwell

Introducción

Cuando una onda electromagnética penetra en un medio dieléctrico, excita (hace resonar) los electrones del material, ya sea que estén libres o ligados, poniéndolos en un estado vibratorio con la misma frecuencia que la onda. Estos electrones, a su vez, irradiarán sus propios campos electromagnéticos como resultado de su oscilación (campos electromagnéticos de cargas oscilantes). Debido a la linealidad de las ecuaciones de Maxwell, se espera que el campo total en cualquier punto del espacio sea la suma del campo original y del campo producido por los electrones oscilantes. Sin embargo, este resultado es contrario a la intuición de la onda en el dieléctrico que se observa en la práctica, que se mueve a una velocidad de c/n, donde n es el índice de refracción medio. El teorema de extinción de Ewald-Oseen busca explicar este fenómeno, demostrando cómo la superposición de estas dos ondas reproduce el resultado familiar de una onda que se mueve a una velocidad de c/n.

Deducción

La siguiente es una deducción basada en un trabajo de Ballenegger y Weber.[4] Se parte de considerar una situación simplificada en la que una onda electromagnética monocromática normalmente incide sobre un medio que llena la mitad del espacio en la región z>0, como se muestra en la Figura 1.

Figura 1: El semiespacio z>0 es un material dieléctrico con susceptibilidad χ, y el semiespacio z<0 es el vacío

El campo eléctrico en un punto del espacio es la suma de los campos eléctricos debidos a todas las diversas fuentes. En el caso analizado, se separan los campos en dos categorías según sus fuentes generadoras. Se denota el campo incidente como

𝐄vac

y la suma de los campos generados por los electrones oscilantes en el medio atravesado como:

𝐄rad(z,t).

El campo total en cualquier punto z del espacio viene dado por la superposición de las dos contribuciones,

𝐄(z,t)=𝐄vac(z,t)+𝐄rad(z,t).

Para coincidir con las observaciones empíricas, 𝐄vac tiene esta forma. Sin embargo, ya se sabe que dentro del medio, z>0, solo se observa lo que se denomina el campo E transmitido 𝐄T, que viaja a través del material a la velocidad c/n.

Por lo tanto, con estas condiciones:

𝐄rad(z,t)=𝐄vac(z,t)+𝐄T(z,t)

Es decir, el campo radiado anula al campo incidente y crea un campo transmitido que viaja dentro del medio a velocidad c/n. Usando la misma lógica, fuera del medio el campo radiado produce el efecto de un campo reflejado 𝐄R que viaja con velocidad c en dirección opuesta al campo incidente:

𝐄rad(z,t)=𝐄vac(z,t)𝐄R(z,t)

Supóngase que la longitud de onda es mucho mayor que la separación promedio de los átomos, por lo que el medio puede considerarse continuo. Usando los campos macroscópicos E y B habituales y tomando el medio como no magnético y neutro, las ecuaciones de Maxwell toman la forma

𝐄=0𝐁=0×𝐄=𝐁t×𝐁=μ0𝐉+ϵ0μ0𝐄t

Tanto el campo eléctrico total como el campo magnético

𝐄=𝐄vac+𝐄rad,𝐁=𝐁vac+𝐁rad

se expresan según el conjunto de ecuaciones de Maxwell dentro del dieléctrico:

𝐄rad=0𝐁rad=0×𝐄rad=𝐁rad/t×𝐁rad=μ0𝐉+ϵ0μ0𝐄rad/t

donde 𝐉 incluye la corriente verdadera y de polarización inducida en el material por el campo eléctrico exterior. Se supone ahora una relación lineal entre la corriente y el campo eléctrico, y por lo tanto:

𝐉=σ(𝐄vac+𝐄rad)

El conjunto de ecuaciones de Maxwell fuera del dieléctrico no tiene término de densidad de corriente.

𝐄vac=0𝐁vac=0×𝐄vac=𝐁vac/t×𝐁vac=ϵ0μ0𝐄vac/t

Los dos conjuntos de ecuaciones de Maxwell están acoplados, ya que el campo eléctrico del vacío aparece en el término de densidad de corriente.

Para una onda monocromática con incidencia normal, el campo eléctrico del vacío tiene la forma:

𝐄vac(z,t)=𝐄vacexp[i(kzωt)],

con k=ω/c.

Ahora, para resolver 𝐄rad, se toma la curvatura de la tercera ecuación del primer conjunto de ecuaciones de Maxwell y se combina con la cuarta:

××𝐄rad=t(×𝐁rad)××𝐄rad=t(μ0𝐉+ϵ0μ0𝐄radt)

Simplificando la expresión en un par de pasos usando la suma de Einstein, se obtiene:

(××𝐄)i=ϵijkϵklmjlEm=(δilδjmδimδjl)jlEm=i(jEj)jjEi

y por lo tanto, resulta que

××𝐄rad=(𝐄rad)2𝐄rad

Ahora, sustituyendo 𝐉 por σ(𝐄vac+𝐄rad), y aprovechando el hecho de que 𝐄rad=0, se obtiene

2𝐄rad=t(μ0σ𝐄vac+μ0σ𝐄rad+ϵ0μ0𝐄rad/t)

Si se observa que todos los campos tienen la misma dependencia temporal de exp(iωt), las derivadas respecto al tiempo son sencillas, y se obtiene la siguiente ecuación de onda no homogénea:

2𝐄rad+μ0ω2(ϵ0+iσ/ω)𝐄rad=iμ0ωσ𝐄vac(z)

con solución particular:

𝐄radP=𝐄vac(z)

Para la solución completa, se suma a la solución particular la solución general de la ecuación homogénea, que es una superposición de ondas planas que viajan en direcciones arbitrarias:

(𝐄radc)i=gi(θ,ϕ)exp(i𝐤𝐫)dΩ

donde k se encuentra a partir de la ecuación homogénea que es

k2=μ0ϵ0ω2(1+iσϵ0ω)

Debe tenerse en cuenta que se ha tomado la solución como una superposición coherente de ondas planas. Debido a la simetría, se sabe que los campos serán iguales en un plano perpendicular al eje z. Por lo tanto, 𝐤𝐚=0, donde 𝐚 es un desplazamiento perpendicular a z.

Como no hay fronteras en la región z>0, se espera una onda que viaje hacia la derecha. La solución de la ecuación homogénea se convierte en,

𝐄radc=𝐄Texp(ikz)

Sumando esto a la solución particular, se obtiene la onda radiada dentro del medio (z>0)

𝐄rad=𝐄vac(z)+𝐄Texp(ikz)

El campo total en cualquier posición z es la suma de los campos incidente y radiado en esa posición. Sumando los dos componentes dentro del medio, se obtiene el campo total:

E(z)=ETexp(ikz),z>0

Esta onda viaja dentro del dieléctrico a una velocidad c/n,:

n=ck/ω=1+iσϵ0ω

Se puede simplificar el n anterior a una forma familiar del índice de refracción de un dieléctrico isotrópico lineal. Para ello, basta con recordar que en un dieléctrico lineal un campo eléctrico aplicado 𝐄 induce una polarización 𝐏 proporcional al campo eléctrico 𝐏=ϵ0χe𝐄. Cuando el campo eléctrico cambia, las cargas inducidas se mueven y producen una densidad de corriente dada por 𝐏/t. Como la dependencia del campo eléctrico con respecto al tiempo es exp(iωt), resulta que

𝐉=iϵ0ωχe𝐄,

lo que implica que la conductividad

σ=iϵ0ωχe.

Entonces, sustituyendo la conductividad en la ecuación de n, se obtiene

n=1+χe

que es una forma más familiar. Para la región z<0, se impone la condición de una onda que viaja hacia la izquierda. Al establecer la conductividad en esta región σ=0, se obtiene la onda reflejada

E(z)=ERexp(ikz),

viajando a la velocidad de la luz.

Por último, téngase en cuenta que la nomenclatura de coeficientes, 𝐄T y 𝐄R, solo se adopta para mostrar que el resultado coincide con lo que se esperaba.

Aproximación vectorial de Hertz

La siguiente es una derivación basada en un trabajo de Wangsness[5] y un desarrollo similar que se encuentra en el capítulo 20 del texto de Zangwill, Electrodinámica moderna.[6] La configuración es la siguiente: sea el semiespacio infinito z<0 el vacío y el medio espacio infinito z>0 un material dieléctrico isotrópico uniforme con susceptibilidad eléctrica χ.

La ecuación de onda electromagnética no homogénea para el campo eléctrico se puede escribir en términos del potencial de Hertz eléctrico, πe, en el calibre de Lorenz como

2πe1c22πet2=𝐏ϵ0.

El campo eléctrico en términos de los vectores de Hertz viene dado como

𝐄=××πe𝐏ϵ0t(×πm),

pero el vector magnético de Hertz πm es 0, ya que se supone que el material no es magnetizable y no hay campo magnético externo. Por lo tanto, el campo eléctrico se simplifica a

𝐄=××πe𝐏ϵ0.

Para calcular el campo eléctrico primero se debe resolver la ecuación de onda no homogénea para πe. Para hacer esto, se divide πe en las soluciones homogéneas y particulares.

πe(𝐫,t)=πe,h(𝐫,t)+πe,p(𝐫,t).

La linealidad permite entonces escribir

𝐄(𝐫,t)=𝐄h(𝐫,t)+𝐄p(𝐫,t).

La solución homogénea 𝐄h(𝐫,t) es la onda plana inicial que viaja con el vector de onda k0=ω/c en la dirección z positiva

𝐄h(𝐫,t)=𝐄0ei(k0zωt).

No es necesario encontrar πe,h(𝐫,t) explícitamente, ya que solo interesa encontrar el campo.

La solución particular, πe,p(𝐫,t) y por lo tanto, 𝐄p(𝐫,t), se encuentra usando un método basado en la función de Green dependiente del tiempo en la ecuación de onda no homogénea para πe,p que produce la integral del potencial retardado.

πe,p(𝐫,t)=14πϵ0d3r𝐏(𝐫,t|𝐫𝐫|/c)|𝐫𝐫|.

Dado que el campo eléctrico inicial está polarizando el material, el vector de polarización debe tener la misma dependencia espacial y temporal 𝐏(𝐫,t)=𝐏0ei(kzωt).. Wangsness analiza más detalles sobre esta suposición. Conectando esto a la integral y expresándolo en términos de coordenadas cartesianas, se obtiene

πe,p(𝐫,t)=𝐏0ei(kzωt)4πϵ00dzeik(zz)dxdyeik0|𝐫𝐫||𝐫𝐫|.

Primero, considérese solo la integración sobre x y y y conviértase a coordenadas cilíndricas (x,y,z)(ρ,φ,z) y denomínese |𝐫𝐫|=R

I:=dxdyeik0|𝐫𝐫||𝐫𝐫|=02πdφ0dρeik0RR=2π0dρeik0RR.

Entonces, usando la sustitución

R2=ρ2+|zz|2ρ2=R2|zz|2ρdρ=RdR

y

ρ=R2|zz|2

con lo que los límites toman la forma

ρ=0=R2|zz|2R=|zz|

y

ρ==R2|zz|2R=.

Ahora, se introduce un factor de convergencia eϵR con ϵ en el integrando, ya que no cambia el valor de la integral

I=2π|zz|dReik0R=2πlimϵ0|zz|dRe(ik0ϵ)R=2πlimϵ0[e(ik0ϵ)Rik0ϵ]||zz|=2πlimϵ0[e(ik0ϵ)ik0ϵe(ik0ϵ)|zz|ik0ϵ].

Entonces, ϵ implica que limϵ0eϵ=0, y por lo tanto limϵ0e(ik0ϵ)=limϵ0eik0eϵ=0. En consecuencia

I=2πlimϵ0[0e(ik0ϵ)|zz|ik0ϵ]=2πeik0|zz|ik0=2πieik0|zz|k0.

Ahora, reemplazando este resultado nuevamente en la integral de z se obtiene

πe,p(z,t)=i𝐏0ei(kzωt)2k0ϵ00dzeik(zz)eik0|zz|

Obsérvese que πe,p ahora es solo una función de z y no de 𝐫, como se esperaba para la simetría dada.

Esta integración debe dividirse en dos debido al valor absoluto de |zz| dentro del integrando. Las regiones son z<0 y z>0. Nuevamente, se debe introducir un factor de convergencia para evaluar ambas integrales y el resultado es

πe,p(z,t)=𝐏eiωt2ϵ0k0{1k+k0eik0zz<02k0k02k2eikz+1kk0eik0zz>0.

En lugar de introducir πe,p directamente en la expresión del campo eléctrico, se pueden hacer varias simplificaciones. Se comienza con la lazo de la identidad del vector lazo,

×(×πe,p)=(πe,p)2πe,p,

por lo tanto,

𝐄p=××πe𝐏ϵ0=(πe,p)2πe,p𝐏ϵ0.

Obsérvese que πe,p=0 porque 𝐏 no tiene dependencia de 𝐳 y siempre es perpendicular a 𝐳^. Además, el segundo y el tercer términos son equivalentes a la ecuación de onda no homogénea, y por lo tanto,

𝐄p=1c22πe,pt2=1c2(iω)2πe,p=k02πe,p

En consecuencia, el campo total es

𝐄(z,t)=𝐄0ei(k0zωt)+k02πe,p(z,t)

que se convierte en

𝐄(z,t)={𝐄0ei(k0zωt)𝐏2ϵ0k0k+k0ei(k0z+ωt)z<0𝐄0ei(k0zωt)𝐏2ϵ0k0kk0ei(k0zωt)𝐏ϵ0k02k02k2ei(kzωt)z>0.

Ahora, se opera sobre el campo dentro del dieléctrico. Usando el hecho de que 𝐄(z,t) es complejo, se puede escribir inmediatamente que

𝐄(z>0,t)=𝐄ei(k0zωt)

Si también se recuerda que dentro del dieléctrico 𝐏=ϵ0χ𝐄, por coincidencia de coeficientes se tiene que

ei(kzωt)1=χk02k02k2

y

ei(k0zωt)0=𝐄0χ2k0kk0𝐄.

La primera relación produce rápidamente el vector de onda en el dieléctrico en términos de la onda incidente como

k=1+χk0=nk0.

Usando este resultado y la definición de 𝐏 en la segunda expresión, se obtiene el vector de polarización en términos del campo eléctrico incidente como

𝐏=2ϵ0(n1)𝐄0.

Ambos resultados se pueden sustituir en la expresión del campo eléctrico para obtener la expresión final:

𝐄(z,t)={𝐄0ei(k0zωt)(n1n+1)𝐄0ei(k0z+ωt)z<0(2n+1)𝐄0ei(nk0zωt)z>0.

Este es exactamente el resultado esperado: solo hay una onda dentro del medio y su velocidad de propagación se reduce en n. También se recuperan los coeficientes de reflexión y de transmisión esperados.

Longitudes de extinción y pruebas de la relatividad especial

La "longitud de extinción" característica de un medio es la distancia después de la cual se puede decir que la onda original ha sido reemplazada por completo. Para la luz visible, que viaja en el aire al nivel del mar, esta distancia es de aproximadamente 1 mm.[7] En el espacio interestelar, la duración de la extinción de la luz es de 2 años luz.[8] A frecuencias muy altas, los electrones en el medio no pueden "seguir" la onda original hacia la oscilación, lo que permite que esa onda viaje mucho más lejos: para los rayos gamma de 0,5 MeV, la longitud es de 19 cm en el aire y de 0,3 mm en lucita ([Polimetilmetacrilato|[metacrilato]]), y para 4,4 GeV, 1,7 m en aire y 1,4 mm en carbono.[9]

La teoría de la relatividad especial predice que la velocidad de la luz en el vacío es independiente de la velocidad de la fuente que la emite. Esta predicción ampliamente aceptada ha sido probada mediante algunas observaciones astronómicas.[7][8] Por ejemplo, en un sistema estelar binario, las dos estrellas se mueven en direcciones opuestas y se podría probar la predicción analizando su luz (véase, por ejemplo, el experimento de la estrella binaria de Sitter). Desafortunadamente, la duración de la extinción de la luz en el espacio anula los resultados de cualquier experimento de este tipo utilizando luz visible, especialmente si se tiene en cuenta la espesa nube de gas estacionario que rodea a tales estrellas.[7] Sin embargo, los experimentos que utilizan rayos X emitidos por púlsares binarios, con una duración de extinción mucho más larga, han tenido éxito.[8]

Referencias

Plantilla:Listaref

Plantilla:Control de autoridades