--- title: "La nature de la lumière" dependencies: - fr/optique/??? --- # La nature de la lumière ## Nature ondulatoire de la lumière ## Nature corpusculaire de la lumière ## Une constante fondamentale de la nature : la vitesse de la lumière dans le vide Dans le vide, l'énergie lumineuse se propage à la vitesse de la lumière. Cette vitesse de la lumière dans le vide est notée universellement "$c$", et sa valeur exacte, exacte car fixée par l'humain depuis 1975 (l'unité de longueur du système international, le mètre, est depuis cette date fixé à partir de cette valeur définie et exacte de la vitesse de la lumière) est : ```math c = 299\,792\,458\;m.s^{-1} ``` - Cette vitesse de la lumière est constante pour tout observateur quelque soit son état de mouvement. ce fait expérimental contredit la loi d'addition galiléenne des vitesses de la mécanique newtonienne, et il ne se comprend de façon cohérente que dans le cadre de la relativité restreinte et de la relativité générale toutes deux introduites par Einstein respectivement en 1905 et 1915. - La notion de vitesse est traditionnellement associée à la mesure de la variation de la position d'un corps localisé dans l'espace en fonction du temps. Un ballon de football peut ainsi communément atteindre une vitesse de $`30 m.s^{-1}`$ (environ $`100 km.h^{-1}`$), ce qui signifie que la matière qui constitue le ballon s'est effectivement déplacée de 30 m par rapport au sol sur une durée de 1 seconde (on néglige ici les effets de déformation, et de rotation du ballon sur lui-même). Concernant une onde, la notion de vitesse est plus subtile. En regardant l'océan, je perçois chaque vague comme une structure étendue mais localisée dans l'espace. Cette structure reste discernable sur une certaine durée avant de se fracasser contre un rocher ou se disperser sur le sable de la plage. Pendant cette durée je peux attribuer une vitesse à cette structure, et je choisis intuitivement de suivre le mouvement de la crête d'une vague pour définir cette vitesse. Ainsi définie, un surfeur pourra estimer la vitesse d'une vague de l'ordre de $`8 m.s^{-1}`$ (environ $`30 km.h^{-1}`$). Cependant, le mouvement réel d'un centimètre cube d'eau, ou le mouvement d'une bouée censée être entraînée par la vague, est essentiellement un mouvement d'oscillation de bas en haut, et sa vitesse dans le plan horizontal est quasiment nulle. Une onde est un transport d'énergie, pas de matière. Je peux penser les vagues comme une onde qui déforme la surface de l'océan, et transporte à une vitesse de l'ordre de $`8 m.s^{-1}`$ l'énergie nécessaire pour déplacer alternativement de bas en haut la bouée. Ainsi "mal" définie, la vitesse d'une onde apparait comme une notion bien différente de la vitesse d'un corps en mécanique. C'est pourquoi il existe un mot spécifique pour parler de la "vitesse apparente" de déplacement d'une onde, c'est le mot "célérité". La lumière se comporte par bien des aspects comme une onde, aussi le terme de célérité est souvent employé à la place du terme "vitesse" concernant la lumière. C'est là l'origine de la lettre "$`c`$" représentant par convention la vitesse de la lumière dans le vide. - Pour une onde, la notion de vitesse ou célérité est bien plus complexe que ne le laissent présager ces deux termes. Même idéalisée, le profil de la vague se déforme au cours de sa propagation. L'analyse de Fourier me montrera que la vague peut se décomposer comme une superposition d'ondes planes sinusoïdales progressives (on dit aussi d'ondes planes harmoniques ou monochromatiques progressives) de la surface de l'eau, dont l'enveloppe décrit la vague. Une onde sinusoïdale présente un profil périodique qui se reproduit infiniment sans se déformer. Il est ainsi possible d'attribuer une vitesse bien définie, par exemple la vitesse de propagation d'un maximum d'amplitude de l'onde sinusoïdale. Chaque composante sinusoïdale possède donc une vitesse de propagation propre et bien définie, appelée vitesse de phase. A la vitesse de l'enveloppe, résultante de la superposition de toutes ses composantes sinusoïdales, je pourrai associer une "vitesse de groupe" dont une définition physique rigoureuse sera présentée dans divers chapitres de niveaux 3 et 4 liées aux phénomènes ondulatoires. ## Le spectre électromagnétique # Interaction entre la lumière et la matière ## Interaction lumière-matière L'univers est composé de matière en mouvement et de lumière. Dans cette phrase il faudrait restreindre le terme matière à la *matière baryonique*, c'est à dire de matière composée d'*électrons*, de *protons* et de *neutrons*, c'est à dire la matière que nous connaissons, et étendre le terme lumière à tout les spectre des ondes électromagnétiques depuis les rayons gamma de très hautes énergies jusqu'au domaine radio de très grandes longueurs d'ondes. Matière et lumière sont en interaction constante. Du point de vue des grands domaines de la physique, il y a *trois façons pour la matière de créer ou d'absorber de la lumière* : l'interaction classique (classique au sens non relativiste), l'interaction quantique et l'interaction relativiste. ### L'interaction classique La matière est composée de particules élémentaires dont certaines sont caractérisées par une charge électrique non nulle, ce qui signifie qu'elles sont sensibles à l'interaction électromagnétique. Or la lumière est la propagation d'un champ électromagnétique. Un "champ" en physique décrit une grandeur physique définie en tout point de l'espace. L'existence d'un champ électromagnétique signifie donc qu'en tout point de l'espace existent un vecteur champ électrique $`\overrightarrow{E}`$ et un vecteur champ magnétique $`\overrightarrow{B}`$ liés par les équations de Maxwell. L'interaction électromagnétique précise qu'en présence d'un champ électrique $`\overrightarrow{E}`$ et d'un champ magnétique $`\overrightarrow{B}`$, une particule de charge électrique $`q`$, de masse $`m`$ et animée d'une vitesse $`\overrightarrow{v}`$ dans le référentiel où elle est observée, subit une force électromagnétique dite force de Lorentz $`\overrightarrow{F}_{L}`$ qui s'exprime comme suit : ```math \overrightarrow{F}_{L}=q\cdot(\overrightarrow{E}+\overrightarrow{v}\wedge\overrightarrow{B}) ``` **Un champ électromagnétique induit une accélération à toute particule chargée**, du fait de la *force de Lorentz*. Le phénomène inverse est aussi vrai, les lois de l'électromagnétisme disent que **toute particule chargée accélérée est source d'une onde électromagnétique**. - Ainsi, pour créer une onde électromagnétique de fréquence $`\nu`$, il suffit de communiquer à un électron un mouvement oscillatoire à cette même fréquence $`\nu`$. Inversement, pour détecter une onde électromagnétique de fréquence $`\nu`$, il suffit de placer un électron libre sur le trajet de l'onde, et de détecter son mouvement oscillatoire induit (donc le petit courant alternatif résultant de son mouvement induit). - Le domaine de la lumière visible correspondant à des fréquences de l'ordre de $`5\cdot10^{14}Hz`$, ce qui représente $`5\cdot10^{14}`$ oscillations par seconde, il est impossible mécaniquement ou même électriquement d'inculquer un mouvement oscillatoire aussi rapide à des particules chargées pour créer de la lumière visible. Cette interaction "classique" concerne donc le domaine des ondes électromagnétiques de fréquences moindres, celui des ondes radioélectriques ($`\lambda\geq1m`$) ou du domaine des micro-ondes ($`1mm\geq\lambda\leq1m`$). ### L'interaction quantique Un atome est composée d'un noyau, ensemble compact de protons et de neutrons en interaction forte, entouré d'un nombre d'électrons équivalent au nombre de proton du noyau qui se répartissent dans un certain nombre d'orbitales caractérisées par leurs énergies. La mécanique quantique est probabiliste. L'électron entre deux mesures n'a pas de trajectoire définie. La notion même de trajectoire n'as pas de sens. Seule la probabilité de présence de l'électron dans un volume donné peut être calculée. Une orbitale est définie comme une région de l'espace où l'électron a une probabilité de présence supérieure à 90%. Dans son état fondamental, les électrons se répartissent dans les orbitales de plus basses énergies. Dans un état excité de l'atome, certains électrons ont sauté sur des orbitales plus énergétiques. La transition entre deux états (entre l'état fondamental et un état excité, ou entre deux états excités) peut-être radiative. Dans ce cas elle s'accompagne de l'émission ou l'absorption (selon les cas) d'un photon d'énergie égale à la différence d'énergie entre les deux états concernés. ### L'interaction relativiste Je comprends facilement cette interaction à partir de la célèbre formule d'Einstein $`E=m\cdot^2`$ qui dit qu'un corps immobile et de masse $m$ dans un référentiel donné contient une énergie $`E`$ égale à la masse au repos du corps multipliée par la vitesse de la lumière $`c`$ élevée au carré. La théorie de la relativité prévoit, en parfait accord avec l'expérience, que la masse d'un corps croît avec la vitesse de celui-ci. La masse d'un corps varie donc selon le référentiel dans lequel ce corps est observé. Dans la relation $`E=m\cdot c^2`$, $`m`$ est la masse du corps mesurée dans un référentiel où le corps est immobile, je l'appelle "masse au repos". A chaque particule de matière de masse au repos $`m`$ correspond son anti-particule qui possède la même masse. Lorsqu'une particule de matière rencontre son anti-particule, toutes deux sont annihilées, et la somme de leurs masses est entièrement convertie en énergie, sous la forme de photons. Entre le proton, le neutron et l'électron, l'électron est la particule atomique de plus faible masse $`m_e`$ au repos : $`m_e=9.1\cdot10^{-31}kg`$. L'annihilation entre un électron et son antiparticule appelée positron libère 2 fois l'énergie : ```math m_e\cdot c^2=8.2\cdot10^{-14}J=511 000eV ``` ---
Je comprends facilement cette interaction à partir de la célèbre formule d'Einstein $E=m\cdotc^2$ qui dit qu'un corps immobile et de masse $m$ dans un référentiel donné contient une énergie $E$ égale à la masse au repos du corps multipliée par la vitesse de la lumière $c$ élevée au carré.
Cela se traduit par la création de deux photons d'énergie $511 keV$. Chaque photon posède donc une énergie plus de $250 0000$ fois supérieur à un photon visible. Cette interaction relativiste ne s'observe que dans le domaine des rayons gamma.
Parmi les cinq sens de l'être humain (vue, ouïe, odorat, goût, toucher), la vue est le sens le plus développé, ce qui signifie que c'est le sens qui nous donne le plus d'informations sur notre environnement. Notre vision nous permet de localiser et de reconnaître des objets solides ou des étendues liquides qui peuvent nous être utiles ou représenter un danger, des objets que nous voulons attraper ou bien éviter. La vue nous permet de percevoir la présence et d'identifier ces objets à distance, sans contact physique comme avec notre sens du toucher ou celui du goût. Le vecteur de l'information visuelle sur la localisation, la nature et la forme de l'objet est la lumière émise ou diffusée par l'objet et qui atteint notre oeil.
Toute matière émet de la lumière, principalement en fonction de sa température selon la loi du corps noir. Cependant ce type de rayonnement thermique propre à chaque objet n'émet dans le visible que pour des températures de plusieurs centaines de degrés au minimum. Notre oeil est sensible à la lumière émise par ces objets très chauds émettant ce type de rayonnement, ce sont les anciennes ampoules électriques à incandescence, c'est le morceau de métal porté à plus de 800°C qui devient rougissant, et c'est bien sûr et surtout le soleil dont la température de surface est proche de $5800K$. Chaque élément de surface de ces objets très chauds émet une lumière visible dans toutes les directions du demi-espace libre situé devant lui.
D'autres types de sources de lumière visible émettent un spectre de raies plus ou moins larges. L'énergie de chaque photon émis correspond à la différence d'énergie entre un état de plus haute énergie et un état de plus basse énergie, entre lesquelles l'atome ou la molécule transite.
L’optique géométrique modélise le comportement de la lumière avec les concepts de rayon lumineux, d'indice de réfraction et un principe de base : le principe de Fermat appliqué à la trajectoire des rayons lumineux
Elle permet de comprendre puis maîtriser la formation des images par des systèmes optiques de dimensions caractéristiques a grandes devant la longueur d’onde λ de la lumière (a ≫ λ).
Elle permet de comprendre comment l'oeil perçoit son environnement, comprendre et maîtriser le fonctionnement et les caractéristiques de tous les appareils d'optiques utilisés dans la vie de tous les jours : loupes, miroirs, appareils photos, téléobjectifs, microscopes, télescopes et lunettes astronomiques ou terrestres, ainsi que lunettes et lentilles de vue pour corriger un défaut de la vision.
L'optique géométrique ne permet pas de comprendre les phénomènes lumineux induits par des systèmes optiques de taille caractéristique a de l'ordre de grandeur ou inférieure à la longueur d'onde λ de la lumière (a ≈ λ ou a ≤ λ) : les phénomène de diffraction et d'interférences lumineuses. Je comprendrai et maîtriserai ces phénomènes dans le cadre de l'optique ondulatoire, puis de façon plus approfondie dans le cadre de la théorie électromagnétique de Maxwell (Electromagnétisme).
Elle ne permet pas de comprendre comment la lumière est créée ou absorbée par la matière, ni les phénomènes liés à la polarisation et à la diffusion de la lumière. Je comprendrai et maîtriserai ces phénomènes dans le cadre beaucoup plus large de l'électromagnétisme.
la lumière se propage dans le vide à la vitesse de $c=300 000\;km.s^{-1}=3\cdot10^8\;m.s^{-1}$, et se propage en ligne droite dans tout milieu transparent homogène et isotrope. Cependant, en passant d'un milieu à un autre, je peux observer que la lumière change de direction à l'interface entre les deux milieux : c'est le phénomène de réfraction de la lumière à l'interface entre les deux milieux.
Le phénomène de réfraction peut être expliquer quantitativement dans le cadre du principe de Fermat, si je considère que la vitesse de la lumière change selon le milieu de propagation.
la vitesse de la lumière dans différents milieux apparait ainsi comme une quantité importante, qui est à l'origine de toutes les caractéristiques (grandissement, grossissement, aberrations, dispersion, ...) de tous les systèmes optiques utilisant des lentilles ou des primes. Parce que la vitesse de la lumière dans le vide est une constante fondamentale de la nature et qu'elle intervient dans un grand nombre de domaines de la physique, il est sensé de vouloir exprimer la vitesse de la lumière dans tout milieu relativement à sa valeur dans le vide : cela est réalisé avec l'indice de réfraction.
L'indice de réfraction , noté $n$, est défini comme le rapport entre la vitesse de la lumière dans le vide $c$ et celle dans le milieu considéré $v$ : $$n\;=\;\frac{c}{v}$$
L'indice de réfraction étant le rapport de deux vitesse, c'est une grandeur physique sans dimension.
Comme la vitesse de la lumière dans tout milieux ne peut être qu'inférieure ou égale à sa valeur dans le vide, l'indice de réfraction est toujours une quantité supérieure ou égale à 1 : ($n\ge1$)
Je sais qu'un prisme disperse dans différentes directions toutes les composantes colorées d'un faisceau incident de lumière blanche. la fait que chaque rayon de lumière de ce faisceau subit simplement deux réfractions montre que dans le domaine visible, l'indice de réfraction varie légèrement avec la couleur, ou pour le dire plus précisément avec la fréquence (ou la longueur d'onde dans le vide) de la lumière.
Ainsi pour réaliser une expérience précise de dispersion, je dois préciser la fréquance à laquelle est donné la valeur de l'indice de réfraction. Cependant, dans le visible, cette variation reste limitée (de l'ordre de quelques dixièmes de pourcent) and est donné seulement la valeur moyenne de l'indice de réfraction (comme $n_{eau}=1.33$), ou la valeur de l'indice de réfraction à des longueurs d'onde (dans le vide) spécifiques à des raies spectrales ou des sources de lumières quasi-monochromatiques intenses qui ont permis de mesurer précisément la valeur de cette indice (par exemple $n\;_{546nm}$ pour un indice spectral déterminé à partir de la raie verte d'une lampe à vapeur de mercure, ou $n\;_{632nm}$ quand c'est un laser helium-néon qui a été utilisé).
Les deux lois importantes en optique géométrique (loi de la réflexion, et loi de la réfraction connue sous le nom de Snell-Descartes) dérivent directement du principe de Fermat.
Soit un chemin $S_{AB}$ (donc une ligne continue) défini entre deux points donnés $A$ et $B$ de l'espace. Ce chemin possède une longueur $s(S_{AB})$ telle que : $$ s(S_{AB})\;=\;\int_{S_{AB}} ds$$ ou $ds$ est un élément de longueur infinitésimal pris le long du chemin $S_{AB}$.
Ce chemin est parcouru à une vitesse variable au cours de son parcours. En chaque point $P$ de ce chemin , l'élément de longueur infinitésimal $ds_P$ est parcouru à la vitesse instantanée $v_P$, et le temps infinitésimal $dt_P$ mis par la lumière pour parcourir cette distance $ds_P$ est, comme $ds_P\,=\,v_P\cdot dt_P$, alors : $$dt_P\,=\,\frac{ds_P}{v_P}$$
Si $t_A$ est l'instant de départ sur le chemin $S_{AB}$ et $t_B$ est l'instant d'arrivée, le temps de parcours $\tau=t_B-t_A$ de ce chemin est la somme intégrale des temps infinitésimaux $dt_P$ mis pour parcourir chacun des éléments de longueurs infinitésimaux $ds_P$ pris en tout point $P$ appartenant au chemin $S_{AB}$. Je peux écrire ce temps de parcours :
$$\tau\;=\;\int_{P \in S_{AB}} dt_P\;=\;\int_{P \in S_{AB}}\frac{ds_P}{v_P}$$
ou
$$\tau\;=\;\;\int_{\tau} dt\;=\;\int_{S_{AB}}\frac{ds}{v}$$
ou encore
$$\tau\;=\;\int_{t_A}^{t_B} dt\;=\;\int_{A}^{B}\frac{ds}{v}$$
Cette écriture intégrale me permet de calculer un temps de parcours dans les cas les plus complexe, si la vitesse est connue (ou estimée si je veux un temps de parcours estimé) en chaque point de la trajectoire considéré. Une trajectoire qui minimise le temps de parcours entre deux points de l'espace n'est pas toujours le segment de droite qui joint ces deux points..
Si j'applique ce calcul du temps de parcours à la lumière, en chaque point d'une trajectoire la vitesse de la lumière est déterminée par l'indice de réfraction du milieu en ce point et je peux écrire : $$\tau\;=\;\int_{S_{AB}}\frac{ds}{v}\;=\;\frac{1}{c}\cdot\int_{S_{AB}}\frac{c}{v}\;\cdot ds$$ $$\tau\;=\;\frac{1}{c}\cdot\int_{S_{AB}}n\;ds$$
Lorsque la lumière se déplace sur des trajectoires traversant des milieux d'indices réfraction différents, les différents temps de parcours ne sont pas égaux aux longueurs correspondantes multipliées par un nombre réel unique, indépendant des trajectoires. Cela reste vrai sur la trajectoire unique d'un rayon de lumière traversant plusieurs milieux : pour une même longueur considérée le long de la trajectoire, le temps de parcours pourra être différent selon la portion de trajectoire sur laquelle la longueur est prise. Je peux résumer cela d'une phrase :
Sur l'ensemble des cas, le temps de parcours n'est pas proportionnel à la distance parcourue. Or la grandeur physique importante associée à un parcours entre deux points de l'espace, pour savoir si la lumière choisira ce parcours plutôt q'un autre, sera le temps de parcours. Cependant lorsque je visualise mentalement une trajectoire, je vois une ligne à laquelle j'associe intuitivement une longueur. Comment travailler mathématiquement avec une grandeur physique homogène à une longueur, mais qui aurait les mêmes propriétés que le temps de parcours pour décrire la propagation de la lumière ? Une telle grandeur a été définie en physique, et est grandement utilisée en optique géométrique, optique ondulatoire, électromagnétisme, et elle est nommée "chemin optique noté usuellement " $\delta_o$".
Le chemin optique $\delta_o$ d'un parcours donné $\Gamma_o$ entre deux points A et B de l'espace est homogène à une longueur. Son unité (S.I.) (son unité dans le Système International d'unités) est donc le "mètre".
Pour tout segment de droite pris entre deux points infiniment proche dans l'espace, son chemin optique infinitésimal (ou élémentaire) $\mathrm{d}\delta$ est égal à sa longueur euclidienne $\mathrm{d}s$ multipliée par la valeur de l'indice de réfraction $n$ moyennée sur le segment infinitésimal considéré : $$\mathrm{d}\delta\;=\;n\times \mathrm{d}s$$
Le chemin optique $\delta$ d'un parcours donné $\Gamma_o$ entre deux point de l'espace est simplement la somme des chemins optiques infinitésimaux intégrés sur ce parcours : $$\delta = \int_{\Gamma_o}\mathrm{d}\delta= \int_{\Gamma_o}n\cdot \mathrm{d}s$$
Quelques soient deux points donnés A et B de l'espace, et quelque soit le parcours considéré entre ces deux points, le chemin optique sera toujours égal au temps de parcours de la lumière sur ce parcours divisé par la vitesse de la lumière dans le vide $c$ qui est une constante universelle de la nature : $$\mathrm{d}\delta\;=\;\frac{ds}{c}$$ $$\delta = \int_{S_{AB}}n\cdot\mathrm{d}s\;=\;\int_{S_{AB}}\frac{c}{v}\cdot\mathrm{d}s$$ $$\hspace{1cm}= c\;\int_{S_{AB}}\frac{\mathrm{d}s}{v} =\;c\;\tau$$
Soit $\Gamma_o$ un chemin continue dans l'espace entre deux points A et B, chemin entièrement déterminé par son paramètre $\lambda_o$, ou plusieurs paramètres indépendants $\lambda_{io}$.
Soit $f$ une grandeur physique caractérisant ce chemin $\Gamma$.
Je considère maintenant $\Gamma$ tout chemin infiniment proche de $\Gamma_o$ et de mêmes extrémités A et B, et caractérisé par son paramètre $\lambda=\lambda_o+d\lambda$ ou ses paramètres $\lambda_i=\lambda_{io}+d\lambda_i$.
La grandeur physique $f$ est stationnaire sur le chemin $\Gamma_o$ si sa variation calculée au premier ordre est nulle sur tout chemin $\Gamma$ infiniment proche de $\Gamma_o$ : $$\mathrm{d}f(\Gamma_o)=\frac{\mathrm{d}f}{\mathrm{d}\lambda}(\Gamma_o)\cdot\mathrm{d}\lambda=0$$ ou $$\mathrm{d}f(\Gamma_{o})=\sum_i\frac{\partial f}{\partial\lambda_i}(\Gamma_o)\cdot\mathrm{d}\lambda_i=0$$
En mathématiques, pour une fonction $f:\mathbb{R}\rightarrow\mathbb{R}$ (fonction réelle $f$ à variable réelle $x$), un point stationnaire ou point critique correspond à un maximum (au moins local), ou à un minimum (au moins local), ou encore à un point d'inflexion stationnaire. Pour une fonction $f :\mathbb{R}^2\rightarrow\mathbb{R}$, il faut rajouter le point col ou point selle (en un point selle la fonction présente un maximum local selon un axe et un minimum local selon un autre axe, ce qui lui donne localement la forme d'une selle de cheval). Il faut aussi noter que tout point d'une fonction constante (de $\mathbb{R}\rightarrow\mathbb{R}$ ou de $\mathbb{R}^2\rightarrow\mathbb{R}$) est un points stationnaire.
Le principe de Fermat peut s'énoncer à partir du temps de parcours ou bien à partir du chemin optique de la lumière entre deux points de sa trajectoire. Ces deux grandeurs physiques associées sont en effet simplement proportionnelles entre elles, et elles auront donc la propriété de stationnarité sur les mêmes parcours. Les deux énoncés du principe de Fermat sont :
"Entre deux points de sa trajectoire, la lumière suit tout parcours sur lequel son temps de propagation est stationnaire par rapport à tout autre parcours infiniment voisin."
"Entre deux points de sa trajectoire, la lumière suit tout parcours de chemin optique stationnaire par rapport à tout autre parcours infiniment voisin."
Par définition, dans un milieu homogène l'indice de réfraction à la même valeur en tout point, donc je peux écrire :
$$\tau\;=\;\frac{1}{c}\cdot\int_{S_{AB}}n\;ds\;=\;\frac{n}{c}\cdot\int_{S_{AB}}ds$$
Comme $n$ et $c$ sont des constantes, lors le temps de parcours $\tau$ est proportionnel à la simple longueur euclidienne $s= \int_{S_{AB}}ds$ du chemin suivi entre A et B.
Il existe une infinité de chemins possibles entre A et B, dont les longueurs s'étendent depuis une longueur minimum jusqu'à l'infini. Le seul chemin sur lequel le temps de parcours de la lumière est stationnaire est ici le chemin de longueur minimum entre ces deux points, soit le segment de droite [AB]. Le principe de Fermat postule donc que la lumière suivra le segment de droite qui joint ces deux points A et B.
Dans un milieu homogène, les rayons lumineux sont des droites
Soit un miroir plan.
Pour simplifier les calculs, je choisi un système d'axes $(O,x, y, z)$ orthonormé direct tel que la surface du miroir soit dans le plan $(O,x,y)$.
Soit A et B deux points situés d'un même côté du miroir, et par lesquels passe un même rayon lumineux. Le rayon lumineux passe d'abord par le point A, se réfléchit sur le miroir en un point I avant de passer par le point B.
Pour simplifier les calculs, je peux choisir les axes $Ox$ et $Oy$ tels que les points A et B soient situés dans le plan $(O,x,z)$.
Soient $(x_A,0,z_A)$, $(x_B,0,z_B)$ les cordonnées fixées des deux points A et B dans le système d'axe choisi, et $(x_I,y_I,0)$ les cordonnées variables du point I dans le plan du miroir.
Le trajet du rayon lumineux se fait en deux parties, du point A au point I, puis après réflexion du point I au point B, toutes deux situées dans un même milieu homogène d'indice de réfraction $n$. Le chemin suivi par la lumière est donc constitué des deux segments de droite [AI] et [IB], de longueurs respectives notées d(A,I) et d(I,B). Le chemin optique s'écrit alors : $$\delta=\int_{S_{AI}}n\;ds\;+\int_{S_{IB}}n\;ds$$ $$\hspace{0.2cm}=n\cdot \big( d(A,I)+d(I,B) \big)$$
En fonction des coordonnées des points A et B et des variables coordonnées du point I, il se réécrit : $$\delta(x_I,y_I)=n\cdot\Big(\sqrt{(x_I-x_A)^2+y_i^2+z_A^2}$$ $$\hspace{0.8cm}+\sqrt{(x_I-x_B)^2+y_i^2+z_B^2}\;\Big)$$
Tout couple de coordonnées ($x_I,y_I) \in \mathbb{R}^2$ représente un parcours entre A et B susceptible d'être emprunté par la lumière. Par ailleurs tout parcours susceptible d'être emprunté par la lumière peut être identifié par un couple ($x_I,y_I) \in \mathbb{R}^2$ .
Le parcours réellement suivi par la lumière selon le principe de Fermat doit être stationnaire. Donc tout couple de coordonnées ($x_I,y_I$) qui vérifie $$\delta(x_I,y_I)=\frac{\partial\delta}{\partial x_I}\cdot dx_I\;+\;\frac{\partial\delta}{\partial y_I}\cdot dx_I=0$$ pour toutes variations infinitésimales et indépendantes $dx_I$ et $dy_I$, est un parcours effectivement choisi par la lumière.
Cela n'est possible que si chacune des dérivées partiels est nulle, soit : $$(1)\hspace{0.2cm}\frac{\partial\delta}{\partial x_I}=n\cdot\bigg({\small{\frac{x_I-x_A}{\sqrt{(x_I-x_A)^2+y_i^2+z_A^2}}}}$$ $$\hspace{0cm}+{\small{\frac{x_I-x_b}{\sqrt{(x_I-x_B)^2+y_i^2+z_B^2}}}}\;\bigg)=0$$ et $$(2)\hspace{0.2cm}\frac{\partial\delta}{\partial y_I}=n\cdot\bigg({\small{\frac{y_I}{\sqrt{(x_I-x_A)^2+y_i^2+z_A^2}}}}$$ $$\hspace{0cm}+{\small{\frac{y_I}{\sqrt{(x_I-x_B)^2+y_i^2+z_B^2}}}}\;\bigg)=0$$
Comme les points A et B sont ne sont pas dans le plan du miroir ($z_A > 0$ et $z_B > 0$) alors les deux termes en racine carré sont strictement positifs. L'équation $(2)$ n'est donc vérifiée que si implique $y_I=0$ : le principe de Fermat postule ici que les 3 points A, I et B sont dans le même plan $y=0$, appelé plan d'incidence. Ainsi le rayon réfléchi est dans plan d'incidence défini par le rayon incident et la normale à la surface du miroir. au point I.
Dans ce plan d'incidence $(O,x,z)$, l'équation $(1)$ implique que les coordonnées des points A=($x_A,z_A$) et B=($x_B,z_B$) vérifient : $${\small{\frac{x_I-x_A}{\sqrt{(x_I-x_A)^2+z_A^2}}=\frac{x_I-x_B}{\sqrt{(x_I-x_B)^2+z_B^2}}}}$$ Cela implique premièrement, comme une racine carrée est toujours un nombre positif, que $x_I$ est un nombre compris entre $x_A$ et $x_B$. Dans le plan d'incidence, le rayon réfléchi est toujours de l'autre côté de la normale au plan du miroir au point d'impact, par rapport au rayon incident.
Deuxièmement, en remarquant dans cette même équation (1) que $${\small{\frac{|\,x_I-x_A\,|}{\sqrt{(x_I-x_A)^2+z_A^2}}}}=\sin(i_i)$$ $${\small{\frac{|\,x_I-x_B\,|}{\sqrt{(x_I-x_B)^2+z_B^2}}}}=\sin(i_r)$$
on en déduit que l'angle de réflexion à la surface du miroir est égal à l'angle d'incidence.
J'appelle dioptre plan toute surface plane séparant deux milieux transparents homogènes d'indices de réfraction différents.
Pour simplifier les calculs, je choisi un système orthonormé direct d'axes $(O,x, y, z)$ tel que le dioptre soit le plan $(O,x,y)$. Le milieu situé côté positif de l'axe $Oz$ a pour indice de réfraction $n_1$ , et le milieu situé côté négatif a pour indice de réfraction $n_2$.
Soit A et B deux points situés de part et d'autres du dioptre, et par lesquels passe un même rayon lumineux. Le rayon lumineux passe d'abord par le point A situé dans le milieu d'indice $n_1$, traverse le dioptre en un point I avant de passer par le point B situé dans le milieu d'indice $n_2$.
Pour simplifier les calculs, je peux choisir l'origine O et les axes $Ox$ et $Oy$ tels que les points A et B soient situés dans le plan $(O,x,z)$.
Soient $(x_A,0,z_A)$, $(x_B,0,z_B)$ les cordonnées fixées des deux points A et B dans le système d'axe choisi, et $(x_I,y_I,0)$ les cordonnées variables du point I dans le plan du dioptre
Le trajet du rayon lumineux se fait en deux parties, du point A au point I dans le milieu d'indice $n_1$, puis après traversée du dioptre, du point I au point B dans le milieu d'indice $n_2$. Le chemin suivi par la lumière est donc constitué des deux segments de droite [AI] et [IB], de longueurs respectives notées d(A,I) et d(I,B). Le chemin optique s'écrit alors : $$\delta=\int_{[AI]}n_1\;ds\;+\int_{[IB]}n_2\;ds$$
En fonction des coordonnées des points A et B et des coordonnées variables du point I, le chemin optique se réécrit : $$\delta(x_I,y_I)=n_1\cdot\sqrt{(x_I-x_A)^2+y_I^2+z_A^2}$$ $$\hspace{0.8cm}+n_2\cdot\sqrt{(x_I-x_B)^2+y_I^2+z_B^2}$$
Le parcours réellement suivi par la lumière selon le principe de Fermat doit être stationnaire. Donc tout couple de coordonnées ($x_I,y_I$) qui vérifie $$\delta(x_I,y_I)=\frac{\partial\delta}{\partial x_I}\cdot dx_I\;+\;\frac{\partial\delta}{\partial y_I}\cdot dx_I=0$$ pour toutes variations infinitésimales et indépendantes $dx_I$ et $dy_I$, est un parcours effectivement choisi par la lumière.
Cela n'est possible que si chacune des dérivées partiels est nulle, soit : $$(3)\hspace{0.2cm}\frac{\partial\delta}{\partial x_I}=n_1\cdot{\small{\frac{x_I-x_A}{\sqrt{(x_I-x_A)^2+y_i^2+z_A^2}}}}$$ $$\hspace{0cm}+n_2\cdot{\small{\frac{x_I-x_B}{\sqrt{(x_I-x_B)^2+y_i^2+z_B^2}}}}\;=0$$ et $$(4)\hspace{0.2cm}\frac{\partial\delta}{\partial y_I}=n_1\cdot{\small{\frac{y_I}{\sqrt{(x_I-x_A)^2+y_i^2+z_A^2}}}}$$ $$\hspace{0cm}+n_2\cdot{\small{\frac{y_I}{\sqrt{(x_I-x_B)^2+y_i^2+z_B^2}}}}\;=0$$
Dans l'équation (4), chaque terme en racine carrée est un nombre réel strictement positif dans les cas qui nous intéressent (A et B de part et d'autre du dioptre, donc $z_A>0$ et $z_B>0$). De plus les indices $n_1$ et $n_2$ sont toujours supérieurs ou égaux à l'unité, donc l'équation ne peut être vérifiée que si $$y_I\;=\;0$$ Je retrouve bien le cas de la réflexion. Tout rayon réfracté est contenu dans le plan d'incidence.
De même, l'équation (3) n'est vérifiée que si : $$n_1\cdot (x_I-x_A)\;=- \;n_2\cdot (x_I-x_B)$$ et là encore, comme $n_1$ et $n_2$ sont strictement positifs, cela implique que que $x_I$ est un nombre compris entre $x_A$ et $x_B$. Dans le plan d'incidence, le rayon réfracté est toujours de l'autre côté de la normale au plan du dioptre au point d'impact, par rapport au rayon incident.
Enfin si je remarque dans cette même équation (3) que $${\small{\frac{|\,x_I-x_A\,|}{\sqrt{(x_I-x_A)^2+z_A^2}}}}=\sin(i_1)$$ $${\small{\frac{|\,x_I-x_B\,|}{\sqrt{(x_I-x_B)^2+z_B^2}}}}=\sin(i_2)$$
j'en déduis que la relation entre l'angle d'incidence $i_1$ et l'angle de réfraction $i_2$ à la surface du miroir est $n_1\cdot \sin(i_1)=n_2\cdot\sin(i_2)$.
Je regarde la trajectoire d'un rayon lumineux dans l'espace. Sur cette trajectoire, je sélectionne deux points distincts quelconques sur cette trajectoire, mais tels que le sens de propagation de la lumière soit de A vers B. Quelques soient les systèmes optiques placés sur cette trajectoire entre ces deux points A et B, la trajectoire suivie par la lumière entre ces deux points suit le principe de Fermat : entre l'infinité de trajectoires possibles entre ces deux points, la lumière "choisit" celle qui minimise ou maximise le temps de parcours.
Si maintenant je considère une situation où la lumière doit se propager depuis le point B vers le point A, quelle serait la trajectoire de la lumière pour ce sens de parcours? Dans son énoncé, le principe de Fermat ne mentionne nullement un sens de propagation (de A vers B, ou de B vers A). Il est ainsi évident que la trajectoire déterminée par le principe de Fermat est identique, que la lumière se propage de A vers B ou de B vers A. Ce principe est connu sous le nom de "principe du retour inverse de la lumière et je peux l'énoncer de la façon suivante :
Le trajet suivi par la lumière est indépendant du sens de propagation.
Application : en optique géométrique, pour résoudre certains problèmes, il peut être parfois plus facile pour moi de considérer que la lumière se propage en sens inverse de son sens de propagation réel.
L'optique géométrique est l'art de comprendre et maîtriser les images. Les images que je vois sont la perception indirecte d'objets. La perception est indirecte parce que les rayons lumineux issus de l'objet ne se propagent pas en ligne droite de l'objet jusqu'à l'oeil dans le milieu homogène que constitue l'air (ou l'eau, ou le vide, ou tout autre milieu homogène), mais qu'ils rencontrent sur leur trajectoire des objets surfaces réfléchissantes, des volumes transparents ou des modifications graduelles de l'indice de réfraction du milieu traversé qui modifient la direction des rayons lumineux. Ces surfaces et volumes seront appelés systèmes optiques. Entre l'objet physique initial qui émet sa propre lumière ou diffuse la lumière ambiante et l'oeil peuvent se trouver plusieurs systèmes optiques.
Quand je dis "les images que je vois", cela signifie qu'il y a une image à voir. Mais est-ce toujours le cas? A travers une vitre translucide, je ne vois aucun des objets présents de l'autre côté de la vitre. Ou plus exactement ce que je vois semble très flou, ce qui ne m'empêche pas de distinguer des choses. Alors, ce que je vois peut-il être qualifié d'images d'objets vues à travers la vitre translucide?
L'optique géométrique est l'art de comprendre et maîtriser les images. Mais avant de maîtriser le système optique qui me permettra de réaliser l'image que je souhaite, je dois définir la notion même d'image, je dois préciser la relation entre l'objet, l'image et le système optique qui la créé si elle existe. Avec une première question simple. Le vocabulaire est imprécis sur ce sujet : l'image est-elle seulement la perception mentale d'un objet vu à travers un système optique ? Ou bien a t'elle une existence physique propre indépendante du fait que je l'observe ou non ? Voici des questions que je dois préparer avec mon défi "objets et images".
L'objet physique initial occupe un volume dans l'espace, délimité par une surface. Cette surface peut se décomposer en une infinité de surfaces physiques élémentaires (une surface élémentaire est une surface dont l'aire tend vers zéro), chacune ayant sa position propre dans l'espace, émettant sa propre lumière ou diffusant la lumière qu'elle reçoit dans un faisceau lumineux
En optique géométrique, j'appelle faisceau lumineux un ensemble continu de rayons lumineux se propageant en lignes droites et convergents en un point, qui délimitent le volume de l'espace éclairé.
Cette surface physique élémentaire peut :
Si je vois un objet, c'est que de la lumière parcourt une certaine trajectoire entre cet objet et mon oeil. La lumière porte de l'énergie. Cette énergie lumineuse est convertie en énergie chimique puis en énergie électriques dans les cellules de la rétine de mon oeil. Cette énergie électrique se propage dans le nerf optique puis les neurones de mon cortex cérébral dans lequel un processus cognitif me donne conscience de percevoir de la lumière.
J'appelle rayon lumineux une trajectoire orientée par une flèche parcourue par la lumière entre le point objet qui émet la lumière et
L'objet que je vois est en général étendu, et donc dans une direction particulière de l'espace, je vois une infime partie de l'objet. Je peux décomposer cet objet visible en un ensemble continue de points émetteur. Ainsi chaque point émetteur émet donc de la lumière, c'est à dire q'un ensemble de rayons lumineux partent du point émetteur.
J'appelle élément optique toute structure matérielle qui, exposée ou placée dans un faisceau de lumière, modifie la direction de propagation des rayons lumineux du faisceau ou le bloque ou modifie toute autre propriété de la lumière du faisceau.
En optique géométrique qui décrit l'optique de la vie de tous les jours, les éléments optiques simples seront ceux qui sont utiliser pour construire les appareils optiques usuels : je les limite au miroirs, aux dioptres, et aux lentilles minces .
Un système matériel présente un symétrie de révolution autour d'un axe $Oz$ si toutes les caractéristiques de cet élément dans un plan contenant l'axe $Oz$ restent identiques dans tout plan contenant le même axe $Oz$. Les caractéristiques du système matériel que va prendre en compte l'optique géométrique seront bien sur la forme, l'état de surface (qui permet ou non le phénomène de réflexion) et la matière (à travers l'indice de réfraction qui la caractérise).
La plupart des appareil optiques usuels (télescopes, lunettes astronomiques ou terrestres, microscopes, optique d'un appareil photo, ...) présentent une symétrie de révolution autour d'un axe que je peux appeler $Oz$, par référence au système de coordonnées cylindriques qui décrit facilement ce type de symétrie. Il en est donc de même pour les miroirs, lentilles et dioptres qui les composent.
Les éléments optiques simples sur lesquels je vais travailler à ce niveau présentent une symétrie de révolution.
La surface que je considère ici est une surface réelle séparant deux milieux homogènes d'indices de réfraction différents. Si les deux milieux sont transparents, cette surface s'appelle un dioptre.
Le rayon lumineux étant une ligne de section nulle, le voisinage de la surface au point d'impact est toujours une portion de plan (au premier ordre).
Le plan d'incidence est le plan perpendiculaire à la surface, contenant le rayon incident, et la normale à la surface au point d'impact.
Au point d'impact I, une partie de l'énergie du rayon incident est réfléchie et l'autre est transmise , conduisant à un rayon réfléchi et un rayon réfracté.
L'énergie transmise dans le second milieu se propage sans perte dans un milieu transparent. Elle est absorbée dans un milieu opaque
Un miroir sphérique est un miroir dont la surface s'inscrit dans la surface d'une sphère. Il présente en général une symétrie de révolution autour de l'axe optique. Il est définit par deux points situés sur l'axe optique :
Le rayon de courbure R est la longueur (non algébrique) du segment de droite. [S;C].
Dans les calculs, les longueurs sont algébriques, donc j'ai : $R=|SC|=|CS|$
Un dioptre sphérique est une surface qui s'inscrit localement sur la surface d'une sphère, et qui sépare deux milieux homogènes et isotropes d'indices de réfraction différents.
L'axe optique
Le dioptre plan étant un dioptre sphérique de rayon de courbure infini, les lentilles sphériques épaisses sont généralement classées en :
Une lentille épaisse sphérique est un système optique composée de deux dioptres sphériques séparant le milieu constitutif de la lentille, centrés sur un même axe de révolution.
Il est défini par 4 points situés sur l'axe optique :
Ces 4 points définissent 3 longueurs algébriques :
Ces 2 dioptres séparent 3 milieux d'indices de réfraction différents :
Tout système $Syst$ admet des grandeurs d'entrée $E_1, E_2,...E_n$ et fournit des grandeurs de sortie $S_1, S_2,...S_m$.
$$Syst\: :\:E_1, E_2,...E_n\: \mapsto\: S_1, S_2,...S_m$$| Caractérisation OBJET | |||
|---|---|---|---|
| Taille $BC$ | Diamètre apparent $\alpha$ | ||
| Caractérisation IMAGE | Taille $B'C'$ | Grandissement $\gamma$ | 0.003 |
| Diamètre apparent $\alpha'$ | 1.7 | 0.002 | |
Le microscope permet de voir des détails invisibles à la simple vision directe, d'un objet de petite taille placé devant lui. est un système optique centré, qui donne d'un objet de petite taille placé devant lui