Teorema delle funzioni implicite

In matematica, in particolare in analisi matematica e geometria, il teorema delle funzioni implicite è un importante strumento che stabilisce quando il luogo di zeri di un'equazione implicita si può esplicitare rispetto a una variabile.

Nella letteratura italiana, il teorema è generalmente detto teorema di Dini in onore del matematico Ulisse Dini, che contribuì ad estenderne la formulazione.[1]

Il teorema di Dini

Il teorema di Dini stabilisce che una funzione reale di classe C 1 {\displaystyle C^{1}} di due variabili del tipo:

F ( x , y ) {\displaystyle F(x,y)}

definisce implicitamente un'unica funzione del tipo:

y = f ( x ) {\displaystyle y=f(x)}

in un intorno di un punto ( a , b ) {\displaystyle (a,b)} tale che (esplicitando rispetto alla variabile y):[2]

F ( a , b ) = 0 , F y ( a , b ) 0. {\displaystyle F(a,b)=0,\qquad {\frac {\partial F}{\partial y}}(a,b)\neq 0.}

Il teorema di Dini fornisce quindi una condizione sufficiente affinché esista un'unica funzione y = f ( x ) {\displaystyle y=f(x)} tale che

F ( x , f ( x ) ) = 0 {\displaystyle F(x,f(x))=0}

sia soddisfatta al variare di x {\displaystyle x} , oppure un'unica funzione x = g ( y ) {\displaystyle x=g(y)} tale che

F ( g ( y ) , y ) = 0 {\displaystyle F(g(y),y)=0}

sia soddisfatta al variare di y {\displaystyle y} .

Questo non significa che sia possibile esplicitare una delle due incognite in funzione dell'altra, ossia che sia possibile trovare y = f ( x ) {\displaystyle y=f(x)} oppure x = g ( y ) {\displaystyle x=g(y)} in forma esplicita, ma mostra piuttosto che esiste almeno una delle due funzioni, detta funzione implicita.

Se ci si limita all'individuazione di particolari tipi di funzione, ad esempio quelle continue e definite su un intervallo, si può dimostrare anche la loro unicità, il che sancisce un'equivalenza formale tra la scrittura implicita F ( x , y ) = 0 {\displaystyle F(x,y)=0} e quella esplicita y = f ( x ) {\displaystyle y=f(x)} oppure x = g ( y ) {\displaystyle x=g(y)} . Ad esempio, l'equazione:

F ( x , y ) = y + x 2 e y = 0 {\displaystyle F(x,y)=y+x^{2}e^{y}=0}

ben definisce un'unica funzione continua y = f ( x ) {\displaystyle y=f(x)} definita per ogni x {\displaystyle x} reale, che tuttavia non può essere scritta esplicitamente.

Enunciato

Sia F : G R 2 R {\displaystyle F\colon G\subset \mathbb {R} ^{2}\to \mathbb {R} } una funzione a valori reali, differenziabile e le cui derivate parziali prime siano funzioni continue. Sia inoltre ( x 0 , y 0 ) G {\displaystyle (x_{0},y_{0})\in G} tale che:

F ( x 0 , y 0 ) = 0 , F y ( x 0 , y 0 ) 0. {\displaystyle F(x_{0},y_{0})=0,\qquad {\frac {\partial F}{\partial y}}(x_{0},y_{0})\neq 0.}

Il teorema afferma che esiste una funzione derivabile reale:

g : [ x 0 h , x 0 + h ] [ y 0 k , y 0 + k ] , h , k > 0 , h , k R , {\displaystyle g\colon [x_{0}-h,x_{0}+h]\to [y_{0}-k,y_{0}+k],\qquad h,k>0,\quad h,k\in \mathbb {R} ,}

la cui derivata prima sia continua. Inoltre, il grafico di g {\displaystyle g} è l'insieme delle coppie:

{ ( x , y ) G : F ( x , y ) = 0 } {\displaystyle \{(x,y)\in G:F(x,y)=0\}}

che sono contenute nel rettangolo:

[ x 0 h , x 0 + h ] × [ y 0 k , y 0 + k ] . {\displaystyle [x_{0}-h,x_{0}+h]\times [y_{0}-k,y_{0}+k].}

Il teorema in due dimensioni

Si consideri una funzione di classe C1 F : A R {\displaystyle F\colon A\to \mathbb {R} } definita su un insieme aperto A R 2 {\displaystyle A\subseteq \mathbb {R} ^{2}} , e si consideri l'insieme:

Z = { ( x , y ) A : F ( x , y ) = 0 } . {\displaystyle Z=\{(x,y)\in A:F(x,y)=0\}.}

Se Z {\displaystyle Z} è non vuoto esiste un punto ( x 0 , y 0 ) {\displaystyle (x_{0},y_{0})} tale che:

F ( x 0 , y 0 ) = 0. {\displaystyle F(x_{0},y_{0})=0.}

Il teorema afferma che se ( x 0 , y 0 ) {\displaystyle (x_{0},y_{0})} non è un punto critico, ossia:

F ( x 0 , y 0 ) 0 , {\displaystyle \nabla F(x_{0},y_{0})\neq 0,}

allora esiste un intorno U {\displaystyle U} di ( x 0 , y 0 ) {\displaystyle (x_{0},y_{0})} tale che l'insieme Z U {\displaystyle Z\cap U} è il grafico di una funzione derivabile.

Questo equivale a dire che esiste un'unica funzione del tipo y = y ( x ) {\displaystyle y=y(x)} o del tipo x = x ( y ) {\displaystyle x=x(y)} che mette in relazione le due incognite x {\displaystyle x} e y {\displaystyle y} . Si noti che questo non significa che è davvero possibile esplicitare una delle due variabili in funzione dell'altra, ma solo che l'equazione definisce implicitamente un legame tra le due incognite che è univoco.

Sia g : A R 2 R {\displaystyle g\colon A\subset \mathbb {R} ^{2}\rightarrow \mathbb {R} } una funzione di classe C 1 {\displaystyle {\mathcal {C}}^{1}} nell'aperto A {\displaystyle A} e sia ( x 0 , y 0 ) A {\displaystyle (x_{0},y_{0})\in A} tale che:

g ( x 0 , y 0 ) = 0 , g y ( x 0 , y 0 ) 0. {\displaystyle g(x_{0},y_{0})=0,\qquad g_{y}(x_{0},y_{0})\neq 0.}

Allora esistono un intervallo reale aperto I {\displaystyle I} , con x 0 I {\displaystyle x_{0}\in I} , un intervallo reale aperto J {\displaystyle J} , con y 0 J {\displaystyle y_{0}\in J} , ed una funzione y ( x ) {\displaystyle y(x)} di classe C 1 {\displaystyle {\mathcal {C}}^{1}} in I {\displaystyle I} a valori in J {\displaystyle J} tali che:

y ( x 0 ) = y 0 , y ( x 0 ) = ( g x ( x 0 , y 0 ) g y ( x 0 , y 0 ) ) {\displaystyle y(x_{0})=y_{0},\qquad y'(x_{0})=-\left({\frac {g_{x}(x_{0},y_{0})}{g_{y}(x_{0},y_{0})}}\right)}

e tali che per ogni x I , y J {\displaystyle x\in I,y\in J} la relazione:

g ( x , y ) = 0 {\displaystyle g(x,y)=0}

si verifica se e solo se:

y = y ( x ) . {\displaystyle y=y(x).}

Scambiando i ruoli delle variabili si giunge a definire una funzione x = x ( y ) {\displaystyle x=x(y)} .

Dimostrazioni

Prima dimostrazione

Sia data una funzione continua g : A R 2 R {\displaystyle g\colon A\subset \mathbb {R} ^{2}\to \mathbb {R} } di classe C 1 {\displaystyle {\mathcal {C}}^{1}} in A {\displaystyle A} tale che g ( x , y ) 0 {\displaystyle \nabla g(x,y)\neq 0} in tutti i punti tali che g ( x , y ) = 0 {\displaystyle g(x,y)=0} , cioè nella curva di livello:

V = { ( x , y ) A : g ( x , y ) = 0 } . {\displaystyle V=\{(x,y)\in A:g(x,y)=0\}.}

Sia ( x 0 , y 0 ) {\displaystyle (x_{0},y_{0})} un punto di V {\displaystyle V} e si consideri il relativo sviluppo al primo ordine di Taylor:

g ( x , y ) = g ( x 0 , y 0 ) + g x ( x 0 , y 0 ) ( x x 0 ) + g y ( x 0 , y 0 ) ( y y 0 ) + o ( ( x x 0 ) 2 + ( y y 0 ) 2 ) . {\displaystyle g(x,y)=g(x_{0},y_{0})+g_{x}(x_{0},y_{0})(x-x_{0})+g_{y}(x_{0},y_{0})(y-y_{0})+o({\sqrt {(x-x_{0})^{2}+(y-y_{0})^{2}}}).}

Tenendo conto che g ( x 0 , y 0 ) = 0 {\displaystyle g(x_{0},y_{0})=0} , uguagliando a zero la prima parte del termine al primo ordine si ottiene:

g x ( x 0 , y 0 ) ( x x 0 ) + g y ( x 0 , y 0 ) ( y y 0 ) = 0. {\displaystyle g_{x}(x_{0},y_{0})(x-x_{0})+g_{y}(x_{0},y_{0})(y-y_{0})=0.}

Per ipotesi, tale equazione di primo grado ha almeno un coefficiente diverso da zero, e si può porre g y ( x 0 , y 0 ) 0 {\displaystyle g_{y}(x_{0},y_{0})\neq 0} . Si può quindi ricavare y {\displaystyle y} in funzione di x {\displaystyle x} :

y = y 0 g x ( x 0 , y 0 ) g y ( x 0 , y 0 ) ( x x 0 ) . {\displaystyle y=y_{0}-{\frac {g_{x}(x_{0},y_{0})}{g_{y}(x_{0},y_{0})}}(x-x_{0}).}

Il teorema mostra che l'errore nella formula di approssimazione al primo ordine non incide sulla possibilità di esprimere una variabile in funzione dell'altra.

La funzione ottenuta ha sviluppo al primo ordine:

y = y 0 g x ( x 0 , y 0 ) g y ( x 0 , y 0 ) ( x x 0 ) + o ( x x 0 ) . {\displaystyle y=y_{0}-{\frac {g_{x}(x_{0},y_{0})}{g_{y}(x_{0},y_{0})}}(x-x_{0})+o(x-x_{0}).}

Seconda dimostrazione (teorema delle contrazioni)

Sia data una funzione continua g : A R 2 R {\displaystyle g\colon A\subseteq \mathbb {R} ^{2}\rightarrow \mathbb {R} } di classe C 1 {\displaystyle {\mathcal {C}}^{1}} nell'aperto A {\displaystyle A} tale che per ( x 0 , y 0 ) A {\displaystyle (x_{0},y_{0})\in A} si abbia

g ( x 0 , y 0 ) = 0 , g y ( x 0 , y 0 ) 0 . {\displaystyle {\begin{aligned}g(x_{0},y_{0})=0,\qquad g_{y}(x_{0},y_{0})\neq 0\end{aligned}}.}

Sia definita la funzione

G ( x , y ) = y g ( x , y ) g y ( x 0 , y 0 ) . {\displaystyle {\begin{aligned}G(x,y)=y-{\frac {g(x,y)}{g_{y}(x_{0},y_{0})}}\end{aligned}}.}

Allora G ( x 0 , y 0 ) = y 0 {\displaystyle G(x_{0},y_{0})=y_{0}} e G ( x , y ) = y {\displaystyle G(x,y)=y} per ( x , y ) I × J {\displaystyle (x,y)\in I\times J} . Dunque trovare gli zeri di g ( x , y ) {\displaystyle g(x,y)} si riduce a trovare il punto fisso della funzione G ( x , y ) {\displaystyle G(x,y)} .

Grazie al teorema delle contrazioni sappiamo che, definito

X = { ψ : I J | ψ C 0 } . {\displaystyle X=\{\psi \colon I\rightarrow J\;|\;\psi \in {\mathcal {C}}^{0}\}.}

Siccome G X {\displaystyle G\in X} , ( X , ) {\displaystyle (X,\lVert \cdot \lVert _{\infty })} è facile dimostrare che sia uno spazio metrico completo, allora

! y = f ( x ) : G ( x , f ( x ) ) = f ( x ) . {\displaystyle \exists !\;y=f(x):G(x,f(x))=f(x).}

Sia H : X X {\displaystyle H\colon X\rightarrow X} una contrazione tale che

w H [ w ] ( x ) = G ( x , w ( x ) ) {\displaystyle w\mapsto H[w](x)=G(x,w(x))}

ci basta dimostrare che H {\displaystyle H} sia ben definita, cioè che H [ w ] X {\displaystyle H[w]\in X} . Questa deve avere le seguenti proprietà:

  1. H [ w ] {\displaystyle H[w]} è continua in I ; {\displaystyle I;}
  2. H [ w ] y 0 ε . {\displaystyle \lVert H[w]-y_{0}\rVert _{\infty }\leq \varepsilon .}

La prima è ovvia siccome l'operatore è composizione di funzioni continue. La seconda può essere dimostrata tramite una catena di disuguaglianze:

H [ w ] y 0 = G ( x , w ( x ) ) G ( x 0 , y 0 ) G ( x , w ( x ) ) G ( x , y 0 ) + G ( x , y 0 ) G ( x 0 , y 0 ) = = G ( x , w ( x ) ) G ( x , y 0 ) + y 0 g ( x , y 0 ) g y ( x 0 , y 0 ) y 0 G y ( x , ξ y ) ( w ( x ) y 0 ) + g ( x , y 0 ) | g y ( x 0 , y 0 ) | sup ξ y J | G y ( x , ξ y ) | w ( x ) y 0 + g ( x , y 0 ) | g y ( x 0 , y 0 ) | ε , {\displaystyle {\begin{aligned}&\lVert H[w]-y_{0}\rVert _{\infty }=\lVert G(x,w(x))-G(x_{0},y_{0})\lVert _{\infty }\leq \lVert G(x,w(x))-G(x,y_{0})\lVert _{\infty }+\lVert G(x,y_{0})-G(x_{0},y_{0})\lVert _{\infty }=\\[10pt]&=\lVert G(x,w(x))-G(x,y_{0})\lVert _{\infty }+\lVert y_{0}-{\frac {g(x,y_{0})}{g_{y}(x_{0},y_{0})}}-y_{0}\lVert _{\infty }\leq \lVert G_{y}(x,\xi _{y})(w(x)-y_{0})\lVert _{\infty }+{\frac {\lVert g(x,y_{0})\lVert _{\infty }}{|g_{y}(x_{0},y_{0})|}}\leq \\[10pt]&\leq {\underset {\xi _{y}\in J}{\sup }}|G_{y}(x,\xi _{y})|\lVert w(x)-y_{0}\lVert _{\infty }+{\frac {\lVert g(x,y_{0})\lVert _{\infty }}{|g_{y}(x_{0},y_{0})|}}\leq \varepsilon ,\end{aligned}}}

dove si è applicato il teorema di Lagrange ed il fatto che

sup ξ y J G y ( x , ξ y ) 1 2  poiché  h , k  possono essere piccoli a piacimento w ( x ) y 0 ε  poiché  w ( x ) X g ( x , y 0 ) | g y ( x 0 , y 0 ) | ε 2 . {\displaystyle {\begin{aligned}&{\underset {\xi _{y}\in J}{\sup }}G_{y}(x,\xi _{y})\leq {1 \over 2}\;\;{\text{ poiché }}h,k\;{\text{ possono essere piccoli a piacimento}}\\[10pt]&\lVert w(x)-y_{0}\lVert _{\infty }\leq \varepsilon \;\;{\text{ poiché }}w(x)\in X\\[10pt]&{\frac {\lVert g(x,y_{0})\lVert _{\infty }}{|g_{y}(x_{0},y_{0})|}}\leq {\varepsilon \over 2}.\end{aligned}}}

Ora basta dimostrare che H {\displaystyle H} sia una contrazione:

H [ w ] H [ v ] = G ( x , w ( x ) ) G ( x , h ( x ) ) sup ξ J | G ( x , ξ ) | w v 1 2 w v . {\displaystyle \lVert H[w]-H[v]\lVert _{\infty }=\lVert G(x,w(x))-G(x,h(x))\lVert _{\infty }\leq {\underset {\xi \in J}{\sup }}|G(x,\xi )|\lVert w-v\lVert _{\infty }\leq {1 \over 2}\lVert w-v\lVert _{\infty }.}

Il teorema in più dimensioni

Sia f : E R n + m R n {\displaystyle \mathbf {f} \colon E\subset \mathbb {R} ^{n+m}\rightarrow \mathbb {R} ^{n}} una funzione di classe C 1 {\displaystyle {\mathcal {C}}^{1}} , dove R n + m {\displaystyle \mathbb {R} ^{n+m}} è il prodotto cartesiano R n × R m {\displaystyle \mathbb {R} ^{n}\times \mathbb {R} ^{m}} i cui elementi sono del tipo ( x , y ) = ( x 1 , x 2 , , x n , y 1 , y 2 , , y m ) {\displaystyle (\mathbf {x} ,\mathbf {y} )=(x_{1},x_{2},\ldots ,x_{n},y_{1},y_{2},\ldots ,y_{m})} . Sia inoltre ( a , b ) = ( a 1 , a 2 , , a n , b 1 , b 2 , , b m ) E {\displaystyle (\mathbf {a} ,\mathbf {b} )=(a_{1},a_{2},\ldots ,a_{n},b_{1},b_{2},\ldots ,b_{m})\in E} un punto tale che f ( a , b ) = 0 {\displaystyle \mathbf {f} (\mathbf {a} ,\mathbf {b} )=0} .

Data la matrice jacobiana di f {\displaystyle \mathbf {f} } in ( a , b ) {\displaystyle (\mathbf {a} ,\mathbf {b} )} :

( D f ) ( a , b ) = [ f 1 x 1 ( a , b ) f 1 x n ( a , b ) f n x 1 ( a , b ) f n x n ( a , b ) | f 1 y 1 ( a , b ) f 1 y m ( a , b ) f n y 1 ( a , b ) f n y m ( a , b ) ] = [ X | Y ] , {\displaystyle {\begin{matrix}(D\mathbf {f} )(\mathbf {a} ,\mathbf {b} )&=&\left[{\begin{matrix}{\frac {\partial f_{1}}{\partial x_{1}}}(\mathbf {a} ,\mathbf {b} )&\cdots &{\frac {\partial f_{1}}{\partial x_{n}}}(\mathbf {a} ,\mathbf {b} )\\\vdots &\ddots &\vdots \\{\frac {\partial f_{n}}{\partial x_{1}}}(\mathbf {a} ,\mathbf {b} )&\cdots &{\frac {\partial f_{n}}{\partial x_{n}}}(\mathbf {a} ,\mathbf {b} )\end{matrix}}\right|\left.{\begin{matrix}{\frac {\partial f_{1}}{\partial y_{1}}}(\mathbf {a} ,\mathbf {b} )&\cdots &{\frac {\partial f_{1}}{\partial y_{m}}}(\mathbf {a} ,\mathbf {b} )\\\vdots &\ddots &\vdots \\{\frac {\partial f_{n}}{\partial y_{1}}}(\mathbf {a} ,\mathbf {b} )&\cdots &{\frac {\partial f_{n}}{\partial y_{m}}}(\mathbf {a} ,\mathbf {b} )\\\end{matrix}}\right]={\begin{bmatrix}X&|&Y\end{bmatrix}}\\\end{matrix}},}

si supponga che X {\displaystyle X} sia invertibile.

Il teorema delle funzioni implicite afferma che vi sono due insiemi aperti U R n + m {\displaystyle U\subset \mathbb {R} ^{n+m}} e V R m {\displaystyle V\subset \mathbb {R} ^{m}} contenenti rispettivamente ( a , b ) {\displaystyle (\mathbf {a} ,\mathbf {b} )} e b {\displaystyle \mathbf {b} } tali che per ogni y V {\displaystyle \mathbf {y} \in V} esiste un unico x {\displaystyle \mathbf {x} } che soddisfa ( x , y ) U {\displaystyle (\mathbf {x} ,\mathbf {y} )\in U} e f ( x , y ) = 0 {\displaystyle \mathbf {f} (\mathbf {x} ,\mathbf {y} )=0} . Inoltre, la funzione g : V R n {\displaystyle \mathbf {g} \colon V\to \mathbb {R} ^{n}} tale che g ( y ) = x {\displaystyle \mathbf {g} (\mathbf {y} )=\mathbf {x} } è una funzione di classe C 1 {\displaystyle {\mathcal {C}}^{1}} tale che:[3]

g ( b ) = a , ( D g ) ( b ) = X 1 Y , {\displaystyle \mathbf {g} (\mathbf {b} )=\mathbf {a} ,\qquad (D\mathbf {g} )(\mathbf {b} )=-X^{-1}Y,}

dove ( D g ) ( b ) {\displaystyle (D\mathbf {g} )(\mathbf {b} )} è la jacobiana di g {\displaystyle \mathbf {g} } in b {\displaystyle \mathbf {b} } . La relazione:

f ( g ( y ) , y ) = 0 , y V , {\displaystyle \mathbf {f} (\mathbf {g} (\mathbf {y} ),\mathbf {y} )=0,\qquad \mathbf {y} \in V,}

definisce implicitamente g {\displaystyle \mathbf {g} } .

Il teorema stabilisce quindi che il sistema f ( x , y ) = 0 {\displaystyle \mathbf {f} (\mathbf {x} ,\mathbf {y} )=\mathbf {0} } :

{ f 1 ( x 1 , x 2 , , x n , y 1 , y 2 , , y m ) = 0 f 2 ( x 1 , x 2 , , x n , y 1 , y 2 , , y m ) = 0 f n ( x 1 , x 2 , , x n , y 1 , y 2 , , y m ) = 0 {\displaystyle \left\{{\begin{matrix}f_{1}(x_{1},x_{2},\cdots ,x_{n},y_{1},y_{2},\cdots ,y_{m})=0\\f_{2}(x_{1},x_{2},\cdots ,x_{n},y_{1},y_{2},\cdots ,y_{m})=0\\\vdots \\f_{n}(x_{1},x_{2},\cdots ,x_{n},y_{1},y_{2},\cdots ,y_{m})=0\\\end{matrix}}\right.}

può essere risolto esplicitando ( x 1 , x 2 , , x n ) {\displaystyle (x_{1},x_{2},\cdots ,x_{n})} in funzione di ( y 1 , y 2 , , y m ) {\displaystyle (y_{1},y_{2},\cdots ,y_{m})} in un intorno di b {\displaystyle \mathbf {b} } se il sistema è risolvibile in ( a , b ) {\displaystyle (\mathbf {a} ,\mathbf {b} )} e se X {\displaystyle X} è invertibile.[4] Le soluzioni così trovate sono inoltre funzioni di classe C 1 {\displaystyle {\mathcal {C}}^{1}} . Il teorema può essere generalizzato al caso di funzioni analitiche.

Il teorema si estende anche agli spazi di Banach.

Note

  1. ^ Steven Krantz e Harold Parks, The Implicit Function Theorem, Modern Birkhauser Classics, Birkhauser, 2003, ISBN 0-8176-4285-4.
  2. ^ W. Rudin, Pag. 225.
  3. ^ W. Rudin, Pag. 226.
  4. ^ W. Rudin, Pag. 227.

Bibliografia

  • Walter Rudin, Principi di analisi matematica, Milano, McGraw-Hill, 1991, ISBN 88-386-0647-1.
  • V.Barutello, M.Conti, D.L.Ferrario, S.Terracini, G.Verzini, Analisi matematica. Con elementi di geometria e calcolo vettoriale, Apogeo Editore, 2008, ISBN 8850324235.

Voci correlate

Collegamenti esterni

  • (EN) Eric W. Weisstein, Teorema delle funzioni implicite, su MathWorld, Wolfram Research. Modifica su Wikidata
Controllo di autoritàGND (DE) 4570203-2
  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica