Cálculo |
---|
|
Definições Conceitos Tabela de derivadas - Somas
- Produto
- Regra da cadeia
- Potências
- Quocientes
- Fórmula de Faà di Bruno
|
Cálculo integral Definições Integração por |
|
|
|
|
|
Em matemática, a matriz Hessiana de uma função "f" de n variáveis é a matriz quadrada com "n" colunas e "n" linhas (n X n) das derivadas parciais de segunda ordem da função. Por isto, esta matriz descreve a curvatura local da função "f". Matrizes Hessianas são usadas em larga escala em problemas de otimização que não usam métodos Newtonianos.
A matriz hessiana foi desenvolvida no século XIX pelo alemão Ludwig Otto Hesse, razão pela qual mais tarde James Joseph Sylvester lhe deu este nome. O próprio Hesse, ao contrário, usava o termo "determinantes funcionais".
Definição formal em termos matemáticos
![](//upload.wikimedia.org/wikipedia/commons/thumb/3/3a/Magnifying_glass_01.svg/17px-Magnifying_glass_01.svg.png)
Ver artigo principal: Matriz (matemática)
Dada uma função real de n variáveis reais
![{\displaystyle f(\mathbf {x} )=f({x_{1}},{x_{2}},{x_{3}}...,x_{n}),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c910153d787a628158e2594306e2989f626428f6)
sendo que
x (em negrito) indica o vetor de dimensão
![{\displaystyle n\times 1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d24148f103e1cccb60addeeb0a64cb1c3d5622e0)
das variáveis
Lembre-se da notação para as derivadas parciais da função em relação às variáveis:
Em linguagem matemática | Em Português | Exemplo: função com n=2: |
![{\displaystyle {\frac {\partial f}{\partial {x_{1}}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/35174a130a6b9406e7293b881b55ea403efc33f8) | derivada parcial de primeira ordem da função "f" em relação a uma variável ![{\displaystyle {x_{1}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2ccffc0b97d586dd754c133d2b3d5b5c8d896a90) | |
![{\displaystyle {\frac {\partial }{\partial {x_{1}}}}\left({\frac {\partial f}{\partial {x_{2}}}}\right)={\frac {\partial ^{2}f}{\partial {x_{1}}\,\partial {x_{2}}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/db581af344cca7847717250320d0f5f157a18b71) | A derivada da derivada (=derivada de segunda ordem): primeiro tomou-se a derivada da função "f" em relação à variável e depois derivou-se esta derivada em relação à variável .[1] | ![{\displaystyle {\frac {\partial ^{2}f}{\partial {x_{1}}\,\partial {x_{2}}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/84abe0efa299940fe87606a9d013ae7c470f5442) ![{\displaystyle ={\frac {\partial \left(2{x_{2}}^{3}\right)}{\partial \partial {x_{2}}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ab225dfc2827f8a5baa069124757e5f18f7225d0) |
Se todas as derivadas parciais de "f" existirem, então a matriz hessiana de f é a matriz quadrada das derivadas de segunda ordem de f:[2]
![{\displaystyle H\left[f({x_{1}},{x_{2}},{x_{3}},...,x_{n})\right]={\begin{bmatrix}{\frac {\partial ^{2}f}{\partial {x_{1}}^{2}}}&{\frac {\partial ^{2}f}{\partial {x_{1}}\,\partial {x_{2}}}}&\cdots &{\frac {\partial ^{2}f}{\partial {x_{1}}\,\partial x_{n}}}\\\\{\frac {\partial ^{2}f}{\partial {x_{2}}\,\partial {x_{1}}}}&{\frac {\partial ^{2}f}{\partial {x_{2}}^{2}}}&\cdots &{\frac {\partial ^{2}f}{\partial {x_{2}}\,\partial x_{n}}}\\\\\vdots &\vdots &\ddots &\vdots \\\\{\frac {\partial ^{2}f}{\partial x_{n}\,\partial {x_{1}}}}&{\frac {\partial ^{2}f}{\partial x_{n}\,\partial {x_{2}}}}&\cdots &{\frac {\partial ^{2}f}{\partial x_{n}^{2}}}\end{bmatrix}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a0c8a166919f66f19be270ba1ac24a2803e16bbb)
Uma outra definição equivalente é: dado o vetor gradiente nX1, a matriz hessiana é sua derivada.[3] Por isso, há outras representações para a mesma matriz hessiana H acima:[4][5]
![{\displaystyle H=D\left[\nabla f\left(\mathbf {x} \right)\right]=D^{2}f_{\mathbf {x} }=D^{2}f\left(\mathbf {x} \right)={\frac {\partial ^{2}f}{\partial (\mathbf {x} )}}(\mathbf {x} )}](https://wikimedia.org/api/rest_v1/media/math/render/svg/65d4d103824fbe32cf842e7abdaf24dad6b921ab)
Propriedades da matriz hessiana
- Dimensão: Como uma função com "n" variáveis tem n2 derivadas parciais de segunda ordem, a matriz hessiana também terá n2 elementos. Por isto, ela sempre será uma matriz quadrada de dimensão nXn.
- Fora da diagonal principal, uma matriz hessiana é composta por derivadas mistas de f.
- Simetria: Se as "segundas derivadas" de f são todas contínuas em uma região dada
consequentemente a hessiana de f é uma matriz simétrica em cada ponto de
dado que, pelo teorema de Young[6] e pelo teorema de Schwartz, nestes casos a ordem de diferenciação não importa (veja, a este respeito, simetria da segunda derivada e Teorema de Schwartz):
![{\displaystyle {\frac {\partial }{\partial {x_{1}}}}\left({\frac {\partial f}{\partial {x_{2}}}}\right)=}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c90d8d421e48c7f50c1a571decdc593529d015ac)
![{\displaystyle {\frac {\partial ^{2}f}{\partial {x_{2}}\,\partial {x_{1}}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/44b3035ca7ca4c634f3c093e74ba204f3dd971e5)
Para variáveis genéricas x
i e x
j, esta igualdade pode ser rescrita como:
![{\displaystyle \partial _{x_{i}x_{j}}f=\partial _{x_{j}x_{i}}f}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1df92d38f20e6b155c3bda3db864d04280e4692e)
Pontos Críticos e Discriminante
Se o gradiente da função f é zero em um ponto x que pertence ao domínio da função, então f em x possui um ponto crítico. O determinante do hessiano em x é chamado de discriminante em x. Se este determinante for zero, x será chamado de ponto crítico degenerado de f. Do contrário, o ponto não será degenerado.
Concavidade de funções
A matriz hessiana é útil para identificar a concavidade de funções duas vezes diferenciáveis. Seja
uma função de n variáveis com derivadas parciais de primeira e segunda ordem contínuas em um conjunto convexo aberto S.
- A função é côncava (e portanto semicôncava também) se e somente se a matriz hessiana for semidefinida negativa
- Se a matriz hessiana é definida negativa, então a função é estritamente côncava. Isso não significa, no entanto, que se a função for estritamente côncava, então H(f) é negativa definida para todo x pertencente a S[7].
- Se a matriz hessiana for definida positiva, então a função é estritamente convexa
- A função é convexa se a matriz hessiana é semidefinida positiva
Propriedade da função | Propriedade da matriz hessiana |
Semidefinida | Definida |
Positiva | Negativa | Positiva | Negativa |
Função côncava (e portanto também quasicôncava) | | X | | |
Função convexa | X | | | |
Função estritamente côncava | | | | X |
Função estritamente convexa | | | X | |
Exemplo simples: como encontrar a matriz hessiana
Considere a função
definida no conjunto de todos os pares de números. Sua matriz hessiana é:
![{\displaystyle H\left[f(x,y)\right]={\begin{bmatrix}{\frac {\partial ^{2}f}{\partial x^{2}}}&{\frac {\partial ^{2}f}{\partial x\,\partial y}}\\\\{\frac {\partial ^{2}f}{\partial y\,\partial x}}&{\frac {\partial ^{2}f}{\partial y^{2}}}\\\end{bmatrix}}={\begin{bmatrix}-2&2\\2&-2\end{bmatrix}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/59c13a2d33ce565baa761c1a605f3202a596ed96)
que é uma matriz negativa semidefinida, portanto f é côncava. Note que neste caso o Hessiano não depende de x e y, mas em geral depende[7]
Uso da matriz hessiana para caracterizar pontos críticos
![](//upload.wikimedia.org/wikipedia/commons/thumb/3/3a/Magnifying_glass_01.svg/17px-Magnifying_glass_01.svg.png)
Ver artigo principal: Ponto crítico (funções)
Dada a função
a condição necessária para que um determinado ponto
seja um ponto crítico é que todas as derivadas parciais, calculadas naquele ponto específico, sejam iguais a zero.[6] No entanto, para definir se este ponto crítico é um ponto de máximo, mínimo ou de sela, é preciso calcular o determinante da matriz hessiana e seus menores principais. Para isso, pode-se seguir os seguintes passos:
- Calcular as "n" derivadas de primeira ordem da função f. O resultado serão "n" funções das variáveis do vetor n × 1
- Igualar cada uma das "n" funções do item 1 a zero. Com isso, serão descobertos valores para cada uma das variáveis
Chamaremos estes valores, cujas coordenadas compõem o ponto crítico, de
Igualmente, o vetor nX1 destes valores (números) será chamado de
Reservar este ponto crítico. - A partir das derivadas de primeira ordem calculadas no item 1, calcular as derivadas de segunda ordem da função f e montar a matriz hessiana nXn. Notar que é possível que muitos elementos desta matriz sejam função das variáveis
- Substitua as variáveis
presentes na matriz hessiana montada no item 3, pelos valores correspondentes do ponto crítico, ou seja, pelos valores do vetor
A matriz resultante não terá mais variáveis, somente números. Por exemplo, a derivada da função f em relação à variável
por sua vez derivada em relação à variável
calculada para o vetor
será representado por
e significa um número. - A partir da matriz resultante do item 4, calcular os menores principais. Os resultados serão números.
![{\displaystyle \left|H_{1}\right\vert =\left|{\frac {\partial ^{2}f}{\partial {x_{1}}^{2}}}(\mathbf {x^{*}} )\right\vert ,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d7299676028503d5bfe8c3fa055d5fea14bb588d)
![{\displaystyle \left|H_{2}\right\vert ={\begin{vmatrix}{\frac {\partial ^{2}f}{\partial {x_{1}}^{2}}}(\mathbf {x^{*}} )&{\frac {\partial ^{2}f}{\partial {x_{1}}\,\partial {x_{2}}}}(\mathbf {x^{*}} )\\\\{\frac {\partial ^{2}f}{\partial {x_{2}}\,\partial {x_{1}}}}(\mathbf {x^{*}} )&{\frac {\partial ^{2}f}{\partial {x_{2}}^{2}}}(\mathbf {x^{*}} )\\\end{vmatrix}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b23f92808ff307f85bbd028b9b4d062225f0bacd)
![{\displaystyle \left|H_{3}\right\vert ={\begin{vmatrix}{\frac {\partial ^{2}f}{\partial {x_{1}}^{2}}}(\mathbf {x^{*}} )&{\frac {\partial ^{2}f}{\partial {x_{1}}\,\partial {x_{2}}}}(\mathbf {x^{*}} )&{\frac {\partial ^{2}f}{\partial {x_{1}}\,\partial {x_{3}}}}(\mathbf {x^{*}} )\\\\{\frac {\partial ^{2}f}{\partial {x_{2}}\,\partial {x_{1}}}}(\mathbf {x^{*}} )&{\frac {\partial ^{2}f}{\partial {x_{2}}^{2}}}(\mathbf {x^{*}} )&{\frac {\partial ^{2}f}{\partial {x_{2}}\,\partial {x_{3}}}}(\mathbf {x^{*}} )\\\\{\frac {\partial ^{2}f}{\partial {x_{3}}\,\partial {x_{1}}}}(\mathbf {x^{*}} )&{\frac {\partial ^{2}f}{\partial {x_{3}}\,\partial {x_{2}}}}(\mathbf {x^{*}} )&{\frac {\partial ^{2}f}{\partial {x_{3}}^{2}}}(\mathbf {x^{*}} )\\\end{vmatrix}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1e8c0ce9317e1d7d8b94b1f85880d3bbd58dcd88)
- ...
=determinante da matriz hessiana calculada no item 4.
- Verificar o sinal dos menores principais do item 5[8]:
Condição | A matriz H | O ponto crítico |
![{\displaystyle \left|H_{1}\right\vert >0,\left|H_{2}\right\vert >0,\left|H_{3}\right\vert >0,\ldots }](https://wikimedia.org/api/rest_v1/media/math/render/svg/bcdb4c2ed76f6d15e62cca1569b7de342b4e4693) | É positiva definida | É ponto de mínimo. |
![{\displaystyle \left|H_{1}\right\vert <0,\left|H_{2}\right\vert >0,\left|H_{3}\right\vert <0,\ldots }](https://wikimedia.org/api/rest_v1/media/math/render/svg/899c9a5ea5e20fc5f5d7211c746ef881cb18fa88) | É negativa definida | É ponto de máximo. |
Ver também
Notas e referências
- ↑ SIMON & BLUME (2004), p. 339.
- ↑ SIMON & BLUME (2004), p. 340.
- ↑ INTRILIGATOR (1971), p. 498.
- ↑ INTRILIGATOR (1971), p. 499.
- ↑ MAS-COLELL, Andreu; WHINSTON, Michael D, e GREEN, Jerry R. Microeconomic Theory. Oxford University press, 1995. ISBN 978-0-19-507340-9. Mathematiocal Appendix, "M.A Matrix Notation for Derivatives", p. 927.
- ↑ a b CHIANG (1984), p. 332.
- ↑ a b Concave and convex functions of many variables. Disponível em: <http://www.economics.utoronto.ca/osborne/MathTutorial/CVN.HTM#p:CcvConds>. Acesso em 10 de abril de 2011.
- ↑ CHIANG (1984), p. 333.
Referências
- SIMON, Carl P., e BLUME, Lawrence. Mátemática para economistas. Porto Alegre: Bookman, 2004. Reimpressão 2008. ISBN 978-85-363-0307-9.
- INTRILIGATOR, Michael D. Mathematical Optimization and Economic Theory. 1971, Prentice-Hall. Inc. Englewood Cliffs, N.J. printed in the United states of America 13-561753-7. Library of Congress Catalog Card Number: 72-127059. Appendix B, "Matrices".
- CHIANG, Alpha C. Fundamental Methods in Mathematical Economics. 3ª edição. McGraw-Hill, Inc. 1984. ISBN 0-07-010813-7. Seção 11.4, "Objective functions with more than two variables".