Inversa de Moore-Penrose

dado uma matriz A, a única matriz B tal que ABA = A, BAB = B, e que AB e BA são ambas hermitianas

Em matemática, e em particular em álgebra linear, a matriz inversa de Moore-Penrose de uma matriz é a generalização mais conhecida da matriz inversa.[1] [2] [3] [4] Ela foi descrita independentemente por EH Moore[5] em 1920, Arne Bjerhammar[6] em 1951 e Roger Penrose[7] em 1955. Anteriormente, Erik Ivar Fredholm introduziu o conceito de pseudoinversa para operadores integrais em 1903. Ao se referir a uma matriz, o termo pseudoinversa, sem maiores especificações, é frequentemente usado para indicar a inversa de Moore-Penrose. O termo inversa generalizada às vezes é usado como sinônimo de pseudoinversa.

Um uso comum da pseudoinversa é o cálculo da solução de mínimos quadrados para um sistema de equações lineares que não possui solução. Outro uso é encontrar a solução de norma (euclidiana) mínima para um sistema de equações lineares com múltiplas soluções. A matriz pseudoinversa facilita o enunciado e a e a prova de resultados em álgebra linear.

A pseudoinversa é definida e única para todas as matrizes cujas entradas são números reais ou complexos. Pode ser determinada usando-se a decomposição de valores singulares. No caso especial em que é uma matriz normal (por exemplo, uma matriz Hermitiana), a pseudoinversa anula o núcleo de e atua como uma inversa tradicional de no subespaço ortogonal ao núcleo.

Notação

editar

Na discussão a seguir, as seguintes convenções são adotadas:

  •   denota o corpo dos números reais ( ) ou o cordos dos números complexos ( ). O espaço vetorial de matrizes   sobre   é denotado por  .
  • Para  , sua transposta é denotada por   e a transposta conjugada (também chamada de adjunta) é denotada por  . Se  , entãoo  .
  • Para  ,   denota o espaço coluna (imagem) de   (o espaço gerado pelos vetores colunas de  ) e   (ou  ) denota o núcleo (espaço nulo) de  .
  • Para qualquer inteiro positivo  , a matriz identidade de ordem   é denotada por  .

Definição

editar

Para  , uma pseudoinversa de A é definida como uma matriz   satisfazendo todos os quatro critérios a seguir, conhecidos como condições de Moore-Penrose:[8][9]

  1.   não precisa ser a matriz identidade, mas deve mapear todos os vetores colunas de A em si mesmos: 
  2.   atua como uma inversa graca:  
  3.   é Hermitiana:  
  4.   também é Hermitiana:  

A pseudoinversa   existe para qualquer matriz  . Se, além disso,   tem posto completo, ou seja, seu posto é  , então   tem uma expressão algébrica particularmente simples.

Em particular, quando   tem colunas linearmente independentes (equivalentemente,   é injetiva e, portanto   é invertível),   pode ser calculado como 

Esta pseudoinversa específica é uma inversa à esquerda, ou seja,   . Se, por outro lado,   tem linhas linearmente independentes (equivalentemente,   é sobrejetiva e, portanto,   é invertível),   pode ser calculado como

 Esta é uma inversa à direita, uma vez que  .

No caso mais geral, a matriz pseudoinversa pode ser expressa usando-se a decomposição de valores singulares. Qualquer matriz pode ser decomposta como   para algumas matrizes   e matriz real positiva diagonal   . A pseudoinversa pode então ser escrita como   . Que esta matriz satisfaz o requisito acima é verificado diretamente observando que   e  , que são as projeções na imagem e suporte de  

 , respectivamente.

Propriedades

editar

Existência e unicidade

editar

Para qualquer matriz  , existe uma, e somente uma pseudoinversa  .[10]

Uma matriz que satisfaz a primeira condição da definição é conhecida como inversa generalizada. Se a matriz também satisfaz a segunda definição, ela é chamada de inversa generalizada reflexiva. Inversas generalizadas sempre existem, mas em geral não são únicas. A unicidade é uma consequência dessas duas condições.

Propriedades básicas

editar
  • Se   tem entradas reais, então   também tem.
  • Se   é invertível, sua pseudoinversa é sua inversa, ou seja,  .[11]
  • A pseudoinversa de uma matriz nula é sua transposta, ou seja,  .
  • A pseudoinversa da pseudoinversa de   é a própria matriz  , ou seja,  .[11]
  • Pseudoinversion commutes with transposition, conjugation, and taking the conjugate transpose:[11]:245
     ,  ,  .
  • A pseudoinversa de um múltiplo escalar de   é o múltiplo inverso de  , ou seja,   for  .

Identidades

editar

As seguintes identidades podem ser usadas para simplificar ou expandir expressões envolvendo pseudoinversas:

 

Exemplos

editar

Como para matrizes invertíveis a pseudoinversa é igual à inversa usual, apenas exemplos de matrizes não invertíveis são apresentados abaixo.

  • Para   a pseudoinversa é   (De modo geral, a pseudoinversa de uma matriz nula é a sua transposta). A unicidade desta pseudoinversa pode ser vista a partir da condição  , já que a multiplicação por uma matriz nual sempre produz uma matriz nula.
  • Para   a pseudoinversa é  
    De fato,   e portanto  
    Similarmente,   e portanto  
  • Para    
  • Para     (Os denominadores são  .)
  • Para    
  • Para   a pseudoinversa é  
    Observe que para esta matriz, a inversa à esquerda existe e, portanto, é igual  . De fato,  

Ver também

editar

Referências

  1. Ben-Israel & Greville 2003, p. 7.
  2. Campbell & Meyer 1991, p. 10.
  3. Nakamura 1991, p. 42.
  4. Rao & Mitra 1971, p. 50–51.
  5. Moore, E. H. (1920). «On the reciprocal of the general algebraic matrix». Bulletin of the American Mathematical Society. 26 (9): 394–95. doi:10.1090/S0002-9904-1920-03322-7  
  6. Bjerhammar, Arne (1951). «Application of calculus of matrices to method of least squares; with special references to geodetic calculations». Trans. Roy. Inst. Tech. Stockholm. 49 
  7. Penrose, Roger (1955). «A generalized inverse for matrices». Proceedings of the Cambridge Philosophical Society. 51 (3): 406–13. Bibcode:1955PCPS...51..406P. doi:10.1017/S0305004100030401  
  8. Penrose, Roger (1955). «A generalized inverse for matrices». Proceedings of the Cambridge Philosophical Society. 51 (3): 406–13. Bibcode:1955PCPS...51..406P. doi:10.1017/S0305004100030401  
  9. Golub, Gene H.; Charles F. Van Loan (1996). Matrix computations 3rd ed. Baltimore: Johns Hopkins. pp. 257–258. ISBN 978-0-8018-5414-9 
  10. Golub, Gene H.; Charles F. Van Loan (1996). Matrix computations 3rd ed. Baltimore: Johns Hopkins. pp. 257–258. ISBN 978-0-8018-5414-9 
  11. a b c Stoer, Josef; Bulirsch, Roland (2002). Introduction to Numerical Analysis 3rd ed. Berlin, New York: Springer-Verlag. ISBN 978-0-387-95452-3 .

Bibliografia

editar