Diagonalizando uma matriz dois por dois simétrica

É muito comum no curso de bacharelado em física termos que diagonalizar matrizes de ordem dois ou três. Em mecânica quântica, principalmente, há uma imensidão de exercícios que requerem a diagonalização de hamiltonianas dois por dois. O problema de spin em um campo magnético externo, por exemplo, é sempre abordado nos cursos de mecânica quântica. Mesmo em mecânica clássica há problemas que envolvem a diagonalização de pequenas matrizes quadradas, nem sempre simétricas. O problema de dois osciladores harmônicos acoplados, por exemplo, envolve a diagonalização de uma matriz de ordem dois. Nesta postagem vou diagonalizar uma matriz dois por dois simétrica, com elementos reais, dada a importância desse caso no curso de graduação e mesmo de pós-graduação. Farei uma exposição específica para este problema particular, de ordem dois, mas, quando discutir o determinante que dá os autovalores, farei uma digressão bem completa sobre a fórmula para calcular, no caso de dimensão finita qualquer, o determinante do produto de duas matrizes.

Vamos considerar a diagonalização de uma matriz simétrica com elementos reais. Seja essa matriz dada por

com e números reais. Para que a diagonalização não seja trivial, vamos supor que Sem perder a generalidade, vamos supor também que pois, no caso tivéssemos negativo, bastaria diagonalizar a matriz ao invés de A Eq. (1) mostra que a matriz é simétrica, pois sua transposta é idêntica a ela mesma, isto é,

Devemos encontrar uma matriz com inversa, tal que

onde é uma matriz diagonal,

e e são os chamados “autovalores de ”. Podemos reescrever a Eq. (1) assim:

onde, por conveniência notacional, definimos

Substituindo a Eq. (5) na Eq. (3), dá

isto é,

ou seja,

pois

Da Eq. (7) vemos que a matriz

é diagonalizável pela mesma matriz que diagonaliza a matriz original, da Eq. (1). Note, na Eq. (7), que os autovalores da matriz são e Vamos, portanto, diagonalizar a matriz da Eq. (9). Mas, antes, vamos ver o que significa diagonalizar uma matriz. Da Eq. (3), podemos escrever

onde multiplicamos, pela esquerda, ambos os membros da Eq. (3) por e usamos a definição da inversa da matriz isto é,

onde

Vamos escrever uma forma explícita para a matriz

onde devemos encontrar os elementos para Multiplicando a Eq. (13) pela Eq. (4), obtemos

Substituindo as Eqs. (13) e (14) na Eq. (10) e usando a Eq. (1) para a matriz encontramos a equação matricial:

Mas,

Com a Eq. (16), a Eq. (15) agora escreve-se

Como a Eq. (17) é, sem dúvida, uma igualdade matricial, cada elemento da matriz escrita no membro esquerdo deve ser igual ao seu correspondente no membro direito da equação. Em particular, a primeira coluna da matriz do primeiro membro da Eq. (17) deve ser igual à primeira coluna do segundo membro e, portanto,

Mas a Eq. (18) pode ser reescrita assim:

Você pode verificar também que igualando a segunda coluna da matriz da esquerda da Eq. (17), com a segunda coluna da matriz da direita dessa equação, resulta em

As Eqs. (19) e (20) são as chamadas equações de autovalores e autovetores. Os números e já foram identificados como os autovalores da matriz logo abaixo da Eq. (4). As duas colunas da matriz que aparecem, respectivamente, nas Eqs. (19) e (20), são os chamadas “autovetores da matriz ”, caso não sejam nulas, isto é, um autovetor não pode ser nulo, por definição. A Eq. (3) define o que é a diagonalização de uma matriz. As Eqs. (19) e (20) são, como vimos acima, equivalentes à Eq. (3). É por causa dessa equivalência que, para diagonalizar uma matriz, podemos proceder encontrando seus autovalores e autovetores. Aqui, embora estejamos tratando o caso de uma matriz simétrica você pode verificar que a equivalência entre a definição da Eq. (3) e o correspondente conjunto de equações de autovalores e autovetores vale também para o caso de matrizes não simétricas e de maior dimensão, desde que sejam matrizes quadradas e que seja possível diagonalizá-las. No caso de matrizes simétricas, sempre é possível diagonalizá-las, embora eu não demonstrarei isso aqui.

Voltando para a diagonalização da matriz da Eq. (9), precisamos encontrar todos os números e autovetores tais que

Definamos, portanto,

Usando as Eqs. (9) e (22), podemos reescrever a Eq. (21) como

isto é,

ou, equivalentemente, usando as Eqs. (12) e (21)

ou seja,

ou ainda,

Se a inversa da matriz existir, podemos denotá-la por Então, a Eq. (24) pode ser multiplicada por essa matriz inversa, pela esquerda, e obtemos

isto é,

ou seja,

Então, se existir a inversa da matriz não encontraremos os autovetores da matriz Qual a condição para que uma matriz não possa ser invertida? Para encontrar essa condição, vamos considerar a matriz da Eq. (13). Para encontrar sua inversa, precisamos encontrar uma outra matriz, denotada tal que a Eq. (11) seja válida.

Tomemos, para começar, o determinante da Eq. (11):

É muito fácil ver que o determinante da identidade é igual à unidade, para qualquer dimensão do espaço de matrizes quadradas. Mas qual o valor do determinante de um produto de duas matrizes quadradas? Para responder a esta questão, vamos considerar o produto de duas matrizes, e Um elemento qualquer desse produto é dado por

onde é um número inteiro representando o número de elementos de uma linha ou coluna das matrizes também chamado de “ordem da matriz”. O determinante de uma matriz pode ser definido como

onde é a função que dá a -ésima permutação de números inteiros, de até e é o sinal da permutação dessas permutações. Por exemplo, vamos considerar matrizes Nesse caso, há permutações. Podemos representar essas permutações por e Não há mais permutações de a além dessas seis. A primeira, definimos como sendo a segunda, como e assim sucessivamente até que a sexta é definida como Poderíamos trocar a ordem dos índices inferiores dessas funções a nosso bel-prazer, sem alterar o resultado da definição da Eq. (28); depois da explicação que segue, você pode pensar e ver que isso é verdade. Então, essas seis funções atuam nos números e dando:

e

O sinal de uma determinada permutação, digamos por exemplo, é calculado tomando elevado ao número de inversões da terna dada, neste particular exemplo, por conforme mostra a Eq. (33). O número de inversões em uma permutação de números, é dada pelo número de pares no conjunto desses números, tais que e, ao mesmo tempo, Neste exemplo, há duas inversões na permutação e pois e Então, essa permutação tem sinal positivo, isto é, pois tem um número par de inversões. Você pode facilmente verificar que, por exemplo, pois o número de inversões na permutação é ímpar, correspondendo aos pares e de acordo com a Eq. (34).

Vamos, então, usar a Eq. (28) para ver o que dá o determinante de uma matriz

onde expandimos o produtório. Uma pequena digressão sobre o símbolo é oportuna neste ponto. Produtórios são análogos a somatórios, exceto que, ao invés de somar termos, produtórios multiplicam fatores. Por exemplo, o produtório que dá é escrito como

Veja, que, como no caso de somatórios, a ordem nos produtórios pode ser invertida sem que haja alteração no resultado final:

onde usamos a Eq. (36) na última igualdade. Também, em analogia com somatórios, o índice aparecendo em um produtório é irrelevante, como explicitado na Eq. (37). O índice em um produtório é também dito “mudo”, como no caso de índices aparecendo em somatórios.

Retornemos à Eq. (35). Podemos agora expandir o somatório e obter

que, com as Eqs. desde (29) até (34), também permite que esse determinante seja escrito como

onde já calculamos os sinais das permutações, contando quantas inversões há em cada uma. Lembrando as regras e a notação para determinantes do segundo grau, podemos ver que a Eq. (38) também pode ser escrita assim:

ou seja,

como é ensinado no segundo grau.

Uma vez que nos certificamos de que a definição para determinantes da Eq. (28) é, nos casos particulares que conhecemos, o que já sabemos, podemos proceder com o cálculo do determinante do produto de duas matrizes. Usando a Eq. (28), mas trocando os elementos da matriz por aqueles do produto dados pela Eq. (27), obtemos

onde precisamos introduzir o subíndice ao índice para não confundir os produtos de somatórios que aparecem quando expandimos o produtório. Vamos expandir o produtório da Eq. (40). Então,

Mas, a ordem de somatórios não importa e, portanto, podemos reescrever a Eq. (41) como

Considere uma sequência de números e a quantidade entre colchetes da Eq. (42). Suponha que dois desses números sejam iguais. Nesse caso, devemos mostrar que a quantidade entre colchetes é nula. Primeiro, considere o caso em que Então,

onde definimos e No caso em que vemos que a Eq. (43) dá zero. Considere agora o caso em que

onde usamos as Eqs. de (29) a (34) para definir É fácil verificar que se dois dos números e forem iguais, a Eq. (44) dá zero. Verifique! Para qualquer a soma entre colchetes da Eq. (42) dá zero. Para ver isso, considere um dos termos da soma entre colchetes, que é dado por, digamos,

onde e Entre os termos da soma entre colchetes da Eq. (42) há, para cada termo como o (45), um outro, proveniente de outra permutação, dada por

para Necessariamente, então, para esses dois termos,

e

já que não pode haver duas permutações iguais na soma sobre as permutações. Então, para cada termo como o (45), há um outro como

onde usamos as Eqs. (46), (47) e (48). Como, por hipótese, os termos (45) e (49) só diferem pelo seu sinal: um tem o fator enquanto o outro tem um fator Esses sinais são opostos. Para ver isso, note que ou pois não podem ser iguais, uma vez que por hipótese. Para que a permutação seja convertida na permutação temos que proceder a um número ímpar de trocas entre dois números adjacentes na sequência dada por Por exemplo, para que a sequência dada por seja convertida na sequência precisamos trocar com depois, com e, depois, com obtendo A seguir, temos que trocar com e, depois, com em um total de trocas. Cada vez que trocamos dois números adjacentes, a nova permutação deve trocar de sinal com relação à anterior, já que um número na sequência é sempre maior, ou menor, do que outro. Para trocar um dos números com qualquer outro, devemos trocar um deles com cada um dos números entre os dois, trocá-los entre si, quando estiverem adjacentes, e, depois, trocar o outro número com os mesmos números que estavam, no início, entre eles. Temos, assim, que efetuar trocas entre números adjacentes, isto é, temos sempre um número ímpar de trocas. Cada troca adjacente muda o sinal da permutação e, portanto, a troca entre dois números quaisquer sempre muda o sinal da permutação, com relação à permutação de partida.

Uma vez que demonstramos que a presença de índices repetidos em termos que não se cancelam na Eq. (42) não ocorre, então, de todos os termos possíveis, somente aqueles que têm todos os índices não nulos podem permanecer sem se cancelar. Assim, os somatórios da Eq. (42) contribuem com termos não nulos somente para permutações da sequência de índices de até Logo, a Eq. (42) pode ser reescrita como

Vamos olhar para a soma entre colchetes. Em cada termo da soma, podemos reordenar os fatores todos de forma a obter os primeiros índices dos fatores na ordem crescente de até Essa é justamente a permutação inversa de Vamos denotar essa permutação inversa como Então, a soma entre colchetes pode ser escrita como

onde é a composição das duas permutações. É evidente que a composição de duas permutações é também uma permutação. Então, seja

Precisamos relacionar o sinal de com os sinais de e Note que qualquer permutação pode ser feita através de uma sequência de trocas entre dois números. Mas, como vimos, cada uma dessas trocas, ou transposições, muda o sinal da permutação com relação à permutação anterior à transposição. Assim, na Eq. (34), por exemplo, partimos de e chegamos a Podemos fazer vários caminhos diferentes para chegar à permutação final. Por exemplo, podemos fazer a transposição a seguir:

e pronto, uma só transposição, entre e dando, portanto, um sinal negativo para a permutação final. Veja que o sinal coincide com aquele obtido através do número de inversões, que neste caso é Poderíamos ter feito outro caminho, por exemplo:

depois

e

ou seja, três transposições adjacentes, isto é, cada uma dessas transposições é uma troca entre dois números adjacentes na sequência: a troca entre e depois a troca entre e e, finalmente, a troca entre e De novo, o número de transposições é ímpar, dando um sinal negativo, idêntico ao sinal da permutação final. Não importa o caminho que fizermos, elevado ao número de transposições para chegar ao destino final dá igual ao sinal da permutação. Para provar isso no caso geral, note primeiro que sempre é possível, através de transposições, chegar ao resultado da permutação desejada, partindo da sequência de até E, como já vimos acima, uma transposição qualquer é composta de um número ímpar de transposições adjacentes. Então, escolha um caminho qualquer para o destino desejado. Esse caminho pode, portanto, ser decomposto por uma sequência de permutações adjacentes. O que precisamos mostrar, portanto, é que, para qualquer caminho, o número de inversões da permutação final, mais o número de transposições adjacentes do caminho, tem que ser um número par. Se demonstrarmos isso, para qualquer caminho, ou o número de transposições adjacentes é ímpar, assim como o número de inversões da correspondente permutação final, ou é par, quando também o é o número de inversões da permutação considerada. Para ver isso, seja o número de transposições adjacentes que leva a sequência de a à permutação final desejada, suposta consistir de inversões e, portanto, com sinal Agora, inverta cada uma das transposições adjacentes. Cada uma dessas transposições multiplica por o sinal da permutação parcial resultante. Após a reversão de todas as transposições adjacentes, o resultado é o de partida: a sequência original de a O sinal dessa permutação é pois é a permutação identidade. Logo, como o número de inversões na permutação em análise era e, portanto, seu sinal era após as transposições adjacentes inversas, esse sinal ficou multiplicado por com o resultado que

ou seja, deve ser par, para qualquer caminho que leve a sequência de a à permutação desejada. Então, se for par, também o será e, se for ímpar, será ímpar também, para qualquer caminho. Assim, elevado ao número de transposições adjacentes, de qualquer caminho, sempre dará o sinal da permutação desejada.

Retornemos, então, para a Eq. (52). Tome um caminho de transposições adjacentes para a permutação e suponha que esse caminho tenha transposições adjacentes e, portanto, Suponha que um caminho de transposições adjacentes para a permutação tenha transposições adjacentes e, portanto, É evidente que, seguindo esses dois caminhos em sequência, reproduziremos a permutação composta da Eq. (52). O sinal dessa nova permutação, portanto, será dado por

Multiplicando a Eq. (53) por encontramos

Vamos, agora, substituir a Eq. (54) de volta na Eq. (51) para obter

já que a soma é sobre e não sobre

Veja agora que o número de permutações de números é igual a Como a composição de permutações da Eq. (52) é também uma permutação, conforme varrermos sobre todas as permutações, a composição também varrerá o conjunto de todas as permutações possíveis. Para ver isso, faça a hipótese de que Então, segue necessariamente, que Isso nós sabemos ser verdade, como podemos verificar com exemplos e pela própria definição de permutação. Assim, vamos supor que, apesar disso, quando tomamos as composições de cada uma dessas duas permutações com encontramos

Então, aplicando cada um dos membros da Eq. (56) à sequência de números de até devemos obter a mesma permutação desses números. Aplicando, portanto, a esse resultado, a inversa de devemos obter uma única permutação. Esta única permutação, de acordo com a Eq. (56) deve ser igual à aplicação de à sequência de a e também deve ser igual à aplicação de à sequência de a Mas este resultado implica que deve ser igual a contradizendo a hipótese que sabemos ser verdade. Logo, a outra hipótese, isto é, a Eq. (56), deve ser falsa. Assim, varrendo a composição sobre estamos varrendo todo o conjunto de permutações de a Com esse resultado, podemos escrever a Eq. (55) assim:

onde usamos a Eq. (28) para o determinante de uma matriz qualquer.

Substituindo a Eq. (55b) na Eq. (50), obtemos

Depois de todas as demonstrações que fizemos acima, agora é fácil ver que o sinal de uma permutação é igual ao de sua inversa, pois ambas podem ser representadas pelo mesmo número de transposições adjacentes. Isso é claro porque, se escolhermos um caminho de transposições adjacentes que dá devemos aplicar o mesmo número de transposições adjacentes ao resultado final para invertê-la, sendo cada uma dessas transposições a inversa de cada uma das que foram aplicadas à sequência de a para obtermos Com este resultado, a Eq. (57) fica, finalmente,

onde, novamente, usamos a Eq. (28) para a definição do determinante de

Logo após a Eq. (25), precisávamos saber qual a condição para que uma matriz não tenha inversa. Agora podemos responder isso de forma fácil. Considere a Eq. (11). Suponha que uma matriz tenha determinante nulo, mas que sua inversa, exista. Então, da Eq. (26), temos que

Usando a Eq. (58) na Eq. (59), vemos que

que é impossível se for nulo. Como, dada uma matriz, sempre podemos calcular seu determinante, a matriz não existe, pois, caso existisse, teríamos que ter a Eq. (60) válida para o que é uma contradição, pois a Eq. (60) implicaria Logo, a condição para uma matriz não ser inversível é que tenha determinante nulo. Vamos impor essa condição à matriz para encontrar seus autovalores e autovetores:

Substituindo a Eq. (9) na Eq. (61), vem

isto é,

ou seja,

cuja solução é dada por

Para futura referência, note que

Para achar os autovetores correspondentes aos autovalores da Eq. (64), utilizamos as Eqs. (9), (22) e (24):

isto é,

e

Com as soluções da Eq. (64), podemos mostrar que a Eq. (68) é equivalente à Eq. (67) e, portanto, não fornece informação diferente daquela fornecida pela Eq. (67). Para vermos isso, basta substituir a Eq. (64) na Eq. (68):

isto é,

ou seja,

ou ainda,

Portanto,

que dá

Como a Eq. (70) é idêntica à Eq. (67), vemos que a Eq. (68) é linearmente dependente da Eq. (67) e, portanto, não fornece nova informação. A Eq. (67) é indeterminada, pois dá apenas uma relação entre e É uma convenção normalizar os autovetores e, assim, devemos ter

Da Eq. (67), temos que

Substituindo a Eq. (72) na Eq. (71) dá

isto é,

Então, extraindo a raiz quadrada da Eq. (73), escolhemos, como solução,

(pois poderíamos, ao invés, escolher a solução com sinal negativo). Substituindo a Eq. (74) na Eq. (72), obtemos

Então, temos os dois autovetores:

e

correspondentes aos autovalores e da Eq. (64), respectivamente, obtidos usando as Eqs. (74) e (75) na Eq. (22).

Note agora que, como não é nulo, nem negativo, pois, por hipótese, e, portanto, (cf. Eq. (64)), podemos escrever

Substituindo a Eq. (65) na Eq. (78), obtemos

ou seja,

Observe também que

isto é,

Podemos agora substituir as Eqs. (79) e (80) na Eq. (77) para obter

Logo, comparando as Eqs. (76) e (81), vemos que

e

Além disso, vemos claramente que os autovetores das Eqs. (76) e (81) são ortonormais, pois, além de normalizados à unidade, satisfazem:

Como os autovetores são ortonormais, a matriz que diagonaliza tanto como é ortogonal, isto é, sua inversa é sua transposta. De acordo com as prescrições das Eqs. (19) e (20), bem como a discussão que segue essas equações, as colunas da matriz são dadas pelos autovetores das Eqs. (76) e (81):

Transpondo a Eq. (85), obtemos a matriz

que, neste caso, é igual a si própria e, portanto, simétrica. Você pode verificar, instantaneamente, que a Eq. (11) está satisfeita pelas matrizes das Eqs. (85) e (86). Para ver que essas matrizes diagonalizam a matriz façamos:

onde usamos as Eqs. (1) e (85). Multiplicando a Eq. (87) pela Eq. (86), pela esquerda, dá

Considere agora os numeradores dos elementos da matriz da Eq. (88). Temos, para o primeiro elemento da diagonal principal, o numerador:

onde usamos a Eq. (6). Então, a Eq. (89) fica

utilizando a Eq. (63) com Também temos, para os numeradores dos elementos fora da diagonal principal,

usando a Eq. (6). Fazendo na Eq. (63), isolando e substituindo na Eq. (91), encontramos

Finalmente, o segundo elemento da diagonal principal tem o numerador dado por

usando a Eq. (6). Substituindo a Eq. (65) na Eq. (92), obtemos

Tomando na Eq. (63) e usando o resultado na Eq. (93), ficamos com

Substituindo, finalmente, as Eqs. (90), (91) e (94) de volta na Eq. (88), obtemos

mostrando que a mesma matriz que diagonaliza a matriz da Eq. (9), também diagonaliza a matriz da Eq. (1), só que com autovalores dados por

e

como previmos na Eq. (7) e explicitamos logo abaixo da Eq. (9).

Agora podemos sumarizar a resposta para o problema de diagonalizar a matriz da Eq. (1). Os autovetores são dados pelas Eqs. (76) e (81) que, com as Eqs. (6), (96) e (97), podem ser escritos em termos dos elementos da matriz

e

onde os respectivos autovalores, e são dados pelas Eqs. (6), (64), (96) e (97):

e

😎

Recomendo também a leitura das postagens a seguir:

Uma versão em PDF

Gostou desta postagem? Então clique no botão abaixo e siga o Nerdyard no Twitter! Toda vez que houver uma nova postagem aqui, você saberá imediatamente! :cool:

Siga Nerdyard no Twitter

Melhor ainda: inscreva-se em Nerdyard e receba, por e-mail, o aviso com links para cada nova postagem ou novidade.

Google Groups
Inscreva-se em Nerdyard
Melhor email:
Visite este grupo

NOTE QUE EU ODEIO SPAM COM TODA CONVICÇÃO! :cool:

Dessa forma, não se preocupe: eu juro que jamais fornecerei seu endereço de e-mail ou qualquer outra informação sobre você para ninguém!

Clip to Evernote

Deixe um comentário for Diagonalizando uma matriz dois por dois simétrica

Editor de Equações (www.codecogs.com/latex/eqneditor.php)

Para entender como utilizar esse editor de equações, clique aqui.