
Sistema de equações lineares
Fundo para as escolas Wikipédia
Crianças SOS tentou tornar o conteúdo mais acessível Wikipedia por esta selecção escolas. Crianças SOS é a maior doação de caridade do mundo órfãos e crianças abandonadas a chance da vida familiar.


Em matemática , um sistema de equações lineares (ou sistema linear) é um conjunto de equações lineares envolvendo o mesmo conjunto de variáveis. Por exemplo,
é um sistema de três equações nas três variáveis x, y, z. Uma solução a um sistema linear é uma atribuição de números para as variáveis tais que todas as equações são simultaneamente satisfeitas. A solução para o sistema acima é dada pela
uma vez que faz todas as três equações válido.
Em matemática, a teoria de sistemas lineares é a base e uma parte fundamental da álgebra linear , um assunto que é usado na maior parte da matemática moderna. Computacionais algoritmos para encontrar as soluções são uma parte importante da álgebra linear numérica, e desempenhar um papel de destaque na engenharia , física , química , ciência da computação e economia . A sistema de equações não lineares podem ser frequentemente aproximada por um sistema linear (ver linearização), uma técnica útil ao fazer uma modelo matemático ou simulação computacional de um sistema relativamente complexo.
Muitas vezes, os coeficientes das equações são reais ou números complexos e as soluções são procuradas no mesmo conjunto de números, mas a teoria e os algoritmos de aplicar para coeficientes e soluções em qualquer campo. Para soluções num domínio integral como o anel dos inteiros , ou em outras estruturas algébricas , outras teorias têm sido desenvolvidas. Ver, por exemplo, programação linear inteira para soluções inteiras, Gröbner base para polinomiais coeficientes e incógnitas, ou também geometria tropical para a álgebra linear em uma estrutura mais exótico.
Exemplo Elementary
O tipo mais simples de sistema linear envolve duas equações e duas variáveis:
Um método para resolver um tal sistema é como se segue. Em primeiro lugar, solucionar o topo equação em termos de
:
Agora substituir esta expressão para x na equação de fundo:
Isto resulta numa equação simples envolvendo apenas a variável . Resolvendo dá
, E substituindo este volta para a equação para
rendimentos
. Este método se generaliza para sistemas com variáveis adicionais (ver "eliminação de variáveis" abaixo ou o artigo sobre álgebra elementar .)
Forma geral
Um sistema geral de equações lineares com m n incógnitas pode ser escrita como
Aqui são as incógnitas,
são os coeficientes do sistema, e
são os termos constantes.
Muitas vezes, os coeficientes e incógnitas são reais ou números complexos , mas inteiros e números racionais também são vistos, como são polinômios e elementos de um resumo estrutura algébrica .
Equação vetorial
Uma extremamente útil visão é que cada desconhecido é um peso para um um vector de coluna em combinação linear.
Isso permite que toda a linguagem e teoria de espaços vetoriais (ou, mais geralmente, módulos) a ser exercida. Por exemplo, a recolha de todas as possíveis combinações lineares dos vectores no lado da mão esquerda é chamado sua extensão, e as equações têm uma solução justa quando o vetor da mão direita está dentro desse intervalo. Se cada vetor dentro desse intervalo tem exactamente uma expressão como uma combinação linear dos vectores indicados do lado esquerdo, em seguida, uma solução é único. Em qualquer caso, o intervalo tem um base de vetores linearmente independentes que fazem garantir exatamente uma expressão; e o número de vectores em que a base (a sua dimensão) não pode ser maior do que m ou n, mas pode ser menor. Isto é importante porque se tivermos m vetores independentes uma solução é garantida, independentemente do lado direito, e de outra forma não garantida.
Equação matricial
A equação vectorial é equivalente a uma matriz equação da forma
em que A é uma matriz m x n, x é um vetor coluna com n entradas, e b é um vetor coluna com m entradas.
O número de vectores de base para a amplitude é agora expressa como a posto da matriz.
Conjunto de soluções


Uma solução de um sistema linear é uma atribuição de valores às variáveis x 1, x 2, ..., x n tal que cada uma das equações é satisfeito. O conjunto de todas as possíveis soluções é chamado o solução definida.
Um sistema linear pode comportar-se em qualquer uma das três formas possíveis:
- O sistema possui infinitas soluções.
- O sistema tem uma única solução única.
- O sistema não tem solução.
Interpretação geométrica
Para um sistema que envolve duas variáveis (x e y), cada equação linear determina uma linha na xy - avião . Como uma solução para um sistema linear, deve satisfazer todas as equações, a solução é ajustado a intersecção destas linhas, e é, portanto, quer de uma linha, de um único ponto, ou o conjunto vazio.
Para três variáveis, cada equação linear determina um avião em espaço tridimensional, eo conjunto solução é a interseção desses planos. Assim, o conjunto solução pode ser um plano, uma linha, um ponto único, ou o conjunto vazio.
Para N variáveis, cada uma equação linear determina hiperplano em n espaço dimensional. O conjunto da solução é a intersecção destas hiperplanos, que pode ser um plana de qualquer dimensão.
Comportamento geral


Em geral, o comportamento de um sistema linear é determinado pela relação entre o número de equações e o número de incógnitas:
- Normalmente, um sistema com menos equações do que incógnitas tem infinitas soluções ou soluções esparsos, por vezes, únicos ( sentindo comprimido). Um tal sistema também é conhecido como um sistema subdeterminada.
- Normalmente, um sistema com o mesmo número de equações e incógnitas tem uma única solução única.
- Normalmente, um sistema com mais incógnitas do que equações não tem solução. Um tal sistema também é conhecido como um sistema sobredeterminado.
No primeiro caso, o dimensão do conjunto da solução é geralmente igual a n - m, em que n é o número de variáveis e m é o número de equações.
As figuras seguintes ilustram esta tricotomia no caso de duas variáveis:
Uma equação Duas equações Três equações
O primeiro sistema tem um número infinito de soluções, ou seja, todos os pontos na linha azul. O segundo sistema tem uma única solução única, ou seja, o ponto de intersecção das duas linhas. O terceiro sistema não tem solução, uma vez que as três linhas compartilhar nenhum ponto comum.
Tenha em mente que as imagens mostram acima apenas o caso mais comum. É possível para um sistema de duas equações e duas incógnitas não ter solução (se as duas linhas são paralelos), ou por um sistema de três equações e duas incógnitas ser solúvel (se as três linhas se intersectam num ponto único). Em geral, um sistema de equações lineares podem se comportar de forma diferente do que o esperado se as equações são linearmente dependente, ou, se duas ou mais das equações são inconsistentes .
Propriedades
Independência
As equações de um sistema linear são independentes se nenhuma das equações pode ser derivada algebricamente a partir dos outros. Quando as equações são independentes, cada equação contém nova informação sobre as variáveis, e removendo qualquer das equações aumenta o tamanho do conjunto de solução. Para equações lineares, independência lógico é o mesmo que independência linear.


Por exemplo, as equações
não são independentes - são a mesma equação quando dimensionado por um factor de dois, e eles iriam produzir gráficos idênticos. Este é um exemplo de equivalência em um sistema de equações lineares.
Para um exemplo mais complicado, as equações
não são independentes, porque a terceira equação é a soma das outras duas. Na verdade, qualquer uma destas equações pode ser derivada a partir dos outros dois, e qualquer uma das equações pode ser removido sem afectar o conjunto solução. Os gráficos destas equações são três linhas que se interceptam num ponto único.
Consistência


Um sistema linear é consistente se tem uma solução, e de outra forma incompatíveis. Quando o sistema é inconsistente, é possível derivar um contradição a partir das equações, que podem sempre ser reescrito como a instrução 0 = 1.
Por exemplo, as equações
são inconsistentes. Na verdade, subtraindo-se a primeira equação da segunda e multiplicando ambos os lados do resultado por 1/6, obtemos 0 = 1. Os gráficos destas equações na -plane xy são um par de linhas paralelas.
É possível que três equações lineares para ser inconsistente, apesar de quaisquer dois deles em conjunto são consistentes. Por exemplo, as equações
são inconsistentes. Adicionando as duas primeiras equações juntos dá 3 x 2 + y = 2, o qual pode ser subtraída da terceira equação para se obter 0 = 1. Note-se que qualquer uma destas duas equações têm uma solução comum. O mesmo fenômeno pode ocorrer por qualquer número de equações.
Em geral, as inconsistências ocorrer se os lados esquerdos das equações em um sistema são linearmente dependentes, bem como os termos constantes não satisfazem a relação de dependência. Um sistema de equações cujos lados esquerdo são linearmente independentes é sempre consistente.
Colocando de outra forma, de acordo com o Rouché-Capelli teorema, qualquer sistema de equações (sobredeterminada ou não) é inconsistente se o posto da matriz aumentada é maior do que a classificação do matriz dos coeficientes. Se, por outro lado, as fileiras de duas matrizes estas forem iguais, o sistema tem de ter pelo menos uma solução. A solução é única se e só se a classificação é igual ao número de variáveis. Caso contrário, a solução geral tem k parâmetros livres, onde k é a diferença entre o número de variáveis ea classificação; portanto, em tal caso, há uma infinidade de soluções.
Equivalência
Dois sistemas lineares usando o mesmo conjunto de variáveis são equivalentes se cada uma das equações do segundo sistema pode ser derivada a partir das equações algebricamente no primeiro sistema, e vice-versa. Dois sistemas são equivalentes se quer ambos são inconsistentes ou cada equação de qualquer um deles é uma combinação linear das equações do outro. Segue-se que dois sistemas lineares são equivalentes se e somente se eles têm o mesmo conjunto solução.
Resolver um sistema linear
Existem vários algoritmos para resolvendo um sistema de equações lineares.
Descrevendo a solução
Quando o conjunto da solução é finito, que é reduzida para um único elemento. Neste caso, a única solução é descrita por uma sequência de equações cujos lados esquerdo são os nomes dos desconhecidos e do lado direito são os valores correspondentes, por exemplo . Quando uma ordem nas incógnitas foi fixado, por exemplo, a ordem alfabética, a solução pode ser descrita como um vector de valores, como o
para o exemplo anterior.
Pode ser difícil para descrever um conjunto com infinitas soluções. Normalmente, algumas das variáveis são designadas como livre (ou independente, ou como os parâmetros), o que significa que eles são autorizados a tomar qualquer valor, enquanto que as restantes variáveis são dependentes dos valores das variáveis livres.
Por exemplo, considere o seguinte sistema:
A solução definido para esse sistema pode ser descrita pelas seguintes equações:
Aqui z é a variável livre, enquanto que X e Y são dependentes z. Qualquer ponto no conjunto de solução pode ser obtido pela escolha de um primeiro valor para z, e em seguida o cálculo dos valores correspondentes para x e y.
Cada variável livre dá a um espaço de solução grau de liberdade, o número dos quais é igual ao dimensão do conjunto solução. Por exemplo, a solução ajustada para a equação acima é uma linha, desde um ponto no conjunto de solução pode ser escolhida através da especificação do valor do parâmetro z. Uma solução infinito de ordem superior podem descrever um avião, ou conjunto de dimensão superior.
Diferentes opções para as variáveis livres podem levar a diferentes descrições do mesmo conjunto solução. Por exemplo, a solução para as equações acima podem, alternativamente, ser descrito como se segue:
Aqui x é a variável livre, e Y e Z são dependentes.
Eliminação das variáveis
O método mais simples para a resolução de um sistema de equações lineares é eliminar repetidamente variáveis. Este método pode ser descrito como se segue:
- Na primeira equação, para resolver uma das variáveis em termos dos outros.
- Ligue esta expressão nas equações restantes. Isso produz um sistema de equações com uma equação menos e menos um desconhecido.
- Continue até ter reduzido o sistema para uma única equação linear.
- Resolver esta equação e, em seguida, voltar-substituto até que seja encontrada a solução inteira.
Por exemplo, considere o seguinte sistema:
Resolvendo a equação para o primeiro x dá x = 5 + 2 z - 3 y, e ligando-a à segunda e terceira rendimentos equação
. Resolvendo a primeira dessas equações para os rendimentos y y = 2 + 3 z, e conectando-a à segunda rendimentos equação z = 2 Temos agora:
Substituindo z = 2 para a segunda equação dá y = 8, e substituindo z = 2 e y = 8 para os primeiros rendimentos equação x = -15. Portanto, o conjunto de soluções é o único ponto (x, y, z) = (-15, 8, 2).
Redução Row
Na redução linha, o sistema linear é representado como um matriz aumentada:
Esta matriz é então modificada usando operações de linha básica até atingir forma escalonada reduzida por linha. Há três tipos de operações elementares de linha:
- Tipo 1: Troque as posições das duas linhas.
- Tipo 2: Multiplique uma fileira por um diferente de zero escalar.
- Tipo 3: Adicionar a uma linha um múltiplo escalar do outro.
Uma vez que estas operações são reversíveis, a matriz aumentada produzida representa sempre um sistema linear, que é equivalente ao original.
Existem vários algoritmos específicos para linha a reduzir uma matriz aumentada, o mais simples de que são a eliminação de Gauss e Eliminação de Gauss-Jordan. O seguinte mostra a computação de eliminação Jordan aplicada à matriz acima:
A última matriz é reduzida na forma escalonada, e representa o sistema x = -15, y = 8, z = 2. A comparação com o exemplo na secção anterior sobre a eliminação algébrica das variáveis mostra que estes dois métodos são, de facto o mesmo; a diferença está na forma como os cálculos são escritos para baixo.
Regra de Cramer
Regra de Cramer é uma fórmula explícita para a solução de um sistema de equações lineares, com cada variável dada por um quociente de dois determinantes . Por exemplo, a solução para o sistema
é dado pela
Para cada variável, o denominador é a determinante da matriz de coeficientes, enquanto o numerador é o determinante de uma matriz na qual uma coluna foi substituída pelo vector de valores constantes.
Embora a regra de Cramer é importante teoricamente, tem pouco valor prático para grandes matrizes, uma vez que o cálculo dos grandes determinantes é um pouco pesado. (Na verdade, as grandes determinantes são mais facilmente calculado usando redução linha.) Além disso, a regra de Cramer tem muito pobres propriedades numéricas, tornando-o inadequado para resolver até mesmo pequenos sistemas de forma confiável, a menos que as operações são realizadas em aritmética racional com precisão ilimitada.
Solução Matrix
Se o sistema de equação é expressa sob a forma de matriz , Todo o conjunto solução também pode ser expresso em forma de matriz. Se a matriz A é quadrada (tem m linhas e n = m colunas) e tem posto completo (todas as linhas são independentes m), então o sistema tem uma única solução dada pela
onde é o inversa de A. De modo mais geral, independentemente de se m = n ou não e independentemente do posto de A, todas as soluções (se houver) são dados usando o Moore-Penrose pseudoinverse de A, denotada
, Como segue:
onde é um vetor de parâmetros livres que varia sobre todos os possíveis n × 1 vetores. Uma condição necessária e suficiente para qualquer solução de (s) que existe é que a solução obtida utilizando potencial
satisfazer
- Ou seja, que
Se esta condição não se sustenta, o sistema de equações é inconsistente e não tem solução. Se a condição de reserva, o sistema é consistente e, pelo menos, uma solução de existir. Por exemplo, no caso acima mencionado, em que A é quadrada e de posto completo,
simplesmente é igual a
e a solução equação geral simplifica a
como indicado anteriormente, onde
caiu completamente para fora da solução, deixando apenas uma única solução. Em outros casos, no entanto,
permanece e, portanto, uma infinidade de valores possíveis do parâmetro vetor livre
dar uma infinidade de soluções da equação.
Outros métodos
Embora os sistemas de três ou quatro equações pode ser prontamente resolvido pela mão, os computadores são muitas vezes utilizados para sistemas maiores. O algoritmo de padrão para a resolução de um sistema de equações lineares baseia-se na eliminação de Gauss, com algumas modificações. Em primeiro lugar, é essencial para evitar a divisão por um número pequeno, o que pode conduzir a resultados imprecisos. Isto pode ser feito por reordenação das equações, se necessário, um processo conhecido como pivotante. Em segundo lugar, o algoritmo não exatamente eliminação de Gauss, mas calcula a LU decomposição da matriz A. Isto é principalmente uma ferramenta organizacional, mas é muito mais rápido se a pessoa tem que resolver vários sistemas com a mesma matriz A, mas diferentes vetores b.
Se a matriz A tem uma estrutura especial, este pode ser explorada para obter algoritmos mais rápido ou mais precisas. Por exemplo, sistemas com um simétrico matriz definida positiva pode ser resolvido duas vezes mais rápido com o Decomposição de Cholesky. Recursão Levinson é um método rápido para Matrizes de Toeplitz. Métodos especiais existem também para matrizes com muitas zero elementos (os chamados matrizes esparsas), que aparecem freqüentemente em aplicações.
Uma abordagem completamente diferente é muitas vezes tida como muito grandes sistemas, que, de outra forma demorar muito tempo ou memória. A idéia é começar com uma aproximação inicial para a solução (que não tem que ser preciso em tudo), e para mudar essa aproximação em vários passos para trazê-lo mais perto da verdadeira solução. Uma vez que a aproximação é suficientemente preciso, isto é considerado como sendo a solução para o sistema. Isto leva à classe de métodos iterativos.
Sistemas homogêneos
Um sistema de equações lineares é homogênea se todos os termos constantes são zero:
Um sistema homogéneo é equivalente a uma equação de matriz da forma
em que A é uma matriz m x n, x é um vector de coluna com n entradas, e 0 é a vetor nulo com m entradas.
Conjunto de soluções
Cada sistema homogéneo tem pelo menos uma solução, conhecida como a solução de zero (ou solução trivial), que é obtido através da atribuição do valor de zero para cada uma das variáveis. Se o sistema tiver uma matriz não singular (det (A) ≠ 0), então também é a única solução. Se o sistema tiver uma matriz singular, em seguida, existe uma solução ajustada com um número infinito de soluções. Este conjunto de soluções tem as seguintes propriedades adicionais:
- Se u e v são dois vectores que representam as soluções de um sistema homogéneo, em seguida, o vector soma de u + v é também uma solução para o sistema.
- Se L é um vector que representa uma solução para um sistema homogéneo, e R é qualquer escalar, então r u também é uma solução para o sistema.
Estes são exactamente as propriedades requeridas para a solução destinada a ser um subespaço linear de R n. Em particular, a solução ajustada para um sistema homogéneo é o mesmo que o espaço nulo da matriz correspondente A.
Relação com sistemas não homogéneas
Há uma relação estreita entre as soluções para um sistema linear e as soluções para o sistema homogêneo correspondente:
Especificamente, se o símbolo p representa qualquer solução específica para o sistema linear A x = b, então todo o conjunto de solução pode ser descrita como
Geometricamente, este diz que o conjunto de soluções para A x = b é um tradução do conjunto de soluções para A x = 0. Especificamente, o plana para o primeiro sistema pode ser obtido mediante a conversão do subespaço linear para o sistema homogéneo por o vector p.
Este raciocínio se aplica apenas se o sistema A x = b tem pelo menos uma solução. Isto ocorre se e somente se o vector b situa-se no imagem do A transformação linear.