Antonino Salibra January 25, 2017 - dsi.unive.itsalibra/appunti-algebra-lineare2016.pdf · Chapter...

140
Appunti di Algebra Lineare Antonino Salibra January 25, 2017

Transcript of Antonino Salibra January 25, 2017 - dsi.unive.itsalibra/appunti-algebra-lineare2016.pdf · Chapter...

Appunti di Algebra Lineare

Antonino Salibra

January 25, 2017

2

Programma di Algebra Lineare (2016/17):

1. Libri di Testo:

• A. Salibra: Appunti di Algebra Lineare, 2016.

• M. Abate, C. de Fabritiis: Geometria analitica con elementi dialgebra lineare, Seconda Edizione, McGraw-Hill, 2010.

2. Campi numerici. Esempi di campi numerici: il campo dei numeri reali;il campo dei numeri complessi; il campo dei numeri modulo 2; il campodei numeri modulo p per un numero primo p.

3. Numeri complessi: parte reale ed immaginaria, coniugato di un numerocomplesso. Modulo e norma. Prodotto e somma di numeri complessi.Rappresentazione trigonometrica: piano complesso. Rappresentazioneesponenziale.

4. Introduzione ai vettori. Grandezze fisiche e vettori. La definizione dispazio vettoriale con somma vettoriale e prodotto per uno scalare.

5. Prodotto interno (o scalare) di due vettori del piano o dello spazio.Proprieta del prodotto interno. Lunghezza di un vettore. Caratteriz-zazione della perpendicolarita con il prodotto interno. Disuguaglianzadi Schwartz. Caratterizzazione del coseno dell’angolo formato da duevettori con il prodotto interno. Alcune applicazioni alla geometria eu-clidea.

6. Rette nel piano. Equazione lineare di una retta. Equazione parametricadi una retta. Retta passante per l’origine e perpendicolare ad un datovettore. Retta parallela ad una retta passante per l’origine. Rettapassante per un punto e parallela (alla retta determinata da) ad undato vettore. Retta passante per due punti.

7. Rette e piani nello spazio. Equazione lineare di un piano. Equazioneparametrica di un piano. Piano passante per l’origine e perpendicolaread un dato vettore. Piano parallelo ad un piano passante per l’origine.Piano passante per tre punti non allineati.

8. Sistema Lineari. Il metodo di eliminazione di Gauss. Criteri da appli-care nel metodo di eliminazione di Gauss.

3

9. Matrici. Matrice quadrata, simmetrica, diagonale, triangolare superi-ore e inferiore. Trasposta di una matrice. Lo spazio vettoriale dellematrici di tipo m× n. Prodotto di matrici. Proprieta del prodotto dimatrici. Moltiplicazione di matrici a blocchi.

10. Matrici e sistemi lineari. Matrici elementari, operazioni elementari emetodo di eliminazione di Gauss. Matrice a gradini e matrice ridotta.Riduzione di una matrice in forma a gradini e in forma ridotta. Appli-cazioni ai sistemi lineari.

11. Spazi vettoriali. Sottospazi. Vettori linearmente dipendenti e linear-mente indipendenti. Basi e dimensione di uno spazio vettoriale.

12. Trasformazioni lineari. Teorema della dimensione. Matrice di unatrasformazione lineare. Trasformazione lineare definita da una matrice.Sottospazio vettoriale delle colonne (righe) di una matrice. Isomorfismie cambi di base. Sistemi lineari e trasformazioni lineari.

13. Interpretazione geometrica del determinante come area di un parallel-ogramma e come volume di un parallelepipedo. Prodotto vettorialedi due vettori dello spazio. Determinante di una matrice quadrata diordine n. Determinante della matrice trasposta, del prodotto di duematrici. Regola di Cramer. Calcolo della matrice inversa con la regoladi Cramer, con il metodo dei cofattori, e con il metodo di Gauss-Jordan.

14. Autovalori e autovettori. Autospazi. Polinomio caratteristico. Radicidel polinomio caratteristico. Matrici simili hanno lo stesso polinomiocaratteristico. Autovettori di autovalori distinti. Diagonalizzazione diuna matrice. Basi di autovettori. Teorema fondamentale. Esempi:algoritmo di Google. Numeri di Fibonacci.

4

Chapter 1

Campi Numerici

Un campo e un insieme di numeri chiuso rispetto alle quattro operazioni:addizione, moltiplicazione, sottrazione e divisione.

Definition 1.0.1. Un campo numerico e una quintupla (X,+,−, 0, ·,−1 , 1),dove X e un insieme, + e · sono operazioni binarie, −, −1 sono operazioniunarie, e 0, 1 costanti che soddisfano le seguenti equazioni:

1. Proprieta associativa: x+(y+z) = (x+y)+z; x ·(y ·z) = (x ·y) ·z.

2. Proprieta commutativa: x+ y = y + x; x · y = y · x.

3. Elemento neutro: x+ 0 = x; x · 1 = x.

4. Proprieta distributiva: x · (y + z) = (x · y) + (x · z).

5. Opposto: x+ (−x) = 0.

6. Inverso: Se x 6= 0, allora x · x−1 = 1.

7. Prodotto per 0: x · 0 = 0 = 0 · x.

Scriveremo

• xy al posto di x · y;

• x− y al posto di x+ (−y);

• x/y oppure xy

per x · y−1.

5

6 CHAPTER 1. CAMPI NUMERICI

Inoltre, il prodotto lega piu della somma. Per esempio, x + yz significax+ (yz).

La quadrupla (X,+,−, 0) e un gruppo commutativo rispetto alla somma,mentre (X \ {0}, ·,−1 , 1) e un gruppo commutativo rispetto al prodotto.

Example 1. I seguenti insiemi sono campi numerici:

• L’insieme dei numeri razionali Q;

• L’insieme dei numeri reali R;

• L’insieme dei numeri complessi C;

• L’insieme dei bits B = {0, 1} con le operazioni di somma e prodottodefiniti come segue:

0 +2 0 = 1 +2 1 = 0; 0 +2 1 = 1 +2 0 = 1;

e

0×2 0 = 0×2 1 = 1×2 0 = 0; 1×2 1 = 1.

L’opposto di 1 e uno, cioe −1 = 1. Questo campo numerico rappresental’aritmetica dei numeri modulo 2.

• Sia p un numero primo. Allora l’insieme dei numeri {0, 1, . . . , p − 1}con le operazioni di addizione +p e moltiplicazione ×p modulo p e uncampo numerico. Se x, y ≤ p− 1, allora abbiamo:

x+p y =

{x+ y if x+ y ≤ p− 1

r if x+ y = p+ r per un certo r.

x×p y =

{x× y if x× y ≤ p− 1

r if x× y = q × p+ r con 0 ≤ r ≤ p− 1.

Per esempio, se p = 5, abbiamo 3 +5 2 = 0 e 3 +5 3 = 1, mentre3×5 3 = 4 e 4×5 4 = 1.

1.1. IL CAMPO DEI NUMERI COMPLESSI 7

1.1 Il campo dei numeri complessi

I numeri reali negativi non ammettono radice quadrata. Questa e una lim-itazione. Per esempio, l’equazione 2x + 2x + 4 = 0 non ammette soluzionireali:

x =−2±

√−28

4= −1

2±√

7

2

√−1.

Le soluzioni dell’equazione 2x + 2x + 4 = 0 sono numeri complessi perchenella formula risolutiva compare

√−1.

Il nuovo numero√−1, indicato con la lettera “i”, soddisfa l’equazione

i2 = −1. In generale un numero complesso z e un numero della forma

z = a+ bi

con a, b numeri reali. Il numero a e la parte reale di z mentre b e la parte im-maginaria di z. Questi numeri vengono denotati rispettivamente da Re(z) =a e Im(z) = b.

Proposition 1.1.1. I numeri complessi sono un campo numerico, cioe sonochiusi rispetto alle quattro operazioni.

Proof. I numeri complessi possono essere sommati e moltiplicati:

(a+bi)+(c+di) = (a+c)+(b+d)i; (a+bi)(c+di) = (ac−bd)+(ad+bc)i.

Si noti che (bi)(di) = bd(i2) = bd(−1) = −bd.L’opposto del numero complesso a+bi e il numero−a−bi, mentre l’inverso

del numero a+ bi (supponendo che a+ bi 6= 0) si calcola come segue:

1

a+ bi=

(1

a+ bi

)(a− bia− bi

)=

a− bi(a+ bi)(a− bi)

=a− bia2 + b2

=a

a2 + b2− b

a2 + b2i.

Example 2. Siano z = 3+2i e w = 5+7i numeri complessi. Allora abbiamo

z + w = (3 + 2i) + (5 + 7i) = 3 + 2i+ 5 + 7i = (3 + 5) + (2 + 7)i = 8 + 9i.

zw = (3+2i)(5+7i) = 15+21i+10i+14i2 = 15+31i+14(−1) = 15−14+31i = 1+31i.

8 CHAPTER 1. CAMPI NUMERICI

Coniugato e modulo di un numero complesso

Se z = a + ib e un numero complesso, il numero z = a − bi si chiama ilconiugato di z. Si calcola facilmente che zz = a2 + b2 e un numero reale.

Valgono le seguenti proprieta:

Proposition 1.1.2. (i) z1 + z2 = z1 + z2;

(ii) z1z2 = z1z2.

(iii) z e un numero reale sse z = z.

Example 3. Siano z = 1 + 2i e w = 2 + 2i. Allora abbiamo:

• z + w = 3 + 4i = 3− 4i.

• z + w = 1 + 2i+ 2 + 2i = (1− 2i) + (2− 2i) = 3− 4i = z + w.

• zw = (1 + 2i)(2 + 2i) = −2 + 6i = −2− 6i.

• z w = (1− 2i)(2− 2i) = −2− 6i = zw.

Ogni numero complesso e rappresentato in maniera unica da un puntodel piano:

a+ bi 7→ (a, b).

La distanza del punto (a, b) dall’origine degli assi cartesiani e il modulo delnumero complesso z

|z| =√a2 + b2.

Proposition 1.1.3. Siano z e w numeri complessi. Allora, |z| =√zz and

|zw| = |z||w|.

Proof. Sia z = a+ bi e w = c+ di. Allora zw = (ac− bd) + (ad+ bc)i.

|zw|2 = (ac− bd)2 + (ad+ bc)2

= a2c2 + b2d2 − 2abcd+ a2d2 + b2c2 + 2abcd= a2c2 + b2d2 + a2d2 + b2c2

= a2(c2 + d2) + b2(c2 + d2)= (a2 + b2)(c2 + d2)= |z|2|w|2.

1.1. IL CAMPO DEI NUMERI COMPLESSI 9

Un altro metodo di prova:

|zw|2 = (zw)(zw)= zwz w Proposizione 1.1.2(ii)= zzww= |z|2|w|2

Prendendo le radici quadrate positive si ricava la conclusione: |zw| = |z||w|.

Proposition 1.1.4. Ogni numero complesso ha una radice quadrata.

Proof. Sia z = a + ib. Dobbiamo trovare un numero w = x + iy tale chew2 = z. Se questo e il caso, allora w =

√z.

Cerchiamo di determinare delle condizioni che ci permettano di ricavarela parte reale e la parte immaginaria di w. Da w2 = (x2−y2) + 2xyi = a+ ibsi ricava:

a = x2 − y2; b = 2xy.

Inoltre, da z = w2 e dalla Proposizione 1.1.3 si ottiene:

√a2 + b2 = |z| = |w2| = |w||w| = x2 + y2.

Sommando membro a membro le due uguaglianze x2 + y2 =√a2 + b2 e

x2 − y2 = a si ha:

x2 =a+√a2 + b2

2.

Possiamo risolvere per x

x = ±

√a+√a2 + b2

2.

Si noti che x e un numero reale! Possiamo poi ottenere y dall’equazioneb = 2xy:

y =b

2x.

10 CHAPTER 1. CAMPI NUMERICI

Example 4. Sia z = 3 + 4i. Allora applicando le formule della prova prece-dente con a = 3 e b = 4, si ottiene

√z =

√3 +√

25

2+

4i

2√

3+√25

2

= 2 + i.

Verifichiamo che elevando al quadrato√z si ottiene effettivamente z: (2 +

i)2 = (2 + i)(2 + i) = 4− 1 + 4i = 3 + 4i.

Da questa proposizione deriviamo che ogni equazione di secondo grado erisolubile nel campo complesso. Vale un risultato molto piu generale:

Theorem 1.1.5. (Teorema fondamentale dell’algebra) Ogni equazione poli-nomiale di grado n

anxn + an−1x

n−1 + · · ·+ a1x+ a0 = 0

e risolubile nel campo complesso.

Si dice che il campo complesso e algebricamente chiuso.

Il piano complesso

Sia z = a + bi un numero complesso. Il numero z ha una naturale interpre-tazione geometrica in termini della sua parte reale ed immaginaria: Re(z) = ae Im(z) = b come coppia di punti (a, b) del piano cartesiano xy. La retta deipunti y = 0 si dice asse reale, mentre la retta x = 0 si dice asse immaginario.Per esempio l’unita immaginaria i ha coordinate (0, 1). Il piano visto comerappresentazione dei numeri complessi si dice piano complesso.

Torniamo al numero z = a + ib. I quattro punti (0, 0), (a, 0), (a, b), (0, b)del piano complesso determinano un rettangolo nel piano complesso la cuidiagonale principale e un segmento di lunghezza |z| =

√a2 + b2. La diagonale

forma un angolo θ con l’asse reale. L’angolo θ ed il modulo |z| determinanounivocamente z. Si scrive

z = |z|(cos θ + i sin θ).

Se consideriamo il numero complesso z = a+ ib come punto (a, b) del piano,allora la coppia (

√a2 + b2, θ) determina univocamente il punto (a, b) del piano

e definisce le cosiddette coordinate polari del punto (a, b).

1.1. IL CAMPO DEI NUMERI COMPLESSI 11

Figure 1.1: piano complesso

Figure 1.2: coordinate polari di z

Per esempio, l’angolo di 90 gradi ed il modulo 1 determinano univoca-mente l’unita immaginaria, mentre l’angolo di 180 gradi ed il modulo 1 de-terminano il numero reale −1, etc.

Proposition 1.1.6. Siano z = |z|(cos θ + i sin θ) e w = |w|(cosφ + i sinφ)due numeri complessi. Allora,

zw = |zw|(cos(θ + φ) + i sin(θ + φ)).

Il prodotto di z e w si ottiene moltiplicando i moduli e sommando gliangoli. Si ricordino le formule

sin(θ + φ) = sin θ cosφ+ cos θ sinφ

cos(θ + φ) = cos θ cosφ− sin θ sinφ

12 CHAPTER 1. CAMPI NUMERICI

Proposition 1.1.7. Sia z = cos θ + i sin θ un numero complesso di modulo1 ed n un numero naturale. Allora,

zn = cos(nθ) + i sin(nθ).

Per esempio, i2 = cos(2π2) + i sin(2π

2) = cos π + i sin π = −1 + 0i = −1,

mentre i4 = cos(4π2) + i sin(4π

2) = cos(2π) + i sin(2π) = cos 0 + i sin 0 =

1 + 0i = 1. L’angolo 2π corrisponde ad un giro completo della circonferenza.

La formula magica di Eulero

Concludiamo questa sezione presentando la formula di Eulero. Il logaritmonaturale ln(a) del numero reale a > 0 (descritto per la prima volta da Nepero)e l’area sottesa dal grafico della funzione f(x) = 1

xda x = 1 a x = a. La base

del logaritmo naturale e data dal numero reale e tale che ln(e) = 1. Questonumero e = 2, 71828 . . . e la costante di Nepero. Il logaritmo e la funzioneinversa dell’esponenziale:

eln(x) = x.

Figure 1.3: grafico di 1/x

Le funzioni, quando possibile, si approssimano con polinomi considerandol’espansione in serie. Abbiamo:

• ex = 1 + x+ x2

2!+ x3

3!+ x4

4!+ . . . ;

• sinx = x− x3

3!+ x5

5!− x7

7!+ . . . ;

• cosx = 1− x2

2!+ x4

4!− x6

6!+ . . . .

1.1. IL CAMPO DEI NUMERI COMPLESSI 13

Applichiamo la funzione al numero complesso iθ:

eiθ = 1 + iθ +(iθ)2

2!+

(iθ)3

3!+

(iθ)4

4!+ . . .

Calcolando otteniamo:

eiθ = 1 + iθ − θ2

2!− θ3

3!i+

θ4

4!+ . . .

Separando la parte reale dalla parte immaginaria si ha:

eiθ = (1− θ2

2!+θ4

4!− θ6

6!+ . . . ) + (θ − θ3

3!+θ5

5!+ . . . )i.

Ne segue l’identita di Eulero:

Theorem 1.1.8. eiθ = cos θ + i sin θ.

Ne segue un’identita che lega tra loro le costanti piu importanti dellamatematica π (lunghezza della circonferenza), e (logaritmo naturale) e i(unita immaginaria):

eiπ = −1.

Figure 1.4: formula di Eulero per numeri complessi di modulo 1

14 CHAPTER 1. CAMPI NUMERICI

Radici dell’unita

Un numero complesso z tale che zn = 1 si chiama radice n-esima dell’unita.Nel seguito calcoliamo le radici dell’unita tramite l’interpretazione geometricadei numeri complessi.

Lemma 1.1.9. Se zn = 1 allora |z| = 1.

Proof. Dalla Proposizione 1.1.3 segue che |zn| = |z|n = 1. Dal fatto che|z| ≥ 0 e un numero reale si ricava |z| = 1.

Proposition 1.1.10. L’equazione

zn = 1

ammette come soluzione principale il numero complesso

ω = cos(2π

n) + i sin(

n).

Le altre soluzioni sono le potenze di ω:

ωk = cos(k2π

n) + i sin(k

n), per ogni k ≥ 0.

Le soluzioni distinte sono 1, ω, ω2, . . . , ωn−1.

Proof. Applichiamo la Proposizione 1.1.7 al numero complesso z = cos(θ) +i sin(θ):

zn = cos(nθ) + i sin(nθ) = 1 = cos(k2π) + i sin(k2π),

perche cos(k2π) = 1 e sin(k2π) = 0 per ogni numero naturale k ≥ 0. Siricava quindi θ = k 2π

n.

Per esempio, le soluzioni dell’equazione z3 = 1 corrispondono ad i numericomplessi nel cerchio unitario di angolo 120◦, 240◦, 360◦. La radice principalee il numero z = −1

2+ i

√32

.Le soluzioni di z4 = 1 corrispondono ad i numeri complessi nel cerchio

unitario di angolo 90◦, 180◦, 270◦, 360◦.

1.1. IL CAMPO DEI NUMERI COMPLESSI 15

Figure 1.5: Radici terze dell’unita

Figure 1.6: Radici quarte dell’unita

16 CHAPTER 1. CAMPI NUMERICI

Chapter 2

Introduzione agli spazivettoriali

2.1 Introduzione ai vettori ed al prodotto in-

terno

In Fisica ma anche nella vita di tutti i giorni dobbiamo continuamente mis-urare qualcosa. Alcune di queste grandezze le possiamo misurare con unnumero reale: saldo del conto corrente, altezza, eta, etc. Ad altre grandezzecorrisponde non solo una quantita rappresentata da un numero ma ancheuna direzione (con/senza verso). Per esempio,

• La forza di gravita terrestre, la cui direzione ed il cui verso vanno dalpunto in cui vi trovate verso il centro della terra;

• La forza di gravita su Giove (molto maggiore della forza di gravitaterrestre);

• La forza esercitata in un punto preciso. Ha una grandezza, una di-rezione ed un verso ben precisi;

• La velocita istantanea di un’automobile. Non conta soltanto il valore,per esempio 120 Km/ora, ma anche la direzione e verso di marcia.

I vettori sono una rappresentazione astratta delle grandezze che hanno unadirezione (e talvolta verso).

17

18 CHAPTER 2. INTRODUZIONE AGLI SPAZI VETTORIALI

E importante distinguere tra vettore liberi e vettore applicati. Se in au-tomobile viaggiamo a velocita costante lungo una linea retta, al tempo t citroviamo in un determinato punto P della retta, mentre al tempo successivot+ 10 ci troveremo in un altro punto Q. Se misuriamo la velocita istantaneanel punto P (velocita misurata + direzione) e poi nel punto Q, otterremo lostesso risultato. Lo stesso vettore e applicato prima nel punto P e poi nelpunto Q.

In generale un vettore e caratterizzato da (a) lunghezza (o grandezza,o modulo, o quantita) che e misurata da un valore in un campo numerico(vedi Capitolo 1); (b) direzione. Possiamo sempre moltiplicare un vettoreper uno scalare, che e un elemento del campo numerico con cui misuriamo lelunghezze: Se a e un vettore ed r uno scalare, allora ra rappresenta il vettoreche ha la stessa direzione di a ma lunghezza r volte la lunghezza di a.

Possiamo misurare la direzione ed il verso? La direzione di un vettore none misurabile con un numero. Possiamo soltanto sapere quando due vettori ae b hanno la stessa direzione:

• I vettori a e b hanno la stessa direzione se esiste uno “scalare” r delcampo numerico tale che a = rb.

Se il campo numerico e totalmente ordinato, come nel caso dei numerireali oppure i numeri razionali, possiamo dire anche se due vettori a e bhanno lo stesso verso:

• I vettori a e b hanno stessa direzione e verso se esiste uno scalare r > 0tale che a = rb. I vettori a e b hanno stessa direzione ma verso oppostose esiste r < 0 tale che a = rb.

Il campo dei numeri complessi non ha un ordinamento naturale. Quindii vettori complessi hanno una direzione, ma non un verso.

Oltre alla moltiplicazione per uno scalare, i vettori ammettono un’altraoperazione, che e detta somma o addizione di vettori. Per spiegare la sommavettoriale, immaginiamo di effettuare il seguente esperimento. Appoggiamouna palla enorme nell’origine O del piano cartesiano xy. Immaginiamo chedue persone Pinco e Pallino spingano la palla con forza. Pinco spinge lungol’asse delle y (che corrisponde alla direzione della retta x = 0) dall’assenegativo delle y verso l’asse positivo delle y. Pallino spinge lungo l’assedelle x (che corrisponde alla direzione della retta y = 0) dall’asse negativodelle x verso l’asse positivo delle x. La palla riceve una spinta da Pinco

2.2. SPAZI VETTORIALI 19

rappresentata dal vettore a (grandezza, direzione, verso) e un’altra spinta daPallino rappresentata dal vettore b. In che direzione si muovera la palla?Se le lunghezze dei due vettori sono uguali (cioe, pari spinta), allora la pallacomincera a muoversi lungo la retta y = x, che e la direzione della retta chebiseca l’angolo di novanta gradi formato dalla retta y = 0 e la retta x = 0.La spinta totale che riceve la palla e rappresentata dal vettore a + b. Sela lunghezza del vettore a e 1 (si scrive ‖a‖ = 1) e se ‖b‖ = 1, allora lalunghezza del vettore a + b e

√2 (non 2 come si potrebbe pensare).

Se Pinco e Pallino spingono con pari forza, il primo dall’asse positivodelle y verso l’asse negativo delle y ed il secondo dall’asse negativo delle yverso l’asse positivo delle y, la palla non si muovera nonostante lo sforzo dientrambi. La somma di due vettori di pari lunghezza e direzione ma di versoopposto e nulla.

Figure 2.1: Forza e vettori

2.2 Spazi vettoriali

2.2.1 Vettori nello spazio

Fissiamo un sistema di assi cartesiani nello spazio euclideo. Questo cor-risponde a scegliere un punto O, l’origine degli assi, e tre rette x, y, z pas-santi per O perpendicolari tra loro. Un punto P nello spazio euclideo diassi Cartesiani xyz e rappresentato da una terna P = [p1, p2, p3] di numerireali, le sue coordinate Cartesiane. La prima coordinata p1 e la seconda p2si ottengono proiettando perpendicolarmente il punto P nel piano z=0, otte-nendo il punto pxy. Poi si proietta questo punto pxy sull’asse delle x (sull’assedelle y, rispettivamente) per ottenere p1 (p2, rispettivamente). Similmentela restante coordinata p3 si ottiene proiettando il punto P nel piano x = 0,ottenendo il punto pyz. Poi si proietta questo punto sull’asse z e si ottienep3.

20 CHAPTER 2. INTRODUZIONE AGLI SPAZI VETTORIALI

Figure 2.2: Coordinate del punto P

Un punto P = [p1, p2, p3] 6= [0, 0, 0] dello spazio determina univocamente

un vettore−→OP che va dall’origine O = [0, 0, 0] degli assi al punto P . Questo

vettore ha come lunghezza la lunghezza√p21 + p22 + p23 del segmento OP che

unisce l’origine degli assi al punto P , come direzione l’unica retta che passaattraverso i punti O e P , e come verso quello che va dal punto O al punto P .

Il vettore−→OP si indichera spesso con il punto P stesso. Quindi parleremo di

vettore P intendendo il vettore−→OP .

I vettori possono essere sommati coordinata per coordinata. Per esempio,se P = [2, 3, 4] e Q = [1, 2, 3] allora P + Q = [3, 5, 7]. Geometricamente ilpunto P +Q si ottiene costruendo il parallelogramma di vertici P , O e Q. Ilquarto vertice e proprio il punto P +Q. Si veda la figura.

Figure 2.3: Somma di vettori

2.2. SPAZI VETTORIALI 21

I vettori possono essere moltiplicati per uno scalare. Se−→OP e un vettore

nello spazio ed r e un numero reale, detto scalare, allora r−→OP e un altro

vettore che sta sempre nella retta, passante per l’origine, determinata dal

vettore−→OP . Per esempio, sia P = [3, 2, 1] un punto, 5 uno scalare e Q

il punto di coordinate 5P = [15, 10, 5]. Allora il vettore 5−→OP e uguale al

vettore−→OQ. Nella prossima sottosezione studieremo in generale le proprieta

della somma vettoriale e del prodotto per uno scalare.

2.2.2 Vettori in astratto

In generale, possiamo considerare in maniera astratta un insieme di vettoriche possono essere sommati tra loro e moltiplicati per uno scalare. Unoscalare e un elemento di un fissato campo numerico K. Nelle applicazioni Ksara uno dei seguenti campi: il campo Q dei numeri razionali, il campo Rdei numeri reali, il campo C dei numeri complessi, oppure il campo Zp deinumeri interi modulo un numero primo p.

Figure 2.4: Vettori opposti.

Definition 2.2.1. Sia K un campo numerico, i cui elementi sono chiamatiscalari. Uno spazio vettoriale su K e costituito da un insieme V di vettoridotati di somma vettoriale + : V × V → V e prodotto per uno scalare· : K× V → V , che soddisfano gli assiomi seguenti (a,b, c ∈ V sono vettoriarbitrari e r, s ∈ K sono scalari arbitrari):

SV1: a + (b + c) = (a + b) + c;

SV2: a + b = b + a;

SV3: 0 + a = a = a + 0;

22 CHAPTER 2. INTRODUZIONE AGLI SPAZI VETTORIALI

Figure 2.5: La proprieta commutativa della somma vettoriale.

SV4: a + (−a) = 0 = (−a) + a;

SV5: (r + s)a = ra + sa;

SV6: (rs)a = r(sa);

SV7: r(a + b) = ra + rb;

SV8: 0a = 0; 1a = a; (−1)a = −a.

Si noti che il vettore nullo viene indicato con 0 e che per brevita scriviamora al posto di r · a.

Si noti anche che l’assioma (SV4) deriva da (SV5) e (SV8):

a + (−a) = 1a + (−1)a = (1 + (−1))a = 0a = 0.

Example 5. Sia R il campo dei numeri reali. L’insieme R2 delle coppie dinumeri reali costituisce uno spazio vettoriale reale con le seguenti operazioni:

[x1, x2] + [y1, y2] = [x1 + y1, x2 + y2]; r[x1, x2] = [rx1, rx2]; 0 = [0, 0].

Per esempio, [3, 6] + [1, 2] = [4, 8] e 7[1, 3] = [7, 21].

2.2. SPAZI VETTORIALI 23

−−→AD =

−→AC +

−−→CD

=(−→AB +

−−→BC) +

−−→CD, ma anche

−−→AD =

−→AB +

−−→BD =

−→AB + (

−−→BC +

−−→CD)

Figure 2.6: Proprieta associativa della somma vettoriale

Example 6. Sia R il campo dei numeri reali. L’insieme C dei numericomplessi costituisce uno spazio vettoriale reale con le seguenti operazioni(a, b, c, d, r numeri reali e i unita immaginaria):

(a+ bi) + (c+di) = (a+ c) + (b+d)i; r(a+ bi) = (ra) + (rb)i; 0 = 0.

Per esempio, (3 + 6i) + (1 + 2i) = 4 + 8i e 7(1 + 3i) = 7 + 21i.

Example 7. Sia C il campo dei numeri complessi. L’insieme C dei numericomplessi costituisce uno spazio vettoriale sul campo dei numeri complessicon le seguenti operazioni (a, b, c, d numeri reali, r = r1 + r2i numero comp-lesso e i unita immaginaria):

(a+ bi) + (c+ di) = (a+ c) + (b+ d)i;

r(a+ bi) = (r1 + r2i)(a+ bi) = (r1a− r2b) + (r1b+ r2a)i; 0 = 0.

I vettori possono essere utilizzati per fornire delle prove di risultati geo-metrici. Un esempio e fornito dal seguente teorema.

24 CHAPTER 2. INTRODUZIONE AGLI SPAZI VETTORIALI

Theorem 2.2.1. Dato un arbitrario quadrilatero convesso ABCD, il quadri-latero avente per vertici i punti medi dei lati consecutivi di ABCD costituisceun parallelogramma (Si veda la figura a pagina 24).

Fissiamo in un qualsiasi quadrilatero ABCD i punti mediani dei suoi lati

consecutivi. Chiamiamo questi punti P,Q,R, S. Siano a =−→AB,b =

−−→BC, c =−−→

CD,d =−−→DA i vettori come in figura a pagina 24. Allora a + b + c + d = 0.

Quindi a + b = −(c + d). Si vede sempre dalla figura che−→PQ = 1

2a + 1

2b =

12(a + b) e

−→RS = 1

2c + 1

2d = 1

2(c + d). Quindi, applicando l’uguaglianza

a + b = −(c + d), si ricava−→PQ = −

−→RS. Segue che i vettori

−→PQ e

−→RS sono

su rette parallele. In maniera simile si prova che il vettore−→QR e parallelo al

vettore−→SP .

Figure 2.7: Prova geometrica con vettori

2.3 Prodotto interno (o scalare)

In questa sezione definiamo il prodotto interno di due vettori dello spazio.Analoghe definizioni possono essere date per vettori di Rn con n arbitrario.Lasciamo al lettore la facile generalizzazione.

2.3. PRODOTTO INTERNO (O SCALARE) 25

Il prodotto interno di due vettori e uno scalare, proporzionale alla lunghezzadei due vettori, che ci da informazione sull’orientazione relativa dei due vet-tori tramite il coseno dell’angolo da essi formato. In particolare, due vettorisono perpendicolari tra loro se il loro prodotto interno e nullo.

Un punto A dello spazio R3 rappresenta anche il vettore−→OA che va

dall’origine O delle coordinate Cartesiane sino al punto A. Quindi in se-guito parleremo di punto A oppure di vettore A senza alcuna distinzione.

Definiamo il prodotto interno in termini delle coordinate dei due vettori.L’interpretazione geometrica del prodotto interno verra data nel seguito.

Definition 2.3.1. Se A = [a1, a2, a3] e B = [b1, b2, b3] sono due vettori di R3,allora il prodotto interno (o scalare) di A e B e definito come segue:

A ·B = a1b1 + a2b2 + a3b3.

Per esempio, se A = [2, 3, 2] e B = [−3, 4, 3] allora A ·B = 12.

Lemma 2.3.1. Il prodotto interno verifica le seguenti proprieta:

PS1 A ·B = B · A;

PS2 A · (B + C) = A ·B + A · C = (B + C) · A;

PS3 Se r e uno scalare (rA) ·B = r(A ·B) = A · (rB);

PS4 Se 0 e il vettore nullo, allora 0 · 0 = 0; in ogni altro caso A · A > 0.

Se A = [a1, a2, a3], allora la lunghezza (o norma o modulo) del vettore Ae definita come

‖A‖ =√A · A =

√a21 + a22 + a23.

Distanza tra due puntiLa lunghezza del vettore A e pari alla distanza del punto A dall’origine dellecoordinate Cartesiane. Se A e B sono due punti dello spazio, la distanza

tra A e B e la lunghezza del vettore applicato−→AB che va da A a B. Se

riportiamo questo vettore applicato nell’origine delle coordinate Cartesiane,cioe consideriamo il punto B − A, otteniamo che la distanza tra A e B e

‖B − A‖.

PerpendicolaritaQuando due vettori sono perpendicolari od ortogonali?

26 CHAPTER 2. INTRODUZIONE AGLI SPAZI VETTORIALI

Proposition 2.3.2. Due vettori A e B sono perpendicolari sse il loro prodottointerno A ·B e 0.

Proof. Due vettori A e B sono perpendicolari se e solo se la distanza tra Ae B e la distanza tra A e −B sono uguali (l’angolo formato dai vettori A eB e uguale all’angolo formato dai vettori A e −B). Questo significa che

‖A−B‖ = ‖A− (−B)‖ = ‖A+B‖.

Calcoliamo con i quadrati delle distanze:

0 = ‖A−B‖2 − ‖A+B‖2= [(A−B) · (A−B)]− [(A+B) · (A+B)]= [(A · A)− 2(A ·B) + (B ·B)]− [(A · A) + 2(A ·B) + (B ·B)]= 4(A ·B)

da cui segue A ·B = 0.

Nel seguito presentiamo alcune applicazioni geometriche del prodotto in-terno.

Theorem 2.3.3. Se un triangolo ABC inscritto in una circonferenza ha undiametro come lato, allora il triangolo e rettangolo (si veda la Figura a pagina27).

Proof. Sia O il centro della circonferenza e siano A,B,C tre punti distintidella circonferenza che determinano un triangolo ABC tale che il segmento

AB e un diametro della circonferenza. Allora−→CO +

−−→OB =

−−→CB ed inoltre−→

CO +−→OA =

−→CA. Se indichiamo con u =

−−→OB e v =

−→OC, allora abbiamo che−→

OA = −u e −−→CB = −v + u;

−→CA = −v − u.

Calcolando il prodotto interno di−−→CB e

−→CA si ha:

−−→CB ·

−→CA = (−v + u) · (−v − u)

= (v · v) + (v · u)− (u · v)− (u · u)= (v · v)− (u · u)= 0

perche ‖v‖2 = v · v, ‖u‖2 = u · u e i vettori v e u hanno la stessa lunghezza

uguale al raggio del cerchio. In conclusione, i vettori−−→CB e

−→CA sono perpen-

dicolari e l’angolo tra di loro compreso e di 90 gradi.

2.3. PRODOTTO INTERNO (O SCALARE) 27

Figure 2.8: Triangolo inscritto in una circonferenza con diametro come lato

Vediamo ora come si puo dimostrare il Teorema di Pitagora tramite ilprodotto interno. Sia ABC un triangolo rettangolo come in figura a pagina

27. Indichiamo con a =−−→BC, b =

−→CA e c =

−→AB i tre vettori dei lati

Figure 2.9: Triangolo rettangolo

consecutivi. Supponiamo che l’angolo retto sia l’angolo compreso tra i vettoria e c, cosicche il prodotto interno a·c = 0 e nullo. Dal fatto che a+b+c = 0,si ricava b = −(a + c). Allora si ha:

‖b‖2 = b·b = (−a−c)·(−a−c) = (a·a)+2(a·c)+(c·c) = (a·a)+(c·c) = ‖a‖2+‖c‖2

perche a · c = 0.

2.3.1 Coseno dell’angolo formato da due vettori

La parte restante di questa sezione ha lo scopo di determinare il significatogeometrico del prodotto interno:

A ·B = ‖A‖ ‖B‖ cos θ,

dove θ e l’angolo formato dai vettori A e B (ovvero l’angolo AOB).

28 CHAPTER 2. INTRODUZIONE AGLI SPAZI VETTORIALI

Lemma 2.3.4. (Disuguaglianza di Schwartz)

(A ·B)2 ≤ (A · A)(B ·B).

Proof. Se A oppure B e il vettore nullo, la disuguaglianza vale. Supponiamoquindi che sia A che B sono diversi dal vettore nullo 0. Siano x e y numerireali arbitrari. Applicando la proprieta (PS4) abbiamo:

0 ≤ (xA+ yB) · (xA+ yB).

Sviluppando otteniamo:

0 ≤ x2(A · A) + 2xy(A ·B) + y2(B ·B).

Poniamo x = B ·B > 0. Dividendo per x si ottiene:

0 ≤ (B ·B)(A · A) + 2y(A ·B) + y2.

Il risultato finale si ottiene ponendo y = −(A ·B). Si ricava

0 ≤ (B ·B)(A · A)− 2(A ·B)2 + (A ·B)2 = (B ·B)(A · A)− (A ·B)2.

Riportando al primo membro (A ·B)2 si ottiene la tesi.

Corollary 2.3.5.

|A ·B| ≤ ‖A‖ ‖B‖.

Lemma 2.3.6. ‖A+B‖ ≤ ‖A‖+ ‖B‖ ed inoltre ‖xA‖ = x‖A‖,

Proof. Sviluppiamo ‖A+B‖2 = (A+B) ·(A+B) = A ·A+2(A ·B)+B ·B =‖A‖2 + 2(A ·B) + ‖B‖2 ≤ ‖A‖2 + 2‖A‖ ‖B‖+ ‖B‖2 = (‖A‖+ ‖B‖)2.

Proposition 2.3.7. Siano A e B due vettori, e sia θ l’angolo da essi formato.Allora si ha:

A ·B = ‖A‖ ‖B‖ cos θ.

Proof. Sia θ l’angolo formato dai vettori A e B. Se proiettiamo il vettore Asulla retta che contiene B, otteniamo un vettore rB (per un certo r ∈ R)che ha la stessa direzione di B. Dalla trigonometria elementare si ha che lalunghezza r‖B‖ del vettore rB e uguale a ‖A‖ cos θ, mentre la lunghezza di

2.3. PRODOTTO INTERNO (O SCALARE) 29

A− rB e uguale a ‖A‖ sin(θ) ed e perpendicolare al vettore B. Utilizzandola Proposizione 2.3.2 si ha:

(A− rB) ·B = A ·B − r(B ·B) = 0

da cui

r =A ·BB ·B

=A ·B‖B‖2

.

Quindi, dar‖B‖ = ‖A‖ cos θ

sostituendo a r il suo valore otteniamo:

(A ·B‖B‖2

)‖B‖ = ‖A‖ cos θ.

Semplificando ricaviamo:

A ·B‖B‖

= ‖A‖ cos θ.

da cui si ha la tesi.

Due vettori sono allineati se cos θ = +1 oppure cos θ = −1, da cui si ha:

|A ·B| = ‖A‖ ‖B‖.

30 CHAPTER 2. INTRODUZIONE AGLI SPAZI VETTORIALI

Chapter 3

Rette e piani

Una equazione lineare nelle incognite x1, . . . , xn a coefficienti nel campo nu-merico K e un’equazione:

a1x1 + · · ·+ anxn = b (3.1)

con a1, . . . , an, b ∈ K. Gli elementi ai sono detti coefficienti, mentre b e iltermine noto. Se b = 0, l’equazione e detta lineare omogenea. Una soluzionedell’equazione lineare e una n-upla (ordinata) (r1, . . . , rn) di elementi di Ktale che

a1r1 + · · ·+ anrn = b.

L’insieme di tutte le soluzioni dell’equazione lineare (3.1) e detto iperpiano(di dimensione n− 1) nello spazio vettoriale Kn di dimensione n.

In questa sezione utilizzeremo come campo numerico l’insieme R dei nu-meri reali e ci limiteremo alle dimensioni n = 2 e n = 3. In tal caso,l’equazione lineare ax + by = c (a, b, c ∈ R) definisce una retta nel piano,mentre l’equazione lineare ax+ by+ cz = d (a, b, c, d ∈ R) definisce un pianonello spazio.

Un’equazione lineare puo essere espressa tramite il prodotto interno. Cilimitiamo alla dimensione tre. Il lettore puo facilmente generalizzare il lemmaa dimensione 2 oppure a dimensione n arbitraria.

Lemma 3.0.1. Sia ax1 + bx2 + cx3 = d un’equazione lineare in tre incognite,a = [a, b, c] il vettore dei coefficienti e x = [x1, x2, x3] il vettore delle incognite.Allora l’equazione lineare si puo scrivere, utilizzando il prodotto interno, comesegue:

a · x = d

31

32 CHAPTER 3. RETTE E PIANI

Essa esprime il luogo di tutti vettori x il cui prodotto interno con il vettorecostante a da come risultato lo scalare d. Se d = 0, l’equazione a · x = 0descrive il piano dei vettori perpendicolari al vettore a.

3.1 Rette nel piano

Cominciamo questa sezione con lo studio delle rette del piano passanti perl’origine. Esse sono definite da equazioni lineari omogenee in due incognite.

• Retta di equazione ax+ by = 0Utilizzando il prodotto interno di vettori, l’equazione lineare 3x+2y = 0(x, y variabili reali) si puo scrivere nel modo seguente: [3, 2] · [x, y] = 0.La retta 3x+2y = 0 descrive quindi l’insieme dei vettori [x, y] che sonoperpendicolari al vettore [3, 2]. Il luogo dei punti

{[x, y] : 3x+ 2y = 0}

e la retta passante per l’origine e perpendicolare al vettore [3, 2]. Seconosciamo un punto sulla retta, per esempio il punto [2,−3], alloratutti gli altri possono essere ottenuti moltiplicando il vettore [2,−3]per lo scalare t numero reale arbitrario (equazione parametrica dellaretta):

x = 2t; y = −3t, al variare del reale t.

In generale, se [a, b] e un vettore, allora ax+ by = 0 e l’equazione dellaretta passante per l’origine i cui punti [x, y] sono vettori perpendicolarial vettore [a, b].

Consideriamo ora le rette del piano che non passano per l’origine.

• Retta di equazione ax+ by = c con c 6= 0Utilizzando il prodotto interno, l’equazione 3x + 2y = 5 si puo scri-vere come segue [3, 2] · [x, y] = 5. Per capire il rapporto esistentetra l’equazione 3x + 2y = 5 e l’equazione omogenea 3x + 2y = 0fissiamo un punto, per esempio P = [1, 1], che appartiene alla retta3x+ 2y = 5. Esiste una corrispondenza bigettiva tra i punti nella retta3x + 2y = 5 ed i punti nella retta 3x + 2y = 0. Se Q = [q0, q1] sod-disfa l’equazione 3q0 + 2q1 = 0 allora P + Q = [1 + q0, 1 + q1] soddisfa3(1+q0)+2(1+q1) = 5. Viceversa, se R = [r0, r1] soddisfa 3r0+2r1 = 5

3.1. RETTE NEL PIANO 33

allora R − P = [r0 − 1, r1 − 1] soddisfa 3(r0 − 1) + 2(r1 − 1) = 0. Ledue funzioni sono l’una inversa dell’altra.

Siccome i punti della retta 3x + 2y = 0 sono descrivibili parametri-camente come tQ con t scalare arbitrario e Q punto nella retta (peresempio, Q = [2,−3]), allora la retta 3x+2y = 5 si descrive parametri-camente come P+tQ. Quindi, l’insieme dei punti [1, 1]+t[2,−3] = [1+2t, 1−3t] sono tutti e soli i punti che verificano l’equazione 3x+2y = 5:

[3, 2] · [1 + 2t, 1− 3t] = 3(1 + 2t) + 2(1− 3t) = 5.

Quindi la seguente equazione parametrica descrive la retta:

x = 1 + 2t; y = 1− 3t, al variare del numero reale t.

La retta data e parallela alla retta di equazione 3x + 2y = 0 e passaper il punto [1, 1].

Lasciamo al lettore la facile generalizzazione al caso generale ax+by = ccon c 6= 0.

• Dato un vettore A ed un punto P nel piano, determinarel’equazione della retta passante per P e parallela alla rettache include il vettore ASpieghiamo il procedimento con un esempio. Sia A = [3, 2] e P =[1,−1]. Prima determiniamo i valori a e b della retta ax + by = 0passante per l’origine e per il punto A. Siccome A sta nella rettaabbiamo

3a+ 2b = 0,

da cui b = −(3/2)a. Se scegliamo a = 2, si ricava b = −3. Alloral’equazione della retta che contiene il vettore A e

2x− 3y = 0.

La nuova retta avra equazione

2x− 3y = c

per un certo c 6= 0. Il punto P sta in questa retta, quindi c = 2 −3(−1) = 5. Quindi l’equazione della retta passante per P e parallelaalla retta di direzione il vettore A e:

2x− 3y = 5.

34 CHAPTER 3. RETTE E PIANI

Figure 3.1: Rette nel piano

• Dati due punti distinti A e B nel piano, determinare l’equazionedella retta passante per A e BSpieghiamo il procedimento con un esempio. Sia A = [2, 2] e B =

[−2, 6]. La retta passante per A e B conterra il vettore applicato−→AB.

Riportiamo tale vettore nell’origine tramite il punto B − A = [−4, 4].

Quindi il vettore−→AB avra la stessa lunghezza e direzione del vettore

B − A.

Equazione della retta contenente il vettoreB−A = [−4, 4]: dall’equazionegenerica ax + by = 0 e dal fatto che il punto B − A appartiene allaretta si ricava che −4a + 4b = 0 da cui a = b. Scegliamo a = b = 1.Quindi l’equazione e x+ y = 0.

Equazione della retta parallela alla retta di equazione x + y = 0 econtenente il punto B = [−2, 6]: Da x+y = c sostituendo le coordinatedel punto B si ricava c = −2 + 6 = 4.

3.2. RETTE E PIANI NELLO SPAZIO 35

Quindi l’equazione della retta e x + y = 4. Anche il punto A sta nellaretta in quanto 2 + 2 = 4.

• Come passare dall’equazione parametrica di una retta all’equazioneax+ by = cSe descriviamo una retta con un’equazione parametrica, per esempio

x = 5 + 2t; y = 2 + t

ricaviamo t da una delle due equazioni e lo sostituiamo nell’altra. Dat = y − 2 si ottiene x = 5 + 2(y − 2) da cui x− 2y = 1.

3.2 Rette e piani nello spazio

Cominciamo con lo studio dei piani passanti per l’origine. Essi sono definitida equazioni lineari omogenee in tre incognite.

• Piano passante per l’origine e perpendicolare ad un dato vet-toreNello spazio abbiamo tre coordinate. Consideriamo tre variabili x, y, z.Cosa descrive l’equazione 3x + 2y + z = 0? Un piano passante perl’origine. Consideriamo il vettore [3, 2, 1] ed il vettore [x, y, z]. L’equazione3x+ 2y+ z = 0 si puo scrivere utilizzando il prodotto interno: [3, 2, 1] ·[x, y, z] = 0. Ossia il vettore [x, y, z] e perpendicolare al vettore [3, 2, 1].Quindi l’equazione descrive l’insieme di tutti i vettori perpendicolari alvettore [3, 2, 1]. Il luogo dei punti

{[x, y, z] : 3x+ 2y + z = 0}

e il piano passante per l’origine e perpendicolare al vettore [3, 2, 1].

L’equazione parametrica del piano si ottiene come segue. Consideri-amo due punti P e Q nel piano 3x+ 2y+ z = 0, che non siano allineatirispetto alle rette del piano passanti per l’origine degli assi (non pos-siamo considerare soltanto un punto perche il piano e bidimensionale).Per esempio, P = [1,−1.− 1] e Q = [−1, 0, 3]. Allora tutti i punti delpiano 3x + 2y + z = 0 si ottengono come combinazione lineare di P eQ:

tP + rQ, al variare di r, t numeri reali,

36 CHAPTER 3. RETTE E PIANI

In altri termini tutti i punti del tipo

x = t− r; y = −t; z = −t+ 3r. (3.2)

• Piano di equazione ax+ by + cz = d con d 6= 0L’equazione 3x+ 2y + z = 4 descrive un piano parallelo al piano 3x+2y + z = 0. Se R = [1, 1,−1] e un punto del piano 3x + 2y + z = 4,allora i punti del nuovo piano si ottengono parametricamente da (3.2)come segue:

x′ = 1 + t− r; y = 1− t; z = −1− t+ 3r.

• Piano passante per tre punti non allineatiSiano P,Q,R tre punti non allineati (cioe, per i tre punti non passa

una retta). Consideriamo i vettori applicati−→PQ e

−→PR. Li riportiamo

all’origine degli assi, considerando il vettore Q−P ed il vettore R−P .Questi due vettori non sono allineati per l’ipotesi iniziale che i tre puntinon sono allineati. Il piano passante per l’origine e contenente i vettoriQ− P e R− P ha la seguente equazione parametrica:

t(Q− P ) + r(R− P ), al variare di r, t numeri reali,

Allora il piano passante per P,Q,R e descritto da

P + t(Q− P ) + r(R− P ), al variare di r, t numeri reali,

Infatti, ponendo r = t = 0 si ottiene il punto P , con t = 1 e r = 0 siottiene Q, ed infine con t = 0 e r = 1 si ha il punto R.

Esempio: P = [1, 1, 1], Q = [1, 2, 1] ed R = [5, 0, 7]. Il piano passanteper l’origine ha equazione parametrica:

x = 4r; y = t− r; z = 6r.

Il piano passante per i tre punti ha equazione parametrica:

x = 1 + 4r; y = 1 + t− r; z = 1 + 6r.

Trasformiamo l’equazione parametrica in una non parametrica: r =(x − 1)/4, da cui z = 1 + 6(x − 1)/4 = 1 + 3(x − 1)/2. Infine si ha2z = 3x− 3 + 2 = 3x− 1:

−3x+ 2z = −1

3.2. RETTE E PIANI NELLO SPAZIO 37

3.2.1 Fasci di rette

L’insieme di tutte le rette del piano che passano per un punto C del pianoprende il nome di fascio di rette che ha come centro il punto C.

Figure 3.2: Fascio di rette di centro C

Se conosciamo le equazioni ax + by + c = 0 e dx + ey + f = 0 di duerette distinte passanti per C allora ogni altra retta nel fascio si scrive comecombinazione lineare di queste due rette. L’equazione lineare

r(ax+ by + c) + s(dx+ ey + f) = 0, (r, s ∈ R)

rappresenta tutte e sole le rette che passano per C se gli scalari r ed s nonsono entrambi nulli. Se s 6= 0, possiamo dividere per s ed ottenere ponendot = r/s:

t(ax+ by + c) + (dx+ ey + f) = 0.

Quest’ultima equazione descrive tutte le rette passanti per C tranne la rettaax + by + c. Quest’ultima forma di descrizione del fascio e utile nelle appli-cazioni come il seguente esempio spiega.

Example 8. Vogliamo scrivere l’equazione della retta passante per i puntiP = [1, 1] e Q = [2, 5]. Consideriamo due rette distinte passanti per P ,per esempio y − x = 0 e x − 1 = 0. Allora, il fascio (y − x) + t(x − 1) = 0comprende tutte le rette passanti per P tranne la retta x−1 = 0. Sostituendole coordinate di Q al posto di x ed y otteniamo: 3 + t = 0 da cui t = −3.

38 CHAPTER 3. RETTE E PIANI

Quindi l’equazione (y− x)− 3(x− 1) = 0, che si semplifica a y− 4x+ 3 = 0,descrive la retta passante per P e Q.

Chapter 4

Sistemi lineari

Un sistema lineare di m equazioni nelle incognite x1, . . . , xn e un insieme diequazioni lineari con coefficienti in un campo numerico K:

a11x1 + · · ·+ a1nxn = b1a21x1 + · · ·+ a2nxn = b2. . . . . . . . .am1x1 + · · ·+ amnxn = bm

Il sistema lineare e omogeneo se bi = 0 per ogni i. Una soluzione del sistemae un vettore [r1, . . . , rn] di elementi del campo numerico tali che

a11r1 + · · ·+ a1nrn = b1a21r1 + · · ·+ a2nrn = b2. . . . . . . . .am1r1 + · · ·+ amnrn = bm

Ciascuna equazione lineare del sistema descrive un iperpiano nello spazio Kn.L’insieme delle soluzioni del sistema lineare descrive l’insieme dei punti checostituiscono l’intersezione di m iperpiani nello spazio Kn. Ciascun iperpianoe descritto dall’equazione ai1x1 + · · ·+ ainxn = bi (i = 1, . . . ,m).

In dimensione 2 con K = R le soluzioni del sistema

a11x1 + a12x2 = b1a21x1 + a22x2 = b2

sono i punti [x1, x2] del piano che costituiscono l’intersezione delle due rettedi equazione rispettivamente a11x1 + a12x2 = b1 e a21x1 + a22x2 = b2. In

39

40 CHAPTER 4. SISTEMI LINEARI

dimensione 3 le soluzioni del sistema

a11x1 + a12x2 + a13x3 = b1a21x1 + a22x2 + a23x3 = b2a31x1 + a32x2 + a33x3 = b3

sono i punti [x1, x2, x3] dello spazio che costituiscono l’intersezione dei trepiani.

4.1 Metodo di eliminazione di Gauss

Gauss, nato a Brunswick nel 1777 e morto a Gottingen nel 1855, introdusseun algoritmo per semplificare un sistema lineare trasformandolo in un sistemalineare piu semplice con le stesse soluzioni del sistema iniziale.

Theorem 4.1.1. (Metodo di eliminazione di Gauss) Se un sistema linearee ottenuto da un altro con una delle seguenti operazioni:

(i) Scambio di due equazioni;

(ii) Sostituzione di un’equazione con un multiplo scalare non nullo dell’equazionestessa;

(iii) Sostituzione di un’equazione con la somma dell’equazione stessa conun’altra moltiplicata per uno scalare d,

allora il sistema di partenza e quello di arrivo hanno le stesse soluzioni.

Per esempio, se ax + by = c e l’equazione di una retta, moltiplicandoper una stessa costante d 6= 0 entrambi i membri dell’uguaglianza si ottieneun’equazione

d(ax+ by) = dc

che descrive la stessa retta. In termini di prodotto interno, se [a, b] · [x, y] = callora [da, db] · [x, y] = dc. Il vettore [da, db] sta nella stessa retta contenenteil vettore [a, b]. Quindi in un sistema lineare possiamo sostituire l’equazioneax + by = c con l’equazione dax + dby = dc senza che cambino le soluzionidel sistema.

Come ulteriore esempio, consideriamo il sistema lineare:

a1x+ b1y = c1a2x+ b2y = c2

(4.1)

4.2. DUE EQUAZIONI IN DUE VARIABILI 41

Possiamo sostituire la prima equazione con la somma dell’equazione stessacon la seconda moltiplicata per una costante d senza modificare l’insieme dellesoluzioni del sistema. In altre parole, sostituiamo l’equazione a1x+ b1y = c1con l’equazione (a1x + b1y) + d(a2x + b2y) = c1 + dc2, ottenendo il nuovosistema lineare:

(a1 + da2)x+ (b1 + db2)y = c1 + dc2a2x+ b2y = c2

(4.2)

Proviamo che i due sistemi (4.1) e (4.2) hanno le stesse soluzioni. Sia [p, q]una soluzione del sistema (4.2). Allora abbiamo direttamente da (4.2) chea2p+ b2q = c2. Resta da verificare che a1p+ b1q = c1. Da (a1 + da2)p+ (b1 +db2)q = c1+dc2 si ricava che a1p+b1q = c1−d(a2p+b2q−c2) = c1+0 = c1. Esemplice verificare che una soluzione di (4.1) e anche una soluzione di (4.2).

4.2 Due equazioni in due variabili

• Consideriamo il sistema seguente:

3x+ 2y = 5x+ 4y = 3

La prima e l’equazione di una retta parallela alla retta di equazione3x+2y = 0, passante per l’origine e perpendicolare al vettore A = [3, 2].La seconda e l’equazione di una retta parallela alla retta di equazionex+4y = 0, passante per l’origine e perpendicolare al vettore B = [1, 4].

Cerchiamo le soluzioni comuni alle due equazioni: un vettore [x, y] ilcui prodotto interno con [3, 2] da come risultato 5; e con [1, 4] da comerisultato 3.

• Numero di possibili soluzioni in generale. Il sistema ammetteun’unica soluzione se le due rette non sono parallele. Se le rette sonoparallele, allora non abbiamo soluzioni se le rette sono distinte, mentreabbiamo infinite soluzioni se le due rette coincidono.

• Numero delle soluzioni nel caso particolare.Per sapere se le rette sono parallele oppure no, calcoliamo il prodottointerno di A e B (si veda Sezione 2.3):

A ·B = [3, 2] · [1, 4] = 3 + 8 = 11.

42 CHAPTER 4. SISTEMI LINEARI

Siccome ‖A‖ =√

13 e ‖B‖ =√

17, abbiamo per l’angolo tra i vettoriA e B:

cos θ =A ·B√13√

17=

11√221

=

√121

221< 1.

Quindi le rette non sono parallele. Se lo fossero cos θ sarebbe uguale a+1 oppure −1.

• Calcolo dell’unica soluzione con il metodo di Gauss.Calcoliamo l’unica soluzione del sistema

3x+ 2y = 5x+ 4y = 3

L’idea e di trasformare il sistema lineare dato in uno equivalente in cuila variabile x non compare nella seconda equazione.

Moltiplichiamo la prima equazione per 1/3 ed otteniamo il nuovo sis-tema

x+ 23y = 5

3

x+ 4y = 3

La retta descritta dall’equazione x + 23y = 5

3e la stessa descritta

dall’equazione 3x + 2y = 5. A questo punto la seconda equazionex+ 4y = 3 e la nuova equazione x+ 2

3y = 5

3hanno lo stesso termine in

x. Sottraiamo la prima equazione dalla seconda per ottenere il sistema

x+ 23y = 5

3

103y = 4

3

da cui y = 25. Sostituendo nella prima equazione si ottiene x = 7

5. La

soluzione e quindi

x =7

5; y =

2

5.

• Un altro esempio con il metodo di eliminazione di Gauss.Consideriamo un altro esempio:

x+ 2y = 34x+ 5y = 6

4.2. DUE EQUAZIONI IN DUE VARIABILI 43

Calcoliamo il numero delle soluzioni. Sia A = [1, 2] e B = [4, 5]. Alloraabbiamo:

cos θ =A ·B‖A‖ ‖B‖

=14√5√

41=

14√205

=

√196

221< 1.

Quindi le due rette non sono parallele ed esiste un’unica soluzione.

Calcoliamo la soluzione. Moltiplichiamo la prima equazione per 4 e lasottraiamo alla seconda. Si ottiene il sistema:

x+ 2y = 3−3y = −6

da cui si ricava y = 2 e, sostituendo 2 per y nella prima equazione, siottiene x = −1.

• Un esempio di sistema con infinite soluzioni.Consideriamo il seguente sistema lineare:

x+ 2y = 32x+ 4y = 6

Calcoliamo il numero delle soluzioni. Sia A = [1, 2] e B = [2, 4)]. Alloraabbiamo:

cos θ =A ·B‖A‖ ‖B‖

=10√5√

20=

10√100

=10

10= 1.

Quindi le due rette sono parallele, anzi sono uguali. La seconda equazionesi scrive come 2(x + 2y) = 2 × 3. Quindi il sistema lineare ammetteinfinite soluzioni.

• Un esempio di sistema con nessuna soluzione. Consideriamoil seguente sistema lineare:

x+ 2y = 32x+ 4y = 12

Calcoliamo il numero delle soluzioni. Sia A = [1, 2] e B = [2, 4]. Alloracome prima abbiamo cos θ = 1. Quindi le due rette sono parallele, manon uguali. La seconda equazione si scrive come 2(x + 2y) = 2 × 6 ecorrisponde alla retta x + 2y = 6 che e parallela alla retta della primaequazione. Quindi il sistema lineare non ammette soluzione.

44 CHAPTER 4. SISTEMI LINEARI

4.3 Due o tre equazioni in tre variabili

1. Consideriamo il sistema lineare:

3x+ 2y + z = 0x+ 4y + 3z = 0x+ y + z = 0

Il sistema e omogeneo perche il vettore dei termini noti e il vettorenullo.

La prima e l’equazione di un piano passante per l’origine e perpendi-colare al vettore A = [3, 2, 1]. La seconda e l’equazione di un pianopassante per l’origine e perpendicolare al vettore B = [1, 4, 3]. Laterza e l’equazione di un piano passante per l’origine e perpendico-lare al vettore C = [1, 1, 1]. Quindi una soluzione comune [x, y, z]delle tre equazioni e un vettore contemporaneamente perpendicolaread A = [3, 2, 1], B = [1, 4, 3] e C = [1, 1, 1].

(i) L’intersezione dei tre piani e un piano sse i tre piani sono coincidenti(lo stesso piano) sse i tre vettori A, B e C sono collineari (nellastessa retta per l’origine);

(ii) L’intersezione dei tre piani e una retta sse i tre vettori A, B e Cnon sono collineari ma si trovano in uno stesso piano passante perl’origine;

(iii) L’intersezione dei tre piani e un punto sse (1) i vettori A e B nonsi trovano nella stessa retta; (2) il vettore C non si trova nel pianogenerato dai vettori A e B.

Ritorniamo al sistema lineare omogeneo precedente. Calcoliamo se ipiani sono paralleli. Siano A = [3, 2, 1], B = [1, 4, 3] e C = [1, 1, 1].Allora abbiamo:

cos(θAB) = (A ·B)/‖A‖ ‖B‖ = 14/√

14√

26 = 14/√

364 < 1.

Quindi A e B non sono collineari. Se C fosse nel piano generato da Ae B, allora esisterebbero due scalari c e d tali che c[3, 2, 1] + d[1, 4, 3] =[1, 1, 1], da cui si ha 3c + d = 1, 2c + 4d = 1 e c + 3d = 1. Sottraendola seconda dalla prima si ricava: c = 3d. Sostituendo nella terza si

4.3. DUE O TRE EQUAZIONI IN TRE VARIABILI 45

ottiene 3d + 3d = 0, cioe d = 0 e quindi c = 0. Si ottiene cosı che Cnon si trova nel piano generato da A e B. Quindi l’unica soluzione delsistema lineare iniziale e il vettore nullo.

2. Consideriamo il sistema seguente:

3x+ 2y + z = 5x+ 4y + 3z = 3x+ y + z = 0

La prima e l’equazione di un piano parallelo al piano di equazione3x + 2y + z = 0 passante per l’origine e perpendicolare al vettoreA = [3, 2, 1]. La seconda e l’equazione di un piano parallelo al pianodi equazione x + 4y + 3z = 0 passante per l’origine e perpendicolareal vettore B = [1, 4, 3]. La terza e l’equazione del piano passante perl’origine e perpendicolare al vettore C = [1, 1, 1].

L’intersezione dei tre piani e un punto se (1) i vettori A e B non sitrovano nella stessa retta; (2) il vettore C non si trova nel piano gen-erato dai vettori A e B. Dai fatti calcoli fatti nel punto precedenteper il sistema omogeno si ottiene che C non si trova nel piano generatoda A e B. Quindi la soluzione e un punto. Applichiamo il metodo dieliminazione di Gauss.

Scambiamo la prima equazione con la terza. Si ottiene il sistema:

x+ y + z = 03x+ 2y + z = 5x+ 4y + 3z = 3

Facciamo scomparire x dalla seconda e terza equazione.

• Sottraiamo 3 volte la prima equazione dalla seconda;

• Sottraiamo la prima equazione dalla terza;

Si ottiene:x + y + z = 0

−y − 2z = 53y + 2z = 3

46 CHAPTER 4. SISTEMI LINEARI

Facciamo scomparire y dalla terza equazione sommando tre volte laseconda:

x + y + z = 0−y − 2z = 5

− 4z = 18

Quindi z = −9/2, y = 4 e infine dalla prima equazione x = −4+9/2 =1/2.

3. Consideriamo il sistema seguente:

3x+ 2y + z = 5x+ 4y + 3z = 3

La prima e l’equazione di un piano parallelo al piano di equazione3x + 2y + z = 0 passante per l’origine e perpendicolare al vettoreA = [3, 2, 1]. La seconda e l’equazione di un piano parallelo al pianodi equazione x+ 4y + 3z = 0 passante per l’origine e perpendicolare alvettore B = [1, 4, 3)].

L’intersezione di due piani, se non paralleli, e una retta.

Cerchiamo le soluzioni comuni alle due equazioni: un vettore [x, y, z] ilcui prodotto interno con [3, 2, 1] da come risultato 5; e con [1, 4, 3] dacome risultato 3.

Calcoliamo se i piani sono paralleli. Sia A = [3, 2, 1] e B = [1, 4, 3].Allora abbiamo:

cos θ = (A ·B)/‖A‖ ‖B‖ = 14/√

14√

26 = 14/√

364 < 1.

Quindi i due piani non sono paralleli.

Applichiamo il metodo di eliminazione di Gauss. Scambiamo la primae la seconda equazione ottenendo

x+ 4y + 3z = 33x+ 2y + z = 5

Sottraiamo alla seconda equazione tre volte la prima equazione otte-nendo: x+4(2-4z)/5 +3z = 3

x + 4y + 3z = 3−10y − 8z = −4

4.3. DUE O TRE EQUAZIONI IN TRE VARIABILI 47

da cui si ha y = 2−4z5

. Sostituiamo nella prima equazione per ottenerele soluzioni in termini del parametro z:

x = (3− (16/5))z + (3− (8/5)); y = −2− 4z

5.

48 CHAPTER 4. SISTEMI LINEARI

Chapter 5

Matrici

Consideriamo nuovamente il sistema lineare:

3x+ 2y + z = 5x+ 4y + 3z = 3x+ y + z = 0

Il sistema lineare e completamente determinato dalla seguente tabella bidi-mensionale con i coefficienti delle variabili 3 2 1

1 4 31 1 1

e dal vettore dei termini noti 5

30

Sia i coefficienti delle variabili che il vettore dei termini noti costituisconodelle matrici. La prima ha dimensione 3× 3, la seconda ha dimensione 3× 1.La matrice completa del sistema si ottiene aggiungendo il vettore dei termininoti alla matrice dei coefficienti: 3 2 1 5

1 4 3 31 1 1 0

In questa sezione introduciamo le matrici in generale e studiamo le loro pro-prieta algebriche.

49

50 CHAPTER 5. MATRICI

5.1 Definizione di matrice

Cominciamo con l’introdurre il concetto di matrice in generale.

Definition 5.1.1. Una matrice A = (aij) con m righe ed n colonne (in breveuna matrice di tipo m×n) sul campo K e una famiglia di mn elementi di K.Ciascun elemento ha un indice di riga ed un indice di colonna. L’elementoaij ha indice di riga i ed indice di colonna j con 1 ≤ i ≤ m e 1 ≤ j ≤ n. Lamatrice si rappresenta come segue:

A =

a11 a12 . . . a1na21 a22 . . . a2n. . . . . . . . . . . .am1 am2 . . . amn

Se A e una matrice di tipo m × n, denotiamo con Ai il vettore che e la

riga i della matrice, e con Aj il vettore che e la colonna j della matrice:

Ai =[ai1 ai2 . . . ain

]; Aj =

a1ja2j. . .amj

Una matrice e quadrata se il numero di righe e uguale al numero di

colonne. Una matrice quadrata di tipo n× n viene detta di ordine n.Una matrice quadrata A di ordine n e

1. simmetrica se aij = aji per ogni 1 ≤ i, j ≤ n.

2. diagonale se aij = 0 per i 6= j.

3. la matrice identica se e diagonale e aii = 1 per ogni i (la matriceidentica di ordine n si indica con In).

4. triangolare superiore (inferiore) se aij = 0 per ogni i > j (i < j).

5. la matrice nulla se aij = 0 per ogni 1 ≤ i, j ≤ n.

La trasposta di una matrice A = (aij) e una matrice At = (bij) le cuirighe sono le colonne di A e le cui colonne sono le righe di A. In altre parole,bij = aji per ogni i e j. Se A e una matrice di tipo m × n allora la suatrasposta e una matrice di tipo n×m.

5.2. OPERAZIONI SU MATRICI 51

Proposition 5.1.1. Sia A una matrice. Allora si ha:

1. (At)t = A.

2. Se A e simmetrica e quadrata allora At = A.

Data una matrice A di tipo m×n, gli elementi aik con i = k si chiamanoelementi principali o elementi appartenenti alla diagonale principale. Laloro somma si chiama traccia della matrice, si indica con trA e si ha trA =a11 + a22 + · · ·+ amm.

Example 9. Le seguenti matrici sono rispettivamente simmetrica, diagonalee la matrice identica:

A =

3 2 12 4 41 4 2

B =

3 0 00 4 00 0 2

I =

1 0 00 1 00 0 1

Il vettore riga A2 =

[2 4 4

]coincide con la seconda riga della matrice A,

mentre il vettore colonna A3 =

142

corrisponde alla terza colonna della

matrice A. La traccia della matrice A e trA = 3 + 4 + 2 = 9.La trasposta della matrice simmetrica A coincide con A, mentre la matrice

C qui di seguito non e simmetrica e la sua trasposta non coincide con C.

C =

3 2 71 4 922 1 0

Ct =

3 1 222 4 17 9 0

La seguente matrice D e triangolare superiore:

D =

3 2 70 4 90 0 5

5.2 Operazioni su Matrici

L’insieme delle matrici di tipo m×n a coefficienti in un campo K costituisceuno spazio vettoriale rispetto all’operazioni di somma componente per com-ponente e prodotto per uno scalare. Se A = (aij) e B = (bij) sono matrici di

52 CHAPTER 5. MATRICI

tipo m× n, allora la matrice C = (cij) e la somma di A e B se:

cij = aij + bij, per ogni i, j.

Se r ∈ K e uno scalare, allora rA e la matrice cosı definita:

(rA)ij = rAij, per ogni i, j.

Limitandoci alle matrici di tipo 3× 3, in modo piu espressivo possiamo scri-vere:

A+B =

a11 a12 a13a21 a22 a23a31 a32 a33

+

b11 b12 b13b21 b22 b23b31 b32 b33

=

a11 + b11 a12 + b12 a13 + b13a21 + b21 a22 + b22 a23 + b23a31 + b31 a32 + b32 a33 + b33

cA = r

a11 a12 a13a21 a22 a23a31 a32 a33

=

ra11 ra12 ra13ra21 ra22 ra23ra31 ra32 ra33

L’opposta della matrice A e la matrice −A le cui componenti sono gli

elementi −aij.

Example 10. 2 31 −53 2

+

1 23 45 6

=

3 54 −18 8

4

2 31 −53 2

=

8 124 −2012 8

A =

2 31 −53 2

; −A =

−2 −3−1 5−3 −2

5.2.1 Prodotto di una matrice per un vettore

Consideriamo il sistema lineare a coefficienti reali:

a11x1 + · · ·+ a1nxn = b1a21x1 + · · ·+ a2nxn = b2. . . . . . . . .am1x1 + · · ·+ amnxn = bm

5.2. OPERAZIONI SU MATRICI 53

Definiamo la matrice A dei coefficienti del sistema ed i vettori colonna delleincognite e dei termini noti:

A =

a11 a12 . . . a1na21 a22 . . . a2n. . . . . . . . . . . .am1 am2 . . . amn

; x =

x1x2. . .xn

; b =

b1b2. . .bm

Allora si vede facilmente che la prima equazione lineare a11x1 + · · ·+a1nxn =b1 si ottiene prendendo il prodotto interno del vettore riga

A1 =[a11 a12 . . . a1n

]per il vettore colonna

x1x2. . .xn

e ponendolo

uguale a b1. Similmente per le altre equazioni lineari. I prodotti internidi questo tipo si rappresentano con il prodotto di matrici:

a11 a12 . . . a1na21 a22 . . . a2n. . . . . . . . . . . .am1 am2 . . . amn

x1x2. . .xn

=

a11x1 + · · ·+ a1nxna21x1 + · · ·+ a2nxn

. . .am1x1 + · · ·+ amnxn

Quindi il sistema lineare si rappresenta globalmente come segue

a11 a12 . . . a1na21 a22 . . . a2n. . . . . . . . . . . .am1 am2 . . . amn

x1x2. . .xn

=

b1b2. . .bm

La precedente equazione matriciale si puo anche scrivere come combinazionelineare di vettori colonna:

x1

a11a21. . .am1

+ x2

a12a22. . .am2

+ · · ·+ xn

a1na2n. . .amn

=

b1b2. . .bm

Cosa significa questa equazione? Ci chiediamo se il vettore

b1b2. . .bm

si puo

54 CHAPTER 5. MATRICI

scrivere come combinazione lineare dei vettori colonna

a11a21. . .am1

, . . . ,a1na2n. . .amn

.

Come vedremo nel Capitolo 7, l’equazione vettoriale ha sicuramente soluzionese i vettori colonna sono “linearmente indipendenti”.

Example 11. La matrice quadrata dei coefficienti del sistema lineare

3x+ 2y = 5x+ 4y = 3

ha ordine 2: [3 21 4

]Il sistema lineare si puo scrivere in notazione matriciale come segue:[

3 21 4

] [xy

]=

[53

]I due vettori [x, y] e [5, 3] sono stati scritti come vettori colonna, cioe comematrici 2× 1.

Il prodotto interno 3x+2y del vettore [3, 2] per il vettore

[xy

]e il prodotto

interno della prima riga della matrice per l’unica colonna del vettore colonna[xy

]. Allo stesso modo il prodotto interno x + 4y del vettore [1, 4] per il

vettore

[xy

]e il prodotto interno della seconda riga della matrice per l’unica

colonna del vettore colonna

[xy

]. Quindi abbiamo:

[3 21 4

] [xy

]=

[3x+ 2yx+ 4y

]

Example 12. Il sistema

3x+ 2y + z = 5x+ 4y + 3z = 3x+ y + z = 0

5.2. OPERAZIONI SU MATRICI 55

si rappresenta in notazione matriciale come segue:3 2 11 4 31 1 1

xyz

=

530

Come prima facciamo il prodotto interno tra la prima (rispettivamente sec-

onda e terza) riga della matrice per l’unica colonna del vettore

xyz

per

ottenere 3 2 11 4 31 1 1

xyz

=

3x+ 2y + zx+ 4y + 3zx+ y + z

=

530

La precedente equazione matriciale si puo anche scrivere come combi-

nazione lineare di vettori colonna:

x

311

+ y

241

+ z

131

=

530

= b

con b il vettore colonna [5, 3, 0]t. Ci chiediamo se il vettore b si puo scrivere

come combinazione lineare dei vettori

311

,

241

and

131

.

5.2.2 Prodotto di matrici

Tutte le trasformazioni sulle matrici della precedente sezione si ottengonoanche utilizzando il prodotto matriciale che ci accingiamo a definire.

Definition 5.2.1. Siano A = (aij) una matrice di tipo m × k e B = (bij)una matrice di tipo k × n. Il prodotto AB di A e B e una matrice C di tipom× n le cui componenti cij sono ottenute come segue (per ogni i e j):

cij =k∑r=1

airbrj.

Osserviamo che sia la riga i di A che la colonna j di B hanno k elementi.

56 CHAPTER 5. MATRICI

Proposition 5.2.1. Siano A = (aij) una matrice di tipo m × k, B = (bij)una matrice di tipo k × n e C = (cij) una matrice di tipo n× r. Il prodottotra matrici e associativo:

A(BC) = (AB)C.

L’elemento neutro della matrice A e a sinistra la matrice identica di ordinem ed a destra la matrice identica di ordine k:

ImA = A = AIk.

Il prodotto distribuisce rispetto alla somma:

A(B + C) = (AB) + (AC); (B + C)A = (BA) + (CA).

Il prodotto non e in generale commutativo. Esistono matrici A e B tali cheAB 6= BA. Abbiamo inoltre per le matrici trasposte:

(AB)t = BtAt.

Infine se r e uno scalare:

(rA)B = A(rB) = r(AB).

Se a = a1e1+a2e2 +a3e3 e b = b1e1+b2e2 +b3e3 sono vettori dello spaziotridimensionale, le cui coordinate sono espresse rispetto alla base canonica,allora il prodotto interno di a e b si puo scrivere con il prodotto matriciale:[a1, a2, a3][b1, b2, b3]

t = a1b1+ · · ·+anbn. Questo risultato non vale in generalese consideriamo le coordinate dei vettori a e b rispetto ad una base arbitraria.

Example 13. In questo esempio consideriamo tre matrici:

A =

[1 24 3

]B =

[3 2 52 −2 4

]C =

1 −2 1−4 −2 1

2 −2 3

e controlliamo che (AB)C = A(BC). Abbiamo:

AB =

[7 −2 13

18 2 32

](AB)C =

[41 −36 4474 −104 116

]BC =

[5 −20 20

18 −8 12

]A(BC) =

[41 −36 4474 −104 116

]

5.2. OPERAZIONI SU MATRICI 57

Example 14. In questo esempio verifichiamo che il prodotto non e commu-tativo: [

1 24 3

] [3 22 −2

]=

[7 −2

18 2

]mentre [

3 22 −2

] [1 24 3

]=

[11 12−6 −2

]Example 15.[

1 00 1

] [3 22 −2

]=

[3 22 −2

]=

[3 22 −2

] [1 00 1

]

Figure 5.1: Prodotto di Matrici

Example 16. Un grafo G = (V,E) e costituito da un insieme finito V ={v1, v2, . . . , vn} di vertici (o nodi) e da un insieme di archi o frecce definitetramite una relazione binaria E ⊆ V ×V . Se (v, u) ∈ E allora esiste un arcoorientato che si diparte dal vertice v ed arriva al vertice u:

v −→ u.

58 CHAPTER 5. MATRICI

Un cammino in un grafo e una sequenza di nodi u0, u1, . . . , uk tali che ui →ui+1 for every 0 ≤ i < k.

La matrice di adiacenza di un grafoG con n vertici e una matrice quadrataA di ordine n:

aij =

{1 se (vi, vj) ∈ E0 altrimenti.

La somma degli elementi della riga Ai e pari al numero di archi che esconodal vertice vi.

Definiamo le potenze della matrice A per induzione come segue: A0 = Ine Ak+1 = AkA (da non confondersi con i vettori colonna di A). Indichiamocon (ak)ij le componenti della matrice Ak. Proviamo per induzione su k che(ak)ij e uguale al numero di cammini di lunghezza k dal nodo vi al nodo vj.Il risultato e vero per A1 = A. Un cammino di lunghezza 1 da vi a vj e unarco orientato che connette vi a vj. L’arco esiste sse aij = 1 sse (vi, vj) ∈ E.

Supponiamo che il risultato sia vero per Ak e dimostriamolo per Ak+1:

(ak+1)ij =n∑r=1

(ak)irarj.

Infatti, un cammino di lunghezza k+ 1 da vi a vj lo possiamo spezzare comeun cammino di lunghezza k da vi ad un vertice intermedio vr ed un arco davr a vj. Se calcoliamo quanti sono questi cammini di lunghezza k + 1 connodo intermedio vr, essi sono pari al numero (ak)ir di cammini di lunghezzak da vi a vr se esiste un arco da vr a vj, oppure sono 0 se tale arco non esiste.In ogni caso e pari a

(ak)irarj.

Ne segue la conclusione. Quindi, per ogni k, (ak)ij e uguale al numero dicammini di lunghezza k da vi a vj.

Consideriamo, come esempio, la matrice binaria

A =

0 1 10 0 11 1 0

Essa rappresenta un grafo con tre vertici v1, v2, v3 ed i seguenti archi:

v1 −→ v2; v1 −→ v3; v2 −→ v3; v3 −→ v1; v3 −→ v2

5.3. MOLTIPLICAZIONE DI MATRICI A BLOCCHI 59

Si ha

A2 = AA =

1 1 11 1 00 1 2

Abbiamo in effetti due cammini di lunghezza due da v3 in v3.

5.3 Moltiplicazione di matrici a blocchi

La moltiplicazione tra matrici si semplifica a volte se utilizziamo la moltipli-cazione a blocchi.

Siano A e B matrici rispettivamente di tipo m× n e di tipo n× p, e siar un numero minore o uguale ad n. Possiamo decomporre le due matrici inblocchi:

A = [C|D]; B = [E

F],

dove C e di tipo m × r, D e di tipo m × (n − r), E e di tipo r × p e F edi tipo (n − r) × p. Allora il prodotto matriciale puo essere calcolato comesegue:

AB = CE +DF.

Se dividiamo A e B in quattro blocchi

A =

[C DE F

]; B =

[C ′ D′

E ′ F ′

],

allora la moltiplicazione matriciale si esegue come se A e B fossero matriciquadrate di ordine 2:

AB =

[CC ′ +DE ′ CD′ +DF ′

EC ′ + FE ′ ED′ + FF ′

].

Example 17. Siano A =

[1 0 50 1 3

]e B =

2 3 1 14 8 0 01 0 1 0

due matrici sud-

divise in blocchi compatibili. Allora si ha:

• [1, 0]

[2 34 8

]+ [5][1, 0] = [2, 3] + [5, 0] = [7, 3].

60 CHAPTER 5. MATRICI

• [1, 0]

[1 10 0

]+ [5][1, 0] = [1, 1] + [5, 0] = [6, 1].

• [0, 1]

[2 34 8

]+ [3][1, 0] = [4, 8] + [3, 0] = [7, 8].

• [0, 1]

[1 10 0

]+ [3][1, 0] = [3, 0].

Quindi

AB =

[7 3 6 17 8 3 0

].

Example 18. Siano A =

[1 0 00 0 3

]e B =

0 0 1 10 0 0 01 0 1 0

due matrici sud-

divise in blocchi compatibili. Siccome alcuni blocchi sono costituiti dalla

matrice nulla, allora si vede facilmente che AB =

[0 0 1 13 0 3 0

].

Chapter 6

Matrici e sistemi lineari

Un sistema lineare di m equazioni in n incognite si scrive come

Ax = b,

dove la matrice A dei coefficienti e di tipo m × n, il vettore colonna x delleincognite ha n componenti ed il vettore b dei termini noti ha m compo-nenti. La matrice completa [A|b] del sistema di tipo m× (n+ 1) rappresentacompletamente il sistema.

Le operazioni elementari sulle righe della matrice completa [A|b], definitecome:

• Scambio di due righe;

• Moltiplicazione di una riga per uno scalare r 6= 0;

• Sostituzione di una riga con la somma della riga stessa con un’altrariga moltiplicata per uno scalare.

determinano un processo di trasformazione tra matrici dello stesso tipo:

[A|b]⇒ [A′|b′]⇒ [A′′|b′′]⇒ . . .

Ciascuna di queste matrici complete rappresenta un sistema lineare che hale stesse soluzioni del sistema di partenza Ax = b. Per esempio, il sistemalineare A′′x = b′′ ha le stesse soluzioni di Ax = b. Alla fine si ottieneuna matrice a gradini che ci permette di ottenere facilmente le soluzioni delsistema di partenza.

61

62 CHAPTER 6. MATRICI E SISTEMI LINEARI

Osserviamo che le operazioni elementari sono reversibili. Se applichiamouna delle operazioni elementari ad una riga di una matrice, ne possiamosempre applicare un’altra che esegue l’operazione inversa. Per esempio, semoltiplichiamo una riga per lo scalare 3, allora se moltiplichiamo successiva-mente per 1

3riotteniamo la riga di partenza.

Due matrici sono equivalenti (per riga) se possiamo passare dall’unaall’altra con operazioni elementari. Questa relazione e una relazione di equiv-alenza.

Alla fine di questa sezione proveremo che, se le matrici complete di duesistemi lineari sono equivalenti (per riga), allora i sistemi hanno le stessesoluzioni.

6.1 Matrici e metodo di eliminazione

Ritorniamo al sistema lineare3 2 11 4 31 1 1

xyz

=

530

e rivediamo i passi effettuati per ottenere la soluzione:

1. Scambia la prima riga con la terza riga;

2. Sottrai la prima equazione dalla seconda;

3. Sottrai 3 volte la prima equazione dalla terza;

4. Somma alla terza equazione un terzo della seconda equazione.

Consideriamo la matrice completa del sistema:3 2 1 51 4 3 31 1 1 0

Scriviamo qui di seguito le varie matrici che si ottengono con i vari passaggi1 1 1 0

1 4 3 33 2 1 5

⇒1 1 1 0

0 3 2 33 2 1 5

⇒1 1 1 0

0 3 2 30 −1 −2 5

⇒1 1 1 0

0 3 2 30 0 −4/3 6

Dalla matrice finale si ottiene facilmente la soluzione.

6.1. MATRICI E METODO DI ELIMINAZIONE 63

Definition 6.1.1. Una matrice e elementare se ha uno dei seguenti tre for-mati:

1. Matrice di tipo I che moltiplicando a sinistra una matrice A effettualo scambio di una riga di A con un’altra riga di A. Per semplicita,consideriamo matrici di tipo 3× 3.

E1,3 =

0 0 10 1 01 0 0

E2,3 =

1 0 00 0 10 1 0

E1,2 =

0 1 01 0 00 0 1

2. Matrice di tipo II che moltiplicando a sinistra una matrice A effettua

la moltiplicazione di una riga di A per uno scalare r:

Er1 =

r 0 00 1 00 0 1

Er2 =

1 0 00 r 00 0 1

Er3 =

1 0 00 1 00 0 r

3. Matrice di tipo III che, moltiplicando a sinistra una matrice A, somma

un multiplo di una data riga di A ad un’altra riga data:

E2+r1 =

1 0 0r 1 00 0 1

E3+r1 =

1 0 00 1 0r 0 1

E3+r2 =

1 0 00 1 00 r 1

E1+r2 =

1 r 00 1 00 0 1

E1+r3 =

1 0 r0 1 00 0 1

E2+r3 =

1 0 00 1 r0 0 1

Ritorniamo al sistema lineare prima della definizione. Le operazioni cheapplichiamo ai coefficienti del sistema lineare, le applichiamo anche ai termininoti. Quindi aggiungiamo una colonna con i termini noti alla matrice A delsistema lineare.

A =

3 2 1 51 4 3 31 1 1 0

64 CHAPTER 6. MATRICI E SISTEMI LINEARI

Per scambiare la prima riga con l’ultima, moltiplichiamo la matrice E1,3, discambio tra la riga 1 e la riga 3, per la matrice A.

E1,3 =

0 0 10 1 01 0 0

Si noti che il vettore [0, 0, 1], riga 1 di E1,3, fara diventare la terza riga primariga, il vettore [0, 1, 0], riga 2 di E1,3, manterra intatta la seconda riga, mentreil vettore [1, 0, 0], riga 3 di E1,3, trasferira la riga 1 al posto della vecchia riga3.

E1,3A =

0 0 10 1 01 0 0

3 2 1 51 4 3 31 1 1 0

=

1 1 1 01 4 3 33 2 1 5

Ora vogliamo sottrarre la prima equazione dalla seconda. Consideriamo lamatrice E2+(−1)1:

E2+(−1)1 =

1 0 0−1 1 0

0 0 1

Allora abbiamo

E2+(−1)1E1,3A =

1 0 0−1 1 0

0 0 1

1 1 1 01 4 3 33 2 1 5

=

1 1 1 00 3 2 33 2 1 5

Sottraiamo 3 volte la prima equazione dalla terza. Consideriamo la seguentematrice:

E3+(−3)1 =

1 0 00 1 0−3 0 1

Allora abbiamo

E3+(−3)1E2+(−1)1E1,3A =

1 0 00 1 0−3 0 1

1 1 1 00 3 2 33 2 1 5

=

1 1 1 00 3 2 30 −1 −2 5

Dividiamo la seconda equazione per 3 e poi sommiamo la seconda equazionealla terza. Consideriamo la matrice

E3+( 13)2 =

1 0 00 1 00 1

31

6.2. MATRICE INVERSA 65

Allora abbiamo

E3+( 13)2E3+(−3)1E2+(−1)1E1,3A =

1 0 00 1 00 1

31

1 1 1 00 3 2 30 −1 −2 5

=

1 1 1 00 3 2 30 0 −4/3 6

Il fatto che il prodotto tra matrici e associativo ci permette anche di molti-plicare prima tutte le matrici E3+( 1

3)2E3+(−3)1E2+(−1)1E1,3 e poi applicare il

risultato ad A per ottenere il risultato finale.

6.2 Matrice inversa

Le operazioni che abbiamo applicato alla matrice A sono tutte reversibili nelsenso che ciascuna delle matrici elementari e invertibile.

Definition 6.2.1. Una matrice quadrata A di ordine n e invertibile se esisteuna matrice B dello stesso tipo tale che

AB = In = BA,

dove In e la matrice identica.

Come dimostreremo nel seguente lemma, esiste al piu una matrice inversadi A; nel caso in cui esiste l’inversa della matrice A essa si indica con A−1.

Lemma 6.2.1. Siano A e B matrici quadrate di ordine n.

1. La matrice inversa A−1 di A e unica.

2. (AB)−1 = B−1A−1.

3. Se A e invertibile, il sistema lineare Ax = b di n equazioni in n incog-nite ha un’unica soluzione data da x = A−1b.

Proof. (1) Supponiamo che C sia un’altra inversa, cioe AC = CA = In.Allora abbiamo:

C = CIn = C(AA−1) = (CA)A−1 = InA−1 = A−1.

(2) (AB)(B−1A−1) = A(BB−1)A−1 = AInA−1 = AA−1 = In.

(3) Sia x = A−1b. Allora si ha: A(A−1b) = (AA−1)b = Inb = b.

66 CHAPTER 6. MATRICI E SISTEMI LINEARI

Lemma 6.2.2. Le matrici elementari sono invertibili.

Example 19. La matrice E1,3 (che scambia la riga 1 e la riga 3) e invertibilecon inversa la matrice stessa:

E1,3E1,3 =

0 0 10 1 01 0 0

0 0 10 1 01 0 0

=

1 0 00 1 00 0 1

= I3

E infatti chiaro che scambiare due volte di seguito la riga uno e la riga treriporta alla situazione iniziale.

Example 20. La matrice E3+r2 e invertibile con inversa E3+(−r)2:1 0 00 1 00 r 1

1 0 00 1 00 −r 1

=

1 0 00 1 00 0 1

6.3 Matrici a gradini

Definition 6.3.1. Una matrice a gradini e una matrice che verifica le seguenticondizioni:

1. Tutte i vettori riga nulli sono nella parte bassa della matrice;

2. Il primo elemento in una riga non nulla e un 1;

3. Date due righe successive i e i + 1 non nulle, il primo elemento nonnullo della riga i + 1 si trova a destra del primo elemento non nullodella riga i.

Una matrice ridotta (per riga) e una matrice a gradini che verifica anche laseguente condizione:

4. Se una colonna contiene il primo elemento non nullo di una riga, alloratutte gli altri elementi della colonna sono nulli.

6.3. MATRICI A GRADINI 67

Example 21. La prima matrice e in forma a gradini, mentre la seconda ein forma ridotta:

1 3 0 2 5 40 1 0 5 6 70 0 0 1 7 70 0 0 0 1 00 0 0 0 0 0

1 0 0 0 0 40 1 0 0 0 70 0 0 1 0 70 0 0 0 1 00 0 0 0 0 0

Definition 6.3.2. Due matrici A e B di dimensione m× n sono equivalentiper riga, e scriviamo A ≡r B, se la matrice B puo essere ottenuta dallamatrice A applicando operazioni elementari (di tipo I, II, III).

Si noti che la relazione ≡r e una relazione di equivalenza perche le matricielementari sono invertibili e quindi anche il prodotto di matrici elementari einvertibile: se B = EA per una matrice elementare E, allora A = E−1B.

Proposition 6.3.1. Ogni matrice non nulla e equivalente ad una matricein forma ridotta. Piu precisamente, per ogni matrice A non nulla esiste unamatrice F , che e prodotto di matrici elementari, tale che FA e una matricein forma ridotta.

Proof. Sia A la matrice di partenza.Come ottenere una matrice equivalente a gradini :Consideriamo la prima colonna (da sinistra) con almeno un elemento diversoda zero. Sia j l’indice di colonna e supponiamo che il primo elemento nonnullo dall’alto si trovi nella riga i. Scambiamo la riga i con la riga 1, ottenendola matrice B. Cosı b1j 6= 0. Dividiamo la riga 1 di B per b1j, ottenendo lamatrice C, dove c1j = 1. Successivamente, per ogni elemento csj (2 ≤ s ≤ m)diverso da zero, sommiamo −csj volte la prima riga alla riga s. Otteniamouna matrice D in cui tutti gli elementi della colonna j sono nulli tranneil primo che e 1. Consideriamo la sottomatrice di D ottenuta eliminando laprima riga di D. Applichiamo la stessa procedura alla sottomatrice. Iterandoil ragionamento alla fine arriviamo ad una matrice a gradini.Come ottenere una matrice in forma ridotta da una matrici a gradini :Sia H = (hij) una matrice a gradini. Applica la procedura seguente dall’altoverso il basso. Considera una riga non nulla, diciamo la riga i. Allora ilprimo elemento da sinistra della riga i e un 1. Supponiamo che si trovi nellacolonna j, cioe, hij = 1. Allora, per ogni riga k (1 ≤ k < i) con elemento nonnullo in posizione kj, cioe hkj 6= 0, somma −hkj volte la riga i alla riga k.

68 CHAPTER 6. MATRICI E SISTEMI LINEARI

Alla fine nella colonna j avremo tutti elementi nulli tranne un 1 in posizioneij.

Proposition 6.3.2. Siano Ax = a e Bx = b due sistemi lineari ciascunocon m equazioni in n incognite. Se le matrici complete A|a e B|b sonoequivalenti allora

(i) I due sistemi hanno le stesse soluzioni.

(ii) Le soluzioni del sistema Ax = a si ottengono trasformando la matricecompleta [A|a] in forma ridotta.

Proof. (i) Per ipotesi esiste una matrice G, che e prodotto di matrici elemen-tari, tale che G(B|b) = A|a. Moltiplicando a blocchi, segue che GB = A eGb = a. Supponiamo che il vettore colonna x sia una soluzione del sistemalineare Bx = b. Allora Ax = GBx = Gb = a. Per simmetria otteniamo latesi.

Un sistema lineare e omogeneo se il vettore dei termini noti e il vettorenullo.

Proposition 6.3.3. Un sistema omogeneo Ax = 0 di m equazioni in nincognite ammette sempre una soluzione non nulla se n > m.

Proof. Riduciamo A in forma ridotta ottenendo la matrice B. Siano r ilnumero di righe non nulle di B. Allora la matrice C di dimensione r × n,formata dalle prime r righe di B, non ha righe nulle. Siccome r ≤ m < npossiamo risolvere il sistema con le prime r incognite che dipendono dallealtre n− r. Queste ultime possono prendere valori arbitrari.

Chapter 7

Spazi vettoriali

Prima di proseguire nel capitolo invitiamo il lettore a rileggersi la definizionedi spazio vettoriale in Sezione 2.2.

Riportiamo nel seguito alcuni esempi “non-standard” di spazi vettoriali.

Example 22. (Spazio vettoriale dei polinomi reali) Un polinomio reale e unafunzione p : R→ R che e esprimibile come

p(x) = a0xn + a1x

n−1 + · · ·+ an−1x+ an

con coefficienti reali ai. Per esempio, i seguenti sono polinomi: 3x + 2,x2 + 5x+ 1, etc. I polinomi costituiscono uno spazio vettoriale reale.

Example 23. (Spazio vettoriale delle sequenze infinite di reali) L’insieme ditutte le successioni (an)n≥0 di numeri reali e uno spazio vettoriale sul camporeale.

Example 24. (Spazio vettoriale delle funzioni a valori reali) Sia X un in-sieme. Allora l’insieme di tutte le funzioni da X ad R e uno spazio vettoriale.Se f, g : X → R sono funzioni e r e uno scalare, definiamo:

(f + g)(x) = f(x) + g(x); (rf)(x) = r · f(x), for all x ∈ X.

L’Esempio 23 e un caso particolare di questo esempio: ogni successione(an)n≥0 e una funzione a : N→ R.

69

70 CHAPTER 7. SPAZI VETTORIALI

7.1 Sottospazi

Definition 7.1.1. Sia V uno spazio vettoriale sul campo K. Un sottoinsiemenon vuoto U di V e un sottospazio vettoriale di V se la somma vettoriale divettori di U e ancora in U e lo stesso accade per il prodotto di un vettore diU per un arbitrario scalare:

1. v,w ∈ U ⇒ v + w ∈ U ;

2. v ∈ U ∧ r ∈ K⇒ rv ∈ U .

Dalla seconda condizione della definizione precedente il vettore nullo 0appartiene ad ogni sottospazio vettoriale.

Ogni spazio vettoriale V ammette due sottospazi banali: il primo {0}costituito dal solo vettore nullo e il secondo da V stesso.

Lemma 7.1.1. L’intersezione di due o piu sottospazi vettoriali di V e ancoraun sottospazio vettoriale.

Proof. Siano W e U due sottospazi. Si vede facilmente che, se v,w ∈ W ∩U ,allora anche che v + w ∈ W ∩ U e rv ∈ W ∩ U per ogni scalare r.

Sia V uno spazio vettoriale e x1, . . . ,xn ∈ V vettori. Un vettore v ∈ V euna combinazione lineare dei vettori x1, . . . ,xn se esistono scalari r1, . . . , rntali che

v = r1x1 + · · ·+ rnxn.

Definition 7.1.2. Sia X ⊆ V un sottoinsieme di uno spazio vettoriale Vsul campo K. Il sottospazio Span(X) di V generato da X e definito comel’intersezione di tutti i sottospazi di V che contengono X.

Span(X) e costituito da tutte le combinazioni lineari finite di elementi diX a coefficienti nel campo K:

Span(X) = {r1v1 + · · ·+ rkvk : r1, . . . rk ∈ K e v1, . . . ,vk ∈ X}

Nella proposizione seguente proviamo questo risultato nell’ipotesi che X siafinito.

Proposition 7.1.2. Sia V uno spazio vettoriale e x1, . . . ,xn ∈ V vettori.L’insieme delle combinazioni lineari di x1, . . . ,xn e un sottospazio vettorialedi V che coincide con Span(x1, . . . ,xn).

7.1. SOTTOSPAZI 71

Proof. Se v = c1x1 + . . . cnxn e w = d1x1 + . . . dnxn, allora v + w = (c1 +d1)x1 + . . . (cn + dn)xn e mv = (mc1)x1 + · · ·+ (mcn)xn per ogni scalare m.Infine, ogni combinazione lineare di x1, . . . ,xn appartiene ad ogni sottospaziovettoriale che contiene i vettori x1, . . . ,xn.

Proposition 7.1.3. 1. I sottospazi vettoriali non banali del piano sono lerette passanti per l’origine.

2. I sottospazi vettoriali non banali dello spazio sono i piani e le rettepassanti per l’origine.

Le rette (i piani) che non passano per l’origine NON sono sottospazivettoriali, perche il vettore nullo non appartiene alla retta (al piano).

Ricordiamo che un sistema lineare e omogeneo se il vettore dei termininoti e il vettore nullo.

Proposition 7.1.4. L’insieme delle soluzioni di un sistema lineare omogeneodi m equazioni in n incognite e un sottospazio vettoriale dello spazio Rn.

Proof. Sia A una matrice di tipo m× n, x,y vettori colonna di lunghezza ntali che Ax = 0 e Ay = 0. Allora A(x + y) = Ax + Ay = 0 + 0 = 0 edinoltre A(rx) = r(Ax) = r0 = 0.

Proposition 7.1.5. Sia Ax = b un sistema lineare con A matrice di tipom×n. Il sistema ammette soluzione se il vettore b appartiene al sottospazioSpan(A1, . . . , An) generato dai vettori colonna di A. In tal caso b = c1A

1 +· · · + cnA

n per opportuni scalari c1, . . . , cn e la soluzione del sistema e x =[c1 . . . cn]t.

Concludiamo la sezione con esempi che chiarificano le proposizioni prece-denti.

Example 25. La retta di equazione 2x+ 3y = 0 e un sottospazio vettorialedi R2 (si consulti Proposizione 7.1.3):

• Se [x1, x2] e [y1, y2] appartengono alla retta (i.e., 2x1 + 3x2 = 0 e 2y1 +3y2 = 0), allora anche [x1 + y1, x2 + y2] appartiene alla retta (2(x1 +y1) + 3(x2 + y2) = 0).

• Se [x1, x2] appartiene alla retta (i.e., 2x1 + 3x2 = 0), allora ancher[x1, x2] = [rx1, rx2] appartiene alla retta (i.e., r(2x1 + 3x2) = 0).

72 CHAPTER 7. SPAZI VETTORIALI

Example 26. Il piano di equazione 2x + 3y + 4z = 0 e un sottospaziovettoriale di R3 (si consulti Proposizione 7.1.3). Le rette passanti per l’originesono anch’esse sottospazi vettoriali di R3 in quanto intersezione di due pianipassanti per l’origine (Si consulti Lemma 7.1.1).

Example 27. Si consideri lo spazio vettoriali delle matrici quadrate di ordinen. I seguenti sono sottospazi vettoriali:

• L’insieme delle matrici triangolari superiori;

• L’insieme delle matrici diagonali;

• L’insieme delle matrici simmetriche.

Example 28. Si consideri la matrice

A =

2 1 14 −6 0−4 −2 −2

L’insieme delle combinazioni lineari dei vettori colonna della matrice

c1

24−4

+ c2

1−6−2

+ c3

10−2

costituisce un sottospazio vettoriale W di R3 (si consulti Proposizione 7.1.2).

Se il vettore

abc

appartiene al sottospazio W allora il sistema lineare

2 1 14 −6 0−4 −2 −2

xyz

=

abc

ammette soluzione.

Example 29. L’insieme dei polinomi di grado minore o uguale ad n e unsottospazio vettoriale dello spazio dei polinomi.

7.2. VETTORI LINEARMENTE INDIPENDENTI 73

Example 30. Siano x1 =

012

e x2 =

543

due vettori nello spazio tridi-

mensionale. Allora le combinazioni lineari di x1 e x2

c1

012

+ c2

543

descrivono l’insieme dei punti del piano di equazione x − 2y + z = 0, che eun sottospazio vettoriale di R3. Infatti, le equazioni x = 5c2, y = c1 + 4c2 ez = 2c1 + 3c2 costituiscono le equazioni parametriche di un piano passanteper l’origine. Da c2 = x

5si ricava 5y = 5c1 + 4x e 5z = 10c1 + 3x. Infine,

sostituendo 5c1 = 5y−4x nell’equazione 5z = 10c1+3x si ottiene l’equazionelineare del piano x− 2y + z = 0.

Example 31. Siano p(x) = x + 3 e q(x) = x2 + 2 due polinomi. Allora lecombinazioni lineari rp(x) + sq(x) con r, s ∈ R costituiscono il sottospaziodei polinomi del tipo

sx2 + rx+ (2s+ 3r)

al variare di r, s tra i reali.

Example 32. Siano A =

[2 00 0

], B =

[0 10 0

]e C =

[0 00 4

]tre matrici.

L’insieme delle combinazioni lineari di A, B e C determina il sottospaziodelle matrici che hanno la seguente forma (c1, c2, c3 arbitrari numeri reali):[

c1 c20 c3

]

7.2 Vettori linearmente indipendenti

Definition 7.2.1. I vettori x1, . . . ,xn di uno spazio vettoriale V si diconolinearmente dipendenti se il vettore nullo 0 e una combinazione lineare dix1, . . . ,xn con coefficienti scalari non tutti nulli; altrimenti si dicono linear-mente indipendenti.

Example 33. Riconsideriamo i tre vettori colonna dell’Esempio 28. Essisono linearmente dipendenti perche

−3

24−4

− 2

1−6−2

+ 8

10−2

= 0.

74 CHAPTER 7. SPAZI VETTORIALI

Quindi il sistema omogeneo 2 1 14 −6 0−4 −2 −2

−3−2

8

=

000

ammette soluzioni diverse dal vettore nullo 0. Infatti si vede facilmente chela terza riga della matrice e un multiplo della prima, cosı il sistema lineareammette una retta di soluzioni che sono l’intersezione del piano 2x+y+z = 0(che e lo stesso piano di equazione −4x−2y−2z = 0) e del piano 4x−6y = 0.Si noti che se i vettori colonna sono lineramente dipendenti, anche i vettoririga [2, 1, 1], [4,−6, 0] e [−4,−2,−2] lo sono:

2[2, 1, 1] + 0[4,−6, 0] + [−4,−2,−2] = 0.

Quest’ultima uguaglianza la possiamo scrivere anche cosı:

[2 0 1

] 2 1 14 −6 0−4 −2 −2

=[0 0 0

]Oppure prendendo le matrici trasposte:2 4 −4

1 −6 −21 0 −2

201

=

000

Proposition 7.2.1. Se A = (aij) e una matrice di tipo m× n a coefficienti

reali e x =

x1. . .xn

un vettore colonna non nullo, allora le seguenti condizioni

sono equivalenti:

1. Ax = 0;

2. x e un vettore perpendicolare agli m vettori riga della matrice:

Prodotto interno: Ai · x =n∑j=1

aijxj = 0, per ogni 1 ≤ i ≤ m.

7.3. BASI 75

3. Gli n vettori colonna di A sono linearmente dipendenti:

x1A1 + · · ·+ xnA

n = x1

a11. . .am1

+ x2

a12. . .am2

+ · · ·+ xn

a1n. . .amn

= 0.

Corollary 7.2.2. Sia A una matrice di tipo m × n. Le colonne di A sonolinearmente indipendenti se e solo se il sistema Ax = 0 ammette il vettorenullo come unica soluzione.

Corollary 7.2.3. Sia A una matrice di tipo m × n con n > m. Allora lecolonne di A sono linearmente dipendenti.

Proof. Segue dalla Proposizione 7.2.1 e dalla Proposizione 6.3.3.

Example 34. Consideriamo la matrice

A =

3 4 24 −6 01 2 −2

I tre vettori colonna

341

,

4−6

2

e

20−2

sono linearmente indipendenti.

Per dimostrarlo e sufficiente verificare che il vettore nullo e l’unica soluzionedel sistema lineare omogeneo Ax = 0.

7.3 Basi

Definition 7.3.1. Una base di uno spazio vettoriale V e un insieme di vettorilinearmente indipendenti che generano tutto lo spazio.

Nel seguito consideriamo soltanto spazi vettoriali con basi costituite daun numero finito di elementi.

Sia x1, . . . ,xn una base di V . Allora ogni vettore v ∈ V si scrive inmaniera unica come combinazione lineare della base. Infatti se v = a1x1 +. . . anxn = b1x1 + . . . bnxn allora 0 = (a1 − b1)x1 + . . . (an − bn)xn. Siccomex1, . . . ,xn sono linearmente indipendenti, si ricava ai − bi = 0 per ogni i, dacui ai = bi.

Se v = a1x1 + . . . anxn allora [a1, . . . , an] e il vettore delle coordinate di vrispetto alla base data.

76 CHAPTER 7. SPAZI VETTORIALI

Example 35. I vettori e1 = [1, 0, 0], e2 = [0, 1, 0] e e3 = [0, 0, 1] sono la basecanonica di R3. Tre vettori qualsiasi linearmente indipendenti costituisconosempre una base di R3.

Example 36. Lo spazio dei polinomi reali non ammette una base finita, masoltanto una base infinita

1, x, x2, . . . , xn, . . .

Il sottospazio dei polinomi di grado ≤ 5 ammette una base finita:

1, x, x2, x3, x4, x5.

Lo stesso risultato vale per il sottospazio dei polinomi di grado ≤ n.

Example 37. Sia C lo spazio vettoriale dei numeri complessi sul camporeale. Allora, i vettori 1 e i =

√−1 costituiscono una base.

Example 38. Sia C lo spazio vettoriale dei numeri complessi sul campocomplesso. Allora, il vettore 1 e una base.

Proposition 7.3.1. Sia V uno spazio vettoriale di base v1, . . . ,vm. Alloraogni insieme di elementi w1, . . . ,wn con n > m e linearmente dipendente.In particolare, due basi qualsiasi di uno spazio vettoriale hanno lo stessonumero di vettori. Questo numero si dice dimensione dello spazio vettorialee si indica con dim V .

Proof. Rappresentiamo wi come combinazione lineare della base v1, . . . ,vm:

wi =m∑j=1

ajivj = a1iv1 + a2iv2 + . . . amivm. (7.1)

I coefficienti aji costituiscono una matrice A di dimensione m×n, per cuisi ha:

[w1, . . . ,wn] = [v1, . . . ,vm]

a11 . . . a1m . . . a1n. . . . . . . . . . . . . . .am1 . . . amm . . . amn

Si noti che (i) ogni colonna della matrice A ha qualche coefficiente diversoda zero; (ii) i coefficienti della matrice sono scalari, mentre le sequenze[v1, . . . ,vm] e [w1, . . . ,wn] hanno elementi in V .

7.3. BASI 77

Risolviamo il sistema lineare omogeneo: a11 . . . a1m . . . a1n. . . . . . . . . . . . . . .am1 . . . amm . . . amn

x1. . .xn

=

0. . .

0

.

La soluzione non banale

b1. . .bn

esiste perche n > m (Proposizione 6.3.3).

Allora abbiamo:

[w1, . . . ,wn]

b1. . .bn

= [v1, . . . ,vm]

a11 . . . a1m . . . a1n. . . . . . . . . . . . . . .am1 . . . amm . . . amn

b1. . .bn

= [v1, . . . ,vm]

0. . .

0

=

0. . .

0

E quindi i vettori w1, . . . ,wn sono linearmente dipendenti.

Proposition 7.3.2. Ogni insieme di vettori linearmente indipendenti puoessere esteso ad una base. Qualsiasi insieme di generatori dello spazio puoessere ridotto ad una base.

Example 39. • R3 ha dimensione 3. La base canonica di R3 e costituita

dai vettori

100

,

010

e

001

. Ogni altra base e costituita da tre vettori

linearmente indipendenti. Per esempio, i tre vettori

111

,

110

e

203

sono linearmente indipendenti e quindi costituiscono una base, percheil sottospazio vettoriale delle soluzioni del sistema lineare omogeneo1 1 2

1 1 01 0 3

xyz

=

000

78 CHAPTER 7. SPAZI VETTORIALI

e costituito solo dal vettore nullo. Le coordinate di un punto dellospazio dipendono dalla base scelta. Per esempio, se il punto P ha

coordinate P =

111

rispetto alla base canonica, allora le coordinate

dello stesso punto rispetto alla base non canonica definita prima sono:

P =

100

Quindi il concetto di coordinata e dipendente dalla base.

• Lo spazio vettoriale reale C dei numeri complessi ha dimensione 2. Labase canonica sono i vettori 1 e i. Altre basi sono, per esempio, 5 e 3i;oppure 2 + 3i e 1 + i.

• Lo spazio vettoriale dei numeri complessi sul campo C ha dimensione1. La base canonica e data dal vettore 1.

• Lo spazio delle matrici m × n ha dimension mn. La base canonica ecostituita dalle matrici A m×n per cui esistono indici ij tali che aij = 1mentre tutte le altre componenti ahk = 0 per h 6= i e k 6= j.

• Lo spazio delle matrici 3× 3 triangolari superiori ha dimensione 6.

• Lo spazio dei polinomi di grado ≤ 3 ha dimensione 4 ed ha come basecanonica i polinomi 1, x, x2, x3.

Chapter 8

Trasformazioni lineari e matrici

8.1 Trasformazioni lineari

Definition 8.1.1. Siano V e W spazi vettoriali sullo stesso campo. Unafunzione f : V → W e una trasformazione lineare se verifica la seguenteproprieta, per ogni x,y ∈ V e scalari r, s:

f(rx + sy) = rf(x) + sf(y).

Si noti che ponendo r = s = 0 si ricava f(0) = 0.

Example 40. Consideriamo il vettore x = [3, 2,−2]. La funzione f : R3 → Rdefinita da

f(y) = 3y1 + 2y2 − 2y3

e una trasformazione lineare:

•f(y + z) = 3(y1 + z1) + 2(y2 + z2)− 2(y3 + z3)

= (3y1 + 2y2 − 2y3) + (3z1 + 2z2 − 2z3)= f(y) + f(z).

•f(ry) = 3(ry1) + 2(ry2)− 2(ry3)

= r(3y1 + 2y2 − 2y3)= rf(y).

79

80 CHAPTER 8. TRASFORMAZIONI LINEARI E MATRICI

In generale, se fissiamo un vettore x = [x1, x2, x3] ∈ R3, allora la funzionef : R3 → R, definita tramite il prodotto interno:

f(y) = x · yt = x1y1 + x2y2 + x3y3, per ogni y = [y1, y2, y3] ∈ R3, (8.1)

e una trasformazione lineare. Richiamiamo dalla Sezione 2.3 le proprieta delprodotto interno che dimostrano la linearita della funzione descritta in (8.1):x · (y + z) = (x · y) + (x · z) e x · (ry) = r(x · y).

Example 41. Sia Pol lo spazio vettoriale dei polinomi in una variabile x.La funzione f : Pol→ R2 definita da:

f(a0xn + a1x

n−1 + · · ·+ an−1x+ an) = [an−1, an],

e un’applicazione lineare. La funzione g : Pol→ R definita da

g(a0xn + a1x

n−1 + · · ·+ an−1x+ an) = a0

non e una applicazione lineare. Infatti, g(2x2 + 3x+ 1) = 2, mentre g(2x2) +g(3x+ 1) = 2 + 3 = 5.

Sia f : V → W una trasformazione lineare. L’immagine di f e definitacome

Im(f) = {w ∈ W : ∃v ∈ V f(v) = w},

mentre il nucleo di f e

ker(f) = {v ∈ V : f(v) = 0}.

Example 42. Una trasformazione lineare iniettiva dello spazio trasformarette in rette, e piani in piani. Una trasformazione lineare iniettiva del pianotrasforma rette in rette. Per esempio, la trasformazione lineare iniettiva fdel piano, definita da f [x, y] = [2x + 3y, 2x], trasforma la retta 2x + y = 5(di equazione parametrica x = 2 + t; y = 1 − 2t) nella retta di equazioneparametrica x′ = 2(2 + t) + 3(1− 2t), y′ = 2(2 + t).

Theorem 8.1.1. Il nucleo di una trasformazione lineare f : V → W e unsottospazio di V , mentre l’immagine di f e un sottospazio di W . Si ha laseguente relazione:

dim V = dim ker(f) + dim Im(f).

8.1. TRASFORMAZIONI LINEARI 81

Proof. Dimostriamo che il nucleo e un sottospazio. Siano v, t ∈ V vettori e runo scalare. Se f(v) = 0 e f(t) = 0 allora f(v+t) = f(v)+f(t) = 0+0 = 0e f(rv) = rf(v) = r0 = 0.

Dimostriamo che Im(f) e un sottospazio. Siano w1,w2 ∈ Im(f). Alloraesistono v1,v2 ∈ V tali che wi = f(vi) (i = 1, 2). Allora w1+w2 = f(v1+v2)e rw1 = f(rv1).Proviamo ora la relazione tra dimensione del nucleo e dimensione dell’immagine.Sia v1, . . . ,vk ∈ V una base del nucleo e sia w1, . . . ,wr ∈ W una basedell’immagine di f . Consideriamo r elementi vk+1, . . . ,vk+r ∈ V tali chef(vk+i) = wi.

Dimostriamo che i vettori v1, . . . ,vk,vk+1, . . . ,vk+r sono linearmente in-dipendenti. Infatti se

c1v1 + . . . ckvk + ck+1vk+1 + · · ·+ ck+rvk+r = 0,

allora

0 = f(c1v1 + · · ·+ ckvk + ck+1vk+1 + · · ·+ ck+rvk+r)= c1f(v1) + · · ·+ ckf(vk) + ck+1f(vk+1) + · · ·+ ck+rf(vk+r)= c10 + · · ·+ ck0 + ck+1w1 + · · ·+ ck+rwr

= ck+1w1 + · · ·+ ck+rwr

E quindi i vettori w1, . . . ,wr ∈ W oppure i vettori v1, . . . ,vk ∈ V sarebberolinearmente dipendenti. Assurdo.

Verifichiamo che i vettori v1, . . . ,vk,vk+1, . . . ,vk+r generano lo spazioV . Sia x ∈ V . Se f(x) = 0 allora x e combinazione lineare di v1, . . . ,vk,altrimenti f(x) = d1w1+· · ·+drwr. E quindi f(x−(d1vk+1+· · ·+drvk+r)) =0. Scriviamo quindi x− (d1vk+1 + . . . drvk+r) come combinazione lineare div1, . . . ,vk ed otteniamo il risultato.

Lemma 8.1.2. Sia f : V → W una trasformazione lineare.

1. f e iniettiva sse ker(f) = {0}.

2. Se f e iniettiva, allora

• dim V = dim Im(f).

• Se v1, . . . ,vn sono linearmente indipendenti, allora f(v1), . . . , f(vn)sono linearmente indipendenti.

Proof. (1) Abbiamo f(x) = f(y) sse f(x− y) = 0.

82 CHAPTER 8. TRASFORMAZIONI LINEARI E MATRICI

Lemma 8.1.3. Sia V uno spazio vettoriale di base v1, . . . ,vn. Ogni trasfor-mazione lineare f : V → W e univocamente determinata dai valori f(v1), . . . , f(vn)assunti dai vettori della base. Se v ∈ V ha coordinate c1, . . . , cn rispetto alladata base allora

f(v) = c1f(v1) + · · ·+ cnf(vn). (8.2)

Viceversa, ogni funzione g : {v1, . . . ,vn} → W puo univocamente essereestesa tramite (8.2) ad una trasformazione lineare da V a W .

Example 43. Si consideri la trasformazione lineare f : R3 → R dell’Esempio40 definita da f(x) = 3x1 + 2x2 − 2x3. La dimensione del nucleo di fe 2 perche il nucleo e il piano ortogonale al vettore [3, 2,−2] di equazione3x1 + 2x2 − 2x3 = 0, per cui dal Teorema 8.1.1 la dimensione dell’immaginedeve essere 1.

Example 44. Consideriamo lo spazio vettoriale infinito dimensionale Pol deipolinomi reali e fissiamo un numero reale, per esempio 3. Allora la funzionef : Pol→ R, definita come segue (per ogni polinomio p(x) = a0x

n+a1xn−1 +

· · ·+ an−1x+ an):

f(a0xn + a1x

n−1 + · · ·+ an−1x+ an) = a03n + a13

n−1 + · · ·+ an−131 + an,

e una trasformazione lineare. Per esempio, se p(x) = x2 + 5x− 1 allora

f(x2 + 5x− 1) = 32 + 5× 3− 1 = 23.

Il nucleo di f e il sottospazio vettoriale determinato dall’insieme dei polinomip(x) che ammettono 3 come radice: p(3) = 0. L’immagine di f e tutto R.

Example 45. Sia V uno spazio di dimensione 2 con base v1, v2 e W unospazio di dimensione 3 con base w1, w2, w3. Dal Lemma 8.1.3 la funzionef : V → W definita da

f(v1) = 3w1 + 5w2 − 2w3; f(v2) = w1 + w3

e estendibile ad una trasformazione lineare.

Lemma 8.1.4. Le seguenti funzioni sono trasformazioni lineari:

1. La funzione identica I : V → V , definita da

I(v) = v, per ogni vettore v ∈ V .

2. La composizione g◦f : V → U di due trasformazioni lineari f : V → We g : W → U , definita da

(g ◦ f)(v) = g(f(v)), per ogni vettore v ∈ V .

8.2. LA MATRICE DI UNA TRASFORMAZIONE LINEARE 83

8.2 La matrice di una trasformazione lineare

Sia f : V → W una trasformazione lineare. Fissiamo una base v1, . . . ,vn diV ed una base w1, . . . ,wm di W . Allora, l’immagine f(vj) di ogni vettoredella base di V deve essere combinazione lineare dei vettori della base di W :

f(vj) = a1jw1 + · · ·+ amjwm, per ogni 1 ≤ j ≤ n.

Consideriamo la matrice A di dimensione m×n la cui colonna j e determinata

dai coefficienti

a1ja2j. . .amj

dalle coordinate di f(vj).

Per ogni vettore v = c1v1 + · · ·+ cnvn ∈ V , si ha

f(v) = f(c1v1 + · · ·+ cnvn)= c1f(v1) + · · ·+ cnf(vn)= c1(a11w1 + · · ·+ am1wm) + · · ·+ cn(a1nw1 + · · ·+ amnwm)= (c1a11 + c2a12 + · · ·+ cna1n)w1 + · · ·+ (c1am1 + c2am2 + · · ·+ cnamn)wm

Sia c = [c1 . . . cn]t il vettore colonna delle coordinate di v. Le coordinate dif(v) si calcolano utilizzando il prodotto matriciale:

Ac =

A1 · cA2 · c. . .

Am · c

Proposition 8.2.1. Siano V,W,U spazi vettoriali sullo stesso campo discalari e siano f : V → W , g : W → U trasformazioni lineari. Siano Ala matrice di f e B la matrice di g rispetto a basi scelte in ciascuno dei trespazi.

• La matrice BA (prodotto di matrici) e la matrice di g ◦ f : V → U .

Example 46. Sia f : R2 → R3 la trasformazione lineare definita da

f(v1) = 4w1 + w2 + w3; f(v2) = w1 + 3w2,

84 CHAPTER 8. TRASFORMAZIONI LINEARI E MATRICI

con v1,v2 base di R2 e w1,w2,w3 base di R3. Allora la matrice della trasfor-mazione lineare e: 4 1

1 31 0

Se v = 5v1 + 3v2 e un vettore di R2, allora4 1

1 31 0

[53

]=

23145

Quindi f(v) = 23w1 + 14w2 + 5w3.

Ogni trasformazione lineare f : V → W assume una forma matricialeveramente semplice se si scelgono le basi di V e W opportunamente.

Denotiamo con In la matrice identica di ordine n e con 0m,n la matricenulla di tipo m× n.

Proposition 8.2.2. Sia f : V → W una trasformazione lineare dallo spaziovettoriale V di dimensione n allo spazio vettoriale W di dimensione m. Sup-poniamo che r = dim Im(f) e k = dim ker(f) con n = k+ r. Allora esistonobasi di V e W tali che la matrice A (di dimensione m × n) di f rispetto aqueste basi assume la forma

A =

[Ir 0r,k

0m−r,r 0m−r,k

]Proof. Sia v1, . . . , vk una base del nucleo di f . Completiamo v1, . . . , vk ad unabase di V : u1, . . . , ur, v1, . . . , vk con r+ k = n. Le immagini f(u1), . . . , f(ur)tramite f dei vettori u1, . . . , ur sono non nulle e costituiscono una base diIm(f). Completiamo f(u1), . . . , f(ur) ad una base di W :

f(u1), . . . , f(ur), w1, . . . , wm−r.

La matrice A di f rispetto a queste due basi verifica le condizioni dellaproposizione.

Remark 1. Supponiamo che gli spazi di partenza e di arrivo della trasfor-mazione lineare f della Proposizione 8.2.2 coincidono: f : V → V . Allorala matrice A di f assume la forma della proposizione soltanto per opportunebasi distinte di V . La forma descritta non sara in generale assunta se la basedi partenza coincide con la base di arrivo.

8.3. LA TRASFORMAZIONE LINEARE DI UNA MATRICE 85

8.3 La trasformazione lineare di una matrice

Sia V uno spazio di base v1, . . . ,vn e W uno spazio di base w1, . . . ,wm sullostesso campo numerico e sia A = (aij) una matrice di tipo m×n ad elementiscalari.

La matrice A determina

1. Il sottospazio di V generato dai vettori di V le cui coordinate sono lerighe della matrice. Tale sottospazio e denotato con Span(A1, . . . , Am).

2. Il sottospazio di W generato dai vettori di W le cui coordinate sono lecolonne della matrice. Tale sottospazio e denotato con Span(A1, . . . , An).

3. Una trasformazione lineare fA : V → W definita come segue. Per ognivettore v = c1v1 + · · ·+cnvn ∈ V , consideriamo le sue coordinate come

vettore colonna c =

c1c2. . .cn

. Definiamo le coordinate di fA(v) rispetto

alla base w1, . . . ,wm con il prodotto matriciale:

Ac = A

c1c2. . .cn

=

A1 · cA2 · c. . .

Am · c

= c1A1 + · · ·+ cnA

n =

∑n

i=1 cia1i∑ni=1 cia2i. . .∑n

i=1 ciami

Cosı si ha fA(v) = (

∑ni=1 cia1i)w1 + · · ·+ (

∑ni=1 ciami)wm. fA e lineare

per le proprieta del prodotto matriciale: A(x+y) = Ax+Ay; A(cx) =c(Ax). Dal Teorema 8.1.1 si ha:

n = dim ker(fA) + dim Im(fa) = dim ker(fa) + dim Span(A1, . . . , An)

dove Span(A1, . . . , An) = Im(fA) e il sottospazio di W generato daivettori colonna della matrice A.

Il sottospazio generato dai vettori riga Span(A1, . . . , Am) e lo spazioortogonale al sottospazio ker(fA), cioe Span(A1, . . . , Am) = ker(fA)⊥.

Abbiamo Ac =

A1 · cA2 · c. . .

Am · c

= 0 sse c e ortogonale ad ogni vettore nello

86 CHAPTER 8. TRASFORMAZIONI LINEARI E MATRICI

spazio Span(A1, . . . , Am):

(d1A1+· · ·+dmAm)·c = d1(A1·c)+· · ·+dm(Am·c) = d10+· · ·+dm0 = 0.

Quindi, dalla Proposizione 11.2.1 si ricava:

n = numero delle colonne= dim ker(fA) + dim(spazio delle righe)= dim ker(fA) + dim(spazio delle colonne).

E quindi lo spazio delle colonne e quello delle righe hanno la stessadimensione.

4. Una trasformazione lineare Af : W → V definita come segue. Perogni vettore w ∈ W , consideriamo le sue coordinate come vettore rigad = [d1, d2, . . . , dm]. Definiamo le coordinate di Af(w) rispetto allabase v1, . . . ,vn con il prodotto matriciale:

dA = [d1, d2, . . . , dm]A = [dA1,dA2, . . . ,dAn] = d1A1 + · · ·+ dmAm =

[m∑i=1

diai1,m∑i=1

diai2, . . . ,m∑i=1

ciain]

Si vede facilmente che Af e lineare per le proprieta del prodotto matri-ciale. Valgono proprieta analoghe al punto (3):

m = numero delle righe= dim ker(Af) + dim(spazio delle colonne)= dim ker(Af) + dim(spazio delle righe).

Example 47. Consideriamo la matrice 3× 4:

A =

3 4 2 14 −6 0 01 2 −2 2

La matrice A determina:

8.3. LA TRASFORMAZIONE LINEARE DI UNA MATRICE 87

(i) Una trasformazione lineare fA : R4 → R3 rispetto alle basi canonichedi R4 e R3, che e definita tramite il prodotto matriciale a destra. Per

esempio, fA

1035

si calcola con il prodotto matriciale:

3 4 2 14 −6 0 01 2 −2 2

1035

=

14−12

5

Attenzione: Se consideriamo una base diversa di R4, la matrice Adefinisce un’altra trasformazione lineare!

(ii) Una trasformazione lineare Af : R3 → R4 rispetto alle basi canonichedi R4 e R3, che e definita tramite il prodotto matriciale a sinistra. Peresempio, Af [0, 1, 2] si calcola con il prodotto matriciale:

[0, 1, 2]

3 4 2 14 −6 0 01 2 −2 2

= [6,−2,−4, 4]

(iii) Il sottospazio di R3 generato dai vettori colonna A1 =

341

, A2 = 4−6

2

, A3 =

20−2

e A4 =

102

le cui coordinate sono le colonne

della matrice. Tale sottospazio e denotato con Span(A1, A2, A3, A4).

Il sottospazio Span(A1, A2, A3, A4) di R3 coincide con il sottospazioIm(fA) perche

Im(fA) = {Ac : c ∈ R4} = {c1A1+c2A2+c3A

3+c4A4 : c ∈ R4} = Span(A1, A2, A3, A4).

(iv) Il sottospazio di R4 generato dai vettori riga A1 = [3, 4, 2, 1], A2 =[4,−6, 0, 0] e A3 = [1, 2,−2, 2] le cui coordinate sono le righe dellamatrice. Tale sottospazio e denotato con Span(A1, A2, A3).

88 CHAPTER 8. TRASFORMAZIONI LINEARI E MATRICI

Il sottospazio Span(A1, A2, A3) di R4 e il sottospazio ortogonale allospazio ker(fA) perche

ker(fA) = {c : Ac = 0} = {c : Ai·c = 0 per ogni 1 ≤ i ≤ 3} = Span(A1, A2, A3)⊥.

Dal Teorema 8.1.1 e dalla Proposizione 11.2.1 si ha

4 = dim ker(fA) + dim Im(fA)= dim ker(fA) + dim spazio colonne= dim ker(fA) + dim spazio righe

Quindi la dimensione dello spazio delle colonne coincide con la dimensionedello spazio delle righe.

8.4 Isomorfismi e cambi di base

Una trasformazione lineare e un isomorfismo se e bigettiva. Due spazi vet-toriali sono isomorfi se esiste un isomorfismo tra di loro.

La funzione inversa f−1 : W → V di un isomorfismo f : V → W eanch’essa un isomorfismo lineare.

Proposition 8.4.1. Due spazi vettoriali sullo stesso campo sono isomorfisse hanno la stessa dimensione.

Proof. Supponiamo che V eW abbiano la stessa dimensione. Siano v1, . . . ,vnuna base di V e w1, . . . ,wn una base di W . Se v ∈ V , allora possiamo rapp-resentare v in maniera unica tramite le sue coordinate: v = c1v1 + · · ·+ cnvnper opportuni scalari c1, . . . , cn. Allora definiamo

f(v) = c1w1 + · · ·+ cnwn.

Proviamo che f e un isomorfismo. Siano v = c1v1 + · · · + cnvn e t =d1v1 + · · ·+ dnvn due vettori di V .

• f e iniettiva: Se f(v) = f(t), allora c1w1 + · · ·+ cnwn = d1w1 + · · ·+dnwn. Per la indipendenza lineare dei wi si ha ci = di per ogni i equindi v = t.

• f e surgettiva: Se w = s1w1 + · · · + snwn ∈ W allora f(s1v1 + · · · +snvn) = w.

8.4. ISOMORFISMI E CAMBI DI BASE 89

Proposition 8.4.2. Sia V uno spazio di dimensione n e W uno spazio didimensione m. Allora lo spazio vettoriale delle trasformazioni lineari da Va W e isomorfo allo spazio vettoriale delle matrici m× n.

Proof. Fissiamo una base v1, . . . ,vn di V ed una base w1, . . . ,wm di W . Allatrasformazione lineare

f : V → W

associamo la matrice Af = [A1, . . . , An] con m righe ed n colonne (Ai e lacolonna i della matrice Af ) tale che

f(vi) = Ai

w1

. . .wm

Viceversa, ad una matrice A con m righe ed n colonne associamo la trasfor-mazione lineare fA : V → W definita da

fA(vi) =m∑k=1

akiwk.

Proposition 8.4.3. Sia V un arbitrario spazio vettoriale di dimensione ndi base v1, . . . ,vn, ed A una matrice quadrata di ordine n. La matrice A einvertibile sse la trasformazione lineare fA : V → V , definita da fA(vi) =∑n

k=1 akivk, e un isomorfismo. In tal caso, la matrice inversa A−1 di A e lamatrice della trasformazione lineare f−1.

Proof. (⇐) Sia fA un isomorfismo e IV : V → V la funzione identica. Alloraf−1A e una trasformazione lineare tale che fA ◦ f−1A = IV = f−1A ◦ fA. Sia B lamatrice della trasformazione lineare f−1A . Allora si ha AB = I = BA con Inmatrice identica. Quindi A e invertibile e B = A−1.

(⇒) Sia A e invertibile. Il lettore e invitato a completare la prova.

8.4.1 Cambio di base

Sia V uno spazio vettoriale di dimensione n, sia v1, . . . ,vn una prima base et1, . . . , tn una seconda base. Consideriamo la trasformazione lineare identica

90 CHAPTER 8. TRASFORMAZIONI LINEARI E MATRICI

I : V → V . Rappresentiamo la trasformazione lineare identica con la matricequadrata A di ordine n del cambio di base:

vi = a1it1 + · · ·+ anitn

Se le coordinate del vettore v = c1v1 + · · ·+ cnvn sono il vettore colonna c =c1c2. . .cn

nella prima base, allora le coordinate di v saranno Ac =

∑n

i=1 a1ici∑ni=1 a2ici. . .∑n

i=1 anici

nella seconda base.

La matrice di un cambio di base e invertibile, perche il cambio di baseinverso e rappresentato dalla matrice inversa.

Definition 8.4.1. Due matrici quadrate A e B di ordine n sullo stessocampo, si dicono simili sse esiste una matrice invertibile P di ordine n taleche

B = PAP−1.

Proposition 8.4.4. Se una trasformazione lineare f : V → V e rappresen-tata dalla matrice A rispetto alla base v1, . . . ,vn e dalla matrice B rispettoalla base w1, . . . ,wn, allora A e B sono matrici simili.

Example 48. Consideriamo la base canonica e1 = (1, 0) e e2 = (0, 1) su R2

e la base t1 = (1, 1), t2 = (3, 2). Allora

e1 = −2t1 + t2; e2 = 3t1 − t2

Quindi la matrice sara [−2 3

1 −1

]Allora il vettore di coordinate

[44

]rispetto alla base canonica avra coordinate[

40

]rispetto alla seconda base non canonica:

[−2 3

1 −1

] [44

]=

[40

]= 4t1.

Il vettore e lo stesso, cambiano solo le coordinate.

8.4. ISOMORFISMI E CAMBI DI BASE 91

Example 49. (Matrici elementari) Le matrici elementari rappresentano odei cambiamenti di base oppure degli isomorfismi. Cominciamo con i cambi-amenti di base.

Le matrici elementari di tipo I scambiano le componenti di una base. Peresempio, la matrice

E1,3 =

0 0 10 1 01 0 0

fa passare dalla base v1,v2,v3 alla base v3,v2,v1.

Le matrici elementari di tipo II moltiplicano per uno scalare un compo-nente della base. Per esempio,

Ec1 =

c 0 00 1 00 0 1

fa passare dalla base v1,v2,v3 alla base cv1,v2,v3.

Infine le matrici elementari di tipo III, sostituiscono un componente dellabase con una sua combinazione lineare. Per esempio,

E2+c1 =

1 0 0c 1 00 0 1

fa passare dalla base v1,v2,v3 alla base v1,v2 + cv1,v3.

In tutti i casi precedenti le matrici elementari rappresentano la trasfor-mazione lineare identica.

Dalla Proposizione 8.4.3 segue che le matrici elementari in quanto invert-ibili rappresentano degli isomorfismi. Fissata la base v1,v2,v3, la matriceE1,3 di tipo I rappresenta l’isomorfismo

fE1,3(v1) = v3; fE1,3(v2) = v2; fE1,3(v3) = v1.

La matrice elementare di tipo II Ec1 rappresenta l’isomorfismo

fEc1(v1) = cv1; fEc

1(v2) = v2; fEc

1(v3) = v3.

Infine la matrice elementare E2+c1 di tipo III rappresenta l’isomorfismo

fE2+c1(v1) = v1; fE2+c1(v2) = v2 + cv1; fE2+c1(v3) = v3.

92 CHAPTER 8. TRASFORMAZIONI LINEARI E MATRICI

8.5 Sistemi lineari e trasformazioni lineari

Consideriamo un sistema lineare omogeneo di m equazioni in n incognite:Ax = 0 con A matrice di tipo m×n. Fissiamo le basi canoniche in Rn e Rm.Allora la matrice A rappresenta una trasformazione lineare fA : Rn → Rm.Abbiamo una soluzione non banale del sistema omogeneo sse ker(fA) 6= {0}.Ricordiamo dal Teorema 8.1.1 che

n = dim Rn = dim ker(fA) + dim Im(fA).

Se n > m, sicuramente il sistema ha soluzione (altrimenti, n = dim Im(fA) ≤m).

Dato il vettore colonna non nullo b ∈ Rm, il sistema lineare Ax = bammette soluzione se b ∈ Im(fA).

Spieghiamo ora il metodo di eliminazione di Gauss in termini di compo-sizione di trasformazioni lineari. Sia A una matrice m×n e sia fA : Rn → Rm

la trasformazione lineare associata alla matrice (rispetto alle basi canoniche).Se g : Rm → Rm e un arbitrario isomorfismo rappresentato dalla matricequadrata B di ordine m, allora

Ax = 0 sse x ∈ ker(fA) sse x ∈ ker(g ◦ fA) sse BAx = 0.

Se il sistema lineare ha un vettore b di termini noti non tutti nulli, si ha:

Ax = b sse b ∈ Im(fA) sse g(b) ∈ Im(g ◦ fA) sse BAx = Bb.

L’isomorfismo g che utilizziamo nel metodo di eliminazione di Gauss e com-posizione di isomorfismi determinati da matrici elementari.

Chapter 9

Determinante

Il determinante det(A) di una matrice quadrata A ha un significato geomet-rico.

9.1 Determinante di una matrice di tipo 2×2

Consideriamo due vettori colonna nel piano: P = [p1, p2]t e Q = [q1, q2]

t.Con i vettori P e Q possiamo costruire la matrice

A =

[p1 q1p2 q2

]

le cui colonne coincidono con i vettori P e Q rispettivamente. Il luogo deipunti rP + sQ (0 ≤ r, s ≤ 1) costituisce il parallelogramma delimitatodall’origine O degli assi cartesiani e dai punti P,Q, P + Q. Sappiamo chei vettori P e Q formano un angolo θ ≤ π, il cui coseno e calcolato con ilprodotto interno: cos θ = ‖P‖‖Q‖

P ·Q . L’area ‖P‖‖Q‖ sin(θ) del parallelogramma

O,P,Q, P +Q e il modulo del determinante della matrice A (si veda la figuraa pagina 94), mentre il segno del determinante dipende dall’orientazione deivettori P e Q rispetto ai vettori della base canonica del piano cartesiano.Calcoliamo ora l’area in termini delle coordinate dei vettori P e Q:

93

94 CHAPTER 9. DETERMINANTE

Figure 9.1: Area del parallelogramma determinato dai vettori a e b nel piano

‖P‖‖Q‖ sin(θ) = ‖P‖‖Q‖√

1− cos(θ)2

= ‖P‖‖Q‖√

1− (P ·Q)2

(P ·P )(Q·Q)

=√

(P · P )(Q ·Q)− (P ·Q)2

=√

(p21 + p22)(q21 + q22)− (p1q1 + p2q2)2

=√p21q

22 + p22q

21 − 2p1p2q1q2

=√

(p1q2 − p2q1)2= |p1q2 − p2q1|.

Il segno del determinante e positivo se la rotazione che porta il vettore Pin Q attraversando l’angolo θ e antioraria, mentre il segno e negativo se larotazione e oraria. In conclusione,

det(A) = p1q2 − p2q1.

Il determinante e 0 se i vettori P e Q sono allineati.

9.2 Determinante di una matrice di tipo 3×3

Analizziamo ora la situazione nello spazio. Consideriamo tre vettori colonnap = [p1, p2, p3]

t,q = [q1, q2, q3]t, r = [r1, r2, r3]

t e la matrice

B =

p1 q1 r1p2 q2 r2p3 q3 r3

9.2. DETERMINANTE DI UNA MATRICE DI TIPO 3× 3 95

Il luogo dei punti up + sq + tr (0 ≤ u, s, t ≤ 1) costituisce il parallelepipedodelimitato dall’origine O degli assi e dai vettori p,q, r (si veda la figura apagina 95). Il volume del parallelepipedo e il modulo del determinante dellamatrice B, mentre il segno del determinante dipende dall’orientazione dei trevettori rispetto alla orientazione dei tre assi cartesiani.

Figure 9.2: Area del parallelepipedo delimitato dai vettori p, q, r nello spazio

Calcoliamo l’area del parallelepipedo eseguendo il ragionamento con l’ausiliodella figura di pagina 95. I vettori p e q determinano un piano di equazioneparametrica up + sq (u, s ∈ R). Indichiamo con k il vettore unitario per-pendicolare al piano di p e q. Il verso di k e determinato dalla figura ap-plicando la regola della mano destra (si veda la figura di pagina 96). L’areadel parallelogramma determinato dai vettori p e q e ‖p‖‖q‖ sin(θ). L’areadel parallelepipedo e pari all’area di questo parallelogramma moltiplicata perl’altezza del parallelepipedo rispetto al piano determinato dai vettori p e q.

L’altezza e ‖r‖ cosα. In conclusione, l’area e ‖p‖‖q‖ sin θ‖r‖ cosα. Seindichiamo con p × q il vettore ‖p‖‖q‖ sin(θ)k allora l’area orientata (cioe,con segno) si puo ottenere con il prodotto interno:

(p× q) · r.

Calcoliamo l’area del parallelepipedo determinato da tre vettori in terminidelle coordinate dei tre vettori.

96 CHAPTER 9. DETERMINANTE

Figure 9.3: Regola della mano destra

Consideriamo prima i due vettori p e q, e sia θpq l’angolo da essi formatonel piano up + sq (u, s ∈ R). Abbiamo gia visto che l’area del parallelo-gramma determinato da p e q e ‖p‖‖q‖ sin(θpq). Quest’area e anche ugualea‖p‖‖p+q‖ sin(θp(p+q)), dove θp(p+q) e l’angolo formato dai vettori p e p+q.

Sia k il vettore unitario perpendicolare al piano up + sq (u, s ∈ R). Ilverso di k e scelto in maniera tale che i tre vettori p,q,k abbiano la stessaorientazione dei tre vettori unitari e1, e2, e3. Allora il prodotto vettoriale p×qdi p e q e definito come il vettore

p× q = ‖p‖‖q‖ sin(θpq)k

la cui lunghezza e pari all’area del parallelogramma formato dai due vettori.il prodotto vettoriale verifica le seguenti condizioni:

1. p× p = 0; (il parallelogramma ha area 0)

9.2. DETERMINANTE DI UNA MATRICE DI TIPO 3× 3 97

2. p × q = −q × p; (lo scambio dei due vettori fa passare dalla basep,q,k alla base q,p,k e quindi cambia l’orientazione rispetto alla basecanonica)

3. s(p × q) = (sp) × q = p × (sq); (allungare o accorciare un lato delparallelogramma di un fattore scalare s ha l’effetto di modificare lacorrispondente area dello stesso fattore)

4. p×(q+r) = p×q+p×r; (La distributivita p×(q+r) = p×q+p×rvale perche si ha (si consulti la figura a pagina 97 dove α = θp(q+r),β = θpq e γ = θpr): ‖q + r‖ sin(θp(q+r)) = ‖q‖ sin(θpq) + ‖r‖ sin(θpr).)

5. Il prodotto vettoriale non e associativo ma soddisfa l’identita di Jacobi:p× (q× r) + q× (r× p) + r× (p× q) = 0.

Figure 9.4: Distributivita del prodotto vettoriale

Definition 9.2.1. Il determinante della matrice A di tipo 3× 3 formata daivettori colonna A1 = p, A2 = q e A3 = r e uguale a (p× q) · r:

det

p1 q1 r1p2 q2 r2p3 q3 r3

= (p× q) · r

98 CHAPTER 9. DETERMINANTE

dove p = [p1, p2, p3]t, q = [q1, q2, q3]

t e r = [r1, r2, r3]t.

Calcoliamo le coordinate del vettore p × q utilizzando la proprieta dis-tributiva del prodotto vettoriale rispetto alla somma vettoriale:

p× q = (p1e1 + p2e2 + p3e3)× (q1e1 + q2e2 + q3e3)= p1e1 × (q2e2 + q3e3) + p2e2 × (q1e1 + q3e3) + p3e3 × (q1e1 + q2e2)= (p1q2 − p2q1)(e1 × e2) + (p1q3 − p3q1)(e1 × e3) + (p2q3 − p3q2)(e2 × e3)= (p1q2 − p2q1)e3 + (p1q3 − p3q1)(−e2) + (p2q3 − p3q2)e1

= (p1q2 − p2q1)e3 − (p1q3 − p3q1)e2 + (p2q3 − p3q2)e1

La seguente tabella spiega il prodotto vettoriale dei vettori della base canon-ica di R3: ∣∣∣∣∣∣∣∣

× e1 e2 e3

e1 0 e3 −e2

e2 −e3 0 e1

e3 e2 −e1 0

∣∣∣∣∣∣∣∣Remark 2. Il piano parametrico rp+sq (r, s ∈ R) passante per l’origine degliassi e definito dalla seguente equazione lineare:

(p2q3 − p3q2)x− (p1q3 − p3q1)y + (p1q2 − p2q1)z = 0.

Quindi il vettore di coordinate [p2q3− p3q2, p1q3− p3q1, p1q2− p2q1] e perpen-dicolare al piano generato dai vettori p e q.

Infine il determinante della matrice calcolato rispetto alla terza colonnae:

r·(p×q) = r1(p2q3−p3q2)−r2(p1q3−p3q1)+r3(p1q2−p2q1) = p·(q×r) = q·(p×r)

Il determinante e lineare in p, q ed r. Inoltre se due dei tre vettori sonouguali il determinante e nullo.

Nella sezione seguente studieremo il determinante in generale.

9.3 Il determinante di una matrice quadrata

di ordine n

Sia A una matrice quadrata di ordine n sul campo numerico K. Ad A pos-siamo associare uno scalare, il suo determinante det(A) ∈ K. Per comodita

9.3. IL DETERMINANTE DI UNA MATRICE QUADRATA DI ORDINEN99

a volte denotiamo il determinante tramite le colonne (oppure le righe) dellamatrice A: det(A1, . . . , An). Il determinante e univocamente determinatodalle seguenti tre proprieta:

(i) Il determinante come funzione di una colonna e lineare:

det(A1, . . . , B+C, . . . , An) = det(A1, . . . , B, . . . , An)+det(A1, . . . , C, . . . , An);

det(A1, . . . , cAj, . . . , An) = c · det(A1, . . . , Aj, . . . , An).

(ii) Se due colonne sono uguali, cioe Ai = Aj (i 6= j), allora det(A) = 0.

(iii) det(In) = 1, dove In e la matrice identica.

Per semplicita utilizzeremo talvolta la notazione |A| al posto di det(A).

Example 50. Il determinante di una matrice diagonale e il prodotto deglielementi della diagonale. Nel caso di dimensione 2 rappresenta l’area di unrettangolo con segno:∣∣∣∣ a 0

0 b

∣∣∣∣ =(i) a

∣∣∣∣ 1 00 b

∣∣∣∣ =(i) ab

∣∣∣∣ 1 00 1

∣∣∣∣ =(iii) ab.

Analizziamo alcune conseguenze delle tre proprieta (i)-(iii).

Proposition 9.3.1. Valgono le seguenti proprieta:

(iv) Se due colonne sono scambiate, il determinante cambia di segno.

(v) Se si somma ad una colonna un multiplo scalare di un’altra colonna ilvalore del determinante non cambia.

Proof. (iv) Per semplicita consideriamo le prime due colonne. Si ha det(A1+A2, A1 +A2, . . . ) = 0 perche due colonne sono uguali. Per linearita si ottiene:

0 = det(A1 + A2, A1 + A2, . . . )= det(A1, A1 + A2, . . . ) + det(A2, A1 + A2, . . . )= det(A1, A1, . . . ) + det(A1, A2, . . . ) + det(A2, A1 + A2, . . . )= 0 + det(A1, A2, . . . ) + det(A2, A1 + A2, . . . )= det(A1, A2, . . . ) + det(A2, A1, . . . ) + det(A2, A2, . . . )= det(A1, A2, . . . ) + det(A2, A1, . . . ) + 0= det(A1, A2, . . . ) + det(A2, A1, . . . ).

100 CHAPTER 9. DETERMINANTE

da cui si ha la conclusione.(v) Sia det(A) = det(. . . , Ai, . . . , Aj, . . . ), mettendo in evidenza le colonne

i e j. Sommiamo alla colonna i c volte la colonna j:

det(. . . , Ai + cAj, . . . , Aj, . . . ) = det(. . . , Ai, . . . , Aj, . . . ) + c · det(. . . , Aj, . . . , Aj, . . . )= det(A) + 0= det(A).

Example 51. Calcoliamo il determinante di

A =

[a bc d

]applicando le regole (i)-(vi).

|A| =∣∣∣∣ a bc d

∣∣∣∣ =

∣∣∣∣ a b0 d

∣∣∣∣+

∣∣∣∣ 0 bc d

∣∣∣∣Inoltre, ∣∣∣∣ a b

0 d

∣∣∣∣ =

∣∣∣∣ a 00 d

∣∣∣∣+

∣∣∣∣ a b0 0

∣∣∣∣ = ad+b

a

∣∣∣∣ a a0 0

∣∣∣∣ = ad.

In maniera simile,∣∣∣∣ 0 bc d

∣∣∣∣ =

∣∣∣∣ 0 0c d

∣∣∣∣+

∣∣∣∣ 0 bc 0

∣∣∣∣ = 0−∣∣∣∣ b 0

0 c

∣∣∣∣ = −bc

applicando Proposizione 9.3.1(iv).

Proposition 9.3.2. I vettori colonna A1, . . . , An sono linearmente dipen-denti sse det(A1, . . . , An) = 0.

Proof. Se i vettori colonna sono linearmente dipendenti, allora possiamoscrivere un opportuno vettore colonna, per esempio il primo, come com-binazione lineare degli altri. Se fosse il primo avremmo: det(A1, . . . , An) =det(c2A

2 + · · ·+ cnAn, A2, . . . , An) = 0 per (i)-(v).

9.4. CALCOLO DEL DETERMINANTE 101

Supponiamo ora che det(A1, . . . , An) = 0 e ipotizziamo per assurdo che ivettori colonna siano linearmente indipendenti. Allora A1, . . . , An generanolo spazio vettoriale Kn. Sia B una matrice qualsiasi il cui determinantee 6= 0. Allora ogni vettore colonna Bi di B e combinazione lineare Bi =ci1A

1 + · · ·+ cinAn. Ne segue che 0 6= det(B) = det(B1, . . . , Bn) = det(c11A

1 +· · ·+ c1nA

n, . . . , cn1A1 + · · ·+ cnnA

n) = 0 per le regole (i)-(v). Assurdo.

Proposition 9.3.3. Una matrice quadrata A a coefficienti nel campo K einvertibile se e solo se il suo determinante e diverso da zero.

Proof. (⇐) Dalla Proposizione 9.3.2 le colonne A1, . . . , An sono linearmenteindipendenti. Quindi ogni vettore dello spazio vettoriale Kn si scrive comecombinazione lineare di A1, . . . , An. In particolare i vettori e1, . . . , en dellabase canonica di Kn. Quindi,

e1 = b11A1 + · · ·+ bn1A

n, . . . . . . , en = b1nA1 + · · ·+ bnnA

n.

e sia B la matrice tale che Bi = [b1i, . . . , bni]t. Allora la matrice A e la matrice

del cambiamento di base dalla base A1, . . . , An alla base e1, . . . , en, mentrela matrice B e la matrice del cambiamento di base inverso. In conclusione,In = BA.

(⇒) Se A e invertibile, allora il sistema lineare Ax = x1A1+ . . . xnA

n = bha un’unica soluzione x = A−1b. Siccome il vettore b e arbitrario allora ivettori A1, . . . , An costituiscono una base di V . Quindi sono linearmenteindipendenti e dalla Proposizione 9.3.2 il determinante di A e diverso dazero.

Proposition 9.3.4. 1. |At| = |A|;

2. |AB| = |A| |B|;

3. |A−1| = |A|−1.

9.4 Calcolo del determinante

Con la regola di Cramer possiamo risolvere il sistema lineare Ax = b utiliz-zando i determinanti.

102 CHAPTER 9. DETERMINANTE

Theorem 9.4.1. (Regola di Cramer) Sia A una matrice quadrata di ordinen con determinante diverso da 0. Se b e un vettore colonna e c1, . . . , cnscalari tali che

c1A1 + · · ·+ cnA

n = b

allora per ogni i abbiamo

ci =det(A1, . . . , Ai−1,b, Ai+1, . . . , An)

det(A1, . . . , An).

Proof. Si sostituisca in det(A1, . . . , Ai−1,b, Ai+1, . . . , An) il vettore b con lacombinazione lineare c1A

1 + · · · + cnAn e si applichino le regole di calcolo

(i)-(v).

Sia A = (aij) una matrice quadrata di ordine n. Fissati i e j indichiamocon Aij la matrice quadrata (n− 1)× (n− 1) ottenuta da A cancellando lariga i e la colonna j.Calcolo del determinante di una matrice quadrata A rispetto alla riga i:

|A| = (−1)i+1ai1|Ai1|+ · · ·+ (−1)i+nain|Ain| =n∑k=1

(−1)i+k|Aik|

Calcolo del determinante di una matrice quadrata A rispetto alla colonna j:

|A| = (−1)j+1a1j|A1j|+ · · ·+ (−1)j+nanj|Anj| =n∑k=1

(−1)j+k|Akj|

Example 52. Il determinante di una matrice di tipo 3×3 sviluppato rispettoalla prima riga:∣∣∣∣∣∣a b cd e fg h i

∣∣∣∣∣∣ = a(ei−fh)−b(di−fg)+c(dh−eg) = aei+bfg+cdh−afh−bdi−ceg

Lemma 9.4.2. Il determinante di una matrice triangolare superiore o infe-riore e dato dal prodotto degli elementi nella diagonale.

Sia A una matrice quadrata. Possiamo semplificare il calcolo del determi-nante applicando ad A la seguente operazione elementare che non modificail determinante: sommare ad una data colonna il multiplo scalare di un’altracolonna.

9.4. CALCOLO DEL DETERMINANTE 103

Example 53. Sia A =

1 2 34 5 67 8 9

una matrice. Sostituiamo la seconda

colonna A2 con A2 − 2A1 e la terza colonna A3 con A3 − 3A1: 1 2 34 5 67 8 9

⇒ 1 0 0

4 −3 −67 −6 −12

= B

Sostituiamo poi la terza colonna B3 =

0−6−12

di B con B3 − 2B2:

1 0 04 −3 −67 −6 −12

⇒ 1 0 0

4 −3 07 −6 0

La matrice finale e triangolare superiore. Il suo determinante e dato dalprodotto degli elementi della diagonale ed e quindi nullo. In conclusione, lamatrice A di partenza ha determinante nullo.

Determinante di una trasformazione lineare

Sia f : V → V una trasformazione lineare. Sia v1, . . . , vn una base e sia A lamatrice quadrata di ordine n che rappresenta f rispetto alla base v1, . . . , vn.

Se consideriamo un’altra base di V , w1, . . . , wn, allora consideriamo lamatrice B che rappresenta f rispetto a questa nuova base. Dalla Sezione 8.4.1sappiamo che esiste una matrice invertibile C che corrisponde al cambiamentodi base. Cosı si ha:

B = C−1AC

e quindi|B| = |C|−1 |A| |C| = |A|.

Theorem 9.4.3. Il determinante di una trasformazione lineare f e indipen-dente dalla scelta della base (e quindi della matrice che rappresenta f).

Data una trasformazione lineare f , possiamo scrivere quindi det(f), in-tendendo con questo il determinante di una qualsiasi matrice che rappresentaf .

104 CHAPTER 9. DETERMINANTE

Corollary 9.4.4. Si ha per trasformazioni lineari componibili g, f e per iso-morfismi lineari h:

det(g ◦ f) = det(g)det(f)

e1 = det(h−1 ◦ h) = det(h−1)det(h) = det(h)−1det(h).

9.4.1 Calcolo matrice inversa con il determinante

Metodo di CramerEj e il vettore colonna con 1 nel posto j e 0 in tutti gli altri posti.

Proposition 9.4.5. Sia A = (aij) una matrice quadrata con determinantenon nullo. Se B = (bij) e la matrice inversa di A, allora applicando la regoladi Cramer al sistema lineare:

b1jA1 + · · ·+ bnjA

n = A

b1jb2j. . .bnj

= Ej

abbiamo

bij =det(A1, . . . , Ai−1, Ej, Ai+1, . . . , An)

|A|.

Metodo dei cofattoriLa matrice dei cofattori di una matrice quadrata A di ordine n, detta anchematrice dei complementi algebrici, e un’altra matrice quadrata di ordine nil cui elemento nella posizione generica i, j e il cofattore (o complementoalgebrico) di A relativo alla posizione i, j:

cofij(A) = (−1)i+jdet(Aij)

dove Aij e il minore di A ottenuto cancellando la riga i e la colonna j.

cof A =

cof1,1(A) . . . cof1,n(A)...

. . ....

cofn,1(A) . . . cofn,n(A)

La matrice inversa di A e:

A−1 =1

det(A)· (cof A)T

9.4. CALCOLO DEL DETERMINANTE 105

Metodo di Gauss-JordanSpieghiamo il metodo con un esempio. Consideriamo la matrice A da inver-tire:

A =

2 1 14 −6 0−2 7 2

Aggiungiamo la matrice identica in fondo: 2 1 1 1 0 0

4 −6 0 0 1 0−2 7 2 0 0 1

L’idea e di eseguire le solite operazioni di triangolarizzazione sulla matrice3× 6 in maniera tale da arrivare ad una matrice1 0 0 b11 b12 b13

0 1 0 b21 b22 b230 0 1 b31 b32 b33

Allora la matrice 3× 3 in fondo sara l’inversa di A.

Cominciamo sottraendo il doppio della prima riga alla seconda riga: 2 1 1 1 0 00 −8 −2 −2 1 0−2 7 2 0 0 1

Sommiamo la prima riga all’ultima riga:2 1 1 1 0 0

0 −8 −2 −2 1 00 8 3 1 0 1

Sommiamo la seconda riga all’ultima:2 1 1 1 0 0

0 −8 −2 −2 1 00 0 1 −1 1 1

Ora cerchiamo di azzerare le componenti 12 e 22, sottraendo la terza rigaalla prima: 2 1 0 2 −1 −1

0 −8 −2 −2 1 00 0 1 −1 1 1

106 CHAPTER 9. DETERMINANTE

e sommando due volte la terza alla seconda:2 1 0 2 −1 −10 −8 0 −4 3 20 0 1 −1 1 1

Per azzerare la componente 12 si procede sommando un ottavo della secondaalla prima: 2 0 0 12

8−5

8−6

8

0 −8 0 −4 3 20 0 1 −1 1 1

Infine si divide la prima riga per 2, la seconda per −8:1 0 0 12

16− 5

16− 6

16

0 1 0 48−3

8−2

8

0 0 1 −1 1 1

Quindi la matrice inversa e:

A−1 =

1216− 5

16− 6

1648−3

8−2

8

−1 1 1

Chapter 10

Autovettori e Autovalori

Una trasformazione lineare di uno spazio vettoriale V in se stesso si chiamaendomorfismo lineare.

10.1 Definizione di autovalore e autovettore

Definition 10.1.1. Sia V uno spazio vettoriale ed f : V → V un endomor-fismo lineare. Un autovettore e un vettore non nullo v ∈ V per cui esiste unoscalare λ tale che

f(v) = λv.

Lo scalare λ viene detto autovalore.

Lo scalare 0 e un autovalore di f sse il nucleo ker(f) ha dimensione ≥ 1.

Remark 3. Se V e uno spazio vettoriale sul campo reale, v e un autovettore diautovalore λ > 0 sse la trasformazione lineare trasforma la retta rv (r ∈ R)in se stessa, dilatandola se λ ≥ 1 oppure contraendola se 0 ≤ λ ≤ 1. Sel’autovalore e negativo abbiamo anche un ribaltamento.

Proposition 10.1.1. Sia f un endomorfismo lineare dello spazio vettorialeV e sia λ un autovalore di f .

(i) L’insieme Eλ degli autovettori di autovalore λ e un sottospazio vettori-ale di V .

(ii) Se λ1, . . . , λk sono autovalori distinti di f e vi e un autovettore dell’autovaloreλi (i = 1, . . . , k), allora i vettori v1, . . . ,vk sono linearmente indipen-denti.

107

108 CHAPTER 10. AUTOVETTORI E AUTOVALORI

Proof. (i) Siano v e w due vettori tali che f(v) = λv e f(w) = λw. Allora

f(rv + sw) = rf(v) + sf(w) = r(λv) + s(λw) = λ(rv + sw).

(ii) Per induzione su k. Se c1v1 + · · ·+ ckvk = 0, allora

f(c1v1 + · · ·+ ckvk) = c1λ1v1 + · · ·+ ckλkvk = 0.

e sostituendo ckvk = −c1v1 − · · · − ck−1vk−1 si ottiene:

c1λ1v1+· · ·+λk(−c1v1−· · ·−ck−1vk−1) = c1v1(λ1−λk)+· · ·+ck−1vk−1(λk−1−λk) = 0.

che contraddice l’ipotesi induttiva che v1, . . . ,vk−1 sono linearmente indipen-denti.

Definition 10.1.2. Il sottospazio vettoriale Eλ degli autovettori di λ sichiama autospazio. La dimensione dell’autospazio Eλ si dice molteplicitageometrica dell’autovalore λ.

Sia I : V → V la funzione identica: I(v) = v for every v ∈ V .

Proposition 10.1.2. Sia f un endomorfismo lineare dello spazio vettorialeV di dimensione n. Allora le seguenti condizioni sono equivalenti:

(i) λ e un autovalore di f ;

(ii) dim ker(f − λI) ≥ 1;

(iii) L’endomorfismo lineare f − λI non e invertibile;

(iv) det(f − λI) = 0.

Proof. λ e un autovalore di f sse esiste un vettore non nullo v tale che(f − λI)(v) = 0.

Se A e la matrice di f : V → V rispetto ad una fissata base di V , alloradet(f − λI) = det(A− λIn) e un polinomio di grado n nell’incognita λ.

Definition 10.1.3. Il polinomio pf (λ) (di grado n) definito come il deter-minante det(f − λI) si chiama polinomio caratteristico di f .

10.1. DEFINIZIONE DI AUTOVALORE E AUTOVETTORE 109

Gli autovalori di f sono gli zeri del suo polinomio caratteristico pf (λ) = 0.Se V ha dimensione n, allora f ha al piu n autovalori.

Il polinomio caratteristico e indipendente dalla scelta della matrice Arappresentante f . Ricordiamo che le matrici A e B sono simili se esisteuna matrice invertibile P di cambiamento di base tale che B = PAP−1 (siconsulti la Definizione 8.4.1). Matrici simili determinano lo stesso polinomiocaratteristico e quindi gli stessi autovalori. Infatti si ha:

det(B − λIn) = det(PAP−1 − λIn)= det(PAP−1 − λPInP−1)= det(P (A− λIn)P−1)= det(P )det(A− λIn)det(P )−1

= det(A− λIn).

Il polinomio caratteristico di una matrice quadrata A e il polinomio carat-teristico dell’endomorfismo lineare determinato da A.

Si noti che la matrice A e la sua trasposta At hanno lo stesso polinomiocaratteristico, perche det(A− λIn) = det(A− λIn)t = det(At − λIn).

Proposition 10.1.3. Il polinomio caratteristico di una matrice quadrata A =(aij) triangolare superiore (o inferiore) e dato da

p(λ) = (a11 − λ)(a22 − λ) · · · (ann − λ).

Gli autovalori di una matrice triangolare superiore (o inferiore) sono gli el-ementi della diagonale.

Definition 10.1.4. Sia λ0 un autovalore di un endomorfismo lineare f . Sidice molteplicita algebrica di λ0 il piu grande k tale che il polinomio (λ−λ0)kdivide il polinomio caratteristico pf (λ):

pf (λ) = (λ− λ0)kq(λ),

dove q(λ) e un opportuno polinomio in λ tale che q(λ0) 6= 0.

Proposition 10.1.4. Sia λ0 un autovalore di un endomorfismo lineare f :V → V . Allora la molteplicita geometrica di λ0 e sempre minore o ugualealla sua molteplicita algebrica.

Proof. Sia r la dimensione dell’autospazio Eλ0 e sia v1, . . . ,vr una base diEλ0 . Si noti che v1, . . . ,vr sono autovettori di autovalore λ0. Completiamo

110 CHAPTER 10. AUTOVETTORI E AUTOVALORI

v1, . . . ,vr ad una base v1, . . . ,vr,vr+1, . . . ,vn di V . Rispetto a questa basela matrice A di f ha la forma

A =

[λ0Ir BOn−r C

]Quindi

A− λIn =

[(λ0 − λ)Ir BOn−r C − λIn−r

]da cui si ricava det(A− λIn) = (λ0 − λ)rpC(λ). Ne segue che la molteplicitageometrica r e minore o uguale a quella algebrica.

Example 54. Sia A = (aij) una matrice di tipo 2 × 2 a coefficienti in uncampo K. Calcoliamo il determinante det(A− λI2):

det(A− λI2) =

∣∣∣∣ a11 − λ a12a21 a22 − λ

∣∣∣∣ = λ2 − c1λ+ c0,

dove c0 = det(A) e c1 = tr(A) = a11 + a22. Allora det(A − λI2) = 0 sseλ2+c1λ+c0 = 0. Quindi per trovare gli autovalori di A bisogna risolvere unaequazione di secondo grado nell’incognita λ. Le due soluzioni dell’equazioneλ2− c1λ+ c0 = 0 esistono sempre se K = C e il campo dei numeri complessi,mentre possono o non possono esistere nel caso in cui K = R e il campo deinumeri reali. Per esempio, l’equazione λ2 + 1 = 0 non ammette soluzionireali.

Example 55. Nel caso di una matrice A = (aij) di tipo 3× 3 a coefficientiin un campo K si ha:

det(A− λI3) =

∣∣∣∣∣∣a11 − λ a12 a13a21 a22 − λ a23a31 a32 a33 − λ

∣∣∣∣∣∣ = −λ3 + c2λ2 − c1λ+ c0,

dovec0 = det(A); c2 = tr(A) = a11 + a22 + a33

e

c1 =

∣∣∣∣ a22 a23a32 a33

∣∣∣∣+

∣∣∣∣ a11 a13a31 a33

∣∣∣∣+

∣∣∣∣ a11 a12a21 a22

∣∣∣∣ .Allora det(A− λI3) = 0 sse −λ3 + c2λ

2 + c1λ+ c0 = 0. L’equazione di terzogrado −λ3 +c2λ

2 +c1λ+c0 = 0 ha sempre tre soluzioni z1, z2, z3 (contate con

10.1. DEFINIZIONE DI AUTOVALORE E AUTOVETTORE 111

la dovuta molteplicita) nel campo dei numeri complessi: se le tre soluzioninon sono tutte reali, allora una soluzione e reale, mentre le altre due sonocomplesse coniugate.

Remark 4. Se consideriamo una rotazione g : R2 → R2 del piano reale (siveda il prossimo capitolo) di un angolo 0 < θ < π

2in senso antiorario, nessun

vettore mantiene la stessa direzione e quindi non devono esistere autovalori.La matrice della rotazione rispetto alla base canonica e (si consulti il Capitolo11):

A =

[cos θ − sin θsin θ cos θ

]Calcoliamo il polinomio caratteristico che e il determinante della matrice∣∣∣∣ cos θ − λ − sin θ

sin θ cos θ − λ

∣∣∣∣ = (cos θ − λ)2 + sin θ2 = λ2 − 2 cos θλ+ 1.

Se calcoliamo le soluzioni troviamo

λ = cos θ ±√

cos θ2 − 1 = cos θ ±√− sin θ2 = cos θ ± i sin θ,

dove i e l’unita immaginaria. Quindi gli autovalori sono numeri complessinon reali. Siccome ogni polinomio ha radici nel campo dei numeri complessi,mentre non e detto che ne abbia nel campo dei numeri reali, conviene spessolavorare direttamente con trasformazioni lineari complesse. Consideriamoquindi la matrice A come una matrice che definisce una endomorfismo linearecomplesso h : C2 → C2 rispetto alla base canonica e1 = (1, 0) e e2 = (0, 1).Calcoliamo l’autospazio associato all’autovalore λ1 = cos θ + i sin θ. Dobbi-amo risolvere il sistema lineare omogeneo

(A−λ1I2)[xy

]=

[−i sin θ − sin θ

sin θ −i sin θ

] [xy

]=

[−ix sin θ − y sin θx sin θ − iy sin θ

]=

[00

],

dove x e y sono numeri complessi. Otteniamo l’equazione della retta comp-lessa che descrive i vettori dell’autospazio di λ1: −ix sin θ − y sin θ = 0, che

dividendo per sin θ diventa y = −ix. Un autovettore e il vettore

[−1i

].

Analogamente, possiamo calcolare la retta complessa y = ix degli autovet-tori di autovalore λ2 = cos θ − i sin θ. Un autovettore di autovalore λ2 e il

vettore

[1i

].

112 CHAPTER 10. AUTOVETTORI E AUTOVALORI

Example 56. Consideriamo una trasformazione lineare f : R3 → R3 chee una rotazione attorno all’asse y di un angolo π. Allora f(e1) = −e1,f(e2) = e2 e f(e3) = −e3. La matrice della rotazione e:

A =

−1 0 00 1 00 0 −1

ed abbiamo sicuramente: (i) l’autovalore λ = 1 con autovettore e2; (ii)l’autovalore λ = −1 con autovettori e1 ed e3. Il lettore provi che non visono altri autovalori.

Example 57. Sia

A =

[1 23 4

]Calcoliamo il polinomio caratteristico di A:∣∣∣∣ 1− λ 2

3 4− λ

∣∣∣∣ = (1− λ)(4− λ)− 6 = λ2 − 5λ− 2.

Le soluzioni dell’equazione λ2 − 5λ − 2 = 0 sono: λ = 5±√33

2. Quindi la

matrice ha due autovalori.Calcoliamo ora l’autospazio associato all’autovalore λ = 5+

√33

2. Dobbi-

amo risolvere il sistema omogeneo associato alla matrice[1− (5+

√33

2) 2

3 4− (5+√33

2)

]=

[−3−

√33

22

3 3−√33

2

]

Otteniamo quindi due rette −(3 +√

33)x + 4y = 0 e 6x + (3 −√

33)y = 0passanti per l’origine. Moltiplicando la prima equazione per 3 −

√33 si

ottiene: 24x+ 4(3−√

33)y = 0 e dividendo per 4 si ottiene infine la secondaequazione. Quindi le due equazioni definiscono la stessa retta per l’origine. Seponiamo x = 1 allora y = 9√

33. Quindi l’autospazio associato all’autovalore

5+√33

2e il sottospazio vettoriale del piano generato dal vettore [1, 9√

33].

Example 58. Sia

A =

1 0 12 0 22 2 3

10.2. MATRICI DIAGONALIZZABILI 113

Il determinante della matrice A e nullo: det(A) = −2

∣∣∣∣ 1 12 2

∣∣∣∣ = 0. Ne segue

che il sistema omogeneo Ax = 0 ammette soluzioni x 6= 0 non nulle. Cal-coliamo il polinomio caratteristico di A sviluppando il determinante rispettoalla prima riga e scopriremo che 0 sara un autovalore della matrice A:

A =

∣∣∣∣∣∣1− λ 0 1

2 −λ 22 2 3− λ

∣∣∣∣∣∣ = (1− λ)

∣∣∣∣ −λ 22 3− λ

∣∣∣∣+

∣∣∣∣ 2 −λ2 2

∣∣∣∣ =

= (1− λ)(−λ(3− λ)− 4) + 4 + 2λ = −λ3 + 4λ2 + 3λ.

L’equazione λ3− 4λ2− 3λ = 0 ammette come soluzioni gli autovalori: λ = 0e λ = 2±

√7.

10.2 Matrici diagonalizzabili

Se una matrice e diagonale, allora il vettore della base canonica ei = [0, . . . , 1, . . . , 0]t

e un autovettore di autovalore aii:a11 0 . . . 0

0 a22 . . . 0. . . . . . . . . . . .

0 0 . . . ann

0. . .

1. . .

0

= aii

0

. . .1

. . .0

Ogni matrice diagonale dilata (o contrae) il vettore ei della base canonicadi aii ≥ 1 (0 < aii < 1). Se il segno di aii e negativo, si ha anche unribaltamento.

Per esempio, abbiamo:[2 00 5

] [10

]= 2

[10

];

[2 00 5

] [01

]= 5

[01

]

Proposition 10.2.1. Sia f : V → V un endomorfismo lineare e v1, . . . ,vnuna base di V . Allora gli elementi della base sono autovettori di f sse lamatrice di f rispetto alla base v1, . . . ,vn e diagonale.

114 CHAPTER 10. AUTOVETTORI E AUTOVALORI

Definition 10.2.1. Un endomorfismo lineare f : V → V e diagonalizzabilese esiste una base di V costituita da autovettori di f .

Corollary 10.2.2. Una matrice quadrata A di ordine n (ad elementi nelcampo K) e diagonizzabile sse lo spazio vettoriale Kn ha una base v1, . . . ,vndi autovettori di A. In tal caso, se P e la matrice del cambiamento di basedalla base v1, . . . ,vn alla base canonica abbiamo che P−1AP e una matricediagonale.

Corollary 10.2.3. Se una matrice quadrata di ordine n ha n autovaloridistinti, allora e diagonalizzabile.

Proof. Siano λ1, . . . , λn gli n autovalori distinti e sia vi un autovettore di λiper i = 1, . . . , n. Dalla Proposizione 10.1.1(ii) i vettori v1, . . . ,vn costituis-cono una base di autovettori dello spazio vettoriale. La conclusione segue dalCorollario 10.2.2.

Sia D = P−1AP la matrice diagonale del Corollario 10.2.2. Allora si ha:

A = PDP−1

Se A e diagonalizzabile e si conoscono la matrice invertibile P e la matricediagonale D, allora e facile calcolare le potenze della matrice A: A2 = AA =P−1DDP = P−1D2P , A3 = AAA = P−1D3P , etc. Se

D =

d1 0 . . . 00 d2 . . . 0

. . . . . . . . . . . .0 0 . . . dn

allora

Dk =

dk1 0 . . . 00 dk2 . . . 0

. . . . . . . . . . . .0 0 . . . dkn

Il teorema seguente precisa meglio il risultato della Proposizione 10.2.1.

Theorem 10.2.4. Sia V uno spazio vettoriale di dimensione n sul campo K,sia f : V → V un endomorfismo lineare e siano λ1, . . . , λk tutti gli autovaloridistinti di f . Sia nialg (resp. nigm) la molteplicita algebrica (geometrica)dell’autovalore λi per i = 1, . . . , k.

Allora le seguenti condizioni sono equivalenti:

10.2. MATRICI DIAGONALIZZABILI 115

(i) f e diagonalizzabile;

(ii) Per ogni vettore v ∈ V , esistono (unici) autovettori wi di autovalore λi(i = 1, . . . , k) tale che v = w1 + · · ·+ wk;

(iii) n1gm + · · ·+ nkgm = n;

(iv) f ha tutti gli autovalori nel campo K e nialg = nigm per ogni i = 1, . . . , k.

Proof. (i) ⇒ (ii) Per ipotesi V ammette una base di autovettori.(ii) ⇒ (iii) Per ipotesi la somma delle dimensioni degli autospazi e n:

dim Eλ1 + · · ·+ dim Eλk = n.

Infine nigm = dim Eλi .(iii) ⇒ (iv) Da nigm ≤ nialg.(iv) ⇒ (i) Ovvio.

Sia f : V → V diagonalizzabile ed A la matrice di f rispetto ad unabase v1, . . . ,vn di V . Sia w1, . . . ,wn una base di autovettori di f , e Pla matrice tale che P i e il vettore colonna delle coordinate di wi rispettoalla base v1, . . . ,vn. Allora abbiamo P−1AP = D e una matrice diago-nale. Le n colonne di P possono essere suddivise in k insiemi di cardinalitadim Eλ1 , . . . , dim Eλk . I vettori colonna del primo insieme sono una base delsottospazio Eλ1 , e cosı via per gli altri insiemi. Gli elementi della diagonaledi D sono gli autovalori. Un autovalore occorrera tante volte in D quanto ladimensione del suo autospazio.

Example 59. Calcoliamo gli autovettori ed autovalori della matrice A =[2 13 2

]. Se x =

[x1x2

]e un autovettore di autovalore λ abbiamo

(A− λI)x = 0.

Il precedente sistema lineare omogeneo ha soluzione non nulla sse

det(A− λI2) =

∣∣∣∣ 2− λ 13 2− λ

∣∣∣∣ = (2− λ)2 − 3 = 0.

L’equazione di secondo grado

λ2 − 4λ+ 1 = 0

116 CHAPTER 10. AUTOVETTORI E AUTOVALORI

ha soluzioniλ1 = 2 +

√3; λ2 = 2−

√3.

Le due matrici che si ottengono sono:

B = A−(2+√

3)I =

[−√

3 1

3 −√

3

]; C = A−(2−

√3)I =

[ √3 1

3√

3

].

Ora calcoliamo gli autovettori. Per λ1 = 2 +√

3 lo spazio degli autovettori,che e lo spazio delle soluzioni del sistema omogeneo Bx = 0, ha dimensione 1ed e descritto dalla retta y =

√3x. Per λ = 2−

√3 lo spazio degli autovettori,

che e lo spazio delle soluzioni del sistema omogeneo Cx = 0, ha dimensione1 ed e descritto dalla retta y = −

√3x.

La matrice A e quindi diagonalizzabile perche esiste una base di autovet-tori v1 = [1,

√3] e v2 = [1,−

√3]. La matrice del cambiamento di base

e

P =

[1 1√3 −

√3

]e P−1AP e la matrice diagonale con gli autovalori nella diagonale.

Calcoliamo l’inversa di P :

P−1 =1

det(P )

[−√

3 −√

3−1 1

]t=

[1/2 1/21

2√3

−12√3

]t=

[1/2 1

2√3

1/2 −12√3

]

Allora

P−1AP =

[1/2 1

2√3

1/2 −12√3

][2 13 2

] [1 1√3 −

√3

]=

=

[1/2 1

2√3

1/2 −12√3

] [2 +√

3 2−√

3

3 + 2√

3 3− 2√

3

]=

[2 +√

3 0

0 2−√

3

]

Example 60. Sia A =

1 0 0−1 2 0

1 0 2

una matrice. Vogliamo

1. Determinare gli autovalori di A e le relative molteplicita.

2. Determinare gli autospazi di A e trovare, se esiste, una base di R3

formata da autovettori di A.

10.2. MATRICI DIAGONALIZZABILI 117

3. Calcolare una matrice P invertibile tale che P−1AP sia diagonale.

La matrice A e triangolare inferiore. Quindi gli autovalori sono gli ele-menti sulla diagonale: l’autovalore 1 con molteplicita 1, e l’autovalore 2 conmolteplicita 2. Un altro modo per calcolare gli autovalori e tramite il poli-nomio caratteristico:∣∣∣∣∣∣

1− λ 0 0−1 2− λ 0

1 0 2− λ

∣∣∣∣∣∣ = (1− λ)(2− λ)2.

Le radici del polinomio caratteristico (1− λ)(2− λ)2 = 0 sono 1, 2, 2.Per trovare gli autospazi bisogna risolvere i sistemi lineari omogenei 1− 1 0 0

−1 2− 1 01 0 2− 1

x1x2x3

=

0 0 0−1 1 0

1 0 1

x1x2x3

=

000

e 1− 2 0 0

−1 2− 2 01 0 2− 2

x1x2x3

=

−1 0 0−1 0 0

1 0 0

x1x2x3

=

000

Il prima sistema equivale a x2 = x1 e x3 = −x1. L’autospazio delle soluzioniha come base il vettore (1, 1,−1). Il secondo sistema ha per soluzione ilpiano x1 = 0, che ha per base i vettori [0, 1, 0] e [0, 0, 1]. Quindi una basedi R3 fatta di autovettori e composta dai vettori [1, 1,−1], [0, 1, 0] e [0, 0, 1].Rispetto alla base composta dagli autovettori [1, 1,−1], [0, 1, 0] e [0, 0, 1] lamatrice diagonale D simile ad A e:

D =

1 0 00 2 00 0 2

La matrice P tale che D = P−1AP e diagonale, e la matrice le cui colonnesono gli autovettori:

P =

1 0 01 1 0−1 0 1

118 CHAPTER 10. AUTOVETTORI E AUTOVALORI

Example 61. Siano dati in R3 i vettori

v1 = [0, 1,−1]; v2 = [2, 0, 1]; v3 = [1, 2, 0].

1. Verificare che esiste una unica trasformazione lineare f : R3 → R3

avente v1,v2,v3 come autovettori associati, rispettivamente, agli auto-valori 0, 3, 6.

2. Determinare (a) la matrice A associata ad f ; (b) ker(f) e Im(f).

Dobbiamo avere:

f(v1) = 0; f(v2) = 3v2; f(v3) = 6v3.

I tre vettori v1,v2,v3 sono linearmente indipendenti e quindi costituisconouna base di R3. Ne segue che la funzione f e unica perche e definita su ognivettore v = c1v1 + c2v2 + c3v3 di R3: f(c1v1 + c2v2 + c3v3) = c1f(v1) +c2f(v2) + c3f(v3) = 3c2v2 + 6c3v3.

La matrice di f rispetto alla base v1,v2,v3 di autovettori e la matricediagonale

D =

0 0 00 3 00 0 6

Per calcolare la matrice A rispetto alla base canonica di R3 dobbiamo consid-erare la matrice P le cui colonne sono le coordinate degli autovettori rispettoalla base canonica:

P =

0 2 11 0 2−1 1 0

Siccome D = P−1AP , ricaviamo che A = PDP−1. L’inversa della matriceP e:

P−1 =

2/3 −1/3 −4/32/3 −1/3 −1/3−1/3 2/3 2/3

E quindi

A = PDP−1 =

0 2 11 0 2−1 1 0

0 0 00 3 00 0 6

2/3 −1/3 −4/32/3 −1/3 −1/3−1/3 2/3 2/3

=

=

2 2 2−4 8 82 −1 −1

10.3. ALGORITMO DI GOOGLE 119

10.3 Algoritmo di Google

Questo esempio e la terza lezione nel sito Winter2009/RalucaRemus (chetroverete con un motore di ricerca).

Supponiamo di avere quattro siti web (www.page1.com, www.page2.com,www.page3.com, www.page4.com) con links tra i siti descritti dal seguentegrafo: Il nodo 1 ha tre archi uscenti. Cio significa che vi sono nella pagina p1

Figure 10.1: Il grafo con archi pesati

tre link, il primo diretto alla pagina p2, il secondo alla pagina p3 e l’ultimoalla pagina p4. Similmente per gli altri archi uscenti dagli altri nodi.

Supponiamo che un utente si trovi nella pagina p1. Immaginiamo che glieventi “passa alla pagina p2”, “passa alla pagina p3”, “passa alla pagina p4”siano equiprobabili. Quindi se un utente si trovera nella pagina p1 vi e unaprobabilita 1

3che passi alla pagina p2, e cosı via. Lo stesso discorso si applica

per gli altri nodi con probabilita possibilmente diverse, che dipendono dalnumero di links.

Siccome il nodo 1 ha tre archi uscenti, trasferisce un terzo della sua im-portanza a ciascuno dei tre nodi riceventi. In generale, se un nodo ha k archiuscenti, trasferisce 1

kdella sua importanza a ciascuno dei nodi riceventi.

I principi sui quali si basa PageRank sono quindi i seguenti:

• Una pagina importante riceve links da pagine importanti.

• Una pagina importante ha pochi links verso altre pagine.

120 CHAPTER 10. AUTOVETTORI E AUTOVALORI

Questi principi vengono formalizzati nella seguente formula: indicando conr(p) il rango della pagina web p (cioe la sua importanza relativa) e con |p| ilnumero di links dalla pagina p verso altre pagine, abbiamo

r(p) =∑q→p

r(q)

|q|.

In questa formula, la somma e effettuata su tutte le pagine q che hanno un linkverso p. Il contributo di una pagina q e quindi direttamente proporzionaleall’importanza (rango) di q ed inversamente proporzionale al numero di linksda q verso altre pagine.

La matrice A di transizione del grafo mette in ciascuna colonna Ai iltrasferimento di importanza dal nodo i agli altri nodi, mentre ciascuna rigaAi della matrice rappresenta l’importanza che il nodo i riceve dagli altri nodi.In altre parole, si ha:

aij =

{1|pj | se esiste un link da pj a pi

0 altrimenti.

e quindi nel nostro esempio abbiamo

A =

0 0 1 1

213

0 0 013

12

0 12

13

12

0 0

La matrice A e invertibile. Sviluppiamo il determinante rispetto alla terzacolonna.

det(A) = det(

13

0 013

12

12

13

12

0

) =1

3· (−1

4) = − 1

12.

Denotiamo con r =

r(p1)r(p2)r(p3)r(p4)

il rango delle quattro pagine. Allora dobbi-

amo avere:

Ar =

0 0 1 1

213

0 0 013

12

0 12

13

12

0 0

r(p1)r(p2)r(p3)r(p4)

=

q→p1r(q)|q|∑

q→p2r(q)|q|∑

q→p3r(q)|q|∑

q→p4r(q)|q|

=

r(p1)r(p2)r(p3)r(p4)

10.4. NUMERI DI FIBONACCI 121

In altre parole, il vettore r e un autovettore di autovalore 1. Risolvendo ilsistema lineare corrispondente

r(p1) = r(p3) + r(p4)2

r(p2) = r(p1)3

r(p3) = r(p1)3

+ r(p2)2

+ r(p4)2

r(p4) = r(p1)3

+ r(p2)2

si ottiene facilmente che abbiamo una retta di soluzioni c(12, 4, 9, 6) al variaredi c. Prendendo il vettore la cui somma delle coordinate e 1 otteniamo

PageRank vector ≡

0.380.120.290.19

In altre parole, la pagina p1 ha importanza 0.38 e cosı via per le altre pagine.Su 100 utenti, 38 visiteranno la pagina p1.

Si suggerisce di cercare con un motore di ricerca il file jkhoury/Google.pdfdove viene spiegato in dettaglio l’algoritmo di Google.

10.4 Numeri di Fibonacci

Questo esempio e preso da jkhoury/fibonacci.htmAll’inizio dell’anno abbiamo una coppia di conigli maschio e femmina. Le

regole sono le seguenti: Dopo due mesi ogni coppia produce una coppia mista(maschio, femmina) e da quel momento una nuova coppia mista ogni mesesuccessivo. Nessun coniglio muore.

Indichiamo con Fn il numero di conigli dopo n mesi. Abbiamo:

F0 = 1; F1 = 1; Fn = Fn−1 + Fn−2.

La successione cresce rapidamente. Dopo 55 mesi abbiamo F55 = 139.583.862.445.Esiste un’espressione che ci permette di trovare Fn facilmente? La risposta

e positiva se si conosce il processo di diagonalizzazione di una matrice.Consideriamo la matrice quadrata

A =

[1 11 0

]

122 CHAPTER 10. AUTOVETTORI E AUTOVALORI

Figure 10.2: Coppie di conigli e successione di Fibonacci

Allora partendo dal vettore [F1

F0

]=

[11

]si ricava che [

Fn+1

Fn

]= A

[FnFn−1

]o in altri termini[

Fn+1

Fn

]= AA · · ·A

[11

]= An

[11

](n-volte)

La matrice A e diagonalizzabile, ossia esiste una matrice invertibile P ed unamatrice diagonale D tale che A = P−1DP da cui si ricava An = P−1DnP .

10.4. NUMERI DI FIBONACCI 123

Siccome e facile calcolare una potenza Dn di una matrice diagonale, e anchefacile calcolare An.

Calcoliamo gli autovalori di A, per cui deve essere det(A− λI) = 0:

det(A− λI) = det(

[1− λ 1

1 −λ

]) = −(1− λ)λ− 1 = 0.

In altri termini,λ2 − λ− 1 = 0.

Le due soluzioni sono reali

λ1 =1 +√

5

2; λ2 =

1−√

5

2.

Se il vettore x e un autovettore corrispondente all’autovalore λi (i = 1, 2)allora abbiamo che Ax = λix, che si puo scrivere come (A−λiI)x = 0, che eun sistema omogeneo. Risolvendo tale sistema omogeneo si scopre che il vet-tore w1 = (1+

√5

2, 1) e una base per lo spazio degli autovettori dell’autovalore

λ1 = 1+√5

2, mentre il vettore w2 = (1−

√5

2, 1) e una base per lo spazio degli

autovettori dell’autovalore λ2 = 1−√5

2. Dal Teorema 10.2.4 si ricava che i

vettori w1, w2 costituiscono una base di R2.Sempre dal Teorema 10.2.4 si ricava che la matrice i cui vettori colonna

sono w1 e w2 e la matrice invertibile che diagonalizza A:

P =

[1+√5

21−√5

2

1 1

]La matrice inversa e

P−1 =

[1√5

−1+√5

2√5

−12√5

1+√5

2√5

]mentre la matrice diagonale D e

D =

[1+√5

20

0 1−√5

2

]

Allora si ha: [Fn+1

Fn

]= An

[11

]= PDnP−1

[11

]=

124 CHAPTER 10. AUTOVETTORI E AUTOVALORI

[1+√5

21−√5

2

1 1

][(1+√5

2)n 0

0 (1−√5

2)n

][1√5

−1+√5

2√5

−12√5

1+√5

2√5

][11

].

Infine moltiplicando le matrici si ricava:

Fn =1√5

(1 +√

5

2

)n+1

(1−√

5

2

)n+1

Un calcolatore potente in poco tempo calcola F100 = 573147844013817084101.Il numero

φ =1 +√

5

2

e la famosa sezione aurea o divina proporzione. E utilizzato in arte e ar-chitettura per dare simmetria alla rappresentazioni figurative geometriche(si consulti il libro di T. Livio: La sezione aurea). Il rettangolo aureo e unrettangolo le cui proporzioni sono basate sulla sezione aurea. Cio significache il rapporto a

bfra il lato maggiore a e quello minore b e identico a quello fra

il lato minore b e il segmento a − b ottenuto sottraendo b dal lato maggiorea (il che implica che entrambi i rapporti siano φ). Quindi se abbiamo unrettangolo aureo di lati a e b con a > b si ha: Se a > b sono lunghezze nonnulle, allora

φ =a+ b

a=a

b=

b

a− b.

Figure 10.3: Sezione aurea

Siccome φ2 − φ − 1 = 0, si ha anche che φ = 1+φφ

. Cosı il rettangolo dilati φ e 1 e un rettangolo aureo.

Si ha anche che il rapporto di due numeri di Fibonacci consecutivi tendealla sezione aurea quando l’indice n tende all’infinito.

φ = limn→∞FnFn−1

.

10.5. CRITTOGRAFIA 125

10.5 Crittografia

I caratteri dell’alfabeto italiano sono 26. Aggiungiamo un ulteriore carattereche rappresenta il “blank”, lo spazio vuoto. Codifichiamo questi 27 carattericon dei numeri arbitrari. Per semplificare i conti riduciamo il numero dicaratteri a 11 compreso il blank:

A = 345; B = 12438; C = 79; D = 987; E = 30078; F = 675;

G = 5499; I = 9090; O = 555; R = 777; blank = 647.

Allora la frase “GIOCO BARO” viene codificata in maniera elementare dallaseguente successione di numeri:

5499, 9090, 555, 79, 555, 647, 12438, 345, 777, 555

Consideriamo una matrice Z quadrata di ordine n (n molto grande) che siainvertibile. Immaginiamo che la matrice Z sia conosciuta soltanto ai dueinterlocutori che devono scambiare il messaggio cifrato. Nel nostro esempioper ragioni di spazio prendiamo una matrice 3× 3:

Z =

1 2 34 5 67 8 9

Allora suddividiamo il messaggio con la codifica elementare in vettori dilunghezza 3 avendo l’accortezza di aggiungere degli spazi finale per ottenereun multiplo del 3. 5499

9090555

, 79

555647

,12438

345777

,555

647647

.Mettiamo tutti questi vettori in una matrice U di dimensione 3× 4

U =

5499 79 12438 5559090 555 345 647555 647 777 647

Consideriamo la matrice prodotto

ZU =

1 2 34 5 67 8 9

5499 79 12438 5559090 555 345 647555 647 777 647

=

126 CHAPTER 10. AUTOVETTORI E AUTOVALORI 25344 3130 15459 379070776 6973 56139 9337116208 10816 96819 14884

Allora i numeri che vengono trasmessi sono

25344, 3130, 15459, 3790, 70776, 6973, 56139, 9337, 116208, 10816, 96819, 14884

Una persona che intercetta i numeri non riesce a decodificare il messaggio,mentre il ricevente semplicemente moltiplica a sinistra la matrice ZU perZ−1 e recupera U .

10.6 Compressione di Immagini

Questa sezione e presa da jkhoury/haar.htm

Figure 10.4: Compressione di immagine con differenti metodi

Consideriamo una immagine digitale come una matrice. Ogni componentedella matrice corrisponde ad un pixel (elemento elementare della figura).Supponiamo di avere una matrice 256× 256 di pixels con valori di ciascunacomponente un numero da 0 (nero) a 255 (bianco). Nel mezzo varie sfumaturedi grigio. La tecnica JPEG divide l’immagine in blocchi 8× 8 e assegna unamatrice ad ogni blocco. Utilizziamo l’algebra lineare per massimizzare lacompressione dell’immagine.

10.6. COMPRESSIONE DI IMMAGINI 127

Figure 10.5: Metodo JPEG

128 CHAPTER 10. AUTOVETTORI E AUTOVALORI

Chapter 11

Ortogonalita e Isometrie

In questa capitolo Rn e lo spazio vettoriale di riferimento.

11.1 Basi ortonormali

Definition 11.1.1. (i) Una base ortogonale di Rn e una base v1, . . . ,vntale che il prodotto interno vi · vj = 0 per ogni i 6= j.

(ii) Una base ortogonale e ortonormale se vi · vi = 1.

Una base ortogonale v1, . . . ,vn si trasforma in una base ortonormale con-siderando i vettori v1

‖v1‖ , . . . ,vn

‖vn‖ .

Example 62. La base canonica e1 = [1, 0, 0], e2 = [0, 1, 0], e3 = [0, 0, 1] diR3 e ortonormale. La base v1 = [ 1√

2, 1√

2, 0],v2 = [− 1√

2, 1√

2, 0], e3 = [0, 0, 1] e

anch’essa ortonormale.

Lemma 11.1.1. Sia v1, . . . ,vn una base ortonormale di Rn e siano x =x1v1 + · · · + xnvn, y = y1v1 + · · · + ynvn due vettori. Allora il prodottointerno di x e y si esprime come segue:

x · y = x1y1 + · · ·+ xnyn.

Se v1, . . . ,vn e una base arbitraria (non necessariamente ortonormale), ilLemma 11.1.1 non vale in generale. Si ha piuttosto il seguente risultato:

x · y =n∑i=1

n∑j=1

xiyj(vi · vj).

129

130 CHAPTER 11. ORTOGONALITA E ISOMETRIE

Lemma 11.1.2. Le coordinate di un vettore w ∈ Rn rispetto ad una baseortonormale v1, . . . ,vn di Rn sono calcolate con il prodotto interno:

w = (w · v1)v1 + · · ·+ (w · vn)vn.

Proof. Sia w = w1v1+· · ·+wnvn. Allora w·v1 = (w1v1+w2v2+· · ·+wnvn)·v1 = w1(v1 · v1) + w2(v2 · v1) · · ·+ wn(vn · v1) = w1(v1 · v1) + 0 + · · ·+ 0 =w1(v1 · v1) = w1.

Example 63. Sia w = 2e1 + e2 + 3e3 un vettore dello spazio. Calcol-iamo le coordinate di w rispetto alla base ortonormale v1 = [ 1√

2, 1√

2, 0],v2 =

[− 1√2, 1√

2, 0], e3 = [0, 0, 1]: w · v1 = 2√

2+ 1√

2= 3√

2; w · v2 = −2√

2+ 1√

2= − 1√

2;

w · e3 = 3. Allora si ha:

w =3√2v1 −

1√2v2 + 3e3

Lemma 11.1.3. Ogni sottospazio vettoriale di Rn ammette una base ortonor-male.

Proof. Analizziamo per semplicita il caso n = 2. Se i vettori v e w sonolinearmente indipendenti, allora lo spazio vettoriale Span(v,w) e anche gen-erato da v e w−v·w

v·v v che sono ortogonali: v·[w−v·wv·v v] = (v·w)−v·w

v·v (v·v) =0.

11.2 Sottospazi ortogonali

Due sottospazi X e Y di Rn sono ortogonali se il prodotto interno di vettoridei due spazi e sempre nullo:

(∀x ∈ X)(∀y ∈ Y )(x · y = 0).

Definition 11.2.1. Lo spazio ortogonale ad un sottospazio X e definito come

X⊥ = {v ∈ V : (∀x ∈ X)(v · x = 0)}.

Proposition 11.2.1. Sia X un sottospazio di uno spazio vettoriale reale V .Allora dim X + dim X⊥ = dim V .

11.3. RANGO DI UNA MATRICE 131

Proof. Sia v1, . . . ,vk una base ortonormale di X e w1, . . . ,wr una baseortonormale di X⊥. Consideriamo il sottospazio Y generato dai vettoriv1, . . . ,vk, w1, . . . ,wr. E sufficiente provare che Y = V . Supponiamo perassurdo che esista u ∈ V \Y . Consideriamo il vettore t = (u·v1)v1+· · ·+(u·vk)vk. Allora 0 6= u−t (altrimenti u ∈ X) e si ha (u−t)·vi = u·vi−t·vi = 0per ogni i = 1, . . . , k. Quindi u− t ∈ X⊥ e si scrive come combinazione lin-eare di w1, . . . ,wr. Ne segue la conclusione u ∈ Y , che contraddice l’ipotesisu u.

Example 64. Sia A = [3, 3] un vettore del piano. Sia X il sottospaziovettoriale generato da A, che e la retta passante per l’origine e per il puntoA. Lo spazio ortogonale X⊥ a X e la retta di equazione 3x+ 3y = 0. Allorauna base del piano e determinata dal vettore A e da un vettore B ∈ X⊥, peresempio B = [1,−1].

Example 65. Sia A = [3, 3, 1] un vettore dello spazio. Sia X il sottospaziovettoriale generato da A, che e la retta passante per l’origine e per il puntoA. Lo spazio ortogonale X⊥ a X e il piano di equazione 3x + 3y + z = 0.Allora una base dello spazio e determinata dal vettore A e da due vettoriB,C ∈ X⊥ non collineari, per esempio B = [1,−1, 0] e C = [1, 1,−6].

11.3 Rango di una matrice

Sia A una matrice di tipo m × n a coefficienti reali e sia fA : Rn →Rm la trasformazione lineare generata da A rispetto alle basi canonichedi Rn e Rm rispettivamente. Le colonne di A generano un sottospazioIm(fA) = Span(A1, . . . , An) di Rm e le righe di A generano un sottospazioSpan(A1, . . . , Am) di Rn. Abbiamo la seguente uguaglianza per la dimensionedi Span(A1, . . . , An):

n = dim Ker(fA) + dim Span(A1, . . . , An)

mentre il sottospazio Span(A1, . . . , Am) di Rn e ortogonale a Ker(fA) perche,se Ax = 0, si ha Ai · x = 0. Quindi dalla Proposizione 11.2.1 si ricava:

n = dim Ker(fA) + dim Span(A1, . . . , Am).

In conclusione, dim Span(A1, . . . , An) = dim Span(A1, . . . , Am).

132 CHAPTER 11. ORTOGONALITA E ISOMETRIE

Il rango r(A) della matrice A e la dimensione comune di questi duesottospazi. E chiaro che r(A) ≤ min(n,m). Se estraiamo r(A) colonnelinearmente indipendenti c1, . . . , cr(A) e r(A) righe linearmente indipendentid1, . . . , dr(A) otteniamo una matrice quadrata E = (eij) di ordine r(A) coneij = Acidj il cui determinante e non nullo.

Se consideriamo il sistema lineare omogeneo Ax = 0, allora la dimensionedello spazio delle soluzioni e n− r(A), dove r(A) e il rango di A.

Se il sistema lineare Ax = b ammette almeno una soluzione v0, alloral’insieme delle soluzioni e {v0 + x : Ax = 0}.

11.4 Matrici ortogonali

Definition 11.4.1. Una matrice quadrata A di ordine n e ortogonale se lamatrice inversa di A e la matrice trasposta At di A.

Se A e ortogonale allora det(A) = ±1: det(A)2 = det(A)det(A) =det(A)det(At) = det(AAt) = det(In) = 1, perche la trasposta di una ma-trice ha lo stesso determinante della matrice stessa.

Proposition 11.4.1. Sia A una matrice quadrata di ordine n. Allora leseguenti condizioni sono equivalenti:

(i) A e ortogonale;

(ii) Le colonne di A costituiscono una base ortonormale di Rn (cioe, Ai ·Ai = 1 e Ai · Aj = 0 per ogni i 6= j);

(iii) La matrice A preserva il prodotto interno di vettori: Ax ·Ay = x ·y (equindi le lunghezze dei vettori ‖Ax‖ = ‖x‖ per ogni x,y).

Proof. (i) ⇔ (ii) AtA = In sse Ai · Aj = δij, il delta di Kronecker.Sia B = AAt. Allora Bii = Ai · (At)i = Ai · Ai = 1 e, per i 6= j,

Bij = Ai · (At)j = Ai · Aj = 0. Quindi B e la matrice identica. La stessaprova funziona per AtA.

(i) ⇒ (iii) (Ax) · (Ay) = (Ax)t(Ay) = xtAtAy = xtIny = x · y.(iii) ⇒ (i) Se xtAtAy = xty per ogni x e y, allora scegliendo opportuna-

mente i valori di x e y si ricava AtA = In.

11.5. IL TEOREMA SPETTRALE 133

Proposition 11.4.2. Le matrici quadrate ortogonali di ordine n costituis-cono un gruppo O(n) rispetto alla moltiplicazione di matrici: il prodotto didue matrici ortogonali e una matrice ortogonale, l’inversa di una matriceortogonale e ortogonale e la matrice identica e ortogonale.

Proof. Siano A e B ortogonali. Allora, (AB)(AB)t = ABBtAt = AAt =In.

Le matrici ortogonali con determinante uguale ad 1 costituiscono un sot-togruppo del gruppo O(n).

11.5 Il teorema spettrale

Definition 11.5.1. Un endomorfismo lineare f : Rn → Rn e simmetrico sela matrice di f rispetto alla base canonica e simmetrica.

Proposition 11.5.1. Sia f : Rn → Rn un endomorfismo lineare. Allora leseguenti condizioni sono equivalenti:

(i) f e simmetrico;

(ii) f(x) · y = x · f(y) per ogni vettore x e y;

(iii) La matrice di f rispetto ad una qualsiasi base ortonormale e simmet-rica.

Proof. Sia v1, . . . ,vn una base ortonormale. Sia A = (aij) la matrice di frispetto alla data base e siano x = x1v1 + · · ·+ xnvn, y = y1v1 + · · ·+ ynvndue vettori. Dal Lemma 11.1.1 si ha:

x · f(y) = [x1 . . . xn]A[y1 . . . yn]t (11.1)

ef(x) · y = [y1 . . . yn]A[x1 . . . xn]t

= ([y1 . . . yn]A[x1 . . . xn]t)t

= [x1 . . . xn]At[y1 . . . yn]t(11.2)

(iii) ⇒ (i) Ovvia.(i) ⇒ (ii) Segue da (11.1) e (11.2) considerando che la matrice A e sim-

metrica (i.e., A = At).

134 CHAPTER 11. ORTOGONALITA E ISOMETRIE

(ii) ⇒ (iii) Sia v1, . . . ,vn una base ortonormale. Sia A = (aij) la matricedi f rispetto alla data base e siano x = x1v1+· · ·+xnvn, y = y1v1+· · ·+ynvndue vettori. Da (11.1), (11.2) e l’ipotesi si ha:

[y1 . . . yn]A[x1 . . . xn]t = [x1 . . . xn]At[y1 . . . yn]t.

Scegliendo opportunamente x e y si verifica che A e simmetrica. Per esempio,se x2 = 1, y1 = 1, xj = 0 (j 6= 2) e yk = 0 (k 6= 1), allora [0, 1, 0, . . . , 0]A = A2

seleziona la seconda riga di A, mentre [0, 1, 0, . . . , 0]At = A2 seleziona laseconda colonna di A. Moltiplicando scalarmente per [1, 0, . . . , 0]t da (11.2)ricaviamo a21 = a12.

Theorem 11.5.2. (Teorema Spettrale) Le seguenti condizioni sono equiv-alenti per un endomorfismo lineare f : Rn → Rn:

(i) f e simmetrico;

(ii) Esiste una base ortonormale costituita da autovettori di f ;

(iii) La matrice di f rispetto alla base canonica e diagonalizzabile.

Proof. (ii) ⇒ (i) La matrice di f rispetto ad una base di autovettori e diag-onale, quindi simmetrica. La conclusione segue dalla Proposizione 11.5.1.

(i)⇒ (ii) Limitiamo la prova alle dimensioni n = 2, 3. Analizziamo primail caso n = 2. Dalla Proposizione 11.5.1 la matrice A di f rispetto alla basecanonica e simmetrica:

A =

[a bb c

]Se b = 0, la matrice A e diagonale e le colonne A1, A2 costituiscono una baseortogonale di autovettori. Dividendo entrambi i vettori per la loro lunghezzaotteniamo una base ortonormale di autovettori. Supponiamo quindi b 6= 0.Il polinomio caratteristico di A e: λ2 − (a + c)λ + (ac − b2) = 0, da cui siricava:

λ =(a+ c)±

√(a+ c)2 − 4ac+ b2

2=

(a+ c)±√

(a− c)2 + b2

2

Quindi abbiamo due radici λ1 e λ2 reali e distinte. Dalla Proposizione 10.1.1due autovettori a di λ1 e b di λ2 sono linearmente indipendenti e costituiscono

11.5. IL TEOREMA SPETTRALE 135

una base di R2. Dall’ipotesi che f e simmetrico si ha λ1(a · b) = (λ1a) · b =f(a) · b = a · f(b) = a · (λ2b) = λ2(a · b), che implica a · b = 0.

Analizziamo ora il caso n = 3. Sia A la matrice simmetrica di f rispettoalla base canonica. Il polinomio caratteristico di f e di terzo grado e quindiammette una radice reale λ1. Sia v = v1e1 + v2e2 + v3e3 un autovettore diλ1 di lunghezza unitaria (cioe, f(v) = λv e ‖v‖ = 1). Consideriamo il pianov⊥ ortogonale a v di equazione v1x+ v2y + v3z = 0. Siano w1,w2 ∈ v⊥ duevettori del piano, ortogonali tra loro e di lunghezza unitaria. Allora, i vet-tori v,w1,w2 costituiscono una base ortonormale di R3. Dalla Proposizione11.5.1 la matrice B di f rispetto alla base v,w1,w2 e simmetrica. Inoltre,per i = 1, 2, si ha: 0 = λ1(v · wi) = f(v) · wi = v · f(wi). Quindi f(wi)e ortogonale a v, da cui si ricava f(v⊥) ⊆ v⊥. Quindi, da f(v) = λ1v,f(w1) = aw1 + bw2 e f(w2) = dw1 + cw2 si ricava

B =

λ1 0 00 a b0 d c

Infine dalla simmetria di B si ha b = d, per cui

B =

λ1 0 00 a b0 b c

Se b = 0, la matrice B e diagonale e dalla Proposizione 10.2.1 v,w1,w2

costituiscono una base di autovettori. Supponiamo b 6= 0. Il polinomiocaratteristico di B e: (λ − λ1)(λ2 − (a + c)λ + (ac − b2)). Quindi B, oltreall’autovalore λ1 gia conosciuto, ha due autovalori reali distinti (si veda il cason = 2) λ2 e λ3. Consideriamo un autovettore ti di λi (i = 2, 3) di lunghezzaunitaria. Allora come nel caso n = 2, si ottiene λ2(t2 · t3) = f(t2) · t3 =t2 ·f(t3) = λ3(t2 · t3), da cui t2 · t3 = 0. La base di autovettori e v, t2, t3.

Corollary 11.5.3. Sia A una matrice quadrata di ordine n a coefficientireali. Allora le seguenti condizioni sono equivalenti:

(i) A e simmetrica;

(ii) Esiste una base ortonormale di Rn costituita da autovettori di A;

(iii) Esiste una matrice ortogonale U (cioe, le colonne U1, . . . , Un di U cos-tituiscono una base ortonormale di Rn) tale che U tAU e diagonale.

136 CHAPTER 11. ORTOGONALITA E ISOMETRIE

11.6 Isometrie lineari

Una isometria lineare e un isomorfismo lineare f : Rn → Rn che preserva ilprodotto interno dei vettori: f(x)·f(y) = x·y e quindi anche la lunghezza deivettori. Sia A la matrice della isometria lineare rispetto alla base canonicacostituita dai vettori colonna e1, . . . , en di Rn. Da f(ei) = Aei = Ai ( lacolonna i della matrice A) si ricava che ‖Ai‖ = 1. Inoltre, per i 6= j, si ha:0 = ei · ej = f(ei) · f(ej) = Ai ·Aj. Quindi la matrice A e ortogonale, la suainversa A−1 = At e la matrice trasposta e det(A) = ±1.

11.6.1 Rotazioni e simmetrie assiali del piano

Consideriamo il piano cartesiano con la base canonica e1 = [1, 0] e e2 = [0, 1].Una isometria lineare e determinata (rispetto alla base canonica) da unamatrice ortogonale

A =

[a cb d

]

Rotazioni del piano

Analizziamo prima il caso in cui det(A) = 1. Valgono le seguenti proprieta:a2 + b2 = 1, c2 + d2 = 1, ac + bd = 0 ed infine ad − bc = 1. Le colonnedi A costituiscono una base ortonormale ed inoltre l’orientazione di questabase coincide con quella canonica e1, e2, perche il determinante di A e 1. Seutilizziamo le coordinate polari, esiste un angolo θ tale che [a, b] = [cos θ, sin θ]e [c, d] = [cos(θ+ π

2), sin(θ+ π

2)] = [− sin θ, cos θ]. Quindi la matrice A e uguale

a

A =

[cos θ − sin θsin θ cos θ

].

La matrice A corrisponde ad una rotazione Rθ in senso antiorario di un angoloθ. Il vettore e1 viene trasformato nel vettore

Rθ(e1) = (cos θ)e1 + (sin θ)e2,

mentre il vettore e2 viene trasformato nel vettore

Rθ(e2) = (− sin θ)e1 + (cos θ)e2 = cos(θ + π/2)e1 + sin(θ + π/2)e2.

11.6. ISOMETRIE LINEARI 137

Ogni rotazione e invertibile. La matrice inversa, che corrisponde ad unarotazione oraria di un angolo θ, e la sua trasposta:[

cos θ sin θ− sin θ cos θ

]=

[cos(−θ) cos(π

2− θ)

sin(−θ) sin(π2− θ)

]Vi e una corrispondenza bigettiva tra rotazioni e matrici[

a b−b a

]con determinante a2 + b2 = 1.

Si ricorda che un altro modo di rappresentare le rotazioni e con la molti-plicazione dei numeri complessi. Se z = cos θ + i sin θ e v = v1 + v2i, allora

zv = (v1 cos θ − v2 sin θ) + (v1 sin θ + v2 cos θ)i,

che corrisponde alla moltiplicazione di matrici:[cos θ − sin θsin θ cos θ

] [v1v2

]=

[v1 cos θ − v2 sin θv1 sin θ + v2 cos θ

]La matrice A della rotazione di angolo θ 6= 0 ammette autovalori reali

soltanto per l’angolo θ = π:∣∣∣∣cos θ − λ − sin θsin θ cos θ − λ

∣∣∣∣ = (cos θ − λ)2 + sin θ2

(cos θ − λ)2 + sin θ2 = 0 sse θ = π. In tal caso l’autovalore λ = −1 e doppio.

Riflessioni (Simmetrie assiali) lineari del piano

Se la matrice

A =

[a cb d

].

ha determinante uguale a −1, allora le colonne di A corrispondono ad unabase ortonormale con orientazione diversa da quella della base canonica e1, e2.Quindi esiste un angolo θ tale che [a, b] = [cos θ, sin θ] e [c, d] = [cos(θ −π2), sin(θ − π

2)] = [sin θ,− cos θ]. Quindi la matrice A e uguale a

A =

[cos θ sin θsin θ − cos θ

]

138 CHAPTER 11. ORTOGONALITA E ISOMETRIE

ed e simmetrica. Quindi, essendo ortogonale, abbiamo AA = I2.Calcoliamo gli autovalori della matrice A:∣∣∣∣cos θ − λ sin θ

sin θ − cos θ − λ

∣∣∣∣ = (λ− cos θ)(λ+ cos θ)− sin θ2 = λ2 − 1

L’equazione λ2 − 1 = 0 ammette come soluzioni λ = ±1. Quindi esistonodue rette R1 e R2 passanti per l’origine e perpendicolari tra di loro con leseguenti proprieta: la prima retta R1 e l’autospazio dell’autovalore λ = 1,mentre la seconda retta R2 e l’autospazio dell’autovalore λ = −1. La matriceA agisce sulla prima retta R1 come la matrice identica, mentre agisce sullaseconda retta R2 mandando ogni vettore v che ha la direzione di R2 in −v.

La trasformazione lineare determinata dalla matrice A si chiama rifles-sione (simmetria assiale) lineare di asse la retta R1 passante per l’origine.La trasformazione geometrica lascia invariata la retta R1 e associa ad ognipunto P del piano non appartenente ad R1 il punto Q in modo tale che ilsegmento PQ sia perpendicolare alla retta R1 e abbia come punto medio H,che e il piede della perpendicolare condotta da P a R1.

Il prodotto di due riflessioni lineariA eB e una rotazione, perche det(AB) =det(A)det(B) = (−1)(−1) = 1.

Example 66. Una riflessione lineare attorno all’asse delle y si rappresentacon la matrice [

−1 00 1

]Infatti, [

−1 00 1

] [0y

]=

[0y

];

[−1 0

0 1

] [x0

]=

[−x

0

]mentre per ogni altro vettore:[

−1 00 1

] [32

]=

[−3

2

]Example 67. La matrice ortogonale:[

0 11 0

]rappresenta la riflessione lineare rispetto alla bisettrice y = x:[

0 11 0

] [xy

]=

[yx

]

11.6. ISOMETRIE LINEARI 139

Il prodotto delle due riflessioni lineari e una rotazione di un angolo θ = −π2:[

0 11 0

] [−1 0

0 1

]=

[0 1−1 0

]Il prodotto delle due riflessioni lineari in ordine inverso e una rotazione di unangolo θ = π

2: [

−1 00 1

] [0 11 0

]=

[0 −11 0

]

Nella parte restante di questa sezione calcoliamo, rispetto alla base canon-ica e1, e2, la matrice A di una simmetria assiale lineare rispetto alla retta Rche forma un angolo φ con l’asse positivo delle x. Consideriamo il vettore uni-tario v1 = (cosφ)e1 + (sinφ)e2 che giace nella retta R. La retta Q passanteper l’origine e perpendicolare ad R ha equazione lineare (cosφ)x+(sinφ)y =0. Un vettore unitario giacente sulla retta Q e v2 = (sinφ)e1− (cosφ)e2. Lamatrice della simmetria assiale rispetto alla base v1,v2 e la matrice diagonaledegli autovalori:

B =

[1 00 −1

]Infatti, [1, 0] sono le coordinate del vettore v1 rispetto alla base ortonormalev1,v2, mentre [0, 1] sono le coordinate del vettore v2 rispetto alla base v1,v2.

Per calcolare la matrice A, dobbiamo applicare alla matrice B un cambiodi base dalla base canonica e1, e2 alla base v1,v2. Allora abbiamo:

A =

[cosφ sinφsinφ − cosφ

] [1 00 −1

] [cosφ sinφsinφ − cosφ

]=

[cosφ − sinφsinφ cosφ

] [cosφ sinφsinφ − cosφ

]=

[cosφ2 − sinφ2 2 cosφ sinφ

2 cosφ sinφ sinφ2 − cosφ2

]=

[cos(2φ) sin(2φ)sin(2φ) − cos(2φ)

]La matrice A e ortogonale con determinante −1. Verifichiamo che Avt1 = vt1:[

cos(2φ) sin(2φ)sin(2φ) − cos(2φ)

] [cos(φ)sin(φ)

]=

[cos(φ) cos(2φ) + sin(φ) sin(2φ)cos(φ) sin(2φ)− sin(φ) cos(2φ)

]Verifichiamo che il vettore ottenuto coincide con vt1. Per fare questo ciavvaliamo dei numeri complessi e scriviamo v1 = cosφ + i sinφ come nu-mero complesso. Ricordiamo dalla Proposizione 1.1.7 che v1v1 = v2

1 =

140 CHAPTER 11. ORTOGONALITA E ISOMETRIE

cos(2φ) + i sin(2φ) e che il coniugato di v1 e v1 = cosφ − i sinφ. Allora,si ha (ricordando che la norma |v1| = 1):

v1 = v1|v1|2 = v1v1v1 = (cos(φ) cos(2φ)+sin(φ) sin(2φ))+i(cos(φ) sin(2φ)−sin(φ) cos(2φ))

ed abbiamo ottenuto la conclusione.

11.7 Rotazioni nello spazio

Le coordinate polari possono essere estese in tre dimensioni anche utilizzandole coordinate (ρ, θ, ϕ), in cui ρ e la distanza dall’origine degli assi, θ e l’angoloformato con l’asse z e ϕ l’angolo formato dalla proiezione sul piano-xy conl’asse x. Le tre coordinate cartesiane di un punto si ottengono dalle trecoordinate polari di quel punto con le formule:

x = ρ sin θ cosϕ; y = ρ sin θ sinϕ; z = ρ cos θ.

Consideriamo nello spazio vettoriale R3 una matrice ortogonale A di tipo3× 3 con determinante uguale ad 1:

A =

a d gb e hc f i

I tre vettori colonna A1, A2, A3 costituiscono una base ortonormale di R3 conlo stesso orientazione della base canonica e1, e2, e3.