2374131 Una Introduccion Al Analisis Numerico

380
Hans C. M¨ uller S.C. Una Introducci´ on al An´ alisis Num´ erico

Transcript of 2374131 Una Introduccion Al Analisis Numerico

Page 1: 2374131 Una Introduccion Al Analisis Numerico

Hans C. Muller S.C.

Una IntroduccionalAnalisis Numerico

Page 2: 2374131 Una Introduccion Al Analisis Numerico

i

Hans C. Muller S.C.

Una IntroduccionalAnalisis NumericoCon 55 figuras

Page 3: 2374131 Una Introduccion Al Analisis Numerico

ii

Hans C. Muller Santa Cruz

Departamento de Matematicas

Facultad de Ciencias y Tecnologıa

Universidad Mayor de San Simon

Casilla 992, Cochabamba, Bolivia

e-mail [email protected]

Page 4: 2374131 Una Introduccion Al Analisis Numerico

Prologo

La Facultad de Ciencias y Tecnologıa tiene 17 anos de vida, perıodo queha sido fructıfero en el ambito universitario, porque se han creado carrerastecnologicas, como cientıficas, haciendo enfasis a una investigacion cientıficaseria como un mecanismo de garantizar una excelencia academica. LaCarrera de Matematicas, una de nuestras Carreras de reciente creacion, estainscrita dentro este marco.

Ahora bien, la Universidad Mayor de San Simon consciente de estasituacion, ha conseguido convenios de cooperacion internacional, como esel caso del Programa MEMI, Programa de Mejoramiento de la Ensenanzade la Matematica y la Informatica. De los objetivos principales de esteprograma es fortalecer el area de las matematicas, incentivar la difusion delas diferentes ramas de las matematicas en el medio universitario y fuera deeste. La Universidad y sus autoridades, dentro de sus polıticas academicas yde investigacion, han tenido la vision de conseguir los servicios de los mejoresprofesionales en esta disciplina y Hans Muller es uno de ellos.

El autor del libro, Hans Muller Santa Cruz, es un joven matematico bo-liviano que ha regresado a su paıs para compartir los conocimientos adquiri-dos en en la Universidad de Ginebra, Suiza. Actualmente es el Coordinadordel Programa Magister en Matematicas, programa implementado de maneraconjunta entre la Universidad Mayor de San Simon y la Universidad Catolicadel Norte, Chile. Ha dictado un curso de Elementos Finitos, destinado a losdocentes en nuestra superior Casa de Estudios; en La Paz, bajo invitacion haimpartido cursos tutoriales en la Academia de Ciencias en temas relaciona-dos a las matematicas aplicadas. El y otros profesionales de su area, estantransformando la manera de hacer matematicas en la Facultad de Cienciasy Tecnologıa.

Los topicos tratados en este libro estan muy relacionados con los cam-bios estructurales que ha ocasionado la introduccion masiva de sistemas in-formaticos. En efecto, la utilizacion masiva del computador ha permitido alHombre efectuar calculos que en otra epoca hubiese sido impensable realizar-los. En la actualidad es muy corriente simular numericamente experiencias,que en laboratorio son muy complicadas, costosas o peligrosas, o simplementeimposible de experimentarlas. Los problemas de optimizacion son abordablesgracias a la utilizacion del ordenador y no faltan situaciones en las cualesel uso de estos dispositivos de calculo, no solamente son de gran ayuda,sino indispensables. El Analisis Numerico es la rama de las Matematicas,cuyo campo de accion es el estudio y analisis de los diferentes algoritmos

Page 5: 2374131 Una Introduccion Al Analisis Numerico

iv Prologo

y metodos numericos que se utilizan para resolver los problemas mediantecomputadoras. El libro “Una Intruduccion al Analisis Numerico” presentalos temas basicos del Analisis Numerico de una manera rigurosa, permitiendoque el lector pueda adquirir los conocimientos matematicos necesarios paraprofundizar en topicos mas especializados o simplemente pueda concebir eimplementar metodos numericos de una manera correcta y optima.

Finalmente, mi esperanza es que este libro sea el inicio de una largaserie de otras publicaciones de alto nivel que ofrezca el autor y su unidadacademica.

Cochabamba, septiembre de 1996

Ing. Alberto Rodrıguez MendezRector de la Universidad Mayor de San Simon

Page 6: 2374131 Una Introduccion Al Analisis Numerico

Prefacio

Este libro nace ante el vacio existente de una bibliografıa en espanol quetrate los temas capitales del Analisis Numerico. El nombre que lleva, “UnaIntroduccion al Analisis Numerico”, se debe esencialmente al caracter quedeseo que tenga este libro.

El Analisis Numerico es una disciplina de las Matematicas en grancrecimiento gracias a la utilizacion masiva de medios informaticos. Dıa quepasa es mas corriente el tratamiento numerico en las Ciencias, como enla Tecnologıa; el modelaje, la simulacion numerica son moneda corriente.Ahora bien, toda persona que pretenda tener como herramienta de tra-bajo, los metodos numericos, debe conocer los topicos introductorios delAnalisis Numerico que son: Sistemas Lineales, Interpolacion, Resolucion deEcuaciones no Lineales, Calculo de Valores Propios y Solucion Numerica deEcuaciones Diferenciales, porque tarde o temprano se topara con alguno deestos temas.

Siguiendo la lınea trazada por este libro, este contiene siete capıtulos: elprimero de caracter introductorio, donde se da los conceptos basicos de errory estabilidad, seguido de un ejemplo mostrando que la aritmetica del puntoflotante no es un impedimento para efectuar calculos de precision arbitraria;el segundo capıtulo trata sobre los problemas lineales mas comunes ylos metodos de solucion de estos; el tercer capıtulo aborda el tema deinterpolacion numerica y extrapolacion, introduciendo el estudio de lossplines cubicos; el capıtulo IV analiza los problemas no lineales y los metodosmas eficientes de resolucion de estos; en el capıtulo V se estudia el problemade valores propios y la implementacion de metodos numericos para el calculode valores propios; el capıtulo sexto trata de la integracion numerica y latransformada rapida de Fourier y finalmente el capıtulo VII estudia losproblemas diferenciales y los metodos numericos de resolucion mas usualesde estos problemas.

Practicamente el contenido de este libro ven los estudiantes de segundoano de las Carreras de Matematicas e Informatica de la Universidad deGinebra, Suiza, Universidad en la cual he sido formado. El pre-requisitopara un buen aprovechamiento de este libro es conocer bien los principiosbasicos del Analisis Real y Complejo, como tambien tener una buena basede Algebra Lineal. Por consiguiente, este libro esta destinado a estudiantesuniversitarios que siguen la asignatura de Analisis Numerico, como ası mismotoda persona interesada en Analisis Numerico que tenga los pre-requisitosy que desea cimentar sus conocimientos en esta disciplina. Este libro puede

Page 7: 2374131 Una Introduccion Al Analisis Numerico

vi Prefacio

ser utilizado como texto base o bien como complemento bibliografico.Debo agredecer a mis profesores de la Universidad de Ginebra, E. Hairer

y G. Wanner cuyos cursos han servido de base para la elaboracion de estelibro. Por otro lado, sin el apoyo en material de trabajo del ProgramaMEMI, Programa de Mejoramiento de la Ensenanza de las Matematicas eInformatica, de la Universidad Mayor de San Simon este libro no habrıaexistido. Ası mismo agradezco a mi familia, mis colegas y amigos queseguieron con inters la elaboracion de este libro.

El libro ha sido transcrito en TEX y las graficas realidas en las sub-rutinas graficas FORTRAN que G. Wanner me las cedio muy gentilmente. Latranscripcion, como la ejecucion de los programas en sido realizados sobreuna WorkStation HP-9000.

Posiblemente este libro contenga muchos errores, me gustarıa que loshagan conocer, para que en una segunda edicion estos sean corregidos.

Octubre, 1995 Hans C. Muller S.C.

Page 8: 2374131 Una Introduccion Al Analisis Numerico

Contenido

I. Preliminares

I.1 Algoritmos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

I.2 Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

I.3 Un ejemplo: Calculo de PI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

II. Sistemas Lineales

II.1 Condicion del Problema Lineal . . . . . . . . . . . . . . . . . . . . . . . . . . 25Normas de Vectores y Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25La Condicion de una Matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

II.2 Metodos Directos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35El Algoritmo de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36El Algoritmo de Cholesky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

II.3 Metodos Iterativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48Metodos de Jacobi y Gauss-Seidel . . . . . . . . . . . . . . . . . . . . . . . . . 48El Teorema de Perron-Frobenius . . . . . . . . . . . . . . . . . . . . . . . . . . . 52Metodo de Sobrerelajacion SOR . . . . . . . . . . . . . . . . . . . . . . . . . . . 56Estudio de un Problema Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . 59Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

II.4 Metodos Minimizantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66Metodo del Gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68Metodo del Gradiente Conjugado . . . . . . . . . . . . . . . . . . . . . . . . . . 69Polinomios de Chebichef . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73Metodo del Gradiente Conjugado Precondicionado . . . . . . . . . 75Resultados Numericos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

II.5 Mınimos Cuadrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83La descomposicion QR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87La Pseudo-Inversa de una Matriz . . . . . . . . . . . . . . . . . . . . . . . . . . 92Error del Metodo de los Mınimos Cuadrados . . . . . . . . . . . . . . . 96Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

Page 9: 2374131 Una Introduccion Al Analisis Numerico

viii Contenido

III. InterpolacionIII.1 Interpolacion de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

Bases Teoricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104Construccion del Polinomio de Interpolacion . . . . . . . . . . . . . . 106El Error de Interpolacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111Polinomios de Chebichef . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113Estudio de los Errores de Redondeo . . . . . . . . . . . . . . . . . . . . . . 115Convergencia de la Interpolacion . . . . . . . . . . . . . . . . . . . . . . . . . 119Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

III.2 Splines Cubicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131Construccion del Spline Interpolante . . . . . . . . . . . . . . . . . . . . . . 133El Error de la Aproximacion Spline . . . . . . . . . . . . . . . . . . . . . . . 136Aplicacion de Spline . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

III.3 Extrapolacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

IV. Ecuaciones No LinealesIV.1 Ecuaciones Polinomiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152

Ecuaciones Resolubles por Radicales . . . . . . . . . . . . . . . . . . . . . . 152Ecuaciones No Resolubles por Radicales . . . . . . . . . . . . . . . . . . 155Localizacion de Ceros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155Metodo de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157Sucesiones de Sturm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161

IV.2 Metodos Iterativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163Posicion del Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163Metodo de la Falsa Posicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165Sistema de Ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168Un Metodo Iterativo Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

IV.3 Metodo de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174El Teorema de Newton-Misovski . . . . . . . . . . . . . . . . . . . . . . . . . . 179Metodo de Newton Simplificado . . . . . . . . . . . . . . . . . . . . . . . . . . 184Metodo de Newton con Relajacion . . . . . . . . . . . . . . . . . . . . . . . . 193Aproximacion de Broyden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

IV.4 Metodo de Gauss Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203Convergencia del Metodo de Gauss-Newton . . . . . . . . . . . . . . . 204Modificaciones del Metodo de Gauss-Newton . . . . . . . . . . . . . 207El Metodo de Levenber-Marquandt . . . . . . . . . . . . . . . . . . . . . . . 210Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211

Page 10: 2374131 Una Introduccion Al Analisis Numerico

Contenido ix

V. Calculo de Valores PropiosV.1 Teorıa Clasica y Condicion del Problema . . . . . . . . . . 214

La Condicion del Problema a Valores Propios . . . . . . . . . . . . . 217Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

V.2 Determinacion de Valores Propios . . . . . . . . . . . . . . . . . . . 223El Metodo de la Potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223Formas Tridiagonales y Formas de Hessenberg . . . . . . . . . . . . 227Teorema de Sturm y el Algoritmo de la Biseccion . . . . . . . . . 229Generalizacion del Metodo de la Potencia . . . . . . . . . . . . . . . . . 233El Metodo QR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241

VI. Integracion Numerica

VI.1 Bases Teoricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244Formulas de Cuadratura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248El Orden de una Formula de Cuadratura . . . . . . . . . . . . . . . . . 249Estimacion del Error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256

VI.2 Cuadraturas de Orden Elevado . . . . . . . . . . . . . . . . . . . . . . 258Polinomios Ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259Los Polinomios de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263Las Formulas de Cuadratura de Gauss . . . . . . . . . . . . . . . . . . . 264Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267

VI.3 Implementacion Numerica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269Tratamiento de Singularidades . . . . . . . . . . . . . . . . . . . . . . . . . . . 273Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

VI.4 Transformacion de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284Estudio del Error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287Interpolacion Trigonometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288Transformacion Rapida de Fourier FFT . . . . . . . . . . . . . . . . . . 290Aplicaciones de FFT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293

VII. Ecuaciones Diferenciales

VII.1 Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296Teoremas de Existencia y Unicidad . . . . . . . . . . . . . . . . . . . . . . . 297Problemas con Valores en la Frontera . . . . . . . . . . . . . . . . . . . . . 300Diferenciabilidad respecto a los Valores Iniciales . . . . . . . . . . 300Simple Shooting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303Shooting Multiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311

Page 11: 2374131 Una Introduccion Al Analisis Numerico

x Contenido

VII.2 Metodo de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313Efectos de los Errores de Redondeo . . . . . . . . . . . . . . . . . . . . . . . 317Estabilidad del Metodo de Euler . . . . . . . . . . . . . . . . . . . . . . . . . 319Metodo de Euler Impıcito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322

VII.3 Metodos de Runge-Kutta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323Construccion de un Metodo de Orden 4 . . . . . . . . . . . . . . . . . . 327Metodos Encajonados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330Soluciones Continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333Convergencia de los Metodos de Runge-Kutta . . . . . . . . . . . . 335Experiencias Numericas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340

VII.3 Metodos Multipasos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341Metodos de Adams Explıcitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341Metodos de Adams Implıcitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343Metodos Predictor-Corrector . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344Metodos BDF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345Estudio del Error Local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348Convergencia de los Metodos Multipaso . . . . . . . . . . . . . . . . . . 350Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353

Bibliografıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355

Indice de Sımbolos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359

Indice Alfabetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361

Page 12: 2374131 Una Introduccion Al Analisis Numerico

Capıtulo I

Preliminares

Con la utilizacion masiva de sistemas informaticos en la resolucion deproblemas a todo nivel, el Analisis Numerico ha tenido un gran desarrollo enlas ultimas decadas, como una rama integrante de las Matematicas. En esteprimer capıtulo se expondra las nociones de base que sustentan el AnalisisNumerico, para ser utilizadas en los capıtulos posteriores.

La primera seccion estara dedicada a estudiar los algoritmos comouna composicion de operaciones elementales, partiendo de un dispositivoideal de calculo. Se analizara las nociones de eficiencia y error de unalgoritmo.

En la segunda seccion se analizara el problema algorıtmico a partirde los dispositivos materiales con que se cuenta en la actualidad, es decirordenadores o computadoras. En esta seccion se estudiara la representacionen punto flotante de un numero real y su redondeo en la computadora. Seintroducira la nocion de precision de una computadora y la relacion de estacon el concepto de estabilidad, en sus diferentes versiones, de un algoritmo.

En la tercera y ultima seccion de este capıtulo, se vera que las li-mitaciones impuestas por la representacion en punto flotante, no es una res-triccion para calcular con la precision que se requiera. Prueba de esto, π seracalculado, como un ejemplo ilustrativo, con 10000 decimales de precision.

Page 13: 2374131 Una Introduccion Al Analisis Numerico

I.1 Algoritmos

En esta seccion se supondra que se cuenta con un dispositivo ideal de calculo,es decir una computadora de precision exacta, situacion que no sucede en larealidad. El cuerpo de base sera R, a menos que se especifique lo contrario.Este dispositivo esta provisto de ciertas operaciones cuya accion se efectuaen un tiempo finito, por ejemplo es capaz de realizar las 4 operacionesaritmeticas elementales, mas algunas como la radicacion, la exponenciaciony las otras funciones elementales que se estudian en un curso de Calculo I.Por consiguiente, se tiene la primera definicion.

Definicion I.1.1.- Una operacion elemental es una operacion matematicao funcion cuya accion se la efectua en un tiempo finito y que ademas eldispositivo ideal la puede realizar.

Inicialmente se supondra que las cuatro operaciones aritmeticascomo: la adicion, la multiplicacion, la sustraccion y la division son posiblesen este dispositivo de calculo. De esta manera es posible evaluar todafuncion polinomial, toda funcion racional, en una cantidad finita de pasos ocomposicion de operaciones elementales.

Definicion I.1.2.- Un algoritmo es una sucesion finita de operacioneselementales. Si se denota por fi una operacion elemental, un algoritmo es lacomposicion de n operaciones elementales, es decir

f = fn fn−1 · · · f2 f1. (I.1.1)

Por otro lado, el dispositivo de calculo con el que se cuenta tiene lafinalidad de evaluar la o las soluciones de un problema matematico, siempreque sea posible hacerlo. Ahora bien, lo que cuenta en este estudio es elresultado, de donde la:

Definicion I.1.3.- Un problema es darse un dato x ∈ Rn y obtener unresultado P(x) ∈ R.

En consecuencia, son problemas todas las funciones cuyo dominioes un espacio vectorial real de dimension finita, cuya imagen esta incluidaen la recta real. Una funcion cuya imagen esta incluida en un espacio dedimension mas grande que 1, puede ser interpretada como un conjunto deproblemas, donde cada problema es la funcion proyeccion correspondiente.Las ecuaciones pueden ser vistas como problemas, pero antes aclarando cualde las soluciones se esta tomando.

Page 14: 2374131 Una Introduccion Al Analisis Numerico

I.1 Algoritmos 3

Es necesario recalcar que problema y algoritmo son conceptos dife-rentes, aunque de alguna manera ligados. Considerese el problema siguiente,

P(x) = anxn + an−1xn−1 + · · ·+ a1x + a0. (I.1.2)

P(x) puede ser obtenido de muchas maneras, en particular utilzando los 2siguientes algoritmos: El primero consiste en evaluar el polinomio (I.1.2) talcomo esta definido, con la convencion que:

x1 = x;

xn = x · xn−1, para n ≥ 2.(I.1.3)

La segunda manera de evaluar el polinomio consiste en utilizar el algoritmode Horner, el cual esta dado por:

q0(x) = an,

q1(x) = q0(x)x + an−1,

q2(x) = q1(x)x + an−2,

...

qn(x) = qn−1(x)x + a0.

(I.1.4)

Como puede observarse ambos algoritmos evaluan el polinomio P(x), sinembargo en el primero se requiere: 1 + · · · + n − 1 multiplicaciones paraevaluar las potencias, n multiplicaciones para evaluar los terminos de laforma aix

i y finalmente n adiciones, lo cual hace un total de

n(n + 3)

2operaciones elementales. (I.1.5)

El algoritmo de Horner requiere a cada paso de una multiplicacion y unaadicion lo cual es igual a

2n operaciones elementales. (I.2.6)

Por lo tanto, puede observarse claramente que el algoritmo de Horner esmas eficiente que el primero, pues la implementacion de este efectua menosoperaciones elementales.

El concepto de eficiencia de un algoritmo esta ligado por consi-guiente al costo en operaciones elementales que se requiere para ejecutarun algoritmo. Ahora bien, en la realidad una computadora requiere menostiempo para evaluar una adicion que para una multiplicacion. Cada ope-racion elemental toma cierto tiempo en efectuarse, que en general dependede la computadora y el lenguaje en el que esta escrito el programa. Es

Page 15: 2374131 Una Introduccion Al Analisis Numerico

4 I Preliminares

por eso, que es mas conveniente medir la eficiencia en terminos de tiempoejecutado, en lugar del numero de operaciones elementales ejecutadas. Conlo argumentado se puede formular una primera definicion de eficiencia.

Definicion I.1.4.- El costo del algoritmo fn · · · fn, esta dado por

C = m1 + m2 + . . . + mn, (I.1.7)

donde mi es el tiempo de ejecucion de fi. Si C1 y C2 son los costos en tiempode dos algoritmos que resuelven el mismo problema, se dira que el primeralgoritmo es mas eficiente que el segundo si C1 ≤ C2.

Tal como se dijo al inicio de esta seccion, el dispositivo ideal conel que se cuenta, puede efectuar una cantidad finita de operaciones elemen-tales. Suponiendo nuevamente, que solamente se cuenta con las cuatro ope-raciones aritmeticas, las unicas funciones que pueden evaluarse utilizandoun algoritmo son las funciones polinomiales y racionales. Ahora bien, existeuna cantidad ilimitada de funciones y se puede mostrar que no existe ningunalgoritmo que sea la composicion de adiciones, multiplicaciones, sustrac-ciones o divisiones, que permita calcular una raiz cuadrada; evaluar funcionestrigonometricas, exponenciales o logarıtmicas. Sin embargo, existen proce-dimientos matematicos que permiten aproximar estas funciones de maneraarbitraria. Los mas comunmente utilizados: son las series de Taylor, las frac-ciones continuas y algunos metodos iterativos. Todos estos metodos estansustentados en las nociones de lımite, de continuidad, derivabilidad dadosen los cursos de Calculo y Analisis.

A continuacion se vera un ejemplo ilustrativo, donde se introducirala nocion del error de truncacion. Considerese la funcion exponencial, cuyodesarrollo en serie de Taylor esta dada por

ex =∞∑

k=0

xk

k!. (I.1.8)

Es evidente que ex no puede evaluarse en un numero finito de pasos, paraun x dado, sin embargo en lugar de evaluar ex, uno se puede contentarevaluando una cantidad finita de terminos de la serie de Taylor, es decir

p(x) =

n∑

k=0

xk

k!, (I.1.9)

para un n fijado de antemano. La diferencia entre ex y p(x) es el errorde truncacion de ex respecto a p(x). Este error de truncacion es del ordenO(xn+1) cuando x tiende a 0. El nombre de truncacion proviene del hechoque para evaluar ex se ha despreciado una parte de la serie. Por consiguiente,el error de truncacion puede definirse como:

Page 16: 2374131 Una Introduccion Al Analisis Numerico

I.1 Algoritmos 5

Definicion I.1.5.- Sean P(x), P ′(x) dos problemas. El error de truncacionde P(x), respecto de P ′(x) esta dado por

P(x)− P ′(x). (I.1.10)

El nombre que tiene este error, como se dijo mas arriba, es debidoa que la la serie de Taylor es truncada a un numero finito de terminos.No obstante, existe una gran diversidad de metodos que aproximan a lasolucion del problema utilizando otro tipo de argumentos, en este caso esmas conveniente utilizar el nombre de error de aproximacion o error delmetodo; de todas formas es cuestion de gusto.

El concepto de eficiencia ha sido definido para aquellos problemasdonde se puede encontrar la solucion mediante un algoritmo. Para aquellosproblemas, donde no es posible encontrar un algoritmo que de la solucion ysuponiendo que es posible aproximar la solucion de manera arbitraria me-diante un metodo algorıtmico, la eficiencia esta ligada al costo en opera-ciones, como tambien al error del metodo. En esta situacion la eficiencia esun concepto mas subjetivo que depende de alguna manera del usuario, puesexisten problemas donde el error de aproximacion debe ser lo mas pequenoposible, y otros problemas donde la exactitud no es un requisito primordial.

Ejemplos

1.- Considerese el problema, determinar π. Utilizando la identidad

arctan 1 =π

4y que la serie de Taylor en el origen esta dada por

arctanx =∞∑

k=0

(−1)k

2k + 1x2k+1, (I.1.11)

se puede obtener un metodo que aproxime π, pero el problema de estemetodo es su convergencia demasiado lenta; es mas, para x = 1 la serie(I.1.11) no es absolutamente convergente.Otro metodo que permitirıa aproximar π, consiste en utilizar el hechoque

arccos(1/2) =π

3y desarrollando arccos en serie de Taylor, se obtiene un metodo cuyaconvergencia es mucho mas rapida.

2.- Considerese el problema, determinar√

2. La primera manera de determi-nar√

2 es tomar un intervalo cuya extremidad inferior tenga un cuadradoinferior a 2 y la extremidad superior tenga un cuadrado mas grande a 2.Se subdivide el intervalo en dos subintervalos de igual longitud, se eligeaquel cuyas extremidades al cuadrado contengan 2. En la tabla siguientese da algunas de las iteraciones de este metodo.

Page 17: 2374131 Una Introduccion Al Analisis Numerico

6 I Preliminares

Iteracion Ext. Inferior Ext. Superior

0 1.0 1.5

1 1.25 1.5

2 1.375 1.5

3 1.375 1.4375

4 1.40625 1.4375

5 1.40625 1.421875

16 1.41420745849609 1.41421508789063

17 1.41421127319336 1.41421508789063

18 1.41421318054199 1.41421508789063

19 1.41421318054199 1.41421413421631

20 1.41421318054199 1.41421365737915

La segunda posibilidad es utilizar la sucesion definida recursivamentepor:

a0 = 1,

an+1 =1

2an +

1

an.

Esta sucesion es convergente y se deja al lector la demostracion paraque verifique que el lımite es

√2. En la tabla siguiente se tiene los seis

primeros terminos de la sucesion. Efectuando unas cuantas iteracionesse obtiene:

Iteracion an

0 1.0

1 1.5

2 1.41666666666667

3 1.41421568627451

4 1.41421356237469

5 1.4142135623731

Puede observarse inmediatamente, que el segundo metodo para determinar√2 es mas eficiente que el primer algoritmo.

Ejercicios

1.- Supongase que, el dispositivo de calculo, con el que se cuenta, puedeefectuar la division con resto; es decir, para a, b enteros no negativos,con b 6= 0, el dispositivo calcula p, q satisfaciendo:

a = pb + r y 0 ≤ r < b.

a) Implementar un algoritmo que calcule el maximo comun divisor de ay b.

b) Utilizando el inciso precedente, implementar otro algoritmo quepermita calcular m, n ∈ Z, tales que

mcd(a, b) = ma + nb.

Page 18: 2374131 Una Introduccion Al Analisis Numerico

I.1 Algoritmos 7

c) Estudiar la situacion mas desfavorable, aquella donde el costo enoperaciones es el mas alto. Deducir una estimacion de la eficiencia delalgoritmo.

2.- Suponiendo que, el dispositivo de calculo puede efectuar la division conresto, con la particularidad siguiente:

a = pb + r y − |b|2

< r ≤ |b|2

.

a) Mostrar que el algoritmo implementado en el ejercicio 1a), puedeimplementarse para esta nueva division con resto.

b) Verificar que, el nuevo algoritmo es mas eficiente que aquel con di-vision con resto normal. Encontrar una estimacion de costo del algoritmo.

3.- Para el polinomio p(x) = a0 + a1x + · · ·+ anxn, el algoritmo de Horner(I.1.9) esta definido por:

bn = an;

bi = ai + x0bi+1, i = n− 1, . . . , 1, 0.

Se plantea q(x) = b1 + xb2 + · · ·+ xn−1bn.

a) Mostrar que p′(x0) = q(x0). Verificar que p(x) = b0 + (x− x0)q(x).b) Generalizar el algoritmo de Horner, de tal forma que se pueda calcularp(x0) y p′(x0) al mismo tiempo.

4.- Una regla y compas constituyen un dispositivo de calculo. Supongaseque se conocen dos puntos O y P tales que OP sea de longitud 1.

a) Mostrar que, ademas de las 4 operaciones aritmeticas elementales, laradicacion puede obtenerse a partir de un numero finito de manipula-ciones de regla y compas.

b) Construir√

1 +√

10.c) Intentar construir 3

√2. ¿Es posible?

Page 19: 2374131 Una Introduccion Al Analisis Numerico

I.2 Estabilidad

En esta seccion, a diferencia de la precedente, se analizara el problema de losalgoritmos y metodos numericos desde el punto de vista de un dispositivomaterial real, mas conocido como computadora. Para comenzar existenesencialmente dos tipos de numeros en la aritmetica de un ordenador: el tipoentero cuya aritmetica es igual a la de los numeros enteros, con la diferenciaque el tipo entero de un ordenador es un conjunto finito, motivo por el cualse tiene que tener cuidado con los overflows en las operaciones aritmeticas; elsegundo tipo de numero es el real, en sus diferentes versiones, la idea de estetipo de numero es la representacion de un numero real en punto flotante, esdecir todo numero real no nulo x se puede escribir de manera unica como

x = a · 10b, donde |a| < 1, b ∈ Z; (I.2.1)

a se llama mantisa y b el exponente. Los numeros reales solo tienen unarepresentacion parcial en el tipo real de un ordenador por limitaciones fısicasdel dispositivo, por consiguiente un numero real estara en una clase deequivalencia de tipo de numero real. Esta representacion de numero realesta dada por la precision de la computadora.

Cuando se trabaja sobre un computador, se tiene a disposicionun numero finito de cifras, por ejemplo l, para la mantisa, Si a denota elredondeado de a, se trabaja en realidad con

arr(x) = a · 10b (I.2.2)

en lugar de x. De esta manera, el numero√

2 = 1.414213562 . . . estarepresentado por

arr(√

2) = 0.141421356 · 101,

si se calcula con l = 8 cifras en base 10.Como se dijo mas arriba, el redondeo esta determinado por la

precision de la computadora. Esta precision esta dada por un numero dadopor la:

Definicion I.2.1.- Se denota por eps, el numero positivo mas pequeno talque

arr(1 + eps) > 1. (I.2.3)

Este numero eps llamado precision de la computadora esta dado porlos siguientes hechos: si los calculos se hacen en base 10 y con l cifras en la

Page 20: 2374131 Una Introduccion Al Analisis Numerico

I.2 Estabilidad 9

mantisa, se tiene

arr(0. 10 . . .0︸ ︷︷ ︸l

49 . . . · 101) = 1,

arr(0. 10 . . .0︸ ︷︷ ︸l

50 . . . · 101) = . 10 . . . 1︸ ︷︷ ︸l

·101 > 1,

deduciendose, por consiguiente

eps = 5.10−l; (I.2.4)

si se realiza el mismo calculo en base 2, como todas las computadoras lohacen, se obtiene

eps = 2−l. (I.2.5)

Para el FORTRAN sobre una HP-9000, se tiene:

REAL∗4, eps = 2−24 ≈ 5.96 · 10−8;REAL∗8, eps = 2−55 ≈ 1.39 · 10−17;REAL∗16, eps = 2−113≈ 9.63 · 10−35.

Ahora bien, un numero real y su representacion en punto flotanteen una computadora estan relacionados por el:

Teorema I.2.2.- Para x 6= 0, se tiene

|arr(x)− x||x| ≤ eps. (I.2.6)

Demostracion.- Sea x = a · 10b y arr(x) = a · 10b. Si se redondea a l cifrassignificativas se tiene

|a− a| ≤ 5 · 10−l−1,

de donde

|arr(x)− x||x| =

|a− a| · 10b

|a| · 10b≤ 5.10−l−1

10−1 = 5 · 10−l = eps

por que |a| ≥ 1/10.

La estimacion dada por (I.2.6) puede ser escrita bajo la forma

arr(x) = x(1 + ǫ), donde |ǫ| ≤ eps. (I.2.7)

Como se vera mas adelante, la relacion (I.2.7) es la base fundamental paratodo estudio de los errores de redondeo.

Page 21: 2374131 Una Introduccion Al Analisis Numerico

10 I Preliminares

Cuando se trabaja en un computador, se tiene que ser cuidadoso enla solucion de los problemas, pues ya no se resuelve con los datos exactos, sino con los datos redondeados. Considerese la ecuacion de segundo grado

x2 − 2√

2x + 2 = 0,

cuya solucion x =√

2 es un cero de multiplicidad 2. Resolviendo en simpleprecision, la computadora da un mensaje de error, debido a que

arr(√

2) = 0.141421 · 10,

arr(arr(√

2)2 − 2) = −0.119209 · 10−6.

Como puede observarse, la manipulacion de ciertos problemas utilizando laaritmetica del punto flotante puede ocasionar grandes dificultades, como enel ejemplo anterior. Es por eso necesario introducir el concepto de condicionde un problema, el cual esta dado en la:

Definicion I.2.3.- Sea P(x) un problema dado por P : Rn → R. Lacondicion κ del problema P es el numero mas pequeno positivo κ, tal que

|xi − xi||xi|

≤ eps ⇒ |P(x)− P(x)||P(x)| ≤ κ eps. (I.2.8)

Se dice que el problema P es bien condicionado si κ no es demasiado grande,sino el problema es mal condicionado.

En la definicion, eps representa un numero pequeno. Si eps es laprecision de la computadora entonces xi puede ser interpretado como elredondeo de xi. Por otro lado, es necesario resaltar que κ depende solamentedel problema, de x y no ası del algoritmo con el que se calcula P(x). Paracomprender mas sobre la condicion de un problema se analizara los siguientesdos ejemplos.

Ejemplos

1.- Multiplicacion de dos numeros reales. Sean x1 y x2 reales, considerese elproblema calcular P(x1, x2) = x1 · x2. Para los dos valores perturbados

x1 = x1(1 + ǫ1), x2 = x2(1 + ǫ2), |ǫi| ≤ eps; (I.2.9)

se obtiene

x1 · x2 − x1 · x2

x1 · x2= (1 + ǫ1)(1 + ǫ2)− 1 = ǫ1 + ǫ2 + ǫ1 · ǫ2.

Puesto que eps es un numero pequeno, el producto ǫ1. ·ǫ2 es despreciablerespecto a |ǫ1|+ |ǫ2|, de donde

∣∣∣∣x1 · x2 − x1 · x2

x1 · x2

∣∣∣∣ ≤ 2 · eps. (I.2.10)

Page 22: 2374131 Una Introduccion Al Analisis Numerico

I.2 Estabilidad 11

Por consiguiente, κ = 2. El problema es bien condicionado.

2.- Adicion de numeros reales. Para el problema P(x1, x2) = x1 + x2, poranalogıa al ejemplo precedente, se obtiene∣∣∣∣(x1 + x2)− (x1 + x2)

x1 + x2

∣∣∣∣ =

∣∣∣∣x1ǫ1 − x2ǫ2

x1 + x2

∣∣∣∣ ≤|x1|+ |x1||x1 + x2|

eps. (I.2.11)

Si x1 y x2 son de signos iguales, se tiene κ = 1, de donde el problema esbien condicionado.

Pero, si x1 ≈ −x2, la condicion κ =|x1|+ |x1||x1 + x2|

se convierte en

una cantidad muy grande. Motivo por el cual el problema esta malcondicionado. Para mejor ilustrar el efecto de condicion muy grande,considerese el siguiente ejemplo numerico.

x1 =1

51, x2 = − 1

52, para el cual κ ≈ 2/50

(1/50)2= 100.

Realizando el calculo con 3 cifras significativas en base 10, se obtienex1 = .196 · 10−1, x2 = −.192 · 10−1 y x1 + x2 = .400 · 10−1. Como lasdos primeras cifras son las mismas para x1 y x2, la adicion las ha hechodesaparecer y no hay mas que una cifra que es significativa. El resultadoexacto es 1/(51 · 52) = 0.377 · 10−3.

Respecto a la definicion de condicion, se debe observar dos situa-ciones. La primera, si uno de los xi = 0, entonces se tiene xi = 0; la segundasucede cuando P(x) = 0, la condicion se la calcula pasando al lımite.

Una vez definida la condicion de un problema, el siguiente paso esver la incidencia que tienen los errores de redondeo en la implementacion deun algoritmo para resolver un problema dado. Tal como se dijo en la seccionprecedente, un algoritmo es una sucesion finita de operaciones elementales,es decir

P(x) = fn(fn−1(. . . f2(f1(x)) . . .)). (I.2.12)

La amplificacion del error, efectuando la operacion fi, esta dada por lacondicion κ(fi). Por consiguiente:

Proposicion I.2.4.- El algoritmo que resuelve el problema dado por(I.2.12), tiene la estimacion siguiente

κ(P) ≤ κ(f1) · κ(f2) · · ·κ(fn). (I.2.13)

Demostracion.- Por induccion sobre n. Para n = 1, el resultado es trivial.Supongase, que es cierto para n, por lo tanto, si el problema es de la forma

P(x) = fn+1(fn(fn−1(. . . f2(f1(x)) . . .))),

Page 23: 2374131 Una Introduccion Al Analisis Numerico

12 I Preliminares

puede escribirse comoP(x) = fn+1(P ′(x)),

utilizando la definicion de condicion se tiene

|P ′(x)− P ′(x)||P ′(x)| ≤ κ(P ′)eps

⇒ |fn+1(P ′(x))− fn+1(P ′(x))||fn+1(P ′(x))| ≤ κ(fn+1)κ(P ′)eps.

Finalmente utilizando la hipotesis de induccion, se tiene (I.2.13).

Definicion I.2.5.- Un algoritmo es numericamente estable, en el sentido deforward analysis, si

κ(f1) · κ(f2) · · ·κ(fn) ≤ Const · κ(P) (I.2.14)

donde Const no es demasiado grande.

La formula (I.2.14) expresa el hecho de que la influencia de loserrores de redondeo durante el calculo de P(x) no es mucho mas grandeque la influencia de los errores en los datos, lo que en realidad es inevitable.

Ejemplo

Sea x = 104 y considerese el problema de calcular 1/(x(1 + x)). Seexaminara los dos algoritmos siguientes: El primero definido por

xր ցx x(x + 1) −→ 1

x(x + 1).

ց րx + 1

Las operaciones efectuadas son muy bien condicionadas, por consiguien-te, este algoritmo es numericamente estable.El segundo algoritmo definido por

1/xր ց

x1

x− 1

x + 1=

1

x(x + 1).

ց րx + 1 −→ 1/(x + 1)

En este algoritmo, solamente las tres primeras operaciones son biencondicionadas. Sin embargo la ultima operacion, la sustraccion, es muy

Page 24: 2374131 Una Introduccion Al Analisis Numerico

I.2 Estabilidad 13

mal condicionada, porque 1/x ≈ 1/(x + 1). Entonces, este algoritmo esnumericamente inestable.La verificacion, si un algoritmo es estable en el sentido de forward

analysis, sobre todo si el numero de operaciones es elevado, es a menudomuy compleja y dificil. Por esta razon, Wilkinson introdujo otra definicionde la estabilidad de un algoritmo.

Definicion I.2.6.- Un algoritmo para resolver el problema P(x) es numeri-camente estable en el sentido de backward analysis si el resultado numerico ypuede ser interpretado como un resultado exacto para los datos perturbadosx, es decir y = P(x), y si

|xi − xi||xi|

≤ Const · eps, (I.2.15)

donde Const no es demasiado grande y eps es la precision de la computadora.

De la definicion I.2.6 y (I.2.15) se deduce que, en el estudio de este tipode estabilidad no se requiere conocer de antemano la condicion del problema.

Ejemplo

Considerese el problema de calcular el producto escalar x1 · x2 + x3 · x4.Para calcular este, se utiliza el algoritmo

x1 · x2ր ց(x1, x2, x3, x4) x1 · x2 + x3 · x4.

ց րx1 · x2

(I.2.16)

El resultado numerico bajo la influencia de los errores de redondeo es

(x1(1 + ǫ1) · x2(1 + ǫ2)(1 + η1) + x3(1 + ǫ3) · x4(1 + ǫ4)(1 + η2)

)(1 + η3),

donde |ǫi| , |ηj | ≤ eps. Este resultado es igual a x1 · x2 + x3 · x4, si seplantea

x1 = x1(1 + ǫ1)(1 + η1),

x2 = x2(1 + ǫ2)(1 + η3),

x3 = x3(1 + ǫ3)(1 + η2),

x4 = x4(1 + ǫ4)(1 + η3).

Despreciando los productos de la forma ηi · ǫj , la relacion (I.2.15) essatisfecha con Const = 2. Por lo tanto, el algoritmo (I.2.16) siempre esnumericamente estable en el sentido de backward analysis.

El ejemplo precedente muestra que un algoritmo puede ser estable,incluso si el problema esta mal condicionado. En consecuencia, es necesariobien distinguir las nociones de estabilidad y condicion.

Page 25: 2374131 Una Introduccion Al Analisis Numerico

14 I Preliminares

Ejercicios

1.- ¿Cual es la condicion de la sustraccion de dos numeros?

2.- Determinar la condicion del problema P(x1, x2) = x1/x2 con x2 6= 0.

3.- Hallar la condicion del calculo del producto escalar

〈x, y〉 =

n∑

i=1

xiyi.

4.- Mostrar que el sistema lineal

ax + by = 1

cx + dy = 0, con ad 6= bc

es numericamente estable en el sentido de backward analysis.

5.- Las raices del polinomio x2 − 2px− q = 0 son:

λ1 = p +√

p2 + q, λ2 = p−√

p2 + q.

Mostrar que para p > 0, grande, y q ≥ 0, muy pequeno, este algoritmoes numericamente inestable. Utilizando la relacion λ1λ2 = q, encontrarun algoritmo que es numericamente estable en el sentido de backwardanalysis.

Page 26: 2374131 Una Introduccion Al Analisis Numerico

I.3 Un ejemplo: Calculo de Pi

En las seccion precedente se ha visto que el dispositivo material que efectualos calculos numericos tiene en general dos tipos de numeros: los enterosque se asemejan mucho a los enteros matematicos y el tipo real que esuna representacion del numero real. Tal como se mostro, ambos tipos denumero presentan ciertas particularidades, por ejemplo son en cantidadfinita, para el tipo real existe el redondeo de los numeros. Por consiguientesi se utiliza el tipo real para determinar π, se tendra una precision de8 decimales; para doble precision se obtendra 16 decimales de precision;para cuadruple precision, que algunos lenguajes de programacion cuentan,se obtendra 32 decimales de precision. Por lo tanto, la precision para obtenerπ esta determinada por el lenguaje de programacion y en algunos casos porel tipo de computadora con que se cuenta.

En esta seccion se pretende mostrar que estas limitaciones no constituyennecesariamente un impedimento para determinar un numero, en particularπ, con la precision que se desee.

Una de las maneras mas usuales de determinar π es utilizar el desarrolloen serie de Taylor en el origen de arctanx, el cual esta dado por

arctan x =∞∑

k=0

(−1)k

2k + 1x2k+1. (1.3.1)

De (I.3.1) se deduce, para x = 1, que

π = 4

∞∑

k=0

(−1)k

2k + 1. (I.3.2)

Como se recalco en la seccion I.2, utilizar la serie (I.3.2) no es conveniente,por que la convergencia de esta serie es muy lenta. Utilizando la relacion

tan(α + β) =tanα + tanβ

1− tanα tanβ,

una verificacion inmediata conduce a

π

4= 12 arctan

1

18+ 8 arctan

1

57− 5 arctan

1

239. (I.3.3)

Remplazando (I.3.1) en (I.3.3), da como resultado

Page 27: 2374131 Una Introduccion Al Analisis Numerico

16 I Preliminares

π = 48∞∑

k=0

(−1)k

2k + 1(

1

18)2k+1

︸ ︷︷ ︸A

+ 32

∞∑

k=0

(−1)k

2k + 1(

1

57)2k+1

︸ ︷︷ ︸B

− 20

∞∑

k=0

(−1)k

2k + 1(

1

239)2k+1

︸ ︷︷ ︸C

. (I.3.4)

Ahora bien, se desea obtener una representacion de π en notacion decimalcon N decimales de precision. Si cada serie del lado derecho de (I.3.4) escalculada con una precision de 10−(N+1) se tiene largamente la precisiondeseada. Denotando por A, el valor calculado de A; B, el valor calculado deB y C, el valor calculado de C, se tiene:

A = 48

MA∑

k=0

(−1)k

2k + 1(

1

18)2k+1,

B = 32

MB∑

k=0

(−1)k

2k + 1(

1

57)2k+1,

C = 20

MC∑

k=0

(−1)k

2k + 1(

1

239)2k+1.

De donde:

∣∣∣A−A∣∣∣ = 48

∣∣∣∣∣∞∑

k=MA+1

(−1)k

2k + 1(

1

18)2k+1

∣∣∣∣∣ ≤ 48(1/18)2MA+3

1− (1/18)2,

∣∣∣B −B∣∣∣ = 32

∣∣∣∣∣∞∑

k=MB+1

(−1)k

2k + 1(

1

57)2k+1

∣∣∣∣∣ ≤ 32(1/57)2MB+3

1− (1/57)2,

∣∣∣C − C∣∣∣ = 20

∣∣∣∣∣∞∑

k=MC+1

(−1)k

2k + 1(

1

239)2k+1

∣∣∣∣∣ ≤ 20(1/239)2MC+3

1− (1/239)2.

Por hipotesis, se tiene por ejemplo que∣∣∣A− A

∣∣∣ ≤ 10−(N+1), por lo tanto

para asegurar esta precision es suficiente que

48(1/18)2MA+3

1− (1/18)2≤ 10−(N+1),

remplazando el signo ≤ por =, se tiene

48(1/18)2MA+3

1− (1/18)2= 10−(N+1), (I.3.5)

Page 28: 2374131 Una Introduccion Al Analisis Numerico

I.3 Un ejemplo: Calculo de Pi 17

obteniendo de esta manera

log10(48)− (2MA + 3) log10(18)− log10(1− (1/18)2) = −(N + 1).

Despejando MA, se obtiene

MA =N + 1 + log10(48)− 3 log10(18) + (1/18)2

2 log10(18). (I.3.6)

Del mismo modo se llega a:

MB =N + 1 + log10(32)− 3 log10(57) + (1/57)2

2 log10(57), (I.3.7)

MC =N + 1 + log10(20)− 3 log10(239) + (1/239)2

2 log10(239). (I.3.8)

Una vez determinada la cantidad de terminos en cada serie para calcularA, B y C, es necesario definir una representacion de los numeros reales ysu respectiva aritmetica que permita calcular A, B y C con la precisionrequerida.

Sea b > 1, entonces todo numero positivo x se escribe de manera unicacomo

x =∞∑

k=0

ak1

bk, (I.3.9)

donde 0 ≤ ak < b para k ≥ 1. Suponiendo que b = 10m, para obtener unarepresentacion de x con N decimales de precision, es suficiente conocer ak

para 0 ≤ k ≤ N/m + 2. Se suma 2 a la cota anterior por seguridad. Por lotanto, para todo numero positivo x,el redondeado x con N cifras decimalesde precision puede escribirse como

x =

N/m+2∑

k=0

ak/10mk, (I.3.10)

con 0 ≤ ak < 10m para k ≥ 1. Comparando (I.3.9) con (I.3.10) se tieneque ak = ak para 0 ≤ k ≤ N/m + 1 y |ak − ak| ≤ 1 para k = N/m + 2,deduciendose de esta manera la:

Proposicion I.3.1.- Sea x un numero no negativo y x su representaciondada por (I.3.10), entonces

|x− x| ≤ 10−(N+2m). (I.3.11)

Page 29: 2374131 Una Introduccion Al Analisis Numerico

18 I Preliminares

Con los elementos presentados, se esta en la capacidad de formular unalgoritmo que permita calcular A, B, y C; por razones obvias el algoritmosera el mismo. Por consiguiente, es suficiente dar el metodo que permitacalcular A con la precision requerida. De la formula (I.3.4) se puede observarque las operaciones efectuadas son adiciones o sustracciones, divisiones porexpresiones de la forma (2k+1) y divisiones por 18 o 182. La aritmetica seraconsiguientemente definida en tres pasos o etapas.

El primer paso sera definir la division por un entero p. Sea x un realpositivo, su redondeo se escribe como en (I.3.10), por consiguiente x/qredondeado se escribe

x

q=

N/m+2∑

k=0

bk/10mk, (I.3.12)

donde los bk se los define de manera recursiva, utilizando la divisioneuclidiana, ası:

a0 = b0q + r0,

a1 + r0 · 10m = b1q + r1,

...

aN/m+2 + rN/m+1 · 10m = bN/m+2 + rN/m+2.

(I.3.13)

El segundo paso sera definir la adicion y la sustraccion para dos realespositivos x y y. Si se denota los redondeados por x y y, sus representacionesen punto fijo estan dadas por:

x =

N/m+2∑

k=0

ak/10mk, y =

N/m+2∑

k=0

bk/10mk.

La suma redondeada se escribe por lo tanto

x± y =

N/m+2∑

k=0

ck/10mk, (I.3.14)

donde los ck estan definidos recursivamente, utilizando la division eu-clidiana, por:

cN/m+2 + dN/m+210m = aN/m+2 ± bN/m+2,

cN/m+1 + dN/m+110m = aN/m+1 ± bN/m+1 + dN/m+2,

...

c0 = a0 ± b0 + d1.

(I.3.15)

El tercer paso sera definir la multiplicacion de un real positivo con unentero q. Sea el productovskip-3pt

qx =

N/m+2∑

k=0

bk/10mk, (I.3.16)

Page 30: 2374131 Una Introduccion Al Analisis Numerico

I.3 Un ejemplo: Calculo de Pi 19

donde x esta dado por (I.3.10), los coeficientes bk estan definidos recursiva-mente, utilizando la division euclidiana, de la manera siguiente:

qaN/m+2 = bN/m+2 + dN/m+210m,

qaN/m+1 + dN/m+2 = bN/m+1 + dN/m+110m,

...

b0 = qa0 + d1.

(I.3.17)

Habiendo definido las operaciones requeridas para calcular π con laprecision requerida, se puede definir el algoritmo que calculara A, y porconsiguiente π.

Algoritmo

1.- Se define x := 1/18, a = x, k = 0.2.- Hacer para k = 1 hasta k = MA:

x := x/182,

y := x/(2k + 1),

a; = a + (−1)ky.

3.- a := 48 · a.

Finalmente, se debe hacer un analisis de la propagacion de errores deredondeo, cometidos en el calculo de A, para asegurar que el resultado quede la computadora corresponde con lo esperado. Este estudio se lo efectuaraen tres partes. Sea x2k+1 el resultado realizado por el algoritmo al calcularx2k+1 para x = 1/18. Utilizando la proposicion I.3.1, se tiene,

x = x + ǫ, |ǫ| ≤ 10−N−2m : (I.3.18)

deduciendose inmediatamente:

x3 = (x + ǫ)/182 + η,

x5 = x3/182 + δ,

...

(I.3.19)

Utilizando desigualdades triangulares y considerando series geometricas, seobtiene ∣∣x2k+1 − x2k+1

∣∣ ≤ 1

1− (1/18)210−N−2m. (I.3.20)

La segunda operacion, que aparece en el algoritmo, es la division por losenteros de la forma 2k + 1. Por el mismo procedimiento que antes, se llega a

∣∣∣ x2k+1/(2k + 1)− x2k+1/(2k + 1)∣∣∣ ≤ 2 · 10−N−2m. (I.3.21)

Page 31: 2374131 Una Introduccion Al Analisis Numerico

20 I Preliminares

Por ultimo para obtener A, se tiene una suma de MA + 1 terminos y unproducto por 48. En cada suma se comete un error menor a 2 · 10−N−2m, dedonde se tiene como estimacion del error acumulado

∣∣∣A−A∣∣∣ ≤ 192(MA + 1)10−N−2m (I.3.22)

Ahora bien, si 192(MA +1) es mas pequeno que 102m−1, entonces el objetivoes satisfecho largamente.

Como ilustracion de lo expuesto, se ha calculado π con 10000 decimalesde precision, utilizando una HP-9000.

π con 10000 decimales3.1415926535 8979323846 2643383279 5028841971 6939937510 E-00050

5820974944 5923078164 0628620899 8628034825 3421170679 E-001008214808651 3282306647 0938446095 5058223172 5359408128 E-001504811174502 8410270193 8521105559 6446229489 5493038196 E-002004428810975 6659334461 2847564823 3786783165 2712019091 E-002504564856692 3460348610 4543266482 1339360726 0249141273 E-003007245870066 0631558817 4881520920 9628292540 9171536436 E-003507892590360 0113305305 4882046652 1384146951 9415116094 E-004003305727036 5759591953 0921861173 8193261179 3105118548 E-004500744623799 6274956735 1885752724 8912279381 8301194912 E-005009833673362 4406566430 8602139494 6395224737 1907021798 E-005506094370277 0539217176 2931767523 8467481846 7669405132 E-006000005681271 4526356082 7785771342 7577896091 7363717872 E-006501468440901 2249534301 4654958537 1050792279 6892589235 E-007004201995611 2129021960 8640344181 5981362977 4771309960 E-007505187072113 4999999837 2978049951 0597317328 1609631859 E-008005024459455 3469083026 4252230825 3344685035 2619311881 E-008507101000313 7838752886 5875332083 8142061717 7669147303 E-009005982534904 2875546873 1159562863 8823537875 9375195778 E-009501857780532 1712268066 1300192787 6611195909 2164201989 E-010003809525720 1065485863 2788659361 5338182796 8230301952 E-010500353018529 6899577362 2599413891 2497217752 8347913151 E-011005574857242 4541506959 5082953311 6861727855 8890750983 E-011508175463746 4939319255 0604009277 0167113900 9848824012 E-012008583616035 6370766010 4710181942 9555961989 4676783744 E-012509448255379 7747268471 0404753464 6208046684 2590694912 E-013009331367702 8989152104 7521620569 6602405803 8150193511 E-013502533824300 3558764024 7496473263 9141992726 0426992279 E-014006782354781 6360093417 2164121992 4586315030 2861829745 E-014505570674983 8505494588 5869269956 9092721079 7509302955 E-015003211653449 8720275596 0236480665 4991198818 3479775356 E-015506369807426 5425278625 5181841757 4672890977 7727938000 E-016008164706001 6145249192 1732172147 7235014144 1973568548 E-016501613611573 5255213347 5741849468 4385233239 0739414333 E-017004547762416 8625189835 6948556209 9219222184 2725502542 E-017505688767179 0494601653 4668049886 2723279178 6085784383 E-018008279679766 8145410095 3883786360 9506800642 2512520511 E-018507392984896 0841284886 2694560424 1965285022 2106611863 E-019000674427862 2039194945 0471237137 8696095636 4371917287 E-019504677646575 7396241389 0865832645 9958133904 7802759009 E-020009465764078 9512694683 9835259570 9825822620 5224894077 E-020502671947826 8482601476 9909026401 3639443745 5305068203 E-021004962524517 4939965143 1429809190 6592509372 2169646151 E-021505709858387 4105978859 5977297549 8930161753 9284681382 E-022006868386894 2774155991 8559252459 5395943104 9972524680 E-022508459872736 4469584865 3836736222 6260991246 0805124388 E-023004390451244 1365497627 8079771569 1435997700 1296160894 E-023504169486855 5848406353 4220722258 2848864815 8456028506 E-024000168427394 5226746767 8895252138 5225499546 6672782398 E-024506456596116 3548862305 7745649803 5593634568 1743241125 E-025001507606947 9451096596 0940252288 7971089314 5669136867 E-025502287489405 6010150330 8617928680 9208747609 1782493858 E-026009009714909 6759852613 6554978189 3129784821 6829989487 E-026502265880485 7564014270 4775551323 7964145152 3746234364 E-02700

Page 32: 2374131 Una Introduccion Al Analisis Numerico

I.3 Un ejemplo: Calculo de Pi 21

5428584447 9526586782 1051141354 7357395231 1342716610 E-027502135969536 2314429524 8493718711 0145765403 5902799344 E-028000374200731 0578539062 1983874478 0847848968 3321445713 E-028508687519435 0643021845 3191048481 0053706146 8067491927 E-029008191197939 9520614196 6342875444 0643745123 7181921799 E-029509839101591 9561814675 1426912397 4894090718 6494231961 E-030005679452080 9514655022 5231603881 9301420937 6213785595 E-030506638937787 0830390697 9207734672 2182562599 6615014215 E-031000306803844 7734549202 6054146659 2520149744 2850732518 E-031506660021324 3408819071 0486331734 6496514539 0579626856 E-032001005508106 6587969981 6357473638 4052571459 1028970641 E-032504011097120 6280439039 7595156771 5770042033 7869936007 E-033002305587631 7635942187 3125147120 5329281918 2618612586 E-033507321579198 4148488291 6447060957 5270695722 0917567116 E-034007229109816 9091528017 3506712748 5832228718 3520935396 E-034505725121083 5791513698 8209144421 0067510334 6711031412 E-035006711136990 8658516398 3150197016 5151168517 1437657618 E-035503515565088 4909989859 9823873455 2833163550 7647918535 E-036008932261854 8963213293 3089857064 2046752590 7091548141 E-036506549859461 6371802709 8199430992 4488957571 2828905923 E-037002332609729 9712084433 5732654893 8239119325 9746366730 E-037505836041428 1388303203 8249037589 8524374417 0291327656 E-038001809377344 4030707469 2112019130 2033038019 7621101100 E-038504492932151 6084244485 9637669838 9522868478 3123552658 E-039002131449576 8572624334 4189303968 6426243410 7732269780 E-039502807318915 4411010446 8232527162 0105265227 2111660396 E-040006655730925 4711055785 3763466820 6531098965 2691862056 E-040504769312570 5863566201 8558100729 3606598764 8611791045 E-041003348850346 1136576867 5324944166 8039626579 7877185560 E-041508455296541 2665408530 6143444318 5867697514 5661406800 E-042007002378776 5913440171 2749470420 5622305389 9456131407 E-042501127000407 8547332699 3908145466 4645880797 2708266830 E-043006343285878 5698305235 8089330657 5740679545 7163775254 E-043502021149557 6158140025 0126228594 1302164715 5097925923 E-044000990796547 3761255176 5675135751 7829666454 7791745011 E-044502996148903 0463994713 2962107340 4375189573 5961458901 E-045009389713111 7904297828 5647503203 1986915140 2870808599 E-045500480109412 1472213179 4764777262 2414254854 5403321571 E-046008530614228 8137585043 0633217518 2979866223 7172159160 E-046507716692547 4873898665 4949450114 6540628433 6639379003 E-047009769265672 1463853067 3609657120 9180763832 7166416274 E-047508888007869 2560290228 4721040317 2118608204 1900042296 E-048006171196377 9213375751 1495950156 6049631862 9472654736 E-048504252308177 0367515906 7350235072 8354056704 0386743513 E-049006222247715 8915049530 9844489333 0963408780 7693259939 E-049507805419341 4473774418 4263129860 8099888687 4132604721 E-050005695162396 5864573021 6315981931 9516735381 2974167729 E-050504786724229 2465436680 0980676928 2382806899 6400482435 E-051004037014163 1496589794 0924323789 6907069779 4223625082 E-051502168895738 3798623001 5937764716 5122893578 6015881617 E-052005578297352 3344604281 5126272037 3431465319 7777416031 E-052509906655418 7639792933 4419521541 3418994854 4473456738 E-053003162499341 9131814809 2777710386 3877343177 2075456545 E-053503220777092 1201905166 0962804909 2636019759 8828161332 E-054003166636528 6193266863 3606273567 6303544776 2803504507 E-054507723554710 5859548702 7908143562 4014517180 6246436267 E-055009456127531 8134078330 3362542327 8394497538 2437205835 E-055503114771199 2606381334 6776879695 9703098339 1307710987 E-056000408591337 4641442822 7726346594 7047458784 7787201927 E-056507152807317 6790770715 7213444730 6057007334 9243693113 E-057008350493163 1284042512 1925651798 0694113528 0131470130 E-057504781643788 5185290928 5452011658 3934196562 1349143415 E-058009562586586 5570552690 4965209858 0338507224 2648293972 E-058508584783163 0577775606 8887644624 8246857926 0395352773 E-059004803048029 0058760758 2510474709 1643961362 6760449256 E-059502742042083 2085661190 6254543372 1315359584 5068772460 E-060002901618766 7952406163 4252257719 5429162991 9306455377 E-060509914037340 4328752628 8896399587 9475729174 6426357455 E-061002540790914 5135711136 9410911939 3251910760 2082520261 E-061508798531887 7058429725 9167781314 9699009019 2116971737 E-062002784768472 6860849003 3770242429 1651300500 5168323364 E-062503503895170 2989392233 4517220138 1280696501 1784408745 E-063001960121228 5993716231 3017114448 4640903890 6449544400 E-06350

Page 33: 2374131 Una Introduccion Al Analisis Numerico

22 I Preliminares

6198690754 8516026327 5052983491 8740786680 8818338510 E-064002283345085 0486082503 9302133219 7155184306 3545500766 E-064508282949304 1377655279 3975175461 3953984683 3936383047 E-065004611996653 8581538420 5685338621 8672523340 2830871123 E-065502827892125 0771262946 3229563989 8989358211 6745627010 E-066002183564622 0134967151 8819097303 8119800497 3407239610 E-066503685406643 1939509790 1906996395 5245300545 0580685501 E-067009567302292 1913933918 5680344903 9820595510 0226353536 E-067501920419947 4553859381 0234395544 9597783779 0237421617 E-068002711172364 3435439478 2218185286 2408514006 6604433258 E-068508856986705 4315470696 5747458550 3323233421 0730154594 E-069000516553790 6866273337 9958511562 5784322988 2737231989 E-069508757141595 7811196358 3300594087 3068121602 8764962867 E-070004460477464 9159950549 7374256269 0104903778 1986835938 E-070501465741268 0492564879 8556145372 3478673303 9046883834 E-071003634655379 4986419270 5638729317 4872332083 7601123029 E-071509113679386 2708943879 9362016295 1541337142 4892830722 E-072000126901475 4668476535 7616477379 4675200490 7571555278 E-072501965362132 3926406160 1363581559 0742202020 3187277605 E-073002772190055 6148425551 8792530343 5139844253 2234157623 E-073503610642506 3904975008 6562710953 5919465897 5141310348 E-074002276930624 7435363256 9160781547 8181152843 6679570611 E-074500861533150 4452127473 9245449454 2368288606 1340841486 E-075003776700961 2071512491 4043027253 8607648236 3414334623 E-075505189757664 5216413767 9690314950 1910857598 4423919862 E-076009164219399 4907236234 6468441173 9403265918 4044378051 E-076503338945257 4239950829 6591228508 5558215725 0310712570 E-077001266830240 2929525220 1187267675 6220415420 5161841634 E-077508475651699 9811614101 0029960783 8690929160 3028840026 E-078009104140792 8862150784 2451670908 7000699282 1206604183 E-078507180653556 7252532567 5328612910 4248776182 5829765157 E-079009598470356 2226293486 0034158722 9805349896 5022629174 E-079508788202734 2092222453 3985626476 6914905562 8425039127 E-080005771028402 7998066365 8254889264 8802545661 0172967026 E-080506407655904 2909945681 5065265305 3718294127 0336931378 E-081005178609040 7086671149 6558343434 7693385781 7113864558 E-081507367812301 4587687126 6034891390 9562009939 3610310291 E-082006161528813 8437909904 2317473363 9480457593 1493140529 E-082507634757481 1935670911 0137751721 0080315590 2485309066 E-083009203767192 2033229094 3346768514 2214477379 3937517034 E-083504366199104 0337511173 5471918550 4644902636 5512816228 E-084008244625759 1633303910 7225383742 1821408835 0865739177 E-084501509682887 4782656995 9957449066 1758344137 5223970968 E-085003408005355 9849175417 3818839994 4697486762 6551658276 E-085505848358845 3142775687 9002909517 0283529716 3445621296 E-086004043523117 6006651012 4120065975 5851276178 5838292041 E-086509748442360 8007193045 7618932349 2292796501 9875187212 E-087007267507981 2554709589 0455635792 1221033346 6974992356 E-087503025494780 2490114195 2123828153 0911407907 3860251522 E-088007429958180 7247162591 6685451333 1239480494 7079119153 E-088502673430282 4418604142 6363954800 0448002670 4962482017 E-089009289647669 7583183271 3142517029 6923488962 7668440323 E-089502609275249 6035799646 9256504936 8183609003 2380929345 E-090009588970695 3653494060 3402166544 3755890045 6328822505 E-090504525564056 4482465151 8754711962 1844396582 5337543885 E-091006909411303 1509526179 3780029741 2076651479 3942590298 E-091509695946995 5657612186 5619673378 6236256125 2163208628 E-092006922210327 4889218654 3648022967 8070576561 5144632046 E-092509279068212 0738837781 4233562823 6089632080 6822246801 E-093002248261177 1858963814 0918390367 3672220888 3215137556 E-093500037279839 4004152970 0287830766 7094447456 0134556417 E-094002543709069 7939612257 1429894671 5435784687 8861444581 E-094502314593571 9849225284 7160504922 1242470141 2147805734 E-095005510500801 9086996033 0276347870 8108175450 1193071412 E-095502339086639 3833952942 5786905076 4310063835 1983438934 E-096001596131854 3475464955 6978103829 3097164651 4384070070 E-096507360411237 3599843452 2516105070 2705623526 6012764848 E-097003084076118 3013052793 2054274628 6540360367 4532865105 E-097507065874882 2569815793 6789766974 2205750596 8344086973 E-098005020141020 6723585020 0724522563 2651341055 9240190274 E-098502162484391 4035998953 5394590944 0704691209 1409387001 E-099002645600162 3742880210 9276457931 0657922955 2498872758 E-099504610126483 6999892256 9596881592 0560010165 5256375678 E-10000

Page 34: 2374131 Una Introduccion Al Analisis Numerico

Capıtulo II

Sistemas Lineales

Una gran cantidad de problemas implica la resolucion de sistemas linealesde la forma

Ax = b,

donde

A =

a11 · · · a1n...

...an1 · · · ann

, b =

b1...

bn

con coeficientes reales o complejos. Por esta necesidad es importante la cons-truccion de algoritmos que permitan su resolucion en un tiempo razonable ycon el menor error posible. Cada problema tiene su particularidad, motivopor el cual no existe un metodo general mediante el cual se pueda resolver efi-cazmente todos los problemas. Es verdad que existen metodos casi generales,que con pequenas modificaciones pueden servir para encontrar la solucionde un problema particular. A lo largo de este capıtulo se expondran estosmetodos, dando criterios de estabilidad y estimaciones de error.

En la primera seccion se tratara la condicion del problema lineal, paraeste efecto sera necesario introducir elementos de la teorıa de normas enlas matrices, para luego introducir las nociones relativas a la condicion delproblema lineal.

En la segunda seccion se abordara los metodos de resolucion como son:el Algoritmo de Eliminacion de Gauss, la Descomposicion de Cholesky yalgunas modificaciones de estos metodos. En esta seccion se estudiara laimplementacion de tales metodos, como tambien la estabilidad de estos.

La tercera seccion tratara, la teorıa e implementacion de los metodos ite-rativos lineales como: Jacobi, Gauss-Seidel y SOR. Ası mismo se analizaranalgunos problemas tipos y se haran comparaciones de tales metodos.

En la cuarta seccion, se vera los metodos de tipo gradiente cuyo enfoquees diferente a los metodos de las dos secciones precedentes, en efecto, sonmetodos que encuentran la solucion a partir de problemas de minimizacion.Se resolveran ejemplos tipos y se comparara la eficiencia de estos con otrosmetodos.

Page 35: 2374131 Una Introduccion Al Analisis Numerico

24 II Sistemas Lineales

La ultima seccion describira el Metodo de los Mınimos Cuadrados, comouna generalizacion de lo anteriormente expuesto, introduciendo como coro-lario la nocion de Pseudo-Inversa. Ası mismo se analizara la implementaciondel metodo QR, incluyendo una estimacion del error de tal metodo.

Page 36: 2374131 Una Introduccion Al Analisis Numerico

II.1 Condicion del Problema lineal

Normas de Vectores y Matrices

La nocion de norma y espacio normado es un instrumento matematico muyutil en el estudio de las magnitudes que se manipulan, como tambien uninstrumento en el estudio de la convergencia y los lımites. Se empezaradefiniendo el concepto de norma en espacios Rn, para luego definir en elalgebra de las matrices a coeficientes reales.

Definicion II.1.1.- Una norma sobre Rn es una aplicacion

‖ ‖ : Rn −→ R,

con las siguientes propiedades:

‖x‖ ≥ 0, ‖x‖ = 0 ⇐⇒ x = 0;i)

‖αx‖ = |α| ‖x‖ , donde α ∈ R;ii)

‖x + y‖ =≤ ‖x‖+ ‖y‖ .iii)

La primera condicion implica que una norma siempre es positiva y esnula siempre y cuando el vector sea el vector nulo. La segunda propiedad esla homogeneidad de la norma y la tercera condicion es mas conocida comodesigualdad del triangulo. Las normas mas usuales en Rn son las siguientes:

‖x‖1 =n∑

i=1

|xi| , norma ciudad-bloque;

‖x‖2 =

(n∑

i=1

|xi|2) 1

2

, norma euclidiana;

‖x‖p =

(n∑

i=1

|xi|2) 1

p

, p > 1;

‖x‖∞ = maxi=1,...,n

|xi| , norma de la convergencia uniforme.

Estas normas, que son las usualmente utilizadas, tienen algunas propiedadesen comun. La mas importante es que, si se aumenta en valor absoluto unade las componentes, la norma se incrementa. Es necesario formalizar estehecho, motivo por el cual, se tiene la:

Page 37: 2374131 Una Introduccion Al Analisis Numerico

26 II Sistemas Lineales

Definicion II.1.2.- Si x = (x1, . . . , xn) ∈ Rn, se define el valor absoluto dex como |x| = (|x1| , . . . , |xn|). Se dice que |x| ≤ |y|, si |xi| ≤ |yi| para todoi = 1, . . . , n. Una norma ‖ ‖ sobre Rn se dice que es:

(a) Monotona, si |x| ≤ |y| implica que ‖x‖ ≤ ‖y‖ para todox, y ∈ Rn.

(b) Absoluta, si ‖x‖ = ‖|x|‖ para todo x ∈ Rn.

Proposicion II.1.3.- Una norma ‖ ‖ sobre Rn es monotona, si y solamentesi es absoluta.

Demostracion.- Si la norma ‖ ‖ es monotona, sea x ∈ Rn, llamenos y = |x|.Como |x| ≤ |y|, y |y| ≤ |x| se tiene inmediatamente, porque la norma esmonotona, que ‖x‖ = ‖y‖.

Si la norma‖ ‖ es absoluta, sea x ∈ Rn, consideresex = (x1, . . . , xk−1, αxk, xk+1, . . . , xn), con α ∈ [0, 1]. Utilizando el hechoque la norma sea absoluta, desigualdad del triangulo y efectuando calculosalgebraicos se tiene:

‖x‖ =

∥∥∥∥1

2(1− α)(x1, . . . , xk−1,−xk, xk+1, . . . , xn) +

1

2(1− α)x + αx

∥∥∥∥

≤ 1

2(1− α) ‖(x1, . . . , xk−1,−xk, xk+1, . . . , xn)‖+

1

2(1− α) ‖x‖+ αx

=1

2(1− α) ‖x‖+

1

2(1− α) ‖x‖+ α ‖x‖ = ‖x‖ .

Ahora bien, si x = (x1, . . . , xk, . . . , xn) y y = (x1, . . . , xk1, yk, xk+1, . . . , xn),

con |yk| ≥ |xk|, utilizando la desigualdad anterior se tiene ‖x‖ ≤ ‖y‖. Parademostrar que |x| ≤ |y| implica que ‖x‖ ≤ ‖y‖, se repite el anterior paso nveces, es decir una vez por cada componente.

Una matriz de orden m×n puede ser vista como un vector que perteneceal espacio Rmn, de esta manera definir la norma de una matriz como la deun vector, pero se perderıa ası muchas de las propiedades que tiene unaaplicacion lineal. Es por eso la:

Definicion II.1.4.- Sea A una matriz de m× n, se define su norma como

‖A‖ = supx6=0

‖Ax‖‖x‖ = sup

‖x‖=1

‖Ax‖ . (II.1.1)

La definicion de la norma de una matriz depende evidentemente de lasnormas elegidas para ‖x‖ y ‖Ax‖. Sin embargo puede ser verificado sinningun problema, que la norma de una matriz, verifica las condiciones denorma de un vector. La demostracion es una simple verificacion de estascondiciones, utilizando la definicion de supremo. Ademas si las norma de losespacios Rn y Rm son monotonas o absolutas, es facil verificar que la norma

Page 38: 2374131 Una Introduccion Al Analisis Numerico

II.1 Condicion del Problema lineal 27

de matriz inducida por estas, es todavıa monotona; es suficiente utilizarla definicion para probar esta afirmacion. Por otro lado ‖A‖ es el numeropositivo mas pequeno α que satisface ‖Ax‖ ≤ α ‖x‖, por lo tanto

‖Ax‖ ≤ ‖A‖ ‖x‖ , ∀x ∈ Rn. (II.1.2)

Una norma sobre el espacio de matrices verifica las siguientes propiedades,dada por la:

Proposicion II.1.5.- Cualquier norma sobre el espacio de las matricesMm(R) satisface las propiedades adicionales siguientes:

‖I‖ = 1, (II.1.3)

‖AB‖ ≤ ‖A‖ ‖B‖ . (II.1.4)

Demostracion.- La relacion (II.1.3) de la proposicion es consecuenciainmediata de la definicion de la norma de una matriz.La relacion (II.1.4) es consecuencia de las observaciones hechas despues dela definicion, en efecto

‖ABx‖ ≤ ‖A‖ ‖Bx‖ ≤ ‖A‖ ‖B‖ ‖x‖ ,

‖ABx‖‖x‖ ≤ ‖A‖ ‖B‖ ,

‖AB‖ ≤ ‖A‖ ‖B‖ .

Se ha dado las propiedades esenciales de la norma de matrices, pero esnecesario conocer algunas de estas por su utilizacion frecuente. Utilizandola misma notacion que en las normas de los vectores definidas al inicio dela seccion, se puede utilizar la misma notacion en los ındices de las normasde las matrices, con la convencion que las normas de los vectores tienen losmismos ındices.

Teorema II.1.6.- Sea A una matriz de n×m, entonces:

‖A‖1 = maxj=1,...,m

n∑

i=1

|aij | , (II.1.5)

‖A‖2 =√

valor propio mas grande de AtA, (II.1.6)

‖A‖∞ = maxi=1,...,n

m∑

j=1

|aij | . (II.1.7)

Page 39: 2374131 Una Introduccion Al Analisis Numerico

28 II Sistemas Lineales

Demostracion.- Se comenzara por ‖A‖1, se tiene:

‖Ax‖1 =n∑

i=1

∣∣∣∣∣∣

m∑

j=1

aijxj

∣∣∣∣∣∣≤

n∑

i=1

m∑

j=1

|aij | |xj |

≤m∑

j=1

(n∑

i=1

|aij |)|xj | ≤

(max

j=1,...,m

n∑

i=1

|aij |)‖x‖1 ,

por lo tanto ‖A‖1 ≤ maxj=1,...,m

n∑

i=1

|aij | .

Se mostrara, que la igualdad se cumple, en efecto, sea jo tal que:n∑

i=1

|aijo| = max

j=1,...,m

n∑

i=1

|aij | ; y x tal que xjo= 1, xi = 0 si i 6= jo;

de esta manera ‖Ax‖ =

∥∥∥∥∥∥∥

a1jo

...amjo

∥∥∥∥∥∥∥1

=

n∑

i=1

|aijo| ‖x‖1 .

Para la ‖ ‖2 se tiene:

‖Ax‖22 = 〈Ax, Ax〉 = xtAtAx,

ahora bien AtA es una matriz simetrica definida positiva, de donde losvalores propios son reales no negativos, ademas es posible formar una base devectores propios ortonormales. Sea e1, . . . , em una base de vectores propios

ortonormales, entonces x =

m∑

i=1

αiei y Ax =

m∑

i=1

λiαiei, donde los λi ≥ 0 son

los valores propios de A. Por lo tanto, se tiene

‖Ax‖22 =

m∑

i=1

λ2i α

2i ≤ max

i=1,...,mλi

m∑

i=1

α2i = max

i=1,...,mλi ‖x‖2 .

Para obtener la igualdad, es suficiente tomar x = ejo, donde λjo

es elautovalor mas grande.

Para la ‖ ‖∞ se tiene:

‖Ax‖∞ = maxi=1,...,n

∣∣∣∣∣∣

m∑

j=1

aijxj

∣∣∣∣∣∣≤ max

i=1,...,n

m∑

j=1

|aij | |xj |

≤ maxi=1...,n

m∑

j=1

|aij | maxj=1,...,m

|xj |

max

i=1,...,n

m∑

j=1

|aij |

‖x‖∞ ,

ası ‖A‖∞ ≤ maxj=1,...,m

m∑

j=1

|aij | .

Page 40: 2374131 Una Introduccion Al Analisis Numerico

II.1 Condicion del Problema lineal 29

Para obtener la igualdad es suficiente tomar x = 1, donde 1 = (1, . . . , 1)t.

La Condicion de una Matriz

La resolucion de un sistema lineal de ecuaciones debe hacer meditar sobremuchos aspectos relacionados, como ser la existencia de la solucion, si elproblema a resolver esta bien condicionado, conocer una estimacion del errorcometido en la solucion numerica, etc. Se tiene inicialmente el sistema deecuaciones

Ax = b, donde A ∈Mn(R), y b ∈ Rn; (II.1.8)

el problema es encontrar x ∈ R que sea solucion del sistema (II.1.8), estasituacion puede escribirse formalmente como

P(A, b) = x.

De esta manera la condicion del problema esta dada por

∣∣P(A, b)− P(A, b)∣∣

|P(A, b)| ≤ cond · eps, (II.1.9)

donde:

aij = aij(1 + ǫij), |ǫij | ≤ eps; (II.1.10)

bi = bi(1 + ǫi), |ǫi| ≤ eps. (II.1.10′)

Si se plantea P(A, b) = x, se tiene‖x− x‖‖x‖ ≤ cond · eps. Por otro lado,

considerando que solamente normas mononotas son utilizadas, se tiene:

∥∥∥∥∥∥

a11ǫ11 · · · a1nǫn1...

......

an1ǫn1 · · · annǫnn

∥∥∥∥∥∥≤ eps ‖A‖ ,

de esta manera

∥∥A−A∥∥ ≤ eps ‖A‖ y

∥∥b− b∥∥ ≤ eps ‖b‖ . (II.1.11)

Suponiendo que la matriz sea inversible, se puede enunciar el siguienteteorema, pero antes una definicion es necesaria.

Definicion II.1.7.- La condicion de una matriz A inversible se define como

cond(A) = ‖A‖∥∥A−1

∥∥ . (II.1.12)

Page 41: 2374131 Una Introduccion Al Analisis Numerico

30 II Sistemas Lineales

Teorema II.1.8.- Sea A una matriz con detA 6= 0, supongase que∥∥A−A∥∥ ≤ ‖A‖ ǫA,

∥∥b− b∥∥ ≤ ‖b‖ ǫb. Si ǫAcond(A) < 1, entonces

‖x− x‖‖x‖ ≤ cond(A)

1− ǫAcond(A)(ǫA + ǫb). (II.1.13)

Si ademas se tiene ǫAcond(A) < 12 , entonces la condicion del problema

resolver Ax = b es ≤ 2cond(A).

Demostracion.- Se tiene Ax = b y Ax = b, de donde:

Ax− Ax = b− b y Ax−Ax + Ax− Ax = b− b,

A(x− x) = (A−A)x + (b− b), x− x = A−1(A−A)x + A−1(b− b),

introduciendo las desigualdades en las normas se obtiene:

‖x− x‖ ≤∥∥A−1

∥∥∥∥A−A∥∥ ‖x‖+

∥∥A−1∥∥∥∥b− b

∥∥

≤∥∥A−1

∥∥ (‖A‖ ǫA (‖x‖+ ‖x− x‖) + ‖b‖ ǫb)

≤∥∥A−1

∥∥ ‖A‖ (ǫA (‖x‖+ ‖x− x‖) + ‖x‖ ǫb) ,

de esta manera‖x− x‖‖x‖ ≤ cond(A)

1− ǫAcond(A)(ǫA + ǫb).

Como la condicion del problema lineal esta ıntimamente ligada a lacondicion de la matriz, es importante conocer algunas de sus propiedades,dadas por la:

Proposicion II.1.9.- La condicion de una matriz satisface las siguientespropiedades:

cond(A) ≥ 1; (II.1.14)

cond(I) = 1; (II.1.15)

cond(αA) = cond(A), α ∈ R. (II.1.16)

Demostracion.- Verificacion inmediata.

Ejemplos1.- Q ortogonal, es decir QtQ = I, la condicion respecto a la norma ‖ ‖2

esta dada porcond2(Q) = 1. (II.1.17)

2.- Sea la matriz A dada por

A =1

h

4 1 0 · · · 01 4 1 · · · 0...

. . .. . .

......

... · · · 1 4 1· · · · · · 1 4

,

Page 42: 2374131 Una Introduccion Al Analisis Numerico

II.1 Condicion del Problema lineal 31

entonces ‖A‖∞ = 6

h, ademas A = 4

h(I + N) donde

N =

0 14 0 · · · 0

14 0 1

4 · · · 0

.... . .

. . . · · ·...

0 · · · 0 14 0

, ‖N‖∞ =

1

2< 1.

Se deduce que

A−1 =h

4(I + N)−1 =

h

4(I −N + N2 −N3 + · · ·),

∥∥A−1∥∥∞≤ h

4(1 + ‖N‖+

∥∥N2∥∥+ · · ·)

≤ h

4

(1

1− ‖N‖

)

≤ h

2,

entonces cond∞(A) ≤ 3, por lo tanto, la matriz es bien condicionada.

3.- El siguiente ejemplo muestra la existencia de una matriz mal condi-cionada.Sea H la matriz de n× n, llamada matriz de Hilbert, definida por

hij =1

i + j − 1, i, j = 1, . . . , n.

H es una matriz simetrica definida positiva, motivo por el cual lacondicion respecto a la norma euclidiana esta dada por

cond2H =λmaxλmin

,

donde los λ son valores propios de H. Se puede mostrar que

cond2H ∼ cen. (II.1.18)

Se puede observar claramente que las matrices de Hilbert son malcondicionadas, inclusive para n bastante pequeno.

4.- Finalmente, este ejemplo muestra la existencia de otra matriz malcondicionada, como ser las matrices de Vandermonde. Sea V la matrizde n× n definida por

V =

1 1 · · · 1c1 c2 · · · cn...

... · · ·...

cn−11 cn−1

2 · · · cn−1n

,

Page 43: 2374131 Una Introduccion Al Analisis Numerico

32 II Sistemas Lineales

donde los ci son diferentes. Se puede mostrar que la cond2V ∼ bn,donde b > 1.

Ahora bien, la estimacion ‖x−x‖

‖x‖ ≤ 2cond(A)eps puede ser demasiada

pesimista, para ver esto, considerese el siguiente ejemplo,(

1 10 108

)(xy

)=

(21

).

Si se llama A a la matriz del sistema, se tiene ‖A‖2 = 108 y∥∥A−1

∥∥ ≈ 1. Elsistema con los errores de redondeo incorporados, esta dado por:

(1 + ǫ1 1 + ǫ2

0 108(1 + ǫ3)

)=

(xy

)= ( 2(1 + ǫ4) 1 + ǫ5 ) ,

y = 108 1 + ǫ51 + ǫ3

≃ 10−8(1 + ǫ5 − ǫ3),

de donde|y − y||y| ≤ 2eps.

Calculando x, se tiene

x =2(1 + ǫ4)− (1 + ǫ2)y

1 + ǫ1

=2− 10−8 + 2ǫ4 − 10−8(ǫ2 + ǫ5 − ǫ3)

1 + ǫ1

=x + 2ǫ1 − 10−8(ǫ2 + ǫ5 − ǫ3)

1 + ǫ1

≃ x(1 + 4eps),

por lo tanto,|x− x||x| ≤ 4eps.

El problema es bien condicionado, aunque la matriz A tenga una grancondicion. Si se multiplica el sistema de ecuaciones por una matriz diagonalD se obtiene, el nuevo problema dado por

DAx = Db,

por el teorema II.1.8, se tiene

‖x− x‖‖x‖ ≤ 2cond(DA)eps, si cond(DA)eps <

1

2.

En el ejemplo anterior, se plantea

D =

(1 00 10−8

), ası DA =

(1 10 1

),

Page 44: 2374131 Una Introduccion Al Analisis Numerico

II.1 Condicion del Problema lineal 33

obteniendo el:

Corolario II.1.10.- Con las misma hipotesis del teorema II.1.8, y ademassi cond(DA)eps < 1

2 , se tiene

La condicion del problema ≤ 2 infD diagonal

cond(DA). (II.1.19)

Ejercicios

1.- a) Sea ‖ ‖ definida en Rn. La bola unitaria cerrada se define como

B =x ∈ Rn

∣∣ ‖x‖ ≤ 1

,

mostrar que la bola unitaria es un conjunto convexo.

b) SeaD un conjunto convexo acotado, en cuyo interior esta 0. Si se suponeque D es equilibrado, es decir si x ∈ D implica que −x ∈ D. Mostrar quese puede definir una norma cuya bola unitaria cerrada sea precisamenteD.

2.- ¿Es la funcion f(x) = |x1 − x2| + |x2| una norma sobre R2? Si lo es, ¿esmonotona? Dibujar la bola unitaria.

3.- Dar las condiciones para que una norma sea monotona, observando subola unitaria cerrada.

4.- Para una matriz A se define la norma de Frobenius como

‖A‖F =

√√√√n∑

i=1

n∑

j=1

|aij |2.

a) Mostrar que ‖A‖F es una norma sobre Rn·n.

b) Verificar la desigualdad

‖A‖2 ≤ ‖A‖F ≤√

n ‖A‖2 .

5.- Verificar la desigualdad

maxi,j|aij | ≤ ‖A‖2 ≤ n. max

i,j|aij | .

6.- Sea A una matriz con detA 6= 0. Mostrar que

∥∥A−1∥∥ =

(min‖x‖=1

‖Ax‖)

.

Page 45: 2374131 Una Introduccion Al Analisis Numerico

34 II Sistemas Lineales

7.- Sea R una matriz triangular inversible. Mostrar que:

|rii| ≤ ‖R‖p , |rii|−1 ≤∥∥R−1

∥∥p; para p = 1, 2,∞.

Deducir que

condp(R) ≥ maxi,k

|rii||rkk|

.

8.- Sea

A =

2(

1

h0+ 1

h1

)0 · · · · · · 0

1

h12(

1

h1+ 1

h2

)1

h2· · · 0

0. . .

. . .. . .

...0 · · · 0 1

hn−22(

1

hn−2+ 1

hn−1

)

la matriz, que se encuentra en la interpolacion spline. Mostrar:

a) cond∞(A) puede ser arbitrariamente grande.(Si max hi/ min hi −→∞).

b) Existe una matriz diagonal D tal que cond∞(DA) ≤ 3.

Page 46: 2374131 Una Introduccion Al Analisis Numerico

II.2 Metodos Directos

En esta seccion se desarrollara los algoritmos de resolucion directa desistemas lineales mas comunes en la actualidad. El problema a resolver es

Ax = b, (II.2.1)

donde A ∈ Mn(R), x, b ∈ Rn. Por los resultados obtenidos en la teorıa delAlgebra Lineal, este sistema de ecuaciones lineales tiene una sola solucion,si y solamente si det A 6= 0. Para mostrar la importancia de contar conalgoritmos cuyo costo en operaciones sea mınimo, vale la pena dar el siguienteejemplo de resolucion de este sistema de ecuaciones lineales. El ejemploconsiste en la utilizacion de la regla de Cramer, que en si misma constituyeuno de los resultados teoricos mas hermosos que se ha obtenido. Para ilustrarel metodo de Cramer, se debe hacer algunas convenciones sobre la notacion.Para comenzar una matriz A de n× n se puede escribir como

A = (A1, . . . , An)

donde Ai es la i-esima columna de la matriz A. Dada una matriz A y unvector b ∈ Rn, se denota por

A(j) = (A1, . . . , Aj−1, b, Aj+1, . . . , An,

la matriz obtenida remplazando la j-esima columna por el vector b. Ahorabien, la solucion del sistema (II.2.1) esta dada por

xi =detA(i)

detA,

donde x = (x1, . . . , xn). Por lo tanto, la resolucion del sistema implica elcalculo de n+1 determinantes. Si para encontrar el valor de los determinantesse utiliza la siguiente relacion

σ∈Sn

signo(σ)n∏

i=1

aiσ(i),

donde Sn es el grupo de permutaciones de n elementos, se debe efectuar n!sumas. Si se desea resolver un sistema de 69 ecuaciones con el mismo numerode incognitas, suponiendo que cada suma se efectua en 10−9 segundos,se tardarıa aproximadamente 6.75 × 1049 anos en llegar a la solucion del

Page 47: 2374131 Una Introduccion Al Analisis Numerico

36 II Sistemas Lineales

problema. Como conclusion se puede decir que existen metodos cuyo valorteorico es importante, pero su ejecucion numerica es desastrosa, razon porla cual es imprescindible implementar algoritmos cuyo costo no sea muyelevado.

El Algoritmo de Gauss

Uno de los algoritmos mas utilizados, precisamente por su relativo bajocosto, es el Algoritmo de Eliminacion de Gauss. Considerese el sistema deecuaciones dado por

a11x1 + a12x2 + · · · +a1nxn = b1

a21x1 + a22x2 + · · · +a2nxn = b2...

...an1x1 + an2x2 + · · · +annxn = bn

.

El Algoritmo de Gauss consiste en:

Primer paso Si a11 6= 0, li1 = ai1a11

, para i = 2, . . . , n.Se calcula lineai − li1 ∗ linea1, para i = 2, . . . , n.Si a11 = 0 se intercambia lineas.

Obteniendose el sistema equivalente dado por

a11x1 + a12x2 + · · · + a1nxn = b1

a(1)22 x2 + · · · + a

(1)2n xn = b

(1)2

......

a(1)n2 x2 + · · · + a

(1)nnxn = b

(1)n

.

Paso 2 Si a(1)22 6= 0, li1 =

a(1)i2

a(1)22

, para i = 3, . . . , n.

Se calcula lineai − li2 ∗ linea2, para i = 3, . . . , n.Si a22 = 0 se intercambia lineas.

Se repite el procedimiento hasta obtener un sistema triangular de ecuacionescomo el siguiente

r11x1 + · · · + r1,n−1xn−1 + r1nxn = c1

......

rn−1,n−1xn−1 + rn−1,nxn = cn−1

rnnxn = cn

.

Page 48: 2374131 Una Introduccion Al Analisis Numerico

II.2 Metodos Directos 37

De donde se tiene:

xn =cn

rnn,

xn−1 =cn−1 − rn−1,nxn

rn1,n−1,

...

x1 =c1 − r12x2 − · · · − r1nxn

r11.

(II.2.2)

Si se utiliza la notacion matricial, se obtiene el siguiente esquema delalgoritmo de Gauss, con las matrices aumentadas:

(A, b)

∗ ∗ ∗ · · · ∗∗ ∗ ∗ · · · ∗

...∗ ∗ ∗ · · · ∗∗ ∗ ∗ · · · ∗

(A(1), b(1)

)

∗ ∗ ∗ · · · ∗0 ∗ ∗ · · · ∗

...0 ∗ ∗ · · · ∗0 ∗ ∗ · · · ∗

(A(2), b(2)

)

∗ ∗ ∗ · · · ∗0 ∗ ∗ · · · ∗0 0 ∗ · · · ∗...

...0 0 ∗ · · · ∗

· · · −→

(A(n−1), b(n−1)

)

∗ ∗ ∗ · · · ∗0 ∗ ∗ · · · ∗0 0 ∗ · · · ∗...

.... . .

. . .

0 0 · · · 0 ∗

.

Teorema II.2.1.- Sea detA 6= 0. El algoritmo de Gauss da la descom-posicion siguiente:

PA = LR, (II.2.3)

donde:

R =

r11 · · · r1n

. . ....

0 rnn

, L =

1 0l21 1...

. . .

ln1 ln2 · · · 1

, (II.2.4)

y P es una matriz de permutacion.

Demostracion.- Supongase, que las permutaciones necesarias han sidoefectuadas al principio, es decir se aplica el Algoritmo de Gauss a la matriz

Page 49: 2374131 Una Introduccion Al Analisis Numerico

38 II Sistemas Lineales

PA. Para no complicar la notacion se escribe A, en vez de PA. Utilizandoel mismo esquema dado mas arriba, se obtiene:

A −→ A(1) −→ · · · −→ A(n−1) = R,

donde:

A(1) =

1 0 0 · · · 0−l21 1 0 · · · 0−l31 0 1 0 · · · 0

......

. . .. . .

−ln1 0 · · · 0 1

= L1A,

A(2) =

1 0 0 · · · 00 1 0 · · · 00 −l32 1 0 · · · 0...

.... . .

0 −ln2 0 · · · 1

= L2A,

por lo tanto

R = Ln−1Ln−2 · · ·L2L1A.

Lo unico que falta mostrar, es que

L−1 = Ln−1Ln−2 · · ·L2L1,

y para eso, se tiene:

Li = I − Vi, donde Vi =

0 00

. . .

0li+1,i 0

......

. . .

lni 0 · · · 0

.

Se puede verificar facilmente que ViVj = 0 para i = 1, . . . , n, de donde seobtiene finalemente:

L−1i = I + Vi,

L = I + V1 + V2 + · · ·+ Vn−1.

Muchas veces, es necesario calcular sistemas de la forma:

Ax1 = b1,

Ax2 = b2.(II.2.5)

Page 50: 2374131 Una Introduccion Al Analisis Numerico

II.2 Metodos Directos 39

Se calcula una vez la descomposicion LR y se resuelve de la manera siguiente:

Ly = b,

Rx = y.(II.2.6)

Teorema II.2.2.- La descomposicion LR da el siguiente resultado,

detA = ±r11r22 · · · rnn, (II.2.7)

donde los rii son coeficientes de la diagonal de R.

Demostracion.- Utilizando identidades en los determinantes se tiene

detP detA = detL detR.

El costo de la descomposicion LR.

Para evaluar cuantas operaciones son necesarias para llegar a la descom-posicion LR de una matriz A ∈Mn(R), se procede de la manera siguiente:

A −→ A(1)

Calculo de los li1: n− 1 divisionesPara cada fila i, es necesario efectuarn−1 multiplicaciones mas adiciones, loque hace un total de (n− 1)2 multipli-caciones y adiciones.

Por lo tanto, contando el numero de operaciones en cada etapa del algoritmo,se tiene

# operaciones ≈ (n− 1)2 + (n− 2)2 + · · ·+ 22 + 12

=

n−1∑

i=1

i2

≈∫ n

0

x2dx

=n3

3. (II.2.8)

La resolucion de LRx = b, implica aproximadamente n2

2 multiplicacionesmas adiciones en la solucion de Ly = b. Igual numero de operaciones setiene para la resolucion de Rx = y, lo que hace un total aproximado de n2

operaciones.

Page 51: 2374131 Una Introduccion Al Analisis Numerico

40 II Sistemas Lineales

La eleccion del pivote

Definicion II.2.3.- Sea A una matriz, se llama pivote de la matriz A alcoeficiente a11.

Para ilustrar la necesidad en elegir un buen pivote, considerese elsiguiente ejemplo. La precision de los calculos tienen tres cifras significativasen base 10. Sea el sistema de ecuaciones dado por

10−4x1 + x2 = 1

x1 + x2 = 2. (II.2.9)

La solucion exacta de este sistema de ecuaciones esta dada por:

x1 = 1, 000100010001000 · · · ,x2 = 0, 999899989998999 · · · . (II.2.10)

Ahora bien, aplicando el algoritmo de Gauss con 10−4 como pivote, se tiene:

l21 =a21

a11= 0, 100 · 105,

La segunda linea del sistema se convierte en

−0, 100 · 105x2 = −0, 100 · 105,

de donde

x2 = 0, 100 · 101,

resolviendo x1 se tiene

0, 100 · 10−3x1 = 0, 100 · 101 − 0, 100 · 101,

por lo tanto

x1 = 0. (II.2.11)

Ahora, aplıquese el algoritmo de Gauss con 1 como pivote, es decir inter-cambiando la primera ecuacion con la segunda, se tiene:

l21 =a21

a11= 0, 100 · 10−5,

La segunda linea del sistema se convierte en

−0, 100 · 101x2 = 0, 100 · 101,

de donde

x2 = 0, 100 · 101,

resolviendo x1, se tiene

0, 100 · 101x1 = 0, 200 · 101 − 0, 100 · 101,

por lo tanto

x1 = 0.100 · 101. (II.2.12)

Page 52: 2374131 Una Introduccion Al Analisis Numerico

II.2 Metodos Directos 41

La explicacion de este fenomeno consiste en que la sustraccion esuna operacion mal condicionada, cuando las cantidades a restar son muyparecidas; en efecto, considerese el siguiente sistema

a11x1 + a12x2 = b1

a21x1 + a22x2 = b2, (II.2.13)

al aplicar el algoritmo de Gauss se obtiene:

l21 =a21

a11

a(1)22 = a22 − l21a12,

b(1)2 = b2 − l21b1,

a(1)22 x2 = b

(1)2 .

Si |l21| ≫ 1 se tiene:

a(1)22 ≈ −l21a12, b

(1)2 ≈ −l21b1,

x2 ≈b1

a12,

x1 =1

a11(b1 − a12x2) ≈

1

a11(b1 − b1) .

Para solucionar este problema, se realiza una busqueda de pivote parcial,que consiste en:

Se escoge el pivote ai1 tal que

|ai1| ≥ |aj1| j = 1, . . . , n.

Se procede de la misma manera para cada paso del algoritmode Gauss.

La Estabilidad del Algoritmo de Gauss

Sea A una matriz cuyo determinante es diferente de 0. Se desea saber cual esel error cometido por el algoritmo de Gauss para encontrar la descomposicionA = LR. No se considera las permutaciones, puesto que no se comete errorde redondeo.

Si se aplica el algoritmo de Gauss, se obtiene las matrices L y R, llamese

A = LR, la descomposicion exacta de A.

Para saber, si el algoritmo es numericamente estable, se utiliza la nocion debaackward analysis dada en capıtulo I. Es decir encontrar una constante queverifique:

|aij − aij ||aij |

≤ C · eps. (II.2.14)

Page 53: 2374131 Una Introduccion Al Analisis Numerico

42 II Sistemas Lineales

Por consiguiente, es necesario estimar la diferencia∣∣∣A− A

∣∣∣ elemento por

elemento. Se tiene el siguiente:

Teorema II.2.4.- Wilkinson. Sea detA 6= 0; L, R el resultado numerico dela descomposicion LR con busqueda de pivote |lij | ≤ 1. Entonces

∣∣∣A− LR∣∣∣ ≤ 2a eps

0 0 · · · 01 1 · · · 11 2 · · · 21 2 3 · · · 3...

......

1 2 3 · · · n− 1

, (II.2.15)

donde a = maxi,j,k

∣∣∣a(k)ij

∣∣∣ y

A(0) −→ A(1) −→ · · · −→ A(n−1).

Como resultado de este teorema, el algoritmo de Gauss es numericamenteestable, siempre y cuando n no sea demasiado grande. La experiencianumerica indica que es aconsejable utilizar la descomposicion de Gauss parasistemas no mayores a 1000 ecuaciones.

Demostracion.- Al efectuar la descomposicion LR, considerando los erroresde redondeo, se tiene el siguiente esquema:

A(0) −→ A(1) −→ · · · −→ A(n−1) = R

Sin considerar los errores de redondeo se tiene L1A = A(1), de donde

L1 =

1−l21 1−l31 0 1

......

−ln1 0 1

, es la matriz L1 con los errores deredondeo.

Por otro lado, se tieneL = L−1

1 L−12 · · ·L−1

n−1,

obteniendo

A− LR =L−11

(L1A− A(1)

)+ L−1

1 L−12

(L2A

(1) − A(2))

+ · · ·(L−1

1 L−12 · · ·L−1

n−1

)(Ln−1A

(n−2) − A(n−1))

.

Page 54: 2374131 Una Introduccion Al Analisis Numerico

II.2 Metodos Directos 43

Ahora bien, los coeficientes de la matriz obtenida en el primer paso, estandadas por

a(1)ij =

(aij − li1a1j(1 + ǫ1)

)(1 + ǫ2), i ≥ 1,

que da como consecuencia(L1A− A(1)

)ij

=li1a1j − aij

=li1a1j −(aij − li1a1j(1 + ǫ1)

)(1 + ǫ2)

=− aijǫ2 + li1a1jǫ2 + li1a1jǫ1 + li1a1jǫ1ǫ2

=− a(1)ij ǫ2 + li1a1jǫ1 + li1a1jǫ1ǫ2,

obteniendo ası:∣∣∣L1A− A(1)

∣∣∣ ≤ 2a eps donde a = maxi,j,k

∣∣∣a(k)ij

∣∣∣ , i ≥ 2.

Bajo forma matricial, el resultado anterior esta dado por

∣∣∣L1A− A(1)∣∣∣ ≤ 2a eps

0 · · · 01 · · · 1...

...1 · · · 1

.

Continuando con el mismo procedimiento en la demostracion, se obtiene

∣∣∣L2A(1) − A(2)

∣∣∣ ≤ 2a eps

0 0 · · · 00 0 · · · 00 1 · · · 1...

......

0 1 · · · 1

,

resultados similares tambien se obtienen para los demas pasos del algoritmode Gauss con lo que se obtiene le resultado deseado.

El Algoritmo de Cholesky

Un caso particular de sistema de ecuaciones lineales, es donde la matriz Aes:

Definicion II.2.5.- Una matriz A ∈Mn(R) es simetrica y definida positiva,si cumple las siguientes dos condiciones:

At = A;(II.2.16)

xtAx > 0, ∀x ∈ Rn, x 6= 0.(II.2.17)

Page 55: 2374131 Una Introduccion Al Analisis Numerico

44 II Sistemas Lineales

Teorema II.2.6.- Sea A simetrica y definida positiva, entonces:a) El algoritmo de Gauss es posible sin busqueda de pivote.b) La descomposicion A = LR satisface

R = DLt, con D = diag(r11, r22, · · · , rnn). (II.2.17)

Demostracion.- Sea A simetrica y definida positiva, dada por

A =

a11 · · · a1n...

...an1 · · · ann

.

El coeficiente a11 de la matriz A es diferente de 0, porque la matriz A esdefinida positiva y a11 = et

1Ae1 donde et1 = (1, 0, · · · , 0). Despues del primer

paso del algoritmo de Gauss, se obtiene:

A(1) =

a11 a12 · · · a1n

0...0

C(1)

, li1 =

ai1

a11,

de donde se tiene

c(1)ij = aij − li1a1j = aij −

ai1a1j

a11.

Por lo tanto es suficiente mostrar que C(1) es simetrica y definida positiva.En efecto, expresando la matriz A como

(a11 zt

z C

),

se tiene

C(1) = C − 1

a11zzt.

Hay que mostrar que

ytC(1)y = ytCy − 1

a11

(ytz)2

> 0, ∀y 6= 0.

Por hipotesis la matriz A es definida positiva, de donde

(x1 yt )

(a11 zt

z C

)(x1

y

)= a11x

21 + x1z

ty + ytzx1 + ytCy > 0,

Page 56: 2374131 Una Introduccion Al Analisis Numerico

II.2 Metodos Directos 45

para x1 ∈ R y y ∈ Rn−1 los dos no nulos al mismo tiempo.

Planteando x1 = −ytza11

, se tiene

(ytz)2

a11− 2 (zty)

2

a11+ ytCy > 0,

por consiguiente

ytCy − 1

a11

(ytz)2

> 0.

La descomposicion LR es unica, si esta existe, en efecto, si

A = L1R1 = L2R2,

dos descomposiciones de A. Se tiene

L−12 L1 = R2R

−11 ;

las matrices del tipo L, como aquellas de tipo R forman subgrupos dentroel grupo de las matrices inversibles, deduciendose que

L−12 L1 = I,

por lo tanto L1 = L2 y R1 = R2. Para demostrar la parte b) del teorema, sedefine la matriz L1, como

Lt1 = D−1R,

donde D = diag(r11, · · · , rnn), hay verificar que L1 = L. Las siguientesidentidades se cumplen:

A = LR = LDLt1,

At = L1DLt,

como A es simetrica y por la unicidad de la descomposicion LR, se deduceL = L1. .

Definicion II.2.7.- Sea D una matriz diagonal a coeficientes no negativos,entonces:

D12 = diag

(√d11, · · · ,

√dnn

). (II.2.18)

Si se define L = LD12 , se tiene

A = LLt,

que es la descomposicion de Cholesky de la matriz A simetrica y definidapositiva. Para simplificar notacion, se escribe L, en lugar de L. Entonces los

Page 57: 2374131 Una Introduccion Al Analisis Numerico

46 II Sistemas Lineales

coeficientes de la matriz L de la descomposicion de Cholesky de A, estandados por:

para k = 1, . . . , n:

lkk =√

akk − l2k1 − l2k2 − · · · − l2k,k−1;

lik =aik − li1lk1 − · · · − li,k−1lk,k−1

lkk, i = 1, . . . , k − 1.

(II.2.19)

El costo en operaciones, despreciando el calculo de las raices cuadradas,para obtener la descomposicion de Cholesky, esta dado por

n∑

k=1

k(n− k) ≈∫ n

0

x(n− x)dx =n3

6. (II.2.20)

La resolucion de la ecuacion Ax = b, donde A es una matriz simetrica ydefinida positiva, se puede efectuar en dos pasos utilizando la descomposicionde Cholesky:

Ly = b,

Ltx = y,

los cuales necesitan un total aproximado, lo mismo que en el algoritmo deGauss,

n2 operaciones.

La estabilidad de la descomposicion de Cholesky esta dada por elsiguiente:

Teorema II.2.8.- Sea A una matriz simetrica y definida positiva. L elresultado numerico de la descomposicion de Cholesky, entonces

∣∣∣A− LLt∣∣∣ ≤ a eps

1 1 1 · · · 11 2 2 · · · 21 2 3 · · · 3...

......

1 2 3 · · · n

, (II.2.21)

donde a = maxij|aij |.

Demostracion.- Se demuesta de la misma manera que el teorema II.2.4referente a la estabilidad de la descomposicion LR.

Page 58: 2374131 Una Introduccion Al Analisis Numerico

II.2 Metodos Directos 47

Ejercicios

1.- Escribir una subrutina DEC(N,NDIM,A,B,IP,IER) que calcule la des-composicion LR, tomando en cuenta la busqueda parcial de pivote.Luego escribir una subrutina SOL(N,NDIM,A,B,IP) que permita resolverAx = b utilizando la descomposicion obtenida por DEC.

a) Resolver

5 2 −1 31 20 3 40 1 1 302 8 −25 4

x =

92832−11

.

b) Calcular la inversa de la matriz de Hilbert dada por

H =

(1

i + j

)n

i,j=1

para n = 2, 3, 4, 5.

2.- a) Calcular la descomposicion de Cholesky LLt para la matriz de Hilbert

H =

(1

i + j

)n

i,j=1

, n = 15.

b) Comparar el resultado numerico con los valores exactos,

ljk =

√2k − 1 · (j − 1)! · (j − 1)!

(j − k)!(j + k − 1)!. (II.2.22)

¿Cuantas cifras son exactas?

c) Si L es el resultado numerico, calcular el residuo

A− LLt,

calcular tambien el residuo A−LLt para la matriz L dada por (II.2.22).

3.- Calcular cond∞(An) para las matrices:

a) de Hilbert

b) de Vandermonde (aij) =(cj−1i

), i, j = 1 · · ·n con ci = i

n ,

para n = 1, 2, 3, . . . , 15. Calcular tambien 1n log10(cond∞(An)) y encon-

trar una formula que aproxime cond∞(An).

4.- Sea A una matriz-banda, simetrica y definida positiva, p el grosor dela banda. Mostrar que, L de la descomposicion de Cholesky es tambienuna matriz-banda. Si n es el orden de la matriz, sabiendo que n ≫ p,¿Cuantas multiplicaciones son necesarias para calcular L?

Page 59: 2374131 Una Introduccion Al Analisis Numerico

II.3 Metodos Iterativos

En la seccion II.2, se analizo dos metodos para resolver directamente sistemasde ecuaciones lineales. Un metodo directo de resolucion de un sistema deecuaciones deberıa dar el resultado numerico igual a la solucion exacta, sino se considerase los errores de redondeo, es decir, si se contase con undispositivo de calculo con una precision infinita, desgraciadamente este noes el caso. Si bien, un metodo directo da una solucion que se aproxima ala exacta, la principal desventaja de utilizarlos, reside en el hecho en quecuando se debe resolver grandes sistemas lineales, la propagacion del errorde redondeo es muy grande, desvirtuando su valor; ademas, en muchos casosno se toma en cuenta muchas de las particularidades que pudiese tener lamatriz del sistema lineal, o finalmente no es necesario obtener una solucionexacta, si no una aproximacion de esta. Los metodos que seran estudiadosen esta seccion, son iterativos en el sentido en que se utilizan las solucionesanteriores para obtener la siguiente. Entre los metodos que seran analizadosse tiene: Jacobi, Gauss-Seidel, SOR.

Metodos de Jacobi y Gauss-Seidel

Estos metodos son utilizados para resolver el sistema de ecuaciones, dadopor

u = Au + b. (II.3.1)

El metodo de Jacobi consiste en la utilizacion de la solucion anterior paracalcular la nueva solucion, es decir

u(k+1) = Au(k) + b. (II.3.2)

Obviamente las soluciones obtenidas por el metodo de Jacobi no son exactas,pero son aproximaciones de estas.

Para la formulacion del metodo de Gauss-Seidel, considerese la matrizA como

A = L + U, (II.3.3)

donde:

L =

0 · · · 0a21 0 · · · 0...

. . ....

an1 · · · an,n−1 0

, U =

a11 a12 · · · a1n

0 a22 · · · a2n...

. . ....

0 · · · 0 ann

.

Page 60: 2374131 Una Introduccion Al Analisis Numerico

II.3 Metodos Iterativos 49

El metodo de Gauss-Seidel esta dado por:

u(k+1) = Lu(k+1) + Uu(k) + b, (II.3.4)

cuya formulacion equivalente es

u(k+1) = (I − L)−1 Uu(k) + (I − L)−1 b. (II.3.5)

Una vez formulados estos metodos, es importante, saber que condicionestiene que cumplir la matriz A, para que estos sean convergentes. Si se denotapor u∗ la solucion exacta de (II.3.1), se define

e(k) = u(k) − u∗, (IV.3.6)

el error cometido en la k-esima iteracion. Por consiguiente, e(k) son losresultados obtenidos en las iteraciones de uno de los metodos definidos masarriba del problema

e = Ae, (IV.3.7)

de donde el metodo sera convergente, siempre y cuando

limn→∞

e(n) = 0. (IV.3.8)

Existe una clase de matrices, para las cuales estos metodos son conver-gentes. Una de sus caracterısticas esta dada por la:

Definicion II.3.1.- Una matriz A es irreducible si para cada (i, j), existeuna sucesion l0 = i, l1, · · · , lm = j tal que

alk,lk+16= 0.

Graficamente se puede visualizar mediante la nocion de grafo dirigido,en Grimaldi se puede encontrar una explicacion bastante detallada sobrelas aplicaciones de la teorıa de grafos. Considerese el grafo G compuesto delconjunto de vertices V y el conjunto de aristas A, definido por:

i) V = 1, 2, . . . , n,ii) (i, j) ∈ A ⇐⇒ aij 6= 0.

Para comprender esta definicion, considerese los dos siguientes ejemplos,sean:

A =

0 12

12 0

1 0 0 00 0 0 1

20 0 1

2 0

1 2

3 4

GA

Page 61: 2374131 Una Introduccion Al Analisis Numerico

50 II Sistemas Lineales

B =

0 1 0 01 0 1 00 1 0 10 0 1 0

1 2

3 4

GB

Se puede observar facilmente, que la matriz A no es irreducible, mientrasque la matriz B si es irreducible.

Con la definicion anterior se puede formular el siguiente teorema que dauna condicion suficiente, para que los metodos de Jacobi, como de Gauss-Seidel, sean convergentes.

Teorema II.3.2.- Sea A una matriz no-negativa (aij ≥ 0), con las siguientespropiedades:

i)

n∑

j=1

aij ≤ 1, i = 1, . . . , n;

ii) Existe io, tal quen∑

j=1

aioj < 1;

iii) A es irreducible;

entonces los metodos de Jacobi y Gauus-Seidel convergen hacia una solucionunica, ademas existe ρ < 1, tal que

∥∥∥e(k)∥∥∥∞≤ Cρk−1

∥∥∥e(0)∥∥∥∞

. (II.3.9)

Demostracion.- Se mostrara para el metodo de Jacobi. Se tiene

e(k+1) = Ae(k),

sea ǫ = max∣∣∣e(0)

i

∣∣∣, de donde

∣∣∣e(1)i

∣∣∣ ≤∑

j

aij

∣∣∣e(0)j

∣∣∣︸ ︷︷ ︸≤ǫ

≤ ǫ,

con desigualdad estricta para i = io.

Page 62: 2374131 Una Introduccion Al Analisis Numerico

II.3 Metodos Iterativos 51

Puesto que la matriz A es irreducible, entonces los coeficientes de An

son todos no nulos, en efecto

(An)ij =∑

k1

· · ·∑

kn−1︸ ︷︷ ︸n−1 veces

aik1ak1k2

· · · akn−1j

tiene un termino no nulo. Ademas para l fijo, se tiene

k

(A2)lk =∑

k

j

aljajk

=∑

j

alj

(∑

k

ajk

)

≤∑

j

alj ≤ 1.

Por induccion matematica, se deduce la desigualdad anterior para todas laspotencias de A, e incluso

k

(An+1)lk =∑

k

j

alj(An)jk

=∑

j

alj

(∑

k

(An)jk

)

<∑

j

alj ≤ 1.

Por otro lado, utilizando la desigualdad (II.1.2), se tiene:

∥∥∥Ae(0)∥∥∥∞≤ ‖A‖∞

∥∥∥e(0)∥∥∥∞≤ ǫ,

∥∥∥e(k)∥∥∥∞

=∥∥∥Ae(k−1)

∥∥∥∞≤ ǫ.

Estas desigualdades se vuelven estrictas para No bastante grande, porejemplo No = n + 1, por lo tanto

∥∥∥e(No)∥∥∥∞≤ ρ

∥∥∥e(0)∥∥∥∞

,

planteando

ρ =

∥∥e(No)

∥∥∞∥∥∥e(0)

∥∥∥∞

1

No

,

Page 63: 2374131 Una Introduccion Al Analisis Numerico

52 II Sistemas Lineales

se tiene que ρ < 1, de donde la convergencia. El mismo procedimiento sesigue para mostrar el metodo de Gauss-Seidel.

El Teorema de Perron-Frobenius

Indudablemente por las consecuencias que implica el teorema de Perron-Frobenius, es que vale la pena estudiarlo como un tema aparte. Es unteorema cuya demostracion ha llevado mucho esfuerzo de parte de muchosmatematicos. Se enunciara este teorema sin dar una demostracion rigurosa,sino los pasos de esta.

Teorema II.3.3.- Sea A una matriz no negativa irreducible, entonces:

i) Existe un vector propio u, con ui > 0 respecto a un valor propior > 0.

ii) Todos los otros valores propios λ de A son |λ| < r. Sola

excepcion posible λ = rei2π

n valor propio simple.

iii) r depende de manera estrictamente monotona de todos loselementos de A.

Demostracion.- Se comenzara por el punto i). Sea u ∈ Rn, tal que ui > 0;entonces

v = Au,

definiendori =

v1

ui,

si los ri son todos iguales, el punto i) esta demostrado; sino es posible variarel vector u de manera que

[rmin, rmax]︸ ︷︷ ︸nuevo

⊂6=

[rmin, rmax]︸ ︷︷ ︸antiguo

,

obteniendo una sucesion de intervalos estrictamente encajonados, siendo ellımite r.

No hay otro vector propio con ui > 0. Sea el cono

K = (u1, . . . , un)|ui ≥ 0 .

Como la matriz A es no negativa, se tiene

A(K) ⊂ K.

No es posible tener:

Au = λu, u ∈ K;Av = µv, v ∈ K;

con λ 6= µ.

Page 64: 2374131 Una Introduccion Al Analisis Numerico

II.3 Metodos Iterativos 53

En efecto, supongase que λ < µ y sea w = −u + tv, tal que t sea lo maspequeno posible, de manera que w ∈ K, entonces

Aw = −λu + tµv 6∈ K,

por consiguiente, no puede haber mas de un valor propio cuyo vector propioeste en el interior del cono.

Ademas, r es un valor propio simple, ya que si no lo fuera, una pequenaperturbacion en la matriz A llevarıa al caso de los valores propios simples,caso que ha sido ya estudiado mas arriba.

Por otro lado, no hay vectores propios en el borde del cono K. Efectiva-mente, sea u ∈ ∂K, vector propio. Por hipotesis, algunos de las componentesde u son nulos, pero al menos una de las componentes es diferente de 0. Dedonde

u + Au + · · ·+ Anu = (1 + λ + · · ·+ λn)u.

Como A es irreducible, existe No ≤ n con

aNo

ij > 0, ∀i, j;

por lo tanto(Anu)j > 0, ∀j;

conduciendo a una contradiccion.

ii) Sean λ otro valor propio de A, v su vector propio respectivo, supongaseque λ ∈ R, se define

w = u + tv,

donde u ∈ K vector propio, t sea lo mas grande posible de manera que w ∈ K,ver la figura IV.3.1.

u

v

w Κ

Figura IV.3.1. Demostracion, Teorema Perron-Frobenius.

Page 65: 2374131 Una Introduccion Al Analisis Numerico

54 II Sistemas Lineales

Si |λ| > r, Aw sale de K, lo que es imposible.Para λ complejo se tiene

Av = (α + iβ)v,

donde λ = α + iβ, v = v1 + iv2 siendo los vj a coeficientes reales. Por lotanto:

Av1 = αv1 − βv2,

Av2 = βv1 + αv2,

el mismo analisis que para el caso real, da el mismo resultado.

iii) La monotonıa de r se muestra, despues de hacer un analisis sobre elpolinomio caracterıstico.

Las consecuencias del teorema de Perron-Frobenius son muchas, entre lascuales, la de mayor utilidad para el tema expuesto, reside sobre el teoremaII.3.2. En efecto, como la matriz A es no negativa e irreducible existe unavalor propio r > 0 mas grande en modulo que los otros. Si la suma de laslineas de la matriz A fuese igual a 1 se tendrıa que r = 1, pero existe unafila cuya suma es inferior a 1, de donde por el punto iii) del teorema dePerron-Frobenius, se tiene r < 1. Por consiguiente, todos los valores propiosen valor absoluto son inferiores a 1, dando la consiguiente convergencia delos metodos de Jacobi y Gauss-Seidel.

Continuando el estudio de los metodos de Jacobi y Gauss-Seidel se tieneotro resultado importante como el:

Teorema II.3.4.- Sea λ el valor propio de A mas grande en modulo y µ elvalor propio mas grande en modulo de

(I − L)−1

U. (II.3.10)

Si λ < 1, entonces µ < λ, para toda matriz A irreducible no negativa.

Demostracion.- Se tiene

(I − L)−1

= I + L + L2 + · · ·+ Lm,

de donde (I − L)−1 U es una matriz no negativa.Supongase que x es vector propio respecto a µ, por consiguiente

(I − L)−1 Ux = µx,

Ux = µx− Lµx,

(µL + U) = µx,

por el teorema de Perron-Frobenius, µ ≥ 0; si µ = 0 no hay nada quedemostrar, si no (

L +U

µ

)x = x.

Page 66: 2374131 Una Introduccion Al Analisis Numerico

II.3 Metodos Iterativos 55

Utilizando nuevamente el teorema de Perron-Frobenius, es necesario que

µ < 1, por que de lo contrario algunos coeficientes de L + Uµ seran mas

pequenos que de L + U y por lo tanto 1 < λNuevamente por el teorema de Perron-Frobenius, se tiene que el valor

propio maximal de µL + U es estrictamente menor al valor propio maximalde L + U .

Como consecuencia de este teorema se tiene que el metodo de Gauss-Seidel converge mas rapidamente a la solucion que el metodo de Jacobi, si lamatriz A es no negativa, irreducible y con valor propio maximal mas pequenoque 1.

Una propiedad muy importante de algunas matrices, esta dada por la:

Definicion II.3.5.- Una matriz A = L + U , como en (II.3.3), posee laproperty A de Young, si los valores propios de la matriz definida por

αL +1

αU =

(1αU

αL

)(II.3.11)

son independientes de α.

Ejemplos

1.- La matriz A definida por

A =

(0 BC 0

),

donde B y C son matrices cuadradas del mismo orden. A posee la

property A. En efecto, si

(xy

)es un vector propio de A se tiene:

(B

C

)(xy

)= λ

(xy

),

(1αB

αC

)(xαy

)= λ

(xαy

).

2.- La matriz tridiagonal con coeficientes diagonales nulos, dada por

0 ab 0 c

d 0 e. . .

. . .

Page 67: 2374131 Una Introduccion Al Analisis Numerico

56 II Sistemas Lineales

posee la property A. Pues, se tiene:

0 ab 0 c

d 0 e. . .

. . .

xyz...

= λ

xyz...

,

0 1αa

αb 0 1αc

αd 0 1αe

. . .. . .

xαyα2z...

= λ

xαyα2z...

.

Teorema II.3.6.- Sea A una matriz no negativa, irreducible, con valorpropio maximal λ < 1 y con la property A, entonces

µ = λ2, (II.3.12)

donde µ es le valor propio mas grande de la matriz inducida por el metodode Gauss-Seidel.

Demostracion.- Sea x el vector propio respecto a µ, de donde

(µL + U)x = µx,

dividiendo esta expresion por√

µ y aplicando la property A, se tiene(√

µL +1√µ

U

)x =√

µx,

de donde√

µ es el valor propio maximal de A.

Si la matriz A es irreducible, no negativa, con valor propio maximalmenor a 1 y ademas con la property A, se tiene:— Metodo de Gauss-Seidel converge 2 veces mas rapido que el de Jacobi.— Metodo de Gauss-Seidel ocupa la mitad de sitio de memoria.— Metodo de Gauss-Seidel ocupa la mitad de plaza de calculo.— Pero Jacobi puede ser paralelizado, en cambio Gauss-Seidel no.

Metodo de Sobrerelajacion SOR

Las siglas SOR significan en ingles Successive over relaxations. Es unamodificacion del metodo de Gauss-Seidel. Consiste en utilizar un factor desobrerelajacion ω. Primero se efectua una iteracion de Gauss-Seidel paraluego corregir con ω, en sıntesis el metodo SOR esta dado por:

u(k+ 12 ) = Lu(k+1) + Uu(k) + b,

u(k+1) = u(k) + ω(u(k+ 1

2 ) − u(k))

,

ω > 1.

(II.3.13)

Page 68: 2374131 Una Introduccion Al Analisis Numerico

II.3 Metodos Iterativos 57

Haciendo el calculo de u, componente por componente, se tiene:

uauxi =∑

j<i

aiju(k+1)j +

j≥i

aiju(k)j + bi,

u(k+1)i = u

(k)i + ω

(uauxi − u

(k)i

).

(II.3.14)

Para ver la velocidad de convergencia de este metodo, es necesario hacer unestudio sobre la convergencia. Una iteracion de SOR puede ser escrita como

u(k+1) = u(k) + ωLu(k+1) + (ωU − ωI) u(k) + ωb,

es deciru(k+1) = ωLu(k+1) + (ωU + (1− ω)I)u(k) + ωb,

por lo tantou(k+1) = (I − ωL)−1

[(ωU + (1− ω)I) u(k) + ωb

]. (II.3.15)

Sea µ un valor propio de u(k+1) = (I − ωL)−1

(ωU + (1− ω)I) y x elvector propio asociado, entonces:

(I − ωL)−1 (ωU + (1− ω)I) x = µx,

(ωU + (1− ω)I) x = µ (I − ωL) x,

ωUx + (1− ω)x = µx− µωLx,

ωUx = (µ− 1 + ω)x− µωLx,

(µL + U) x =µ− 1 + ω

ωx,

dividiendo por√

µ se obtiene

(õL +

1õ

U

)x =

µ− 1 + ω

ω√

µx,

de donde, se ha mostrado el siguiente:

Teorema II.3.7.- Sea A una matriz irreducible, no negativa y con laproperty A. Si µ es un valor propio de la matriz obtenida por SOR, entonces

λ =µ− 1 + ω

ω√

µ(II.3.16)

es valor propio de la matriz A.

El problema ahora, es determinar ω, de manera que los valores propiosµ sean lo mas pequenos posibles. Se tiene:

µ− 1 + ω = λω√

µ,

(µ + (ω − 1))2

= λ2ω2µ,(II.3.17)

Page 69: 2374131 Una Introduccion Al Analisis Numerico

58 II Sistemas Lineales

dando la ecuacion de segundo grado

µ2 +(2(ω − 1)− λ2ω2

)µ + (ω − 1)2 = 0. (II.3.18)

Si µ1, µ2, las dos raices de esta ecuacion, son complejas; entonces ambas sonconjugadas, de donde

|µ| = |ω − 1| .Por lo tanto, condicion necesaria para la convergencia es

−1 < ω < 2. (II.3.19)

Si µ1, µ2 son raices reales de (II.3.18), se tiene que uno de los raices es masgrande que la otra, a menos que µ1 = µ2. Esto sucede cuando la parabolaλω√

µ corta tangencialmente con la recta µ − 1 + ω. Ver figura II.3.2, porconsiguiente, el discriminante de la ecuacion (II.3.18) es nulo, es decir:

(2(ω − 1)− λ2ω2

)2= 4(ω − 1)2,

λ2ω2 = 4(ω − 1),

λ2ω2 − 4ω + 4 = 0.

De donde, se ha demostrado el:

Teorema II.3.8.- El ω optimal esta dado por

w =2

1 +√

1− λ2, (II.3.20)

y el radio espectral de la matriz SOR correspondiente es

µmax = w − 1 =1−√

1− λ2

1 +√

1− λ2. (II.3.21)

λ

λ

λ

µµµ

1

2

3

12

µ raices conjugadas.

Figura IV.3.2 Determinacion de w optimal.

Page 70: 2374131 Una Introduccion Al Analisis Numerico

II.3 Metodos Iterativos 59

Estudio de un problema modelo

Una de las aplicaciones mas importantes de la utilizacion de metodos iter-ativos para resolver sistemas lineales, consiste en la resolucion numerica deecuaciones con derivadas parciales de tipo elıptico. Considerese el siguienteproblema tipo:

−u = f, sobre Ω = [0, 1]× [0, 1];

f |∂Ω = 0.(II.3.22)

Utilizando el metodo de diferencias finitas, se discretiza la ecuacion dederivadas parciales con un esquema de diferencias centradas. El cuadradoΩ es dividido en una malla uniforme de tamano

h =1

n + 1, (II.3.23)

se plantea:

xi = ih, i = 0, . . . , n + 1;

yj = jh, j = 0, . . . , n + 1;(II.3.24)

denotando

uij = u(xi, yj), fij = f(xi, yj). (II.3.25)

Discretizando la ecuacion para esta malla, se obtiene las siguientes ecua-ciones:

−ui,j+1 + ui,j−1 + ui+1,j + ui−1,j − 4ui,j

h2 = fij ,

i = 1, . . . , n,

j = 1, . . . , n;

u0j = 0, j = 0, . . . , n + 1;

un+1,j = 0, j = 0, . . . , n + 1;

ui0 = 0, i = 0, . . . , n + 1;

ui,n+1 = 0, i = 0, . . . , n + 1.

Cambiando la forma de las ecuaciones, se tiene

uij =1

4

(ui,j+1 + ui,j−1 + ui+1,j + ui−1,j + h2fij

),

i = 1, . . . , n,

j = 1, . . . , n;

que en notacion matricial, tiene la forma

u = Au +1

4h2f, (II.3.26)

Page 71: 2374131 Una Introduccion Al Analisis Numerico

60 II Sistemas Lineales

donde:

u = (u11, . . . , u1n, u21, . . . , u2n, . . . , un1, . . . , unn)t,

f = (f11, . . . , f1n, f21, . . . , f2n, . . . , fn1, . . . , fnn)t,

A =1

4

B II B I

. . .. . .

. . .

I B II B

,

B =

0 1

1. . .

. . .. . . 0

, I =

1. . .

1

.

Definicion II.3.9.- El producto tensorial de dos matrices P de orden n×my Q de orden l × k se define como la matriz

P ⊗Q =

p11Q · · · p1mQ...

...pn1Q · · · pnmQ

, (II.3.27)

de orden nl ×mk.

Por lo tanto, la matriz A del problema se escribe como

A =1

4(B ⊗ I + I ⊗B) .

Para hacer estimaciones del costo de operaciones, al encontrar la solucioncon un error fijado de antemano, es necesario determinar la condicion dela matriz A, como ası mismo el radio espectral de A para determinar lavelocidad de convergencia de los metodos de Jacobi, Gauss-Seidel y SOR.Para tal efecto, se tiene la:

Proposicion II.3.10.- El producto tensorial de matrices verifica la siguientepropiedad

(B ⊗ C) (D ⊗ E) = BD ⊗ CE. (II.3.28)

Demostracion.- Se deja como ejercicio

Sean, yk y νk el vector y el escalar respectivamente, definidos por:

yk =

(sin(

kiπ

n + 1)

)n

i=1

,

νk = 2 cos(kπ

n + 1),

(II.3.29)

Page 72: 2374131 Una Introduccion Al Analisis Numerico

II.3 Metodos Iterativos 61

puede verificarse como ejercicio que yk es un vector propio de B asociado alvalor propio νk. Se tiene, utilizando (II.3.28)

A(yk ⊗ yl) =1

4((B ⊗ I)(yk ⊗ yl) + (I ⊗B)(yk ⊗ yl))

=1

4(νk + νl)(yk ⊗ yl),

de donde se ha demostrado el:

Teorema II.3.11.- Los valores propios de A estan dados por:

1

4(νk + νl) =

1

2

(cos(

n + 1) + cos(

n + 1)

). (II.3.30)

La matriz B es tridiagonal con los coeficientes de la diagonal nulos,por consiguiente tiene la property A, verificar el segundo ejemplo sobre estapropiedad. Como la matriz A es igual a la suma de dos productos tensorialesentre B y I, esta tambien verifica la property A. Conociendo los valorespropios de A, se esta en la posibilidad de aplicar los teoremas relativos a laconvergencia de los metodos de Jacobi, Gauss-Seidel y SOR.

Utilizando el anterior teorema, se tiene que el valor propio maximal deA es igual a

λmax = cos(π

n + 1). (II.3.31)

Recordando el metodo de Jacobi se tiene:

u(k+1) = Au(k) + f,

U∗ = AU∗ + f,

e(k) = u∗ − u(k),

e(k+1) = Ae(k),

donde u∗ es la solucion exacta del problema lineal, e(k) el error en k-esimaiteracion.

Existe una base de vectores propios de la matriz A, para la cual el primervector esta asociado a λmax, de donde se tiene

e(k+1)i = λie

(k)i , i = 1, . . . , n2;

donde e(k)i es la i-esima componente respecto a la base. Por consiguiente

e(N)1 = λN

i e(0)i ,

Page 73: 2374131 Una Introduccion Al Analisis Numerico

62 II Sistemas Lineales

obteniendose ası el numero de iteraciones necesarias para conseguir unaprecision relativa de 10−m. Por las siguientes relaciones:

λn1 ≤ 10−m,

N lnλmax ≤ −m ln 10,

N ln(1− π2

2(n + 1)2)≤ −m ln 10,

−Nπ2

2(n + 1)2≤ −m · 2.3,

por lo tanto

N =2m · 2.3

π2 (n + 1)2 ≈ 1

2mn2. (II.3.32)

Ahora bien, una iteracion equivale mas o menos 4n2 operaciones, de dondeel trabajo necesario es 2mn4 operaciones.

Considerando, que el metodo de Gauss-Seidel se realiza en la mitad deoperaciones respecto al de Jacobi, y por el teorema II.3.6, el numero deiteraciones para llegar a una precision relativa de 10−m es la mitad de Jacobi.Las siguiente tabla indica el numero de operaciones, tiempo para diferentesprecisiones requeridas.

Tabla II.3.1. Valores para el metodo de Jacobi.

n Precision # operaciones Tiempo de Calculo

10 10−2 105 0.1sec

100 10−4 109 103sec ≈ 20min

1000 10−6 1013 107sec ≈ 7, 7anos

Para el metodo de Gauss-Seidel los valores, se obtienen de la tabla II.3.1,dividiendo por 4 los valores para numero de operaciones y tiempo de calculo.

En este tipo de problema es donde se ve la verdadera potencia del metodoSOR, respecto a los metodos de Jacobi y Gauss-Seidel. Para estimar eltiempo de calculo, como el numero de operaciones es necesario estimar ωoptimal, como tambien µmax del teorema II.3.8. Utilizando desarrollos deTaylor para la raiz cuadrada, como para el cociente, se obtiene:

umax ≈ 1− 2π

n + 1,

ωop ≈ 2

(1− π

n + 1

).

(II.3.33)

Page 74: 2374131 Una Introduccion Al Analisis Numerico

II.3 Metodos Iterativos 63

Por lo tanto, el numero de iteraciones para obtener una precision relativa de10−m es approximadamente igual a

N ≈ 0.4mn. (II.3.34)

Para una precision de 10−6 se tiene la siguiente tabla:

Tabla II.3.2. Valores para el metodo SOR.

n # Operaciones Tiempo de Calculo ωop

10 104 10−2sec 1, 42

100 107 10sec 1, 93

1000 1010 104sec ≈ 3horas 1, 9937

Para el problema con

f =

1, sobre [1/4, 3/4]× [1/4, 3/4] ;

−1, sino;(II.3.34)

se obtiene utilizando SOR, los valores de u graficados en figura II.3.3.

Figura II.3.3. Grafica de la solucion del problema (II.3.34).

Page 75: 2374131 Una Introduccion Al Analisis Numerico

64 II Sistemas Lineales

Ejercicios

1.- Para resolver iterativamente el problema Ax = b, se considera laiteracion

Mx(k+1) = Nxk + b, con A = M −N.

Determinar M y N para los metodos de Jacobi y Gauss-Seidel.

Programar los dos metodos y aplicarlos al problema

4 −1 0 −1−1 4 −1 00 −1 4 −1−1 0 −1 4

x =

3−371

,

la solucion exacta es x∗ = ( 1 0 2 1 ). Estudiar la velocidad deconvergencia ∥∥x(k+1) − x∗

∥∥∥∥∥x(k) − x∗

∥∥∥

para los dos metodos.

2.- (Estudio de la demostracion del Teorema de Perron-Frobenius). Sea

A =

0 1/21/2 0 1/2

1/2 0 1/21 0

.

Para un vector positivo u dado, se calcula v = Au y se define ri = vi/ui.Para el vector u = (1, 1, 1, 1)t se obtiene de esta manera r1 = 1/2,r2 = r3 = r4 = 1.Modificar este vector con pequenas perturbaciones, para llegar a

1

2< ri < 1 para todo i.

3.- (Un teorema de la teorıa de grafos). Se da un grafo conexo de n nudosy se define una matriz A por

aij =1 si i 6= j y el nudo i esta ligado al nudo j,

0 si i = j o el nudo i no esta ligado al nudo j,

Page 76: 2374131 Una Introduccion Al Analisis Numerico

II.3 Metodos Iterativos 65

Ejemplo:

6 3

45

2

1

⇐⇒ A =

11 1

1 1 11 1

11

Demostrar: Sea r el valor propio maximal de A, entonces se tiene siempre

r >√

3,

excepto en los casos:

r=1, para un grafo;r=√

2, para un grafo;r=(1 +

√5/2), para un grafo;

r=√

3, para dos grafos.

4.- Demostrar que la matriz bloque

A =

0 BC 0 D

E 0

verifica la property A.

5.- (Producto de Kronecker). Sea B = (bij) una matriz de n×n y C = (cij)una matriz m×m. Se define A = B ⊗ C, una matriz nm× nm, por

A = B ⊗ C =

b11C · · · b1nC...

...bn1C · · · bnnC

.

a) Mostrar: si x es un vector propio de dimension n e y es un vector dedimension m, entonces

(Bx)⊗ (Cy) = (B ⊗ C)(x⊗ y)

donde x⊗ y esta definido similarmente.

b) Deducir que: si

x es vector propio de B, con valor propio µ;

y es vector propio de C, con valor propio ν;

entonces

x⊗ y es vector propio de B ⊗ C, con valor propio µ · ν.

Page 77: 2374131 Una Introduccion Al Analisis Numerico

II.4 Metodos Minimizantes

Otra clase de metodos comunmente utilizados en la resolucion de grandessistemas lineales, son los metodos de tipo gradiente que consisten en laresolucion un problema de minimizacion equivalente. Esta clase de metodosse aplica a la resolucion de

Ax = b, (II.4.1)

donde A es una matriz simetrica definida positiva.La equivalencia con el problema de minimizacion, esta dada por la

siguiente:

Proposicion II.4.1.- Si A es simetrica y definida positiva, los dos problemassiguientes son equivalentes:

f(x) =1

2xtAx− xtb + c→ min, (II.4.2)

Ax = b. (II.4.2)

Demostracion.- El primer problema puede ser escrito como

1

2

i,j

xiaijxj −∑

j

xjbj + c→ min . (II.4.4)

El procedimiento para encontrar el mınimo, consiste en derivar f , de donde

∂f

∂xk=

1

2

j

akjxj +1

2

i

xiaik − bk = 0.

Puesto que A es simetrica, se tiene

j

akjxj − bk = 0.

Si x es solucion de (II.4.2), se tiene que x es solucion del problema (II.4.3).Ahora bien, si x es solucion de (II.4.3), es un punto crıtico de la funcion

f , pero como A es definida positiva, se tiene que f posee x como un mınimo.

Page 78: 2374131 Una Introduccion Al Analisis Numerico

II.4 Metodos Minimizantes 67

Metodo del Gradiente

El gradiente de f , utilizando la demostracion de la anterior proposicion,esta dado por

∇f(x) = Ax− b. (II.4.5)

Sea xo un punto de partida, se tiene:

f(x) = f(xo) + 〈∇f(xo), x− xo〉+1

2(x− xo)

tA(x− xo),

= f(xo) + ‖x− x0‖ ‖∇f(xo)‖ cos θ +1

2(x− xo)

tA(x− xo),

donde θ es el angulo entre ∇f(xo) y x − x0. Como se busca que f(x) seamınimo, ∇f(xo) y x−xo deben tener la misma direccion y el mismo sentido.

Supongase que se ha encontrado este x, que se lo denota por x1, sepuede plantear para k ≥ 0, obteniendo ası, el metodo del gradiente

xk+1 = xk − τkgk, (II.4.6)

donde gk = ∇f(xk). El problema, por consiguiente, es determinar τk

teniendo en cuenta las observaciones anteriores, se define la funcion G(τ )por

G(τ ) =1

2(xk − τgk)tA(xk − τgk)− (xk − τgk)tb, (II.4.7)

de donde, el mınimo de G esta en τk, dado por

τk =gkt

gk

gktAgk

. (II.4.8)

Una ilustracion de las iteraciones del metodo del gradiente esta dada en lafigura II.4.1.

x

x

x

x

o

1

2

Figura II.4.1 Ilustracion metodo del gradiente.

Page 79: 2374131 Una Introduccion Al Analisis Numerico

68 II Sistemas Lineales

Planteando hk = Agk, se tiene la version algorıtmica del metodo delgradiente:

1 x := xo;2 g := Ax− b;3 Si |g| ≤ TOL, entonces FIN;4 h := Ag;

5 τ :=〈g, g〉〈g, h〉 ;

6 x := x− τg;7 retornar al paso 2.

La velocidad de convergencia del metodo del gradiente, esta dada porel teorema siguiente, que sera enunciado sin demostracion.

Teorema II.4.2.- Sean, A simetrica y definida positiva, λmax el valor propiomas grande, λmin el valor propio mas pequeno de A, por lo tanto

κ =λmax

λmin= cond2A;

entonces∥∥xk − x∗

∥∥ ≤(

κ− 1

κ + 1

)k ∥∥x0 − x∗∥∥ , (II.4.9)

donde x∗ es la solucion exacta.

Ademas, se tiene el:

Teorema II.4.3.- Existe, x0 tal que

∥∥xk − x∗∥∥ =

(κ− 1

κ + 1

)k ∥∥x0 − x∗∥∥ . (II.4.10)

Demostracion.- En un referencial con un origen adecuado y una base devectores propios de A, el problema (II.4.2) puede formularse como

1

2xtAx− c→ min,

es decirAx = 0, (II.4.11)

donde A = diag(λmin, . . . , λmax). Dividiendo (II.4.11) por λmax, se obtieneel sistema equivalente

Ax =

1. . .

κ

x = 0. (II.4.12)

Page 80: 2374131 Una Introduccion Al Analisis Numerico

II.4 Metodos Minimizantes 69

Por lo tanto, se puede suponer que A tiene la forma de A. Planteando

x0i = 0, para i = 2, . . . , n− 1;

el problema se reduce a resolver(

1 00 κ

)(xy

)=

(00

). (II.4.13)

El siguiente paso, es encontrar (x0, y0)t, que al aplicar el metodo delgradiente, se tenga (

x1

y1

)=

(qx0

−qy0

).

Ahora bien, una iteracion del metodo del gradiente da:

g0 =

(x0

κy0

),

(x1

y1

)=

(x0

y0

)− τ

(x0

κy0

)=

((1− τ )x0

(1− κτ )y0)

),

de donde:q = 1− τ,

−q = 1− κτ ;

despejando q, se obtiene

q =κ− 1

κ + 1.

Puesto que la oscilacion encontrada no depende del punto inicial, las itera-ciones siguientes presentaran el mismo fenomeno. Con lo que se ha mostradoel teorema.

Metodo del Gradiente Conjugado

La ultima demostracion muestra que en determinadas ocasiones el metododel gradiente conduce a una oscilacion en torno a la solucion, haciendoque la convergencia no sea tan rapida como se espera, pudiendo mejoraresta situacion, tomando aparte de la direccion del gradiente otra direccionalternativa. El metodo del gradiente conjugado consiste en tomar tambienla direccion conjugada al gradiente. Para poder enunciar tal metodo esnecesario dar los elementos teoricos para su comprension.

Proposicion II.4.4.- Sea f(x) = 12xtAx − xtb, donde A es una matriz

simetrica y definida positiva. Sea d una direccion, entonces los mınimos def(x) sobre las rectas paralelas a d se encuentran en el hiperplano

dt(Ax− b) = 0. (II.4.14)

Page 81: 2374131 Una Introduccion Al Analisis Numerico

70 II Sistemas Lineales

Demostracion.- Si x pertenece a una recta de direccion d, es de la forma

x = a + λd, donde λ ∈ R.

Se define la funcion g, como g(t) = f(a+ td), por lo tanto esta funcion tieneun mınimo en t0, si

g′(to) = dtf ′(a + tod) = 0,

es decir, si se cumple

dt (A(a + tod)− b) = 0.

Definicion II.4.5.- Dos direcciones d1 y d2 son conjugadas respecto a A si

d1tAd2 = 0. (II.4.15)

Con lo enunciado anteriormente, se puede formular el metodo del gradienteconjugado.

Sea x0 un punto de partida, el gradiente inicial esta dado por

g0 = Ax0 − b,

se defined0 = −g0.

Supongase, que se ha efectuado k iteraciones, es decir, se conoce dk, gk y xk;entonces se define:

τk =−⟨dk, gk

⟩⟨dk, Adk

⟩ ,

xk+1 = xk + τkdk,

gk+1 = Axk+1 − b = gk + τkAdk,

dk+1 = −gk+1 + βkdk.

(II.4.16)

Para determinar βk, se impone la condicion que dk+1 y dk sean conjugados,por consiguiente

gk+1tAdk = βkdkt

Adk,

de donde

β =

⟨gk+1, Adk

⟩⟨dk, Adk

⟩ . (II.4.17)

Page 82: 2374131 Una Introduccion Al Analisis Numerico

II.4 Metodos Minimizantes 71

La version algorıtmica esta dada por:

1 x := punto de partida;2 g := Ax− b;3 d := −g;4 h := Ad;

5 τ :=〈d, g〉〈d, h〉 ;

6 x := x + τd;7 g := g + τh;8 si |g| ≤ 10−6, entonces fin algoritmo;

9 β; =〈g, h〉〈d, h〉 ;

10 d := −g + βd;11 Retornar al paso 4.

Teorema II.4.6.- Con el algoritmo del Gradiente Conjugado se tiene:⟨dk, Adl

⟩= 0, l < k;

⟨gk, gl

⟩= 0, l < k.

(II.4.18)

Demostracion.- Por induccion sobre k.Para k = 1 se tiene

⟨d0, Ad1

⟩= 0 por construccion del metodo,

⟨g1, g0

⟩=⟨g0, g0

⟩−⟨τ0Ag0, g0

= 0.

Supongase cierto para k, por la construccion de gk+1, se tiene⟨gk+1, dk

⟩= 0,

entonces:⟨gk+1, gk

⟩=⟨gk+1, dk

⟩︸ ︷︷ ︸

0

+βk−1

⟨gk+1, dk−1

= βk−1

⟨gk, dk−1

⟩︸ ︷︷ ︸

0

+τkβk−1

⟨Adk, dk−1

⟩︸ ︷︷ ︸0 hip. ind

;

⟨gk+1, gl

⟩=⟨gk, gl

⟩︸ ︷︷ ︸

0

+τk

⟨Adk, dl

= 0;

⟨dk+1, Adl

⟩= c1

⟨gk+1, Adl

⟩+ c2

⟨dk, Adl

⟩︸ ︷︷ ︸0 hip. ind

= c1

⟨gk+1, gl

⟩= 0.

Page 83: 2374131 Una Introduccion Al Analisis Numerico

72 II Sistemas Lineales

En el ejercicio 4, se tiene otras formulas para τk, βk

Definicion II.4.7.- Se define la norma natural del problema por

‖x‖A =√

xtAx. (II.4.19)

Teorema II.4.8.- El error del metodo del Gradiente Conjugado, despuesde l iteraciones satisface

∥∥x∗ − xl∥∥

A≤M

∥∥x∗ − x0∥∥

A, (II.4.20)

donde

M = infµi∈R

(sup

λ v.p. A

∣∣1 + µ1λ + µ2λ2 + · · ·+ µlλ

l∣∣)

. (II.4.21)

Corolario II.4.9.- Si A tiene solamente l valores propios diferentes, en-tonces el metodo del Gradiente Conjugado da la solucion exacta despues del iteraciones.

Demostracion del teorema.- Se puede suponer por traslacion, que b = 0,de donde la solucion exacta es x∗ = 0, por lo tanto el error cometidos esel = xl. Se tiene d0 = −g0, definiendo E1 por:

E1 =x = x0 + τ1d

0

=x = x0 + γ1Ax0

=x = (I + γ1A)x0

.

x1 es el punto de E1 que minimiza f(x) = 12xtAx.

E2 =x|x = x0 + τ1d

0 + τ2d1

=x|x = (I + γ1A + γ2A

2)x0

.

x2 minimiza f(x) en E2. Continuando se llega a

El =x|x = (I + γ1A + · · ·+ γlA

l)x0

,

xl minimiza f(x) en El.Sean v1, . . . , vn vectores propios normalizados de A, por lo tanto forman

una base. Por consiguiente:

x0 =

n∑

i=1

αivi,

x0tAx0 =

i,j

αivtiAvjαj

=∑

i

α2i λi

=∥∥x0∥∥

A.

Page 84: 2374131 Una Introduccion Al Analisis Numerico

II.4 Metodos Minimizantes 73

Por otro lado, se tiene

xk = (I + γ1A + · · ·+ γlAl)

n∑

i=1

αivi

=n∑

i=1

αi(1 + γ1λi + · · ·+ γlλli)vi,

xlAxl =

n∑

i=1

α2i λi(1 + γ1λi + · · ·+ γlλ

li),

de donde∥∥xl∥∥2

A≤ max

λ1,...,λn

∣∣1 + γ1λi + · · ·+ γlλli

∣∣2 ∥∥x0∥∥2

A.

Polinomios de Chebichef

Supongase, que se conoce los valores propios de la matriz A simetrica ydefinida positiva, es decir:

0 < λmin ≤ λi ≤ λmax.

El polinomio que minimiza el polinomio del teorema II.4.8 tiene la propiedadsiguiente:

— es igual a ǫ en λmin,— admite los valores −ǫ, +ǫ como valores maximos en el intervalo

[λmin, λmax] exactamente l + 1 veces,— es igual a ±ǫ en λmax.La razon puede apreciarse en la figura II.4.2, para el caso l = 2.

λλ maxmin

ε

−ε

1

Figura II.4.2 Polinomio minimizante para l = 2.

Page 85: 2374131 Una Introduccion Al Analisis Numerico

74 II Sistemas Lineales

Definicion II.4.10.- El n-simo polinomio de Chebichef, es el polinomio degrado n, Tn(x) tal que:

Tn(1) = 1,Tn(−1) = (−1)n,Todos los mınimos y maximos relativos son±1 y pertenecen a (−, 1, 1).

Teorema II.4.11.- Chebichef. Tn(x) esta dado por

Tn(x) =1

2

((x +

√x2 − 1

)n

+(x−

√x2 − 1

)n). (II.4.22)

Demostracion.- Este teorema sera abordado en el Capıtulo IV, motivo porel cual la demostracion no es necesaria por el momento. Lo unico que puededecirse, es que la definicion moderna de los polinomios de Chebichef estadada por

Tn(x) = cosnθ, donde x = cos θ. (II.4.23)

Teorema II.4.12.- La constante M del teorema II.4.8, esta dada por

M =1

Tl

(λmax+λmin

λmax−λmin

) . (II.4.24)

Demostracion.- Se utiliza la transformacion afın dada por

x = αλ + β,

donde:

α =2

λmax − λmin,

β = −λmax + λmin

λmax − λmin.

por consiguiente tomando 1/M = Tl(β) se tiene el resultado deseado.

Teorema II.4.13.- Para el metodo del Gradiente Conjugado, se tiene laestimacion

∥∥xl − x∗∥∥

A≤ 2

(√κ− 1√κ + 1

)l ∥∥x0 − x∗∥∥

A, (II.4.25)

donde κ = cond2(A), x∗ la solucion exacta.

Page 86: 2374131 Una Introduccion Al Analisis Numerico

II.4 Metodos Minimizantes 75

Demostracion.- Para x ≥ 1, se tiene

|Tl(x)| ≥ 1

2

(x +

√x2 − 1

)l

,

de donde

M ≤ 2(x +

√x2 − 1

)l, para x ≥ 1; (II.4.26)

particularmente para

x =λmax + λmin

λmax − λmin=

κ + 1

κ− 1,

remplazando en (II.4.26), se obtiene (II.4.25).

Con los resultados obtenidos respecto a los errores de convergencia,tanto para el metodo del gradiente, como para el metodo del gradiente con-jugado, se puede estimar el numero de iteraciones necesarias para conseguiruna precision relativa de 10−b. Para el metodo del gradiente por (II.4.6), setiene:

10−b ≈(

κ− 1

κ + 1

),

−2.3b ≈ l ln(1− 1/κ)− l ln(1 + 1/κ),

−2.3b ≈ −2l/κ,

l ≈ bκ. (II.4.27)

Con el mismo procedimiento que para el metodo del gradiente, el metododel gradiente conjugado necesita aproximadamente l iteraciones, de donde

l ≈ b√

κ. (II.4.28)

Metodo del Gradiente Conjugado Precondicionado

El corolario II.4.9 indica claramente, que el metodo del Gradiente Conjugadoconverge a la solucion exacta despues de l iteraciones, siendo l el numero devalores propios diferentes de la matriz A. Se puede mejorar la velocidad deconvergencia, haciendo un cambio de variables en el problema original

f(x) =1

2xtAx− xtb.

Se define x comox = Etx,

Page 87: 2374131 Una Introduccion Al Analisis Numerico

76 II Sistemas Lineales

donde E es una matriz inversible con ciertas condiciones a cumplir que serandadas mas adelante. Para no recargar la notacion, se denota

Et−1= E−t.

Por consiguiente, el problema se convierte en

f(x) =1

2xtE−1AE−tx− xE−1b. (II.4.29)

El problema es encontrar E, de manera EEt ≈ µA, µ > 0 con elmenor gasto de operaciones posibles. Si EEt = µA, aplicando el metodo delgradiente conjugado a (II.4.29) se tiene la solucion exacta despues de unasola iteracion, en este caso, la matriz E es la descomposicion de Choleskyde µA. Ahora bien, realizar la descomposicion de Cholesky significa que sepuede calcular directamente la solucion, lo que implica un gran numero deoperaciones a ejecutar. La determinacion de E se la realiza utilizando dosmetodos que seran analizados mas adelante.

El algoritmo del gradiente conjugado para el problema condicionadoesta dado por:

1 x := punto de partida;2 g := E−1AE−tx− E−1b;3 d := −g;4 h := E−1AE−td;

5 τ :=

⟨d, g⟩

⟨d, h⟩ ;

6 x := x + τ d;7 g := g + τ h;8 si |g| ≤ 10−6, entonces fin algoritmo;

9 β; =

⟨g, h⟩

⟨d, h⟩ ;

10 d := −g + βd;11 Retornar al paso 4.

La implementacion del metodo del gradiente conjugado al problemacondicionado (II.4.29), tiene dos incovenientes: El primero que se debeconocer explicitamente la matriz E y el segundo que se efectuan muchasoperaciones con la matriz E.

Planteando C = EEt, se puede formular el algoritmo, comparandocon el metodo del gradiente conjugado para el problema condicionado yutilizando las identidades para τk y βk dadas en el ejercicio 4, uno se

Page 88: 2374131 Una Introduccion Al Analisis Numerico

II.4 Metodos Minimizantes 77

dara cuenta de las sutilezas empleadas. Por consiguiente, la formulacionalgorıtmica esta dada por:

1 x := punto de partida;2 g := Ax− b;3 χ := C−1g;4 δo := 〈g, χ〉;5 d := −χ;6 h := Ad;7 τ := δ0/〈d, h〉;8 x := x + τd;9 g := g + τh;

10 si |g| ≤ 10−6, entonces fin algoritmo;11 χ := C−1g;12 δ1 := 〈g, χ〉;13 β; = δ1/δ0;14 d := −χ + βd;15 δ0 := 〈d, g〉;16 Retornar al paso 6.

Esta formulacion presenta algunas novedades respecto a la formulaciondel metodo del gradiente conjugado. La mas importante es la apariciondel vector χ. El gasto en memoria es practicamente el mismo, pues sepuede utilizar el mismo lugar de memoria para h y χ. Por las observacionesanteriores la matriz C debe ser lo mas parecida a la matriz A o a un multiplode esta. Ademas, se debe resolver la ecuacion

Cχ = g,

motivo por el cual la matriz C debe ser la mas simple posible. Actualmenteexisten dos metodos muy utilizados para determinar C, dependiendo sobretodo de las caracterısticas de A. Estos son:

1.- Factorizacion Incompleta de Cholesky

La descomposicion de Cholesky incompleta de la matriz A, esta dada porEEt. Los coeficientes de E son nulos en el lugar donde los coeficientes de Ason nulos; para los otros coeficientes, los valores estan dados por las formulasobtenidas para la descomposicion de Cholesky dada en la seccion II.2, esdecir:

eii =

√√√√aii −i−1∑

j=1

e2ji, (II.4.30a)

eki =

aki −

k−1∑

j=1

ekjeji

eii. (II.4.30b)

Page 89: 2374131 Una Introduccion Al Analisis Numerico

78 II Sistemas Lineales

Luego se resuelve:

Eg = g;

Etχ = g.

2.- SSOR precondicionado (Axelsson, 1973)

La matriz A puede ser descompuesta en tres partes, la diagonal, la parteinferior y la parte superior. El metodo SSOR consiste en definir la matrizE, como una matriz triangular inferior, cuyos coeficientes de la diagonalson iguales a la raiz cuadrada de los coeficientes de la diagonal de A. Loscoeficientes de la parte inferior de la matriz E son iguales a los coeficientesde la parte inferior de la matriz A multiplicados por un factor de relajacionpositivo ω, es decir:

eii =√

aii; (II.4.31a)

eki = ωaki, ω ≥ 0. (II.4.31b)

Luego se resulve:

Eg = g,

Etχ = g.

La determinacion del ω optimal se realiza al tanteo, dependiendo del pro-blema a resolver, pues por el momento no existe un criterio analitico paradeterminar este valor optimal.

Resultados Numericos

El estudio teorico y la formulacion de metodos de resolucion de sistemaslineales por si solo constituye un hermoso ejercicio mental. Un metodo no esbueno, hasta que ha sido probado numericamente en problemas concretos,por eso es importante poder comparar la eficiencia de los diferentes metodosformulados en esta seccion, en diferentes tipos de problemas.

Al igual que la seccion II.3, se considerara una ecuacion a derivadasparciales de tipo elıptico, pues este tipo de problema, se presta mucho a laresolucion de grandes sistemas lineales. Sea,

u = −1, sobre Ω = [0, 1]× [0, 1];

u|∂Ω = 0.(II.4.32)

De la misma manera, que la seccion precedente, se subdivide el dominio Ωen una malla uniforme de longitud 1/n + 1, planteando:

xi = ih

yj = jh

, h =

1

n + 1; (II.4.33)

Page 90: 2374131 Una Introduccion Al Analisis Numerico

II.4 Metodos Minimizantes 79

se obtiene el sistema de ecuaciones dado por:

ui,j+1 + ui,j−1 + ui+1,j + ui−1,j − 4uij = −h2, i, j = 1, . . . , n;

ukj = uil = 0, k = 0 o k = n + 1, l = 0 o l = n + 1.

Planteando u = (u11, . . . , u1n, u21, . . . , u2n, . . . , un,1 . . . , unn)t, el sistemalineal se escribe como

Au = h21, (II.4.34)

donde A = 4I+B⊗In+I⊗B, con ⊗ producto tensorial de matrices definidoen la anterior seccion, In la matriz identidad de orden n× n y

B =

0 1

1. . .

. . .. . . 0

.

A es una matriz definida positiva y simetrica de orden n2 × n2.El problema (II.4.34) sera resuelto tomando valores aleatorios para u1.

Se vera el costo en iteraciones para diferentes valores de n. Una vez efectuadoslos experimentos numericos, las graficas de las iteraciones del metodo delgradiente conjugado precondicionado SSOR, pueden ser observadas en lafigura II.4.3.

iter=0 iter=1 iter=2 iter=3

iter=4 iter=5 iter=6 iter=7

iter=8 iter=9 iter=10 iter=18Figura II.4.3. Solucion del problema (II.4.34).

Page 91: 2374131 Una Introduccion Al Analisis Numerico

80 II Sistemas Lineales

En la figura II.4.4 se observa en una grafica el costo en iteraciones paraalcanzar una precision de 10−6 para los diferentes metodos de tipo gradiente.

101 102100

101

102

103

104

iter

n

Gradiante.

Gradiante Conjugado.

Grad. Conj. Chols. Incom.

Gradiante Conjugado SSOR.

Figura II.4.4. Numero de iteraciones vs n.

Finalmente la tabla II.4.1, da el numero de iteraciones para alcanzaruna precision de 10−6 utilizando el metodo del gradiante conjugado pre-condicionado para diferentes valores de n y el factor de relajacion ω. En laultima columna se agrega, ω optimal en funcion de n.

Tabla II.4.1. Determinacion de ω optimal.

n \ ω 0.6 .65 .7 .75 .8 .85 .9 .95 ωop

10 10 9 8 7 8 9 11 12 .75

20 12 12 11 10 9 10 11 14 .8

50 27 24 22 18 17 15 14 16 .9

100 43 35 37 31 27 24 20 18 .95

180 72 59 55 46 40 41 33 27 .95

Page 92: 2374131 Una Introduccion Al Analisis Numerico

II.4 Metodos Minimizantes 81

Ejercicios

1.- Mostrar que una matriz simetrica A es definida positiva si y solamentesi

det(Ak) > 0 k = 1, 2, . . . , n donde Ak =

a11 · · · a1k...

...ak1 · · · akk

son los menores principales.

Indicacion: Intentar con la descomposicion de Cholesky.

2.- Calcular el mınimo de

f(x) =1

50(x1, x2)

(93 2424 107

)(x1

x2

)− 1

5(42, 21)

(x1

x2

)

por el metodo del gradiente conjugado partiendo del valor inicial x0 = 0.Hacer un buen grafico de los puntos x0, x1, x2, de los vectores g0, g1,d0, d1, y de las curvas de nivel de la funcion f(x).

3.- Aplicar el metodo del gradiente conjugado al sistema lineal

2 1 11 2 11 1 2

x =

323

partiendo de x0 = 0. El metodo converge en 2 pasos. ¿Por que?

4.- Mostrar, utilizando las formulas y las relaciones de ortogonalidad delteorema II.4.6, las expresiones siguientes para βk y τk:

βk =

⟨gk+1, gk+1

⟩⟨gk, gk

⟩ , τk =

⟨gk, gk

⟩⟨dk, Adk

⟩ .

5.- Demostrar que la funcion de la forma

f(x) = xn + α1xn−1 + α2x

n−2 + · · ·+ αn

se separa lo menos posible de cero entre los lımites x = −1 y x = +1,esta dada por

f(x) =Tn(x)

2n .

Page 93: 2374131 Una Introduccion Al Analisis Numerico

82 II Sistemas Lineales

6.- Demostrar las relaciones de ortogonalidad

∫ +1

−1

Tn(x)Tm(x)√1− x2

dx =

0 si n 6= m,π

2si n = m 6= 0,

π si n = m = 0.

7.- (Modificacion del metodo del gradiante conjugado para matrices nosimetricas o no definidas positivas). Sea

Ax = b (II.4.35)

un sistema lineal, donde A es una matriz arbitraria inversible. El sistema

AtAx = Atb (II.4.36)

tiene las mismas soluciones que (II.4.35), pero la matriz C = AtA essimetrica y definida positiva. Aplicar el metodo del gradiente conjugadoal sistema (II.4.36) y rescribir el algoritmo obtenido de manera que elproducto AtA no aparezca mas. Cual es la desventaja del nuevo algo-ritmo si, por mala suerte, se aplica al sistema (II.4.35) que inicialmenteera simetrico y definido positivo.

Page 94: 2374131 Una Introduccion Al Analisis Numerico

II.5 Mınimos Cuadrados

Hasta la seccion precedente, se estudiaron problemas inherentes a la reso-lucion de sistemas de ecuaciones lineales donde la solucion existe y es unica.En esta seccion se estudiaran problemas mas generales, donde la existenciay unicidad no juegan un rol tan preponderante.

El problema que se estudiara consiste basicamente en el siguiente. Setiene como datos:

(tj , yj), j = 1, . . . , m, (m grande), (II.5.1)

donde tj ∈ R, yj ∈ R; y una funcion de modelo

y = ϕ ((t, x1, . . . , xn)) , n ≤ m, (II.5.2)

donde t ∈ R, y ∈ R y xi ∈ R.Un ejemplo de funcion de modelo, es la siguiente funcion:

ϕ ((t, x1, x2)) = x1 + tx2 + t2x1.

El problema consiste en encontrar x1, . . . , xn, tales que

ϕ ((t, x1, . . . , xn)) ≈ yj , j = 1, . . . , m. (II.5.3)

* *

** * *

**

t t t1 2 m

*

*

*

Figura II.5.1 Problema de los mınimos cuadrados.

Supongase que, ϕ es lineal respecto a los xi, es decir

ϕ ((t, x1, x2)) =n∑

i=1

ci(t)xi, (II.5.4)

Page 95: 2374131 Una Introduccion Al Analisis Numerico

84 II Sistemas Lineales

de donde el problema se reduce a resolver el siguiente sistema lineal

c1(t1) c2(t1) · · · cn(t1)c1(t2) c2(t2) · · · cn(t2)

......

c1(tm) c2(tm) · · · cn(tm)

︸ ︷︷ ︸A

x1...

xn

︸ ︷︷ ︸x

y1

y2...

ym

︸ ︷︷ ︸b

, (II.5.5)

por consiguiente, resolverAx ≈ b. (II.5.6)

Planteando:ej = ϕ(tj , x)− yj , j = 1, . . . , m; (II.5.7)

la solucion del problema (II.5.6), mediante el metodo de los mınimos cuadra-dos, sera aquella en la que

m∑

i=1

emi −→ min, (II.5.8)

es decir‖Ax− b‖ −→ min . (II.5.9)

La justificacion del metodo de los mınimos cuadrados, esta dada pordos interpretaciones. La primera:

Interpretacion estadıstica

Las componentes yi del vector b en (II.5.5), pueden ser vistas comomedidas experimentales. Ahora bien, toda medida experimental lleva consigoun error, por lo tanto es completamente razonable considerar estas comovariables aleatorias.

Puesto que, la mayor parte de las medidas experimentales siguen leyesnormales, se tiene las dos hipotesis siguientes, para determinar la soluciondel problema (II.5.6):

H1: El valor yi de (II.5.5) es la realizacion de un suceso para la variablealeatoria Yi, i = 1, . . . , m. Se supone que los Yi son independientes y queobedecen la ley normal de esperanza µi y varianza σi. Para simplificar elproblema, se supondra que los σi son iguales y conocidos de antemano.

H2: El sistema sobredeterminado (II.5.6) posee una solucion unica, si seremplaza los yi por los numeros µi; es decir, que existe ξ ∈ Rn unico talque Aξ = µ donde µ = (µ1, . . . , µm)t.

La funcion de distribucion de Yi, en Yi = yi, es igual a

fi(yi) =1√2πσ

exp(− 1

2(yi − µi

σ)2).

Page 96: 2374131 Una Introduccion Al Analisis Numerico

II.5 Mınimos Cuadrados 85

Como los Yi son independientes, el vector aleatorio Y = (Y1, . . . , Ym)t tienela funcion de distribucion

f(y) =

m∏

i=1

1√2πσ

exp(− 1

2(yi − µi

σ)2),

donde y = (y1, . . . , ym)t.Efectuando calculos, se obtiene

f(y) = C exp

(−1

2

m∑

i=1

(yi − µi

σ

)2)

.

Aplicando el principio de maxima presuncion, la probabilidad de medir yi

en lugar de µi, para i = 1, . . . , m; esta dada por

f(y)→ max . (II.5.10)

Por lo tanto, (II.5.10) sucede si

m∑

i=1

(yi − µi

σ

)2 → min, (II.5.11)

es decirm∑

i=1

yi −

n∑

j=1

aijxj

2

→ min . (II.5.12)

con lo que se ha justificado (II.5.7).

Interpretacion geometrica

Se define el subespacio vectorial de Rm de dimension n dado por

E = Ax|x ∈ Rn ⊂ Rm,

la solucion de (II.5.9) esta dada por el vector x0, tal que∥∥Ax0 − b

∥∥ esmınima, es decir Ax0 es el vector mas proximo perteneciente a E al vectorb, de donde el vector Ax0 − b es ortogonal al espacio E, ver figura II.5.2.

E

b

Figura II.5.2 Interpretacion geometrica.

Page 97: 2374131 Una Introduccion Al Analisis Numerico

86 II Sistemas Lineales

Teorema II.5.1.- Sea A una matriz de orden m× n, b ∈ Rm, entonces:

‖Ax− b‖2 → min ⇐⇒ AtAx = Atb. (II.5.13)

Las ecuaciones de la parte derecha de la equivalencia, son las ecuacionesnormales del problema de mınimos cuadrados.

Demostracion.- Utilizando la interpretacion geometrica del metodo demınimos cuadrados se tiene:

‖Ax− b‖2 −→ min

⇐⇒ b− Ax ⊥ Ay, ∀y ∈ Rn

⇐⇒ 〈Ay, b−Ax〉 = 0, ∀y ∈ Rn

⇐⇒ ytAt(b−Ax) = 0, ∀y ∈ Rn

⇐⇒ At(b−Ax) = 0

⇐⇒ AtAx = Atb.

Se remarca inmediatamente que la matriz AtA es simetrica y semi-definida positiva, es decir xtAtAx ≥ 0. La matriz AtA sera definida positivasi y solamente las columnas de A son linealmente independientes. Si este esel caso, se puede utilizar la descomposicion de Cholesky para resolver

AtAx = Atb,

pero en la mayorıa de los casos AtA es una matriz mal condicionada. Comoejemplo vale la pena citar el siguiente ejemplo:

Se tiene, la funcion de modelo dada por

ϕ(t) =

n∑

i=1

= xiti−1,

es decir, se trata de determinar el polinomio de grado n que mejor ajusta a lospuntos (ti, yi), i = 1, . . . , m y 0 = t1 ≤ t2 ≤ · · · ≤ tn = 1. Por consiguiente,se debe encontrar x ∈ Rn, tal que

‖Ax− b‖2 −→ min,

donde:

A =

1 t1 · · · tn−11

1 t2 · · · tn−12

......

1 tm · · · tn−1m

, b =

y1

y2...

ym

.

Page 98: 2374131 Una Introduccion Al Analisis Numerico

II.5 Mınimos Cuadrados 87

Por lo tanto

AtA =

m∑

ti · · · ∑tn−1i∑

ti∑

t2i · · · ∑tni

......∑

tn−1i

∑tni · · · ∑

t2n−1i

=1

m

1 1/m∑

ti · · · 1/m∑

tn−1i

1/m∑

ti 1/m∑

t2i · · · 1/m∑

tni...

...1/m

∑tn−1i 1/m

∑tni · · · 1/m

∑t2n−1i

≈ m

1 1/2 · · · 1/n1/2 1/2 · · · 1/(n + 1)...

...1/n 1/(n + 1) · · · 1/2n

,

puesto que ∫ 1

0

tkdt ≈ 1

m

∑tki .

De donde, la matriz AtA se aproxima a una matriz de tipo Hilbert, la cual esuna matriz mal condicionada, resultado visto en la primera seccion de estecapıtulo. Por lo tanto se debe formular un algoritmo donde la matriz AtAno aparezca directamente.

La descomposicion QR

Dada una matriz A de orden m×n, se busca las matrices: Q de orden m×my la matriz R de orden m× n, tales que la matriz Q sea ortogonal, es decir

QtQ = I;

y la matriz R triangular superior, es decir

R =

n︷ ︸︸ ︷

r11 · · · r1n

. . .

0 rnn

O

m, m ≥ n;

con

A = QR. (II.5.14)

Page 99: 2374131 Una Introduccion Al Analisis Numerico

88 II Sistemas Lineales

Puesto que la matriz Q es ortogonal, para todo vector c ∈ Rm, se tiene

∥∥Qtc∥∥

2= ‖c‖ ,

de donde

‖Ax− b‖2 =∥∥Qt(Ax− b)

∥∥2

=∥∥Rx−Qtb

∥∥2−→ min . (II.5.15)

Por otro lado, la matriz R y el vector Qtb pueden escribirse como:

R =

(R1

0

), Qtb =

(c1

c2

),

donde R1 es una matriz triangular de orden n×n y c1 ∈ Rn. Por consiguiente,resolver el problema (II.5.6) es resolver la ecuacion

R1x = c1. (II.5.16)

Ahora bien, el principal problema es encontrar un algoritmo simple yrapido que permita descomponer la matriz A en un producto de la formaQR. Precisamente uno de estos metodos consiste en la utilizacion de matricesde Householder.

Matrices de Householder (1958)

Sea u ∈ Rm, con ‖u‖2 = 1. Se define la matriz Q por

Q = I − 2uut, (II.5.17)

matriz que es simetrica y ortogonal. En efecto:

Qt =(I − 2uut

)t

=(I − 2uut

),

QtQ =(I − 2uut

)t (I − 2uut

)

= I − 2uut − 2uut + 4uutuut

= I.

La manera como actua Q sobre Rm es la siguiente, sea x ∈ Rm,

Qx = x− 2uutx,

si utx = 0, se tiene inmediatamente que Qx = x, de donde Q es una simetrıarespecto al hiperplano x|utx = 0, en efecto

Qu =(I − 2uut

)u = −u.

Page 100: 2374131 Una Introduccion Al Analisis Numerico

II.5 Mınimos Cuadrados 89

En base a estas matrices se construira un metodo que permita descomponerla matriz A en QR en n− 1 pasos a lo maximo.

Se busca una matriz Q1 = I − 2u1ut1 con ‖u1‖2 = 1, tal que

Q1A =

α1 ∗ · · · ∗0 ∗ · · · ∗...

......

0 ∗ · · · ∗

.

Denotando por e1 a (1, 0, . . . , 0)t y A1 la primera columna de la matriz A,hay que determinar Q1, tal que

Q1A1 = α1e1, α ∈ R. (II.5.18)

Por las propiedades de norma se tiene |α1| = ‖A1‖2, por consiguiente

α1 = ±‖A1‖2 , (II.5.19)

Q1 es una matriz de Householder, por lo tanto:

A1 − 2u1ut1A1 = α1e1,

2u1(ut1A1︸ ︷︷ ︸∈R

) = A1 − α1e1,

de donde u1 tiene la misma direccion que A1 − α1e1. En consecuencia,

u1 =A1 − α1e1

‖A1 − α1e1‖2. (II.5.20)

Sabiendo que la sustraccion es una operacion mal condicionada cuando lascantidades a restar son cercanas, se plantea

α1 = −signo(a11) ‖A1‖2 . (II.5.21)

El siguiente paso es determinar Q1Aj , donde Aj es la j-esima columna de lamatriz A, definiendo v1 = A1 − α1e1, se tiene:

vt1v1

2=

1

2(At

1 − α1et1)(A1 − α1e1)

=1

2

(‖A1‖22︸ ︷︷ ︸

α21

−α1a11 − α1a11 + α21

)

= α1(α1 − a11),

Q1Aj = Aj − 2u1ut1Aj

= Aj −2

vt1v1

v1vt1Aj

= Aj −1

α1(α1 − a11)v1v

t1Aj . (II.5.22)

Page 101: 2374131 Una Introduccion Al Analisis Numerico

90 II Sistemas Lineales

Despues del primer paso de la descomposicion QR, se ha obtenido

Q1A =

α1 ∗ · · · ∗0...0

A(1)

.

El segundo paso es determinar Q2 matriz de Householder, como en el primerpaso, de manera que

Q2Q1A =

α1 ∗ · · · ∗0...0

Q2A(1)

=

α1 ∗ ∗ · · · ∗0 α2 ∗ · · · ∗0...0

0...0

A(2)

,

donde

Q2 =

1 0 · · · 00...0

Q2

.

Costo de la descomposicion QR

La descomposicion se la realiza en n− 1 etapas,

Qn−1 · · ·Q2Q1︸ ︷︷ ︸Qt

A = R,

para el primer paso contando el producto escalar se efectuan:

m + (n− 1)2m operaciones,

por lo tanto, el costo es aproximadamente igual

2(mn + (m− 1)(n− 1) + · · · (m− n + 1),

si n ≈ m se tiene ≈ 23n3 operaciones; si n≪ m se tiene ≈ mn2 operaciones.

Programacion

La descomposicion QR presenta la ventaja que se puede utilizar las plazasocupadas por los coeficientes de la matriz A, con los coeficientes de la matriz

Page 102: 2374131 Una Introduccion Al Analisis Numerico

II.5 Mınimos Cuadrados 91

R y los vectores v1. En lo que se sigue, se tiene un esquema del metodo dedescomposicion QR.

A

→v1

R

A(1)

α1

→v1 v2

R

A(2)

α1 α2

Al final de la descomposicion se obtiene la siguiente matriz

v1 v2 . . .

R

vn

α1 α2 · · · αn

Hay que observar que QR es aplicable, si las columnas de A son linealmenteindependientes. Si no fuesen linealmente independientes se llegarıa a lasituacion de obtener un αi = 0, y la descomposicion en este caso serıanumericamente inestable. Para evitar esta situacion, se puede modificar ladescomposicion QR de la manera siguiente. Sea A la matriz a descomponer,se considera

‖Ajo‖22 = max

j=1,...,n‖Aj‖22 , (II.5.23)

se intercambia la primera columna A1 con Ajoy se procede el primer paso de

la descomposicion QR, para el segundo paso se procede de la misma maneray ası sucesivamente. Por consiguiente, con esta modificacion se obtiene lasucesion decreciente,

α1 ≥ α2 ≥ · · · ≥ αk > 0. (II.5.24)

Si hay vectores linealmente dependientes se llega por lo tanto al siguienteresultado

R =

(R1 R2

0 0

)con R1 =

α1 · · · r1n

. . ....

αk

︸ ︷︷ ︸k = rangA

. (II.5.25)

Page 103: 2374131 Una Introduccion Al Analisis Numerico

92 II Sistemas Lineales

La descomposicion QR es un instrumento numerico que permite determinarel rango de la matriz A. Ahora bien, debido a los errores de redondeo, elprincipal problema consiste en decidir cuando un αj es nulo en la sucesiondecreciente (II.5.24) . Se remarca inmediatamente que, si αk+1 = 0, entoncesαk+i = 0 para i > 2.

Se define la matriz R el resultado numerico obtenido despues de k pasoscomo

R =

α1

. . .

αk

R2

0 0

. (II.5.26)

Planteando

A = QR, (II.5.27)

se tiene la:

Definicion II.5.2.- αk+1 es despreciable, si y solamente si

∥∥∥A− A∥∥∥

2≤ eps ‖A‖2 . (II.5.28)

Se tiene, por consiguiente:

A− A = Q(R− R),

‖A‖2 = ‖R‖2 ,∥∥∥A− A∥∥∥

2=∥∥∥R− R

∥∥∥2,

de donde

αk+1 despreciable ⇐⇒∥∥∥R− R

∥∥∥2≤ eps ‖R‖2 ,

αk+1 es una buena aproximacion de∥∥∥R− R

∥∥∥2, y α1 es una buena aproxi-

macion de ‖R‖2, obteniedo el siguiente resultado

αk+1 despreciable ⇐⇒ αk+1 ≤ eps α1. (II.5.29)

La pseudo-inversa de una matriz

El problema (II.5.6) tiene una solucion unica, si el rango de la matriz A esigual a n y esta dada por

x = (AtA)−1Atb. (II.5.30)

Page 104: 2374131 Una Introduccion Al Analisis Numerico

II.5 Mınimos Cuadrados 93

La matrizA+ = (AtA)−1At, (II.5.31)

sera la matriz inversa para el problema (II.5.6).Para el problema mas general, donde le rango de A es ≤ n, la descom-

posicion QR da el siguiente resultado

R =

(R1 R2

0 0

), con R1 =

α1 · · · r1k

. . .

0 αk

;

planteando x = (x1, x2)t, con x1 ∈ Rk, se tiene

‖Ax− b‖22 =∥∥Rx−Qtb

∥∥2

2∥∥∥∥(

R1x1 + R2x2 − c1

−c2

)∥∥∥∥2

2

‖R1x1 + R2x2 − c1‖22 + ‖c2‖22 ,

de donde el:

Teorema II.5.3.- x = (x1, x2)t es solucion de ‖Ax− b‖2 −→ min, si y

solamente siR1x1 + R2x2 = c1. (II.5.32)

Si el rango de A es igual a n, la solucion es unica; si no las soluciones delproblema (II.5.6) constituyen un espacio afın. Sea por consiguiente

F = x|x es solucion de (II.5.6) ,

de donde, para obtener una solucion unica, el problema (II.5.6) se convierteen

‖Ax− b‖2 −→ min

‖x‖2 −→ min, (II.5.33)

Definicion II.5.4.- La pseudo-inversa de la matrix A de orden m× n es lamatriz A+ de orden n×m, que expresa la solucion x∗ para todo b ∈ Rm delproblema (II.5.33) como

x∗ = A+b. (II.5.34)

Si la matriz A es de rango n, entonces la pseudo inversa esta dada por laformula (II.5.31). Para el caso mas general se tiene los siguientes resultados:

F =

(x1

x2

) ∣∣∣∣x2 arbitrario

x1 = R−11 (c1 −R2x2)

,

‖x‖22 = ‖x1‖22 + ‖x2‖22=∥∥R−1

1 (c1 −R2x2)∥∥2

2+ ‖x2‖22 −→ min . (II.5.35)

Page 105: 2374131 Una Introduccion Al Analisis Numerico

94 II Sistemas Lineales

Derivando (II.5.35), se obtiene

(I + (Rt

2R−t1 )R−1

1 R2

)︸ ︷︷ ︸

simetrica y definida positiva

x2 = Rt2R

−t1 R−1

1 c1. (II.3.36)

Se ha definido la pseudo-inversa de la matriz A, su existencia esta aseguradapor el hecho que el problema (II.5.33) tiene solucion unica, en lo que siguese determinara de manera explıcita esta pseudo-inversa con algunas de suspropiedades mas interesantes.

Teorema II.5.5.- Sea A una matriz de m×n, entonces existe dos matricesortogonales U y V tales que

U tAV =

σ1

. . .

σn

0

con:σ1 ≥ · · · ≥ σk > 0,

σk+1 = · · · = σn = 0.(II.3.37)

(II.3.37) se llama la descomposicion a valores singulares de la matriz A yσ1, . . . , σn son los valores singulares de la matriz A.

Demostracion.- La matriz AtA es simetrica y semi definida positiva, porconsiguiente existe una matriz V ortogonal tal que

V tAtAV =

σ21

. . .

σ2n

,

con σ1 ≥ · · · ≥ σn ≥ 0. Se busca una matriz U ortogonal tal que

AV = U

σ1

. . .

σn

0

,

suponiendo σk > 0 y σk+1 = 0, se define D la matriz diagonal de k × k concoeficientes σi, i = 1, . . . , k; por consiguiente si

AV = ( U1 U2 )

(D 00 0

)= (U1D 0 ) ,

Page 106: 2374131 Una Introduccion Al Analisis Numerico

II.5 Mınimos Cuadrados 95

donde U1 esta constituida por las primeras k columnas de U . Sean

(AV )1 las primeras k columnas de AV,

(AV )2 las otras n− k columnas de AV,

(AV )2 = 0, en efecto, sea x = (0, . . . , 0︸ ︷︷ ︸k

, x)t, donde x ∈ Rn−k, obteniendo:

xtV tAtAV x = xt

σ21

. . .

σ2n

x = 0;

‖AV x‖22 = ‖(AV )2x‖22 , ∀x.

Se define U1 porU1 = (AV )1D

−1,

obteniendo columnas ortonormales, ya que

U t1U1 = D−1

((AV )t

1(AV )1)D−1 = I

Finalmente se construye U2, de manera que U sea ortogonal.

Teorema II.5.6.- Sea A una matriz de m× n, siendo

U tAV = Σ =

σ1

. . .

σk

0

0

, (II.5.38)

la descomposicion en valores singulares. Entonces la pseudo-inversa de Aesta dada por

A+ = V

σ−11

. . .

σ−1k

0

0

U t. (II.5.39)

Demostracion.- Se tiene

‖Ax− b‖22 =∥∥UΣV tx− b

∥∥2

2

=∥∥U(ΣV tx− U tb)

∥∥2

2=

∥∥∥∥∥∥Σ V t︸︷︷︸

y

− U tb︸︷︷︸c

∥∥∥∥∥∥

2

2

= ‖Σy − c‖22 =

∥∥∥∥(

Dy1

0

)−(

c1

c2

)∥∥∥∥2

2

= ‖Dy1 − c1‖22 + ‖c2‖22 .

Page 107: 2374131 Una Introduccion Al Analisis Numerico

96 II Sistemas Lineales

Para que la expresion sea minimal es necesario que y1 = D−1c1. Por otrolado se tiene que y = V tx, de donde ‖y‖2 = ‖x‖2, de manera, que para quex sea minimal es necesario que y2 = 0. De donde

x =V

(D−1c1

0

)

=V

(D−1 0

0 0

)(c1

c2

)

=V

(D−1 0

0 0

)V tb

=A+b, ∀b.

Finalmente se tiene:

Teorema II.5.7.- La pseudo-inversa de una matriz verifica las siguientespropiedades:

(A+A)t = A+A,a)

(AA+)t = AA+,b)

A+AA+ = A+,c)

AA+A = A,d)

llamados axiomas de Moore-Penrose, ademas la pseudo-inversa esta unica-mente determinada por estos axiomas.

Demostracion.- Verificacion inmediata utilizando (II.5.39).

Error del Metodo de los Mınimos Cuadrados

Retomando la interpretacion estadıstica del metodo de los mınimos cuadra-dos. Se han dado dos hipotesis de partida, para determinar la solucion: laprimera sobre los yi de la ecuacion (II.5.5); la segunda concerniente a lacompatibilidad de la funcion modelo (II.5.2) con los datos (II.5.1).

Suponiendo validas estas dos hipotesis, se tiene

Aξ = µ, (II.5.40)

donde µ = (µ1, . . . , µm)t es la esperanza del vector aleatorio Y . Ahora bien,el metodo de los mınimos cuadrados da como solucion (x1, . . . , xn)t, que por(II.5.30), es igual a

x = (AtA)−1Atb.

Page 108: 2374131 Una Introduccion Al Analisis Numerico

II.5 Mınimos Cuadrados 97

Por lo tanto

x− ξ = (AtA)−1At(b− µ) o xi − ξi =

m∑

j=1

αij(bj − µj), (II.5.41)

donde αij es el elemento (i, j) de la matriz (AtA)−1At.Se supondra, por lo tanto, que xi es una realizacion de una variable

aleatoria Xi definida por

Xi − ξi =m∑

j=1

αij(Yj − µj). (II.5.42)

Teorema II.5.8.- Sean X1, X2, . . . , Xm variables aleatorias independientes,con esperanza µi y varianza σi = 1. Entonces, la variable aleatoria Xi,definida por (II.5.42), satisface

E(xi) = ξi y V ar(Xi) = ǫii, (II.5.43)

donde ǫii es el i-esimo elemento de la diagonal de (AtA)−1. Los otroselementos de (AtA)−1 son las covarianzas de Xi.

Demostracion.- Se tiene, utilizando la linearidad de la esperanza,

E(Xi) =m∑

j=1

αijE(Yj − µj) + ξi

= ξi.

Para calcular la varianza de Xi, se utiliza el hecho que V ar(Z1 + Z2) =V ar(Z1) + V ar(Z2), si Z1 y Z2 son independientes. De donde, con ei eli-esimo vector de la base canonica, se tiene

V ar(Xi) = V ar(Xi − ξi)

=m∑

j=1

α2ijV ar(Yj − µj)

=m∑

j=1

α2ij

=∥∥(AtA)−1Atei

∥∥2

2

=∥∥et

i(AtA)−1At

∥∥2

2

= eti(A

tA)−1AtA(AtA)−1ei

= eti(A

tA)−1ei = ǫii.

Page 109: 2374131 Una Introduccion Al Analisis Numerico

98 II Sistemas Lineales

Por consiguiente, si los yi son realizaciones de una variable aleatoria Yi

que sigue N(0, 1), suponiendo que una solucion exacta ξ existe, entonces setiene una probabilidad de 95% que

ξi = xi ± 2σXi. (II.5.44)

La formula (II.5.43) da los valores de σXi, sin embargo se ha visto que

la determinacion de AtA puede representar una cantidad grande de calculo.Utilizando la descomposicion QR, se tiene

AtA = RtQtQR = RtR. (II.5.45)

Como las ultimas filas de ceros no incide en el calculo del producto RtR, sepuede considerar R como una matriz de n × n, obteniendo ası la descom-posicion de Choleski de (AtA).

Una vez determinados los parametros x de la funcion modelo (II.5.2)corresponde saber, si los (II.5.1) son compatibles con tal modelo. Por ladescomposicion QR, el problema (II.5.6) se convierte, ver (II.5.15), en

(R0

)x =

(C1

C2

), donde

(C1

C2

)= Qtb. (II.5.46)

Denotando los elementos de Qt por qij , los elementos del vector C, satisfacen

ci =m∑

j=1

qijbj ,

y las componentes del vector C2 satisfacen tambien

ci =

m∑

j=1

qij(bj − µj).

Es razonable considerar las variables aleatorias

Zi =

m∑

j=1

qij(Yj − µj), i = n + 1, . . . , m. (II.5.47)

A continuacion, se da la proposicion siguiente, sin demostracion.

Proposicion II.5.9.- Sean Y1, . . . , Ym variables aleatorias independientessiguiendo N(0, 1). Entonces las variables aleatorias Zn+1, . . . , Zm, definidaspor (II.5.47) son independientes y siguen tambien una ley normal N(0, 1).

El error cometido, por el metodo de los mınimos cuadrados, es equiva-lente a estudiar ‖C2‖22 de donde el teorema, sin demostracion:

Page 110: 2374131 Una Introduccion Al Analisis Numerico

II.5 Mınimos Cuadrados 99

Teorema II.5.10.- Pearson. Sean Z1, Z2, . . . , Zn variables aleatorias inde-pendientes siguiendo la ley normal N(0, 1). Entonces, la distribucion de lavariable aleatoria

Z21 + · · ·+ Z2

n, (II.5.48)

esta dada por

fn(x) =1

2n/2Γ(n/2)xn/2−1e−x/2, x > 0; (II.5.49)

y por fn(x) = 0 para x ≤ 0. Es la ley χ2 con n grados de libertad. Laexperanza de esta variable es n y su varianza es 2n.

Ejemplo

A partir de la funcion f(t) = t + 0.5 sin(πt/2), se ha elaborado la tablaII.5.1, que tiene como elementos (i, bi) con 0 ≤ i ≤ 9, donde bi = f(i)+ǫi.ǫi es la realizacion de una variablea aleatoria siguiendo una ley normalN(0, σ) con σ = 0.1.

Tabla II.5.1. Valores de bi en funcion de i.

i bi i bi

0 0.11158 5 5.5158

1 1.2972 6 6.0119

2 2.07201 7 6.6802

3 2.4744 8 7.9294

4 3.963 9 9.4129

Se considera, la funcion de modelo

ϕ(t) = xt + y sin(πt/2). (II.5.50)

Obteniendo por la descomposicion QR:

x = 1.00074,

y = 0.413516.

El siguiente paso sera estimar el intervalo de confianza para x y y. Paratal efecto, se considera el problema

xt

σ+ y

sin(πt/4)

σ=

bi

σ, i = 0, . . . , 9;

Page 111: 2374131 Una Introduccion Al Analisis Numerico

100 II Sistemas Lineales

pues, los bi/σ deben ser realizaciones de una variable normal con varianzaigual a 1. De donde la matriz de covarianza esta dada por

(σ2

x σxy

σxy σ2y

)=

(3.57143 · 10−5 −3.57143 · 10−5

−3.57143 · 10−5 2.03571 · 10−3

).

Por consiguiente:x = 1.00074± 0.012,

y = 0.41352± 0.09.

El metodo QR, con la notacion precedente da

‖C2‖2 = 0.0693103;

corrigiendo, para el problema normalizado, se tiene

‖C2‖22σ2

= 6.93103.

Se tiene 10−2 grados de libertad. Viendo en una tabla de la distribucionχ2, se deduce que este valor es lo suficientemente pequeno para serprobable.Ahora bien, si se hubiese considerado la funcion de modelo

ϕ(t) = xt + y, (II.5.51)

se hubiera encontrado‖C2‖22

σ2= 90.5225,

valor demasiado grande para ser probable.La conclusion es que, para los valores de la tabla II.5.1, la ley (II.5.50)es mas probable que la ley (II.5.51).En la figura II.5.3, puede observarse en linea continua la grafica de lafuncion modelo dada por (II.5.50) y con lineas segmentadas la grafica dela funcion modelo (II.5.1).

Page 112: 2374131 Una Introduccion Al Analisis Numerico

II.5 Mınimos Cuadrados 101

0 1 2 3 4 5 6 7 8 90

1

2

3

4

5

6

7

8

9

10

Figura II.5.3. Resultados del metodo de los mınimos cuadrados.

Ejercicios

1.- Sea A una matriz inversible de n × n. Mostrar que la descomposicionQR es unica, si se supone que rjj > 0 para j = 1, . . . , n.

2.- Aplicar el algoritmo de Golub-Householder a la matrice de rotacion

A =

(cos α sin α− sin α cos α

).

Page 113: 2374131 Una Introduccion Al Analisis Numerico

102 II Sistemas Lineales

Dar una interpretacion geometrica.

3.- Sea Q una matriz ortogonal de n × n. Mostrar que Q puede escribirsecomo el producto de n matrices de Householder, de donde cada trans-formacion ortogonal de Rn es una sucesion de al menos n reflexiones.

4.- Escribir una subrutina DECQR(N,M,MDIM,A,ALPH),

(A(MDIM,N),ALPH(N)), que calcula la descomposicion QR de una ma-triz m× n, m ≥ n.Escribir tambien una subrutina SOLQR(N,M,MDIM,A,ALPH,B) que cal-cula la solucion del problema

‖AX − b‖2 −→ min .

Determinar la parabola x1 + x2t + x2t2, que ajusta lo mejor posible:

ti 0 0, 2 0, 4 0, 6 0, 8 1.0

yi 0, 10 0, 15 0, 23 0, 58 0, 45 0, 60

5.- Sea A una matriz m × n. Mostrar que AtA + ρI es no singular paraρ > 0 y

A+ = limρ→0+

(AtA + ρI)−1At.

Page 114: 2374131 Una Introduccion Al Analisis Numerico

Capıtulo III

Interpolacion

Uno de los mayores problemas con que se tropieza, radica en la evaluacionde las funciones en determinados puntos. Las causas principales de estasdificultades estan esencialmente en la dificil manipulacion de estas funciones;una funcion tan inocente como la logaritmo presenta dificultades en su eva-luacion y se debe recurrir a utiles matematicos como series, etc. Por otro lado,la sola informacion que se conoce de esta funcion, son determinados puntos,e incluso suponiendo que esta es lo bastante regular, la evaluacion en otrospuntos es de gran dificultad. De donde un metodo de facil manipulacionconsiste en la aproximacion de las funciones a evaluar por polinomios.Existen dos enfoques diferentes, el primero radica en la aproximacion me-diante polinomios de interpolacion y el otro mediante la mejor aproximacionpolinomial respecto a una norma.

Este capıtulo abordara sobre todo la aproximacion mediante polinomios.La primera parte tratara sobre la interpolacion de Lagrange y Hermite, laformulacion de algoritmos para calcular estos polinomios sera hecha, lasestimaciones de error cometido seran tambien estudiadas a fondo, como asımismo los problemas de estabilidad inherentes a la interpolacion de Lagrangeseran abordados con resultados y ejemplos, como elementos teoricos lospolinomios de Chebichef seran vistos dando como consecuencia resultadosinteresantes sobre la eleccion de los puntos de interpolacion. Un segundotopico a ver sera los splines, polinomios que operan como serchas, por su facilmanipulacion, como por su gran utilidad seran estudiados en la formulacionde los metodos, el calculo de error y sus diferentes aplicaciones. Un tercertema de gran interes por las grandes utilidades que puede dar, consiste enlos metodos de extrapolacion tanto como en su valor teorico, como tambienpor su propiedad de acelerar la convergencia de muchas sucesiones.

Page 115: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange

En la introduccion del capıtulo, se menciono la interpolacion como uninstrumento de aproximacion de una funcion determinada. Sea f una funcionde la que se conoce las imagenes en una cantidad finita de puntos, es decir

f(xi) = yi i = 1, . . . , n;

la funcion interpolante p sera por definicion igual a f(xi) para i = 1, . . . , n.Se hablara de interpolacion cuando se evalua en el punto x con

x ∈ [min xi, max xi],

y de extrapolacion si no. Por su facil manipulacion, pues solo se efectuamultiplicaciones y adiciones, es conveniente que la funcion interpolante p seaun polinomio.

Definicion III.1.1.- Dados (k+1) puntos diferentes: x0, x1, . . . , xk de [a, b],los enteros no negativos α0, . . . αk y los reales yili con 0 ≤ i ≤ k y 0 ≤ li ≤ αi.El Polinomio de Hermite pn de grado n = k + α0 + · · ·+ αk, respecto a losxi, αi y los yili verifica

p(li)n (xi) = yili . (III.1.1)

Si los αi = 0 para i = 0, . . . , k, pn se llama Polinomio de Lagrange.

Definicion III.1.2.- Cuando los puntos yili satisfacen

yili = f (li)n (xi), (III.1.2)

para una determinada funcion f , pn es el polinomio de interpolacion deHermite, y si los αi son nulos, se hablara del polinomio de interpolacion deLagrange.

Estas dos definiciones dan las condiciones que deben cumplir los poli-nomios de interpolacion, sin embargo la existencia, como la unicidad no estandadas, podrıa suceder que no existiesen en algun caso. Por eso es necesarioinsistir en la base teorica que asegure la existencia y la unicidad de estos,ademas, para que la construccion de estos pueda ser relativamente facil.

Bases Teoricas

Sin querer dar un tratado sobre la teorıa de los polinomios, existen resultadosque deben formularse para la mejor comprension de la interpolacion polino-mial. Aunque en Algebra se hace distincion entre polinomio y su funcion

Page 116: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange 105

polinomial asociada, no se hara distincion entre estos, por que son poli-nomios a coeficientes reales o complejos los que se utilizan en la mayor partede los problemas a resolverse numericamente.

Definicion III.1.3.- Sea p(x) ∈ R[x], a es un cero de multiplicidad m dep(x), si

p(k)(a) = 0 m = 0, . . . , m− 1, y p(m) 6= 0.

Proposicion III.1.4.- a es un cero de multiplicidad m de p(x), si ysolamente si, existe un polinomio q(x) con q(a) 6= 0 tal que

p(x) = (x− a)mq(x).

Demostracion.-Ver en cualquier libro de Algebra.

Corolario III.1.5.- Un polinomio pn(x) de grado n tiene a lo mas n ceroscontando con su multiplicidad.

Teorema III.1.6.- Existe a lo sumo un polinomio de Hermite de grado nrespecto x0, . . . , xk, α0, . . . , αk, con k + α0 + · · ·+ αk = n, tal que

p(li)n (xi) = yili ,

donde yili ∈ R, 0 ≤ li ≤ αi.

Demostracion.- Sean pn y qn dos polinomios de Hermite que satisfacenlas hipotesis del teorema. pn − qn es un polinomio nulo o de grado ≤ n.Ahora bien, pn − qn tiene ceros de al menos multiplicidad αi + 1 en xi parai = 0, . . . , k. Por la proposicion anterior se tiene

pn − qn =

(k∏

i=0

(x− xi)αi+1

)r(x),

sumando los grados, la unica posibilidad es que r(x) = 0.

Teorema III.1.7.- Existe al menos un polinomio de Hermite de grado nrespecto x0, . . . , xk, α0, . . . , αk, con k + α0 + · · ·+ αk = n, tal que

p(li)n (xi) = yili ,

donde yili ∈ R, 0 ≤ li ≤ αi.

Demostracion.- Es suficiente mostrar que existe un polinomio de Hermitede grado n tal que para i ∈ 0, . . . , k y l ∈ 0, . . . , αi se tenga:

p(l)(xi) = 1, p(m)(xj) = 0 para m 6= l oj 6= i,

Page 117: 2374131 Una Introduccion Al Analisis Numerico

106 III Interpolacion

denotese por pi,l este polinomio. xj para j 6= i es un cero de multiplicidadαj + 1, de donde:

pi,l = r(x)

j 6=i

(x− xj)αj+1)

,

pi,αi= Ci,αi

(x− xi)αi

j 6=i

(x− xj)αj+1)

,

la constante Ci,αies escogida de manera que p

(αi)i,αi

(xi) = 1. Los polinomiospi,l se los define recursivamente de la siguiente manera

pi,l = Ci,l

(x− xi)

αi

j 6=i

(x− xj)αj+1)

m>l

cil,mpi,m

,

donde las constantes cil,m son escogidas de manera que p

(m)i,l (xi) = 0 para

m > l y Ci,l de manera que p(l)i,l = 1.

Para construir el polinomio de interpolacion no debe utilizarse lospolinomios definidos en la demostracion, uno porque el costo en operacioneses demasiado elevado y otro por la sensibilidad de estos polinomios asıdefinidos a los errores de redondeo.

Construccion del Polinomio de Interpolacion

Inicialmente se considerara polinomios de interpolacion del tipo de Lagrange.Por lo tanto, dados los puntos x0, . . . , xn todos diferentes, y los valoresy0, . . . , yn, el problema se reduce a encontrar un polinomio de grado n quesatisfaga

p(xi) = yi 0 ≤ i ≤ n. (III.1.3)

Indudablemente el caso mas sencillo es para n = 1 y luego para n = 2.Para n = 1 la recta de interpolacion esta dada por

p(x) = y0 +

(y1 − y0

x1 − x0

)(x− x0),

para n = 2 la parabola de interpolacion esta dada por

p(x) = y0 +

(y1 − y0

x1 − x0

)(x− x0) + a(x− x0)(x− x1),

Page 118: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange 107

este ultimo polinomio verifica p(x0) = y0 y p(x1) = y1, por consiguiente esnecesario determinar a de manera que p(x2) = y2. Unos simples calculosalgebraicos dan

a =1

x2 − x0

[y2 − y1

x2 − x1− y1 − y0

x1 − x2

].

Para n = 3 se puede continuar con el mismo esquema, pero antes es necesariodar la nocion de diferencias divididas.

Definicion III.1.8.- (Diferencias Divididas) Sean (x0, y0), . . . , (xn, yn), losxi diferentes entre si. Entonces las diferencias divididas de orden k se definende manera recursiva por:

y[xi] = yi, (III.1.4a)

y[xi, xj ] =yj − yi

xj − xi, (III.1.4b)

y[xi0 , . . . , xik] =

y[xi1 , . . . , xik]− y[xi0 , . . . , xik−1

]

xik− xi0

. (III.1.4c)

Teorema III.1.9.- (Formula de Newton). El polinomio de interpolacion degrado n que pasa por (xi, yi), i = 0, . . . , n, esta dado por

p(x) =

n∑

i=0

y[x0, . . . , xi]

i−1∏

k=0

(x− xk), (III.1.5)

con la convencion−1∏

k=0

(x− xk) = 1.

Demostracion.- Por induccion sobre n. Para n = 1 y n = 2 la formula deNewton es correcta, ver mas arriba. Se supone que la formula sea correctapara n− 1.

Sea, p(x) el polinomio de grado n que pasa por (xi, yi), i = 0, . . . , n; dedonde

p(x) = p1(x) + a(x− x0)(x− x1) · · · (x− xn−1),

con p1(x) el polinomio de interpolacion de grado n− 1 que pasa por (xi, yi)i = 0, . . . , n− 1. Por hipotesis de induccion se tiene

p1(x) =

n−1∑

i=0

y[x0, . . . , xi]

i−1∏

k=0

(x− xk),

por lo tanto hay que demostrar que

a = y[x0, x1, . . . , xn].

Page 119: 2374131 Una Introduccion Al Analisis Numerico

108 III Interpolacion

Sea, p2(x) el polinomio de interpolacion de grado n−1 que pasa por (xi, yi),i = 1, . . . , n; definiendo el polinomio q(x) por

q(x) = p2(x)(x− x0)

(xn − x0)+ p1(x)

(xn − x)

(xn − x0),

q(x) es un polinomio de grado a lo sumo n, ademas q(xi) = yi, i = 0, . . . , n.Por la unicidad del polinomio de interpolacion se tiene que p(x) = q(x).Comparando los coeficientes del termino de grado n se obtiene

a =y[x1, . . . , xn]− y[x0, . . . , xn−1

xn − x0= y[x0, . . . , xn]

La formula de Newton es muy simple y facil de implementar en unprograma para determinar el polinomio de interpolacion de tipo Lagrange,ver la figura III.1.1 donde se muestra un esquema del algoritmo de Newton.

x0 y[x0]ց

y[x0, x1]ր ց

x1 y[x1] y[x0, x1, x2]ց ր ց

y[x1, x2] y[x0, . . . , x3]ր ց ր ց

x2 y[x2] y[x1, x2, x3] y[x0, . . . , x4]ց ր ց ր

.... . .

y[x2, x3] y[x1, . . . , x4]ր ց ր

.... . .

x3 y[x3] y[x2, x3, x4]ց ր

.... . .

y[x3, x4]ր

.... . .

x4 y[x4]...

.... . .

Figura III.1.1. Esquema de la Formula de Newton.

La programacion del polinomio de interpolacion es muy facil, ademasque se puede utilizar la plaza ocupada por yi. En efecto la primera columnadel esquema es utilizada por los yi, se remarca inmediatamente que yn

aparece una vez en los calculos, por consiguiente las ultimas n−1 lugares dela columna son utilizados por los n − 1 valores de las diferencias divididasque aparecen en la segunda columna, quedando el primer valor de y0, y secontinua de esta manera hasta obtener y[x0, . . . , xn].

Page 120: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange 109

Un caso particular en la determinacion del polinomio de interpolacionocurre cuando la subdivision de los puntos es uniforme, es decir

xi = x0 + ih, i = 0, . . . , n; (III.1.6)

donde h = (xn − x0)/n. Para poder implementar el algoritmo de Newtoncon esta subdivision es necesario, las siguientes dos definiciones.

Definicion III.1.10.- (Diferencias Finitas Progresivas) Sea y0, y1, . . . , unasucesion de numeros reales, se define el operador de diferencias finitasprogresivas de orden k de manera recursiva como sigue:

∇0yi = yi, (III.1.7a)

∇yi = yi+1 − yi, (III.1.7b)

∇k+1yi = ∇kyi+1 −∇kyi. (III.1.7b)

Definicion III.1.11.- (Diferencias Finitas Retrogradas) Sea y0, y1, . . . , unasucesion de numeros reales, se define el operador de diferencias finitasretrograda de orden k de manera recursiva como sigue:

∇0yi = yi, (III.1.8a)

∇yi = yi − yi−1, (III.1.8b)

∇k+1yi = ∇kyi − ∇kyi−1. (III.1.8b)

Ahora bien, tomando una subdivision uniforme x0 < . . . < xn setiene los dos resultados equivalentes para el polinomio de interpolacion deLagrange que pasa por los puntos (xi, yi). Utilizando las diferencias finitasprogresivas se tiene

p(x) =

n∑

i=0

∇iy0

i!hi

i−1∏

k=0

(x− xk), (III.1.9)

donde h = (xn − x0)/n y con la convencion

−1∏

k=0

(x− xk) = 1. Utilizando las

diferencias retrogradas se tiene

p(x) =n∑

i=0

∇iyn

i!hi

i−1∏

k=0

(x− xn−k), (III.1.10)

con la convencion−1∏

k=0

(x−xn−k) = 1. La programacion es la misma que para

el caso general, con la unica diferencia que no se efectuan divisiones. Por

Page 121: 2374131 Una Introduccion Al Analisis Numerico

110 III Interpolacion

consiguiente, se tiene el mismo esquema de resolucion para una subdivisionuniforme. En la figura III.1.2 se observa los esquemas para las diferenciasfinitas progresivas y las diferencias finitas retrogradas.

x0 ∇0y0ց

∇y0ր ց

x1 ∇0y1 ∇2y0ց ր ց

∇y1 ∇3y0ր ց ր ց

x2 ∇0y2 ∇2y1 ∇4y0ց ր ց ր

∇y2 ∇3y1ր ց ր

x3 ∇0y3 ∇2y2ց ր

∇y3ր

x4 ∇0y4

......

. . .

xn ∇0ynց

∇ynր ց

xn−1 ∇0yn−1 ∇2ynց ր ց

∇yn−1 ∇3ynր ց ր ց

xn−2 ∇0yn−2 ∇2yn−11 ∇4ynց ր ց ր

∇yn−2 ∇3yn−1ր ց ր

xn−3 ∇0yn−3 ∇2yn−2ց ր

∇yn−3ր

xn−4 ∇0yn−4

......

. . .

Figura III.1.2. Esquemas para Diferencias Finitas

La evaluacion del polinomio de interpolacion en un punto x ∈ [x0, xn] sela realiza utilizando el algoritmo de Horner, ver ejemplo seccion I.1. Para verla simplicidad de la determinacion del polinomio de interpolacion utilizandodiferencias divididas, y si la subdivision es uniforme, diferencias finitas; setiene el siguiente:

Ejemplo

Se desea evaluar la raiz cuadrada de un numero positivo, por ejemplo1, 4. Para mostrar le eficacia y simplicidad, se va construir un polinomiode interpolacion de grado 3, y con tal efecto se utiliza los puntos dondela raiz cuadrada es exacta como una expresion decimal.

xi 1, 00 1, 21 1, 44 1, 69

yi 1, 00 1, 10 1, 20 1, 30

Por consiguiente, el esquema de diferencias divididas para el polinomiode interpolacion, esta dado por

1,00 1,00ց

,4762ր ց

1,21 1,10 −,0941ց ր ց

,4348 ,0313ր ց ր

1,44 1,20 −,0725ց ր

,400ր

1,69 1,30

Page 122: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange 111

de donde el polinomio de interpolacion es igual a

p(x) =1 + 0, 476(x− 1)− 0, 094(x− 1)(x− 1, 21)

+ 0, 031(x− 1)(x− 1, 21)(x− 1, 44),

y p(1, 4) = 1, 183.

El Error de Interpolacion

Sea f(x) una funcion que cumple ciertas condiciones, se supone que sehace pasar un polinomio de interpolacion por los puntos (xi, f(xi)), lapregunta natural es saber que error se comete con el calculo del polinomiode interpolacion, es decir p(x) − f(x) vale cuanto, para un x determinado.Es por esta razon que los siguientes teoremas seran enunciados para teneruna idea del error cometido.

Teorema III.1.12.- Sea f(x) n-veces continuamente diferenciable yyi = f(xi), i = 0, . . . , n; los xi todos diferentes.

Entonces existe ξ ∈ (min xi, maxxi) tal que

y[x0, x1, . . . , xn] =f (n)(ξ)

n!. (III.1.11)

Demostracion.- Se define la funcion r(x) por

r(x) = f(x)− p(x),

donde p(x) es el polinomio de interpolacion que pasa por (xi, f(xi)),i = 0, . . . , n. Se observa inmediatamente que r(xi) = 0 para i = 0, . . . , n;por el teorema de Rolle se deduce que r′(x) se anula al menos una vez encada subintervalo [xi, xi+1], es decir existe ξi1 ∈ (xi, xi+1), para i = 0, . . . , n.Aplicando una vez mas Rolle se deduce que r′′(x) tiene n − 1 ceros en elintervalo [x0, xn], finalmente aplicando el teorema de Rolle las veces quesean necesarias se llega a la conclusion que r(n) tiene al menos un cero en elintervalo requerido. Por otro lado

r(n)(x) = f (n)(x)− n!y[x0, . . . , xn].

Teorema III.1.13.- Sea, f n+1 veces continuamente diferenciable y p(x) elpolinomio de interpolacion de grado n definido por (xi, f(xi)), i = 0, . . . , n yxi 6= xj si i 6= j. Entonces ∀x, ∃ξ ∈ (min(x0, . . . , xn, x), max(x0, . . . , xn, x)),tal que

f(x)− p(x) = (x− x0)(x− x1) · · · (x− xn)f (n+1)(ξ)

(n + 1)!. (III.1.12)

Page 123: 2374131 Una Introduccion Al Analisis Numerico

112 III Interpolacion

Demostracion.- Se deja x fijo, se plantea xn+1 = x. Sea p(x) el polinomiode interpolacion de grado n + 1 que pasa por (xi, f(xi)), i = 0, . . . , n + 1.Por consiguiente

p(x) = p(x) +

n∏

k=0

(x− xk)y[x0, . . . , xn+1],

por el teorema anterior, se tiene

p(x) = p(x) +

n∏

k=0

(x− xk)f (n+1)(ξ)

(n + 1)!,

p(x) = f(x), de donde el teorema queda demostrado.

Ejemplo

Para el ejemplo de la implementacion del metodo de diferencias divididaspara calcular el valor

√1, 4, la funcion interpolada es

√x. El intervalo de

estudio del polinomio de interpolacion de grado 3 esta dado por [1; 1, 69],x0 = 1, x1 = 1, 21, x2 = 1, 44 y x3 = 1, 69. Por lo tanto

f(x) =√

x,

f ′(x) = −1

2x− 1

2 ,

f ′′(x) =1

4x− 3

2 ,

f (3)(x) = −3

8x− 5

2 ,

f (4)(x) =15

16x− 7

2 ,

por consiguiente∣∣f (4)(x)

∣∣ ≤ 1516 para x ∈ [1; 1, 69], lo cual implica que el

error cometido en el calculo de√

x esta dado por:

∣∣√x− p(x)∣∣ ≤ 15

16 · 4!|(x− 1)(x− 1, 21)(x− 1, 44)(x− 1, 69)| ,

∣∣∣√

1, 4− p(1, 4)∣∣∣ ≤ 3, 45.10−5.

El teorema II.1.13 da un resultado sobre el error cometido durante elproceso de interpolacion. Este error depende de la derivada numero n + 1de la funcion f , este depende por lo tanto de la funcion a interpolar y esta

Page 124: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange 113

fuera de alcanze. Pero tambien el error depende de la subdivision x0, . . . , xn,por lo tanto en cierta manera es controlable. De ahı una pregunta naturalsurge: Sea [a, b] un intervalo. ¿Como escoger x0, x1, . . . , xn, tales que

maxx∈[a,b]

|(x− x0)(x− x1) · · · (x− xn)| −→ min ? (III.1.13)

Polinomios de Chebichef

La respuesta de la anterior interrogante, esta en el estudio de los polinomiosde Chebichef, que ya fueron tratados en la seccion II.4.

Definicion III.1.14.- El n-simo polinomio de Chebichef esta definido en elintevalo [−1, 1] por la siguiente relacion

Tn(x) = cos(n arccosx). (III.1.14)

Por lo tanto T0(x) = 1, T1(x) = x, etc.

Los polinomios de Chebichef tienen las siguientes propiedades, que valela pena enunciarlas en la siguiente proposicion.

Proposicion III.1.15.- Los polinomios de Chebichef satisfacen:a) T0(x) = 1, T1(x) = x y

Tn+1(x) = 2xTn(x)− Tn−1(x). (III.1.15)

b) Se tiene para n entero no negativo:

|Tn(x)| ≤ 1, para x ∈ [−1, 1]; (III.1.16)

Tn

(cos

(kπ

n

))= (−1)k; (III.1.17)

Tn

(cos

(2k + 1

2nπ

))= 0; (III.1.18)

para k = 0, 1, . . . , n− 1.

Demostracion.- El inciso a) se demuestra utilizando el hecho que

cos((n + 1)ϕ) = 2cosϕ cos(nϕ)− cos((n− 1)ϕ).

La primera parte del inciso b) es consecuencia de la definicion del n-si-mo polinomio de Chebichef. Las dos ultimas relaciones provienen de lasecuaciones cos nϕ = 0 y |cos nϕ| = 1.

Page 125: 2374131 Una Introduccion Al Analisis Numerico

114 III Interpolacion

Finalmente, es facil observar que el coeficiente del termino dominantede Tn para n > 0 es igual a 2n−1. Los polinomios de Chebichef T0, T1, T2 yT3 pueden observarse en la figura III.1.3.

T0(x) T1(x)

T2(x) T3(x)

Figura III.1.3. Los cuatro primeros polinomios de Chebichef.

Teorema III.1.16.- Sea q(x) un polinomio de grado n con coeficientedominante 2n−1 para n ≥ 1 y q(x) diferente a Tn(x). Entonces

maxx∈[−1,1]

|q(x)| > maxx∈[−1,1]

|Tn(x)| = 1. (III.1.19)

Demostracion.- La demostracion se la realiza por el absurdo. Se suponeque existe un polinomio q(x) de grado n, tal que

|q(x)| ≤ 1 para |x| ≤ 1,

Page 126: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange 115

de donde r(x) = q(x)−Tn(x) polinomio no nulo de grado al menos n−1, peror(x) posee al menos n raices, lo que contradice que r(x) sea una polinomiode grado menor o igual n− 1.

Teorema III.1.17.- Si xk = cos

((2k + 1)π

2(n + 1)

), entonces

maxx∈[−1,1]

|(x− x0) · · · (x− xn)|

es minimal respecto a todas las divisiones x0 < x1 < . . . < xn conxi ∈ [−1, 1].

Demostracion.- Se tiene:

(x− x0) · · · (x− xn) = Tn+1(x)2−n,

(x− x0) · · · (x− xn) = q(x)2−n.

Para construir una division optima para cualquier intervalo [a, b], setoma los puntos xk definidos por

xk =a + b

2+

b− a

2xk, (III.1.20)

donde los xk son los ceros del n + 1-simo polinomio de Chebichef.

Estudio de los Errores de Redondeo

En esta subseccion, se estudiara la incidencia de los errores de redondeoen la determinacion del polinomio de interpolacion, mas precisamente enlos polinomios de interpolacion de tipo Lagrange. Hay que recalcar quelos errores de redondeo en el calculo del polinomio interpolante esta muyrelacionado con el concepto de estabilidad del algoritmo de determinaciondel polinomio de interpolacion.

El problema es el siguiente: Dada una subdivision x0, . . . , xn, determinarp(x) de grado n tal que p(xi) = yi, i = 0, . . . , n. En el calculo se cometenerrores de redondeo por un lado, y por otro lado los datos iniciales tienen unaparte de error de redondeo. Para simplificar el estudio de la estabilidad delpolinomio de interpolacion, los errores de redondeo a considerar son aquellospresentes en los yi, y se supone que no se comete errores de redondeo enlos calculos propiamente dichos y que los xi son considerados por su valorexacto.

El teorema III.1.7 afirma la existencia de un polinomio de interpolacionde grado n de tipo Lagrange para (xi, yi), i = 0, . . . , n y los xi diferentes,

Page 127: 2374131 Una Introduccion Al Analisis Numerico

116 III Interpolacion

durante la demostracion de este teorema se vio de manera explıcita la formaque debıa tener este polinomio, recordando se enuncia el siguiente teorema:

Teorema III.1.18.- Sean (xi, yi), i = 0, 1, . . . , n, los xi diferentes entre si,p(x) el polinomio de grado n que satisface p(xi) = yi. Entonces

p(x) =n∑

i=0

yili(x), (III.1.21)

donde li(x) =n∏

j=0j 6=i

(x− xj)

(xi − xj). (III.1.22)

Como se dijo al inicio de esta subseccion, se considerara los errores deredondeo cometidos en los yi, es decir

yi = yi(1 + ǫi), donde |ǫi| ≤ eps.

Definiendo el polinomio p(x) por p(xi) = yi, i = 0, . . . , n. Realizando calculosy mayoraciones se obtiene:

p(x)− p(x) =

n∑

i=0

(yi − yi︸ ︷︷ ︸−ǫiyi

)li(x),

|p(x)− p(x)| ≤n∑

i=0

|ǫi| |yi| |li(x)|

≤ eps |y|max

n∑

i=0

|li(x)| ,

|p(x)− p(x)||y|max

≤ epsn∑

i=0

|li(x)| .

Definicion III.1.19.- La constante de Lebesgue asociada a la subdivisionx0 < x1 < · · · < xn, esta dada por

Λn = max[x0,xn]

n∑

i=0

|li(x)| . (III.1.23)

Ejemplos

a) Para la division equidistante xj = −1 +2jn , j = 0, . . . , n. Se puede

mostrar que la constante de Lebesgue se comporta asintoticamente,cuando n −→∞, como

Λn ∼2n+1

en log n, (III.1.24)

Page 128: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange 117

En el ejercicio 7 de esta seccion, se indica como se calcula numericamenteestas constantes, en la tabla III.1.1 estan los resultados de estos calculos.

b) Para la division con puntos de Chebichef xj = − cos

(2j + 1

2n + 2π

), se

puede mostrar que la constante de Lebesgue se comporta asintotica-mente, cuando n −→∞, como

Λn ∼2

πlog n. (III.1.25)

Tabla III.1.1. Constantes de Lebesgue

nDivision

Equidistante

Division

de Chebichef

10 29.900 2.0687

20 10987. 2.4792

30 6.6011 · 106 2.7267

40 4.6925 · 109 2.9044

50 3.6398 · 1012 3.0432

60 2.9788 · 1015 3.1571

70 2.5281 · 1018 3.2537

80 2.2026 · 1021 3.3375

90 1.9575 · 1024 3.4115

100 1.7668 · 1027 3.4779

Por los valores dados en la tabla, no se debe utilizar polinomios deinterpolacion de grado superior a 20, si la division utilizada es equidistante.Tratar en lo posible de utilizar los puntos de Chebichef para interpolacion.

En la figura III.1.4 se tienen las graficas de l11 para n = 18 para las divi-siones equidistantes y de Chebichef. En la figura III.1.5, se ve claramente loserrores cometidos por redondeo utilizando puntos equidistantes al interpolarla funcion sin(πx).

Page 129: 2374131 Una Introduccion Al Analisis Numerico

118 III Interpolacion

−1 0 1

−5

0

5

puntos equidistantespuntos equidistantes

−1 0 1

puntos Chebichefpuntos Chebichef

Figura III.1.4. Grafica de un Polinomio de Lagrange.

−1 0 1

−1

0

1n=15n=15

−1 0 1

−1

0

1n=20n=20

−1 0 1

−1

0

1n=30n=30

−1 0 1

−1

0

1n=40n=40

Figura III.1.5. Interpolacion de sin(πx).

Page 130: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange 119

Convergencia de la Interpolacion

En esta subseccion, se analizara el problema de la convergencia de lainterpolacion. Sea f : [a, b] −→ R, para cada entero natural se considerauna subdivision de [a, b] dada por

x(n)0 < x

(n)2 < · · · < x(n)

n ,

pn(x) el polinomio de interpolacion respecto a esta subdivision. Se desearıasaber que sucede cuando n −→∞, es decir

|f(x)− p(x)| n→∞−−−−−→ ?.

Teorema III.1.20.- Sea f ∈ C∞[a, b] tal que∣∣f (n)(x)

∣∣ ≤ M para todo

x ∈ [a, b] y para todo n ∈ N, sea

x(n)0 < x

(n)2 < · · · < x

(n)n

una sucesion de

subdivisiones de [a, b]. Entonces

maxx∈[a,b]

|f(x)− pn(x)| n→∞−−−−−→ 0, (III.1.25)

donde pn(x) es el polinomio de interpolacion de grado n, respecto a lassubdivisiones dadas.

Demostracion.- Utilizando el teorema III.1.13 y la hipotesis que lasderivadas de cualquier orden son acotadas se tiene

|f(x)− pn(x)| =∣∣∣(x− x

(n)0 ) · · · (x− x(n)

n )∣∣∣∣∣f (n+1)(ξ)

∣∣(n + 1)!

≤M(b− a)n+1

(n + 1)!

n→∞−−−−−→ 0.

Las funciones exponencial , senos y cosenos son acotadas y sus derivadaslo son tambien, motivo por el cual estas funciones pueden ser aproximadaspor polinomios de interpolacion teniendo asegurada la convergencia de lainterpolacion. El teorema III.1.20 da condiciones suficientes para asegurarla convergencia, no obstante existen muchas otras funciones cuyas derivadasde orden superior no estan acotadas por una sola constante M , por ejemplofunciones racionales. Por lo tanto es necesario poder enunciar otras condi-ciones para asegurar convergencia, o de lo contrario para decidir que sucededivergencia en el proceso de interpolacion.

Para poder comprender mas aspectos de la convergencia o divergenciade la interpolacion es necesario introducir algunas definiciones y resultadosimportantes en el estudio de la aproximacion de funciones por polinomios.

Page 131: 2374131 Una Introduccion Al Analisis Numerico

120 III Interpolacion

Considerese la aplicacion Ln que a la funcion f asocia su polinomiode interpolacion en los puntos x0, x1, . . . , xn: Ln(f) = pn. Se remarcainmediatamente que esta aplicacion es lineal, ademas si Pn es el espaciode los polinomios de grado igual o menor a n se tiene

∀q ∈ Pn, Ln(q) = q.

Se puede mostrar, ver ejercicios, que

Λn = maxg∈C0[a,b]

g 6=0

‖Ln(g)‖∞‖g‖∞

,

de manera que la constante Λn representa la norma del operador Ln respectoa la norma de la convergencia uniforme en C0[a, b]. Por otro lado se obtieneel siguiente teorema de mayoracion sobre el error de interpolacion.

Teorema III.1.21.- Dados una funcion f ∈ C0[a, b] y su polinomio deinterpolacion de Lagrange en los puntos x0, . . . , xn, se tiene

‖f − pn‖∞ ≤ (1 + Λn)En(f), (III.1.26)

donde En(f) = infq∈Pn

‖f − q‖∞.

Demostracion.- Para todo q ∈ Pn, se tiene

f − pn = (f − q)− (pn − q) = (f − q)− Ln(f − q),

por consiguiente

‖f − pn‖∞ ≤ ‖f − q‖∞ + ‖Ln(f − q)‖∞ ≤ (1 + Λn) ‖f − q‖∞ ,

el resultado se obtiene tomando la cota inferior sobre los q ∈ Pn.

Definicion III.1.22.- La cantidad En(f) se llama el grado de aproximacionde la funcion f por los polinomios de grado≤ n, respecto a la norma de laconvergencia uniforme.

Examinando los diferentes factores de la mayoracion dada por el anteriorteorema, la cantidad Λn depende solamente de la subdivision tomada delintervalo [a, b], mientras que En(f) depende solamente de la funcion f . En elestudio de la estabilidad se vio Λn para dos tipos de subdivision, los puntosde Chebichef y los equidistantes, se ha podido demostrar que Λn es minimalcuando se toman los puntos de Chebichef, pero en todos las sucesiones desubdivisiones dadas al principio de este paragrafo, se tiene

limn→∞

Λn =∞.

Page 132: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange 121

Como Λn es la norma del operador Ln, consecuencia del teorema deBanach-Steinhauss, se tiene que, cualquiera sea la sucesion de subdivisiones

x(n)0 , . . . , x

(n)n , existe una funcion continua f , tal que Ln(f) no converge uni-

formente hacia f cuando n→∞.El siguiene paso es estudiar el comportamiento de En(f), cuando

n→∞; esto esta intimamente ligado a la regularidad de la funcion f y masparticularmente a su modulo de continuidad, denotado por ω(f, h), definidopor

ω(f, h) = maxt,t′∈[a,b]

|t−t′|≤h

|f(t)− f(t′)| . (III.1.27)

Se verifica facilmente las propiedades siguientes del modulo de continuidad:i) la funcion h → ω(f, h) definida sobre R+ es positiva, creciente y

subaditiva, es decir: ∀h1, h2 ≥ 0, ω(f, h1 + h2) ≤ ω(f, h1) + ω(f, h2),ii) si n ∈ N, ω(f, nh) ≤ nω(f, h); si λ ∈ R+, ω(f, λh) ≤ (1 + λ)ω(f, h),iii) si f ∈ C0[a, b], lim

h→0ω(f, h) = 0 y la funcion h → ω(f, h) es continua

sobre R+,iv) si f ∈ C1[a, b], ω(f, h) ≤ h ‖f ′‖∞.

Teorema III.1.23.- Existe un real M , independientemente de n, a y b, talque para todo n ≥ 1 y toda f ∈ C0[a, b], se tiene

En(f) ≤Mω

(f,

b− a

n

). (III.1.28)

Demostracion. El cambio de variable s = (x − a)/(b − a) permite detrasladarse al caso en que a = 0, b = 1, f ∈ C0[0, 1], lo que se supondra acontinuacion.

Considerese primero el caso en que n = 2p es par, y planteando

jn(t) =1

αn

sin(

(p+1)t

2

)

sint

2

4

=1

αn

(n∑

k=0

cos(p− 2k)t

2

)4

,

donde αn es escogido de manera que∫ π

−πjn(t)dt = 1, es evidente que jn

puede escribirse bajo la forma

jn(t) = a0n + a1n cos t + · · ·+ ann cos nt. (III.1.29)

Planteando g(t) = f(|cos t|), esta claro que g es una funcion par, continuasobre R y periodica de periodo π, ademas ω(g, h) ≤ ω(f, h) porque |t− t′| ≤

Page 133: 2374131 Una Introduccion Al Analisis Numerico

122 III Interpolacion

h ⇒ ||cos t| − |cos t|| ≤ h. Continuando con la demostracion se introduce lafuncion

ϕn(s) =

∫ π

−π

g(t)jn(s− t)dt =

∫ π

−π

g(s− t)jn(t)dt,

se tiene

g(s)− ϕn(s) =

∫ π

−π

(g(s)− g(s− t))jn(t)dt,

de donde

|g(s)− ϕn(s)| ≤∫ π

−π

|(g(s)− g(s− t))| jn(t)dt

≤∫ π

−π

ω(g, |t|)jn(t)dt = 2

∫ π

0

ω(g, t)gn(t)dt

≤ 2

∫ π

0

(1 + nt)jn(t)dt · ω(g, 1/n), por la propiedad ii.

Utilizando las mayoraciones2

π≤ sin x

x≤ 1 para x ∈ [0, π/2], se obtiene

∫ π

0

tjn(t)dt ≤ C

n,

ver ejercicio 12, por lo tanto se tiene

|g(s)− ϕn(s)| ≤ 2(1 + C)ω(g,1

n).

Se remarca que

∫ π

−π

g(t) cos(k(s− t))dt = cos ks

∫ π

−π

g(t) cos(kt)dt + sin ks

∫ π

−π

g(t) sin(kt)dt

= cos ks

∫ π

−π

g(t) cos(kt)dt,

puesto que g es una funcion par.Resulta de (III.1.29) y de la definicion de ϕn que existe pn ∈ Pn tal que

para todo s ∈ R, ϕn(s) = pn(cos s), por consiguiente se tiene

maxx∈[0,1]

|f(x)− pn(x)| ≤ maxs∈R

|f(|cos s|)− pn(cos s)| = maxs∈R

|g(s)− ϕn(s)|

≤ 2(1 + C)ω(g, 1/n) ≤ 2(1 + C)ω(f, 1/n).

El caso en que n = 2p + 1 es impar se deduce del precedente remarcandoque E2p+1(f) ≤ E2p(f) y que ω(f, (b− a)/n) ≤ 2ω(f, (b− a)/(n + 1)).

Page 134: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange 123

Corolario III.1.24.- Teorema de Weirstrass. Sea [a, b] un intervalo cerradoy acotado de R, entonces el conjunto de las funciones polinomiales es densoen C0[a, b] para la topologıa de la convergencia uniforme

Demostracion.- En efecto, por la propiedad iii) del modulo de continuidad,se tiene que

limn→∞

ω

(f,

b− a

n

)= 0,

por consiguiente limn→∞

En(f) = 0. para toda funcion f ∈ C0[a, b].

Corolario III.1.25.- Se supone que f ∈ Cp[a, b], p ≥ 0, entonces para todon > p se tiene

En(f) ≤Mp+1 (b− a)p

n(n− 1) · · · (n− p + 1)ω

(f (p),

b− a

n− p

). (III.1.30)

Demostracion.- Por el teorema III.1.23, el corolario es cierto para p = 0,supongase cierto el enunciado del corolorio para p y sea f ∈ Cp+1[a, b], setiene por lo tanto f ′ ∈ Cp[a, b], de donde ∀n > p + 1

En−1(f′) ≤Mp+1 (b− a)

(n− 1) · · · (n− p)ω

(f (p+1),

b− a

n− 1− p

).

Se puede mostrar, ver Crouzeix, Capıtulo I.3, que existe q ∈ Pn−1 talque ‖f ′ − q‖∞ = En−1(f

′). Planteando por lo tanto p(x) =∫ x

aq(t)dt y

ϕ(x) = f(x) − p(x), se tiene p ∈ Pn, entonces En(f) = En(ϕ), ademas‖ϕ′‖∞ = ‖f ′ − q‖∞ = En−1(f

′). Aplicando el teorema III.1.23 a la funcionϕ y la propiedad iv) del modulo de continuidad, se obtiene

En(f) = En(ϕ) ≤Mω

(ϕ,

b− a

n

)≤M

b− a

n‖ϕ′‖∞ ,

de donde

En(f) ≤Mp+2 (b− a)p+1

n(n− 1) · · · (n− p)ω

(f (p+1),

b− a

n− p− 1

).

Utilizando las estimaciones dadas para las constantes de Lebesgue yel teorema III.1.21, se obtiene las mayoraciones siguientes del error deinterpolacion de Lagrange si f ∈ Cp[a, b]:

a) En el caso que los xi son equidistantes,

‖f − pn‖∞ ≤ Cp(b− a)p2n

np+1 log nω

(f (p),

b− a

n− p

),

Page 135: 2374131 Una Introduccion Al Analisis Numerico

124 III Interpolacion

b) En el caso de los puntos de interpolacion de Chebichef

‖f − pn‖∞ ≤ Cp(b− a)p log n

np ω

(f (p),

b− a

n− p

),

este resultado con p = 0, da el resultado de Bernstein que dice que elinterpolante de Lagrange con los puntos de Chebichef converge hacia f delmomento en que lim

h→0ω(f, h) log h = 0, que es el caso si f ∈ C1[a, b].

Teorema III.1.26.- Si la funcion f ∈ C1[a, b], si los puntos utilizadosdurante el proceso de interpolacion son puntos de Chebichef, entonces

limn→∞

pn = f.

La utilizacion de los puntos de Chebichef en la aproximacion de unafuncion continuamente diferenciable en un intervalo [a, b], no implica nece-sariamente convergencia numerica, pues el calculo del polinomio interpolantepor medio de computadoras esta imbuido de errores de redondeo. Por lotanto hay que tener mucho cuidado cuando se utilizan muchos puntos deinterpolacion.

Fenomeno de Runge

Hasta ahora, se ha visto condiciones suficientes para asegurar la convergenciade la interpolacion de una funcion por polinomios. Tambien se ha mostradoque la utilizacion de puntos de Chebichef en la interpolacion de una funcioncontinuamente derivable permitıa la convergencia. En esta parte, se veraque tener una funcion continuamente derivable y una division equidistanteno es una condicion suficiente de convergencia. Con el siguiente ejemplose ilustrara el conocido fenomeno de Runge. En la figura III.1.6, puedeapreciarse que la interpolacion de Lagrange diverge cuando la division esequidistante. Mientras, que en la figura III.1.7. utilizando subdivisiones deChebichef se tiene convergencia. En lineas punteadas se tiene la grafica dela funcion a interpolar.

−1 0 10

1

n=5

−1 0 10

1

n=10

−1 0 10

1

n=15

−1 0 10

1

n=20

Figura III.1.6. Interpolacion con puntos equidistantes.

Page 136: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange 125

−1 0 10

1

n=5

−1 0 10

1

n=10

−1 0 10

1

n=15

−1 0 10

1

n=20

Figura III.1.7. Interpolacion con puntos de Chebichef.

Sea f : [−1, 1] −→ R, definida por

f(x) =1

1 + 25x2 ,

funcion que es indefinidamente derivable. Sean x(n)0 , . . . , x

(n)n la division

equidistante de [−1, 1], pn(x) el polinomio de interpolacion de grado n de lafuncion f respecto a la subdivision dada anteriormente. Prolongando f(x) al

plano complejo, se tiene que f(z) tiene polos simples en z =1

5i y en z = −1

5i.

Se considera un camino cerrado simple C tal que [−1, 1] ⊂ interior de C, y lospolos esten en el exterior de C. Por consiguiente se puede aplicar la formulade Cauchy para integrales complejas, de donde

f(x) =1

2iπ

C

f(z)

z − xdz.

1−1

c

Se define el polinomio Πn(x) de grado n por

Πn(x) = (x− x(n) )(x− x(n)

) · · · (x− x(n)n ),

Por otro lado se comprueba facilmente que la expresion(Πn(z)−Πn(x))/(z−x) es un polinomio de grado n respecto a x, definiendoel polinomio de grado n, q(x) por

q(x) =1

2iπ

C

f(z)

z − x

(Πn(z)−Πn(x))

Πn(z)dz, (III.1.31)

se verifica que q(x(n)i ) = f(x

(n)i ), de donde se ha mostrado el teorema

siguiente.

Page 137: 2374131 Una Introduccion Al Analisis Numerico

126 III Interpolacion

Teorema III.1.27.- Si f es una funcion racional con polos fuera de C.Entonces el error de interpolacion esta dado por

f(x)− pn(x) =1

2iπ

C

f(z)

z − x

Πn(x)

Πn(z)dz, (III.1.32)

donde pn es el polinomio de interpolacion.

Introduciendo valores absolutos, se obtiene

|f(x)− pn(x)| ≤ 1

C

|f(z)||z − x|

∣∣∣∣Πn(x)

Πn(z)

∣∣∣∣ |dz| ,

por consiguiente se debe analizar el comportamiento cuando n −→ ∞ de laexpresiones que aparecen en la integral precedente. Se tiene convergencia si

∣∣∣∣Πn(x)

Πn(z)

∣∣∣∣ < κn,

con κ < 1, de lo contrario cuando n −→ ∞ |f(x)− pn(x)| diverge. Porconsiguiente hay convergencia en x ∈ [−1, 1] si y solamente si

limn→∞

n

√∣∣∣∣Πn(x)

Πn(z)

∣∣∣∣ < 1. (III.1.33)

En lugar de la expresion (III.1.33), se puede utilizar

ln n√|Πn(z)| = 1

nln (|Πn(z)|)

=2

2n

n∑

j=0

ln |z − xj | ,

como los xj son equidistantes, cuando n −→∞ se tiene

limn→∞

ln n√|Πn(z)| = 1

2

∫ 1

−1

ln |z − t| dt

=1

2ℜ∫ 1

−1

log(z − t)dt

=1

2ℜ(z + 1) log(z + 1) + (1− z) log(z − 1) − 1.

Definiendo G(z) por

G(z) = exp

(1

2ℜ(z + 1) log(z + 1) + (1− z) log(z − 1) − 1

), (III.1.34)

Page 138: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange 127

se obtiene quelim

n→∞

n√|Πn(z)| = G(z).

Si x ∈ R, la funcion G es igual a

G(x) = exp

(1

2ln(x + 1)(x+1) +

1

2ln(1− x)(1−x) − 1

)

=√

(1 + x)1+x(1− x)1−x/e.

Para decidir si la interpolacion converge para un x dado se debe tenernecesariamente G(z)/G(x) < 1, esto sucede solamente si |x| < 0, 72668.La figura III.1.8 muestra una grafica de G(x) y en la figura III.1.7 estandadas las curvas de nivel para G(z).

2/e

1/e

0 1−1

Fig. III.1.8. Grafica de G(x).

x

y

G(z)=2/e

Fig. III.1.9. Curvas de nivel de G(z).

Ejercicios

1.- Demostrar por induccion

y[x0, . . . , xn] =

n∑

j=0

yj

i 6=j

1

xj − xi,

ny0 =n∑

j=0

(n

j

)yj(−1)n−j .

2.- Supongase conocidos los valores de la funcion de Bessel

J0(x) =1

π

∫ π

0

cos(x sin t)dt.

Page 139: 2374131 Una Introduccion Al Analisis Numerico

128 III Interpolacion

para los puntos equidistantes xi = x + 0 + ih, i ∈ Z.

a) ¿Para que h, el error de la interpolacion lineal es menor a 10−11?

b) La misma pregunta para la interpolacion cuadratica.

3.- Calcular el polinomio de interpolacion de grado n = 10 y n = 20, quepasa por (xi, f(xi)), i = 0, 1, . . . , n, donde f(x) = 1/(1 + 25x2).

a) xi = −1 +2i

n.

b) xi = cos(2i + 1

2n + 2π).

Hacer graficas, estudiar los errores.

4.- Sea p(x) el polinomio de interpolacion de grado 1 de una funcion f dosveces continuamente derivable. Mostrar que el error satisface

f(x)− p(x) =

∫ x1

x0

G(x, t)f ′′(t)dt (∗)con

G(x, t) =

1

h(x− x0)(t− x1) si x ≤ t

1

h(t− x0)(x− x1) si x ≥ t

.

Dibujar la funcion G(x, ·). Deducir de (∗) el resultado del teoremaIII.1.13.

5.- Sean x0 < x1 < · · · < xn y li(x) =n∏

j=0j 6=i

(x− xj)

(xi − xj).

Verificar que la funcion

λn(x) =

n∑

i=0

|li(x)|

tiene un solo maximo local sobre cada [xi−1, xi]

Indicacion: Sobre [xj−1, xj ] se tiene a λn(x) =

n∑

i=0

ǫili(x) con ǫ = ±1.

6.- Si la funcion f : [x0, x1] −→ R tiene solamente un maximo local y six0 < a < b < x1, entonces

f(a) ≤ f(b) =⇒ x∗ ∈ [a, x1],

f(a) ≥ f(b) =⇒ x∗ ∈ [x0, b],

donde f(x∗) = maxx∈[x0,x1]

f(x).

Page 140: 2374131 Una Introduccion Al Analisis Numerico

III.1 Interpolacion de Lagrange 129

7.- Calcular las constantes de Lebesque

Λn = maxx∈[−1,1]

n∑

i=0

|li(x)| , n = 10, 20, . . . , 100,

a) para la division equidistante xi = −1 + 2i/n, i = 0, 1, . . . , n;

b) para los puntos de Chebichef.

Calcular el maximo de f(x) =

n∑

i=0

|li(x)| sobre [xj−1, xj ] con la busqueda

de Fibonacci:

x1 = xj , x0 = xj−1, γ = (√

5− 1)/2;

d = γ(x1 − x0);

a = x1 − d, b = x0 + d;

10 d = γd;

si (f(a) ≤ f(b)) entonces

x0 = a, a = b, b = x0 + d

si no

x1 = b, b = a, a = x1 − d;

si (x1 − x0 ≥ 10−14) vaya a 10

si no, final.

x a xb0 1

x a b x

xbax0 1

10

8.- Sean dados (xi, yi, y′i), i = 0, 1, . . . , n, los xi distintos entre si.

Mostrar que existe un unico polinomio q(x) de grado 2n + 1 tal que

q(xi) = yi, q(xi) = y′i (i = 0, . . . , n).

Utilizar la formula de Newton con (x0, y0), (x0+ǫ, y0+ǫy′0), . . . y estudiar

su lımite cuando ǫ→ 0.¿Que formula se obtiene para n = 2?, utilizar y[xi, xi] = y′

i, Generalizarel ejercicio para cualquier polinomio de Hermite y obtener un esquemade calculo semejante a la figura III.1.1.

9.- Se considera la funcion f(s) = |s(s− 1) · · · (s− n)| definida para s ∈[0, n].a) Mostrar que f alcanza su maximo en un punto sn ∈ (0, 1/2) y que

sn ∼1

lnncuando n→∞.

b) Mostrar que limn→∞

[f(1/ lnn)(lnn/n!)] = 1/e, deducir que existe

c1 > 0 tal que ∀n > 1, f(sn) ≥ c1n!

ln n.

Page 141: 2374131 Una Introduccion Al Analisis Numerico

130 III Interpolacion

Sean x0, x1, . . . , xn n + 1 puntos equidistantes sobre el intervalo [a, b]con x0 = a y xn = b. Mostrar que existe una constante C2 tal que

∀n > 1. maxx∈[a,b]

∣∣∣∣∣n∏

i=0

(x− xi)

∣∣∣∣∣ ≤C2e

−n

√n lnn

(b− a)(n+1).

10.- Conservando las notaciones, construir una funcion f ∈ C0[a, b] tal que‖Ln(f)‖∞ = Λ ‖f‖∞ y ‖f − Ln(f)‖∞ = (1 + Λn) ‖f‖∞.

11.- Se considera el conjunto x0, . . . , xn de n + 1 puntos diferentes delintervalo [a, b] y Λn la constante de Lebesgue correspondiente a lainterpolacion de Lagrange en estos puntos. Se plantea

li(θ) =

n∏

j=0j 6=i

cos θ − cos θj

cos θi − cos θjcon θi = arccos((2xi − (a + b))/(b− a)),

i = 0, . . . , n.a) Mostrar que:

Λn = maxθ∈R

(n∑

i=o

∣∣∣li(θ)∣∣∣)

;

cos k(θ − ϕ) + cos k(θ + ϕ) =

n∑

i=0

[cos k(θi − ϕ) + cos k(θi + ϕ)] li(θ),

0 ≤ k ≤ n.

b) Planteando ϕn(θ) =n∑

i=0

[li(θ + θi) + li(θ − θi)− li(θ)

], mostrar que:

ϕn(θ) = 1 + 2

n∑

k=1

cos kθ =sin((n + 1/2)θ)

sin(θ/2);

si F (θ) =1

∫ π

−π

signo(ϕn(θ − s))ϕn(s)ds, entonces

3Λn ≥ ‖F‖∞ =1

π

∫ π

−π

|ϕn(s)| dθ ≤ 2

π

∫ (n+1/2)π

0

|θ|θ

dθ = γn,

γn − γn−1 =4

nπ2 +O(

1

n3

)cuando n→∞,

γn ∼4

π2 lnn cuando n→∞.

12.- Sea jn la funcion definida en la demostracion del teorema III.1.23. conn = 2p. Mostrar que ∀p ≥ 1,∫ π

0

tkjn(t)dt ≤ ck/nk,

para k = 1 y 2.

Page 142: 2374131 Una Introduccion Al Analisis Numerico

III.2 Splines Cubicos

En la seccion precedente, se ha visto como determinar el polinomio deinterpolacion. Existen dos problemas de gran magnitud cuando se requiereencontrar un polinomio de interpolacion dado un conjunto (xi, yi), i =0, . . . , n; el primero consiste en la inestabilidad de la interpolacion deLagrange cuando n es grande, por ejemplo para n ≥ 20 no es aconsejabletomar puntos equidistantes. El segundo problema es que aun obteniendo elpolinomio de interpolacion, este no refleja la verdadera forma de la funciona interpolar, por ejemplo, para una funcion racional, se desearıa que elinterpolante tenga la menor curvatura promedio, tal como se grafica conuna sercha. Por consiguiente, dados los puntos a = x0 < x1 < · · · < xn = by los reales yi con i = 0, . . . , n se busca una funcion spline s, tal que:

s(xi) = yi i = 0, . . . , n(i)

s ∈ C2([a, b]),(ii)

s de curvatura pequena.(iii)

La curvatura de s esta dada por

κ(x) =(s′′(x)

(1 + (s′(x))2)32

,

suponiendo que s′(x) es despreciable, se obtiene s′′(x) = κ(x), por consi-guiente la condicion, se expresa de la siguiente forma

∫ xn

x0

(s′′(x))2dx −→ min . (III.2.1)

En la figura III.2.1 se observa dos graficas: la de la izquierda es de unpolinomio de interpolacion de tipo Lagrange; mientras que en la derecha

Page 143: 2374131 Una Introduccion Al Analisis Numerico

132 III Interpolacion

es la grafica del spline interpolante que pasa por los mismos puntos.

Figura III.2.1. Spline de Interpolacion

Definicion III.2.1.- Un spline cubico es una funcion s : [a, b] −→ R cona = x0 < x1 < · · · < xn = b, que satisface:

s ∈ C2[a, b], (III.2.2a)

s|[xj−1,xj ] polinomio de grado 3. (III.2.2b)

Teorema III.2.2.- Dados (xi, yi), i = 0, . . . , n, con a = x0 < x1 < · · · <xn = b. Sean:

s : [a, b] −→ R un spline con s(xi) = yi,f : [a, b] −→ R una funcion con f(xi) = yi,

sis′′(b)[f ′(b)− s′(b)] = s′′(a)[f ′(a)− s′(a)], (III.2.3)

entonces ∫ b

a

[s′′(x)]2dx ≤∫ b

a

[f ′′(x)]2dx.

La condicion (III.2.3) es satisfecha si por ejemplo s′′(a) = s′′(b) = 0, opor ejemplo si f ′(a) = s′(a) y f ′(b) = s′(b).

Definicion III.2.3.- Si s′′(a) = s′′(b) = 0, el spline se llama spline natural.Si f ′(a) = s′(a) y f ′(b) = s′(b) el spline se dice fijo en los bordes.

Demostracion.- Calculando las integrales, se obtiene∫ b

a

[f ′′(x)]2dx−∫ b

a

[s′′(x)]2dx =

∫ b

a

[f ′′(x)− s′′(x)]2dx

︸ ︷︷ ︸≥ 0

+ 2

∫ b

a

s′′(x)[f ′′(x)− s′′(x)]dx.

Page 144: 2374131 Una Introduccion Al Analisis Numerico

III.2 Splines Cubicos 133

Para demostrar la afirmacion del teorema, es suficiente mostrar que lasegunda integral del miembro derecho de la ecuacion es nula. En efecto,integrando por partes, se tiene

∫ b

a

s′′(x)[f ′′(x)− s′′(x)]dx = s′′(x)[f ′(x)− s′(x)]|ba︸ ︷︷ ︸= 0 por (III.2.2)

−∫ b

a

s′′′(x)[f ′(x)− s′(x)]dx

=−n∑

j=1

κj

∫ xj

xj−1

[f ′(x)− s′(x)]dx

=−n∑

j=1

κj [f(x)− s(x)]|xj

xj−1= 0.

Construccion del Spline Interpolante

En este paragrafo, se determinara explıcitamente el spline interpolante. Paratal efecto sea a = x0 < x1 < · · · < xn = b una division cualquiera del inter-valo [a, b]; y sean y0, y1, . . . , yn numeros reales. Se desea construir s : [a, b] −→R, el spline tal que s(xi) = yi. Llamando si = s|[xi−1, xi] : [xi−1, xi] −→ R.Por consiguiente se busca una representacion de si, utilizando los siguientesdatos:

yi−1, yi, pi−1 = s′i(xi−1), pi = s′i(xi). (III.2.4)

Por lo tanto, si(x) es igual a

si(x) =yi−1 + y[xi−1, xi](x− xi−1)

+ (x− xi−1)(x− xi)[a(x− xi−1) + b(x− xi)

], (III.2.5)

faltando determinar los valores de a y b. Planteando hi = xi − xi−1 yderivando (III.2.5) en los puntos xi−1 y xi, se obtiene:

pi−1 = s′(xi−1) = y[xi−1, xi] + h2i b, (III.2.6)

pi = s′(xi) = y[xi−1, xi] + h2i b, (III.2.7)

de donde

si(x) =yi−1 + y[xi−1, xi](x− xi−1)

+(x− xi−1)(x− xi)

h2i

[(pi − y[xi−1, xi])(x− xi−1)

+ (pi−1 − y[xi−1, xi])(x− xi)]. (III.2.8)

Page 145: 2374131 Una Introduccion Al Analisis Numerico

134 III Interpolacion

Ahora bien, se debe determinar los pi, i = 0, . . . , n de manera que s ∈ C2[a, b].Por consiguiente:

s′′i (xi) = s′′i+1(xi) i = 1, . . . , n− 1,

Utilizando la regla de Leibnitz

(fg)′′(x) = f ′′(x)g(x) + 2f ′(x)g′(x) + f(x)g′′(x),

se obtiene:d2

dx2

((x− xi−1)

2(x− xi)

∣∣∣∣x=xi

= 4hi,

d2

dx2

((x− xi−1)(x− xi)

2

∣∣∣∣x=xi

= 2hi,

de donde:

s′′i (xi) =1

hi

[4(pi − y[xi−1, xi]) + 2(pi−1 − y[xi−1, xi])

],

s′′i+1(xi) =1

hi+1

[2(pi+1 − y[xi, xi+1]) + 4(pi − y[xi, xi+1])

]

por lo tanto,

pi−1

hi+ 2pi

(1

hi+

1

hi+1

)+

pi+1

hi+1= 3

[y[xi−1, xi]

hi+

y[xi, xi+1]

hi+1

], (III.2.9)

para i = 1, . . . , n−1. Es ası que se ha obtenido n−1 ecuaciones, teniendo n+1ecuaciones, las dos ecuaciones que faltan para obtener un sistema completo,se obtienen de las condiciones de borde para x0 y xn.

Si el spline es natural, se tiene s′′(a) = s′′(b) = 0, obteniendo:

2p0

h1+

p1

h1= 3

y[x0, x1]

h0(III.2.10a)

2pn−1

hn+

pn

hn= 3

y[xn−1, xn]

hn(III.2.10b)

Si el spline esta fijado en los bordes, se tiene s′(a) = f ′(a) y s′(b) = f ′(b),obteniendo:

p0 = f ′(a), (III.2.11a)

pn = f ′(b). (III.2.11b)

Existen muchos otros tipos de spline, como por ejemplo periodicos, deBezier, etc. Las condiciones de borde son diferentes, pero las ecuaciones dadas

Page 146: 2374131 Una Introduccion Al Analisis Numerico

III.2 Splines Cubicos 135

por (III.2.9) son esencialmente las mismas, estos aspectos seran desarrolladoscon mas detalle posteriormente o en la parte de los ejercicios.

Por otro lado, las ecuaciones que determinan los pi pueden escribirse demanera matricial. A continuacion, se daran las notaciones matriciales paralos splines natural y fijo.

2h1

1h1

0

1h1

2( 1h1

+ 1h2

) 1h2

0 1h2

2( 1h2

+ 1h3

) 1h3

. . .. . .

. . .1

hn−12( 1

hn−1+ 1

hn) 1

hn

1hn

2hn

p0

p1

p2

...

pn−1

pn

=

3h1

y[x0,x1]

3h1

y[x0,x1]+3

h2y[x1,x2]

3h2

y[x1,x2]+3

h3y[x2,x3]

...3

hn−1y[xn−2,xn−1]+ 3

hny[xn−1,xn]

3hn

y[xn−1,xn]

Matriz del spline natural.

2( 1h1

+ 1h2

) 1h2

1h2

2( 1h2

+ 1h3

) 1h3

. . .. . .

. . .1

hn−12( 1

hn−1+ 1

hn)

p1

p2

...

pn−1

=

3h1

y[x0,x1]+ 3h2

y[x1,x2]−p0h1

3h2

y[x1,x2]+3

h3y[x2,x3]

...3

hn−1y[xn−2,xn−1]+ 3

hny[xn−1,xn]− pn

hn

Matriz del spline fijo en los bordes.

Denotando A, la matriz del spline natural como fijo en los bordes, se tieneel siguiente teorema.

Teorema III.2.4.- La matriz A es inversible, es decir

detA 6= 0.

Demostracion.- Se mostrara que la siguiente implicacion es cierta

Ap = 0 =⇒ p = 0.

Supongase que Ap = 0, entonces

pi−1

hi+ 2pi(

1

hi+

1

hi+1) +

pi+1

hi+1= 0,

Page 147: 2374131 Una Introduccion Al Analisis Numerico

136 III Interpolacion

se denota por pioa

|pio| = max

i|pi| ,

por consiguiente

2 |pio| ( 1

hio

+1

hio+1) ≤ |pio

|hio

+|pio|

hio+1,

de donde

2 |pio| ≤ |pio

| .

En uno de los ejercicios de la seccion II.1, se muestra que el problema deencontrar los pi es un problema bien condicionado. Por otra lado la resolucionde este sistema se procede facilmente con el algoritmo de Eliminacion deGauss, si n no es muy grande; en el caso contrario con un metodo iterativoutilizando el hecho que A es simetrica y definida positiva.

El Error de la Aproximacion Spline

Se ha visto en el paragrafo anterior, que la construccion del spline inter-polante es muy simple, solo se requiere resolver un sistema tridiagonal deecuaciones lineales. En esta parte, se insistira en las estimaciones del errorcometido en el proceso de interpolacion spline.

Sean f : [a, b] −→ R una funcion, a = x0 < x1 < · · · < xn = b unasubdivision del intervalo [a, b] y finalmente s(x) el spline fijo en los bordesque interpola f , es decir

s(xi) = f(xi), i = 0, . . . , n;

s′(x0) = f ′(x0);

s′(xn) = f ′(xn);

se desearıa saber que error se comete, en otras palabras

|f(x)− s(x)| ≤ ?

Teorema III.2.5.- Si f ∈ C4[a, b], a = x0 < x1 . . . < xn = b unasubdivision, hi = xi − xi−1, los pi derivadas en los nudos del spline fijoen los bordes. Entonces

|f ′(xi)− pi| ≤h3

24

∥∥∥f (4)∥∥∥∞

, (III.2.12)

Page 148: 2374131 Una Introduccion Al Analisis Numerico

III.2 Splines Cubicos 137

donde h = max hi. Si ademas, la division es equidistante, se tiene

|f ′(xi)− pi| ≤h4

60

∥∥∥f (5)∥∥∥∞

. (III.2.13)

Ademas del interes del resultado del teorema que servira para laestimacion del error, se tiene un medio simple para calcular las derivadasde f en los puntos xi.

Demostracion.- La demostracion del caso general es muy similar a ladel caso de los puntos equidistantes, aquı se mostrara el caso equidistante,dejando al lector el caso general. La construccion del spline esta dada porlas ecuaciones

1

h(pi−1 + 4pi + pi+1)−

3

h2 (f(xi+1)− f(xi−1)) = 0. (III.2.14)

Se define qi, i = 1, . . . , n− 1, por

qi =1

h

(f ′(xi−1) + 4f ′(xi) + f ′(xi+1)

)− 3

h2

(f(xi+1)− f(xi−1)

)(III.2.15)

Por otra lado, utilizando el teorema de Taylor con resto en el punto xi

se tiene:

f(xi+1) = f(xi) + hf ′(xi) +h2

2!f ′′(xi) +

h3

3!f (3)(xi)

+h4

4!f (4)(xi) + h5

∫ 1

0

(1− t)4

4!f (5)(xi + th)dt,

f ′(xi+1) = f ′(xi) + hf ′′(xi) +h2

2!f (3)(xi) +

h3

3!f (4)(xi)

+ h4

∫ 1

0

(1− t)3

3!f (5)(xi + th)dt,

de donde, introduciendo en (III.2.15), se obtiene

qi =h3

∫ 1

0

[(1− t)3

3!− 3

(1− t)4

4!

]f (5)(xi + th)dt

+ h3

∫ 1

0

[(1− t)3

3!− 3

(1− t)4

4!

]f (5)(xi − th)dt.

Utilizando el teorema del valor medio y calculando la integral

∫ 1

0

[(1− t)3

3!− 3

(1− t)4

4!

]dt =

1

60,

Page 149: 2374131 Una Introduccion Al Analisis Numerico

138 III Interpolacion

se obtiene finalmente que

qi =1

60h3(f (5)(ξi) + f (5)(ηi)

),

con ξi ∈ [xi−1, xi] y ηi ∈ [xi, xi+1], por consiguiente

qi ≤h3

20

∥∥∥f (5)∥∥∥∞

. (III.2.16)

Restando (III.2.14) con (III.2.15), se tiene

ei = f ′(xi)− pi,

que es solucion del sistema de ecuaciones

1

h[ei−1 + 4ei + ei+1] = qi, i = 1, . . . , n− 1.

Sea io tal que|eio| = max

i=1,...,n|ei| ,

en consecuencia, se tiene:

4eio= hqio

− eio−1 − eio+1,

4 |eio| ≤ h |qio

|+ |eio−1|+ |eio+1|≤ h |qio

|+ |eio|+ |eio

| ,

de donde finalmente

|ei| ≤ |eio| ≤ h

2|qio| .

Antes de poder estimar el error cometido por el polinomio de interpo-lacion spline, es necesario el siguiente teorema.

Teorema III.2.6.- Si xi = x0 + ih, con h = (b − a)/n, f ∈ C5[a, b], s(x)el spline fijo en los bordes, y p(x) el polinomio de interpolacion de Hermitesobre el intervalo [xi−1, xi], tal que

p(xj) = s(xj), p′(xj) = f ′(xj), j = i− 1, i.

Entonces

|p(x)− s(x)| ≤ h5

240

∥∥∥f (5)∥∥∥∞

para x ∈ [xi−1, xi]. (III.2.17)

Page 150: 2374131 Una Introduccion Al Analisis Numerico

III.2 Splines Cubicos 139

Demostracion.- El polinomio de Hermite, utilizando (III.2.8), esta dadopor

p(x) =yi−1 + y[xi−1, xi](x− xi−1)

+(x− xi−1)(x− xi)

h2i

[(f ′(xi)− y[xi−1, xi])(x− xi−1)

+ (f ′(xi−1)− y[xi−1, xi])(x− xi)], (III.2.18)

restando (III.2.18) con (III.2.8), se obtiene

p(x)− s(x) =(x− xi−1)(x− xi)

h2i

[(f ′(xi)− pi)(x− xi−1)

+ (f ′(xi−1)− pi−1)(x− xi)],

por lo tanto

|p(x)− s(x)| ≤ |x− xi−1| |x− xi|h4∥∥f (5)

∥∥∞

60[|x− xi|+ |x− xi−1|]

≤ h5

240

∥∥∥f (5)∥∥∥∞

.

Ahora bien, para tener una estimacion del error de la interpolacionspline, solo falta conocer el error cometido por el polinomio de interpolacionde Hermite, estimacion que esta dada en el siguiente teorema.

Teorema III.2.7.- Sean, f ∈ [x0, x1], h = x1 − x0, p(x) el polinomio deinterpolacion de Hermite que satisface:

p(xi) = f(xi), i = 0, 1;

p′(xi) = f ′(xi), i = 0, 1;

entonces

|f(x)− p(x)| ≤ h4

384

∥∥∥f (4)∥∥∥∞

. (III.2.19)

Demostracion.- Sean ǫ > 0 suficientemente pequeno, pǫ(x) el polinomio deinterpolacion que satisface:

pǫ(x0) = f(x0), pǫ(x0 + ǫ) = f(x0 + ǫ),

pǫ(x1) = f(x1), pǫ(x1 − ǫ) = f(x1 − ǫ).

Page 151: 2374131 Una Introduccion Al Analisis Numerico

140 III Interpolacion

Por el teorema (III.1.13), se tiene para todo ǫ.

|f(x)− pǫ(x)| ≤ |(x− x0)(x− x0 − ǫ)(x− x1 = ǫ)(x− x1)|∥∥f (4)

∥∥4!

,

haciendo tender ǫ hacia 0, se obtiene

|f(x)− p(x)| ≤∣∣(x− x0)

2(x− x1)2∣∣∥∥f (4)

∥∥4!

≤ h4

384

∥∥∥f (4)∥∥∥ .

Finalmente, con los anteriores teoremas se puede dar la siguiente esti-macion del error del spline fijo en los bordes.

Teorema III.2.8.- Sean, f ∈ C5[a, b], xi = x0 + ih, i = 0, . . . , n, conh = (b− a)/n, s(x) el spline fijo en los bordes de la funcion f respecto a lasubdivision equidistante, entonces

|f(x)− s(x)| ≤ h4

384max

x∈[xi−1,xi]

∣∣∣f (4)(x)∣∣∣+ h5

240

∥∥∥f (5)∥∥∥∞

. (III.2.20)

Demostracion.- Suficiente utilizar la desigualdad del triangulo en los dosanteriores teoremas, es decir

|f(x)− s(x)| ≤ |f(x)− p(x)|+ |p(x)− s(x)| .

Los resultados obtenidos en los teoremas de esta subseccion han sidodemostrados para el caso de divisiones equidistantes, no obstante modifi-cando las demostraciones para divisiones mas generales se puede obtenerresultados similares en la mayoracion del error de la interpolacion spline, nohay que sorprenderse que las mayoraciones sean muy parecidas al del casoequidistante, con la diferencia que h este elevado a una potencia de un gradomenor.

Por otro lado, los teoremas enunciados consideran el caso del spline fijoen los bordes, para los otros tipos de spline, las mayoraciones del error deinterpolacion se deben efectuar utilizando los resultados anteriores mas unerror debido al cambio de tipo de spline.

Teorema III.2.9.- Sean, f ∈ C5[a, b], xi = x0 + ih, i = 0, . . . , n; conh = (b − a)/n, s(x) el spline fijo en los bordes, s(x) es el spline natural.Entonces

|s(x)− s(x)| ≤ h2

8max

x∈I1∪In

|f ′′(x)|+ h5

240

∥∥∥f (5)∥∥∥∞

, (III.2.21)

Page 152: 2374131 Una Introduccion Al Analisis Numerico

III.2 Splines Cubicos 141

donde I1 = [x0, xn] y In = [xn−1, xn].

Demostracion.- Sustrayendo los sistemas lineales que determinan pi y pi

en la construccion de los splines fijo en los bordes y natural, se obtiene:

(pi−1 − pi−1) + 4(pi − pi) + (pi+1 − pi+1) = 0 i = 0, . . . , n− 1;

2(p0 − p0) + (p1 − p1) = C0;

2(pn − pn) + (pn−1 − pn−1 = Cn;

donde:

C0 = 3y[x0, x1]− 2p0 − p1, Cn = 3y[xn−1, xn]− 2pn − pn−1.

Sea io ∈ 0, 1, . . . , n, tal que

|pio− pio

| = maxi|pi − pi|.

Ahora bien,io = 0, o bien io = n, por que de lo contrario se tendrıa

4 |pio− pio

| ≤ |pio−1 − pio−1|+ |pio+1 − pio+1| ≤ 2 |pio− pio

| .

Suponiendo que io = 0, se tiene la siguiente mayoracion

|pi − pi| ≤ |p0 − p0| ≤ C0;

en el otro caso, se obtiene

|pi − pi| ≤ |pn − pn| ≤ Cn.

Utilizando la formula de Taylor, con resto en forma de integral, se obtienepara la funcion f en el punto x0, los siguientes resultados:

f(x1)− f(x0) = hf ′(x0) + h2

∫ t

0

(1− t)f ′′(x0 + th)dt, (III.3.22)

f ′(x1) = f ′(x0) + h

∫ 1

0

f ′′(x0 + th)dt; (III.3.23)

y en el punto xn los siguientes resultados:

f(xn−1)− f(xn) = −hf ′(xn) + h2

∫ t

0

(1− t)f ′′(xn − th)dt,

f ′(xn−1) = f ′(xn)− h

∫ 1

0

f ′′(xn − th)dt.

Page 153: 2374131 Una Introduccion Al Analisis Numerico

142 III Interpolacion

La formula (III.3.13) del teorema III.3.5, conduce a las estimaciones:

p1 = f ′(x1) + ǫh4

60

∥∥∥f (5)∥∥∥∞

, con |ǫ| ≤ 1; (III.3.24)

pn−1 = f ′(xn−1) + ǫ′h4

60

∥∥∥f (5)∥∥∥∞

, con |ǫ′| ≤ 1.

Suponiendo que io = 0, introduciendo (III.3.22-24) en C0, se obtiene

C0 = 3f ′(x0) + h

∫ 1

0

(1− t)f ′′(x0 + th)dt− 2f ′(x0)− f ′(x0)

− h

∫ 1

0

f ′′(x0 + th)dt− ǫh4

60

∥∥∥f (5)∥∥∥∞

= −h

∫ 1

0

tf ′′(x0 + th)dt− ǫh4

60

∥∥∥f (5)∥∥∥∞

,

de donde

|C0| ≤1

2h max

x∈I1

|f ′′(x)|+ h4

60

∥∥∥f (5)∥∥∥∞

.

Si io = n, se obtiene similarmente

|Cn| ≤1

2h max

x∈In

|f ′′(x)|+ h4

60

∥∥∥f (5)∥∥∥∞

.

La diferencia de ambos splines esta mayorada por lo tanto por

|p(x)− p(x)| =∣∣∣∣(x− xi−1)(x− xi)

h2 [(pi − pi)(x− xi−1) + (pi−1 − pi−1)(x− xi)]

∣∣∣∣h

4

(1

2max

x∈I1∪In

|f ′′(x)|+ h5

60

∥∥∥f (5)∥∥∥∞

)(|x− x− xi−1|+ |x− xi|)

≤ h2

8max

x∈I1∪In

|f ′′(x)|+ h5

240

∥∥∥f (5)∥∥∥∞

.

El spline fijo en los bordes es mas preciso que el natural, siempre ycuando se conozca los valores de la derivada de la funcion interpolada enlos bordes. En la demostracion del ultimo teorema puede observarse que ladiferencias de los pi verifican una ecuacion de diferencias finitas con valoresen la frontera, resolviendo esta ecuacion puede observarse que la diferenciaentre los pi es mucho menor en los nudos centrales, que en aquellos que estancerca de los bordes. Por consiguiente la estimacion del teorema (III.2.9) esmuy pesimista, en la practica la diferencia de los errores es menor.

Page 154: 2374131 Una Introduccion Al Analisis Numerico

III.2 Splines Cubicos 143

Aplicacion de spline

Al inicio de esta seccion, los splines fueron abordados como un instrumentonumerico de aproximacion, como una alternativa a la interpolacion poli-nomial de tipo Lagrange. Esto debido a sus propiedades de no presentarproblemas de inestabilidad numerica, por sus cualidades de convergencia ypor la poca curvatura que presentan.

Figura III.2.1. Aplicacion grafica de los splines

Ahora bien, los splines son utilizados tambien como un instrumentografico. Una gran cantidad de los algoritmos desarrollados en grafismoasistido por computadora, utilizan ampliamente los splines en sus diferentesversiones. En la figura III.2.2, se observa con claridad la potencia de lainterpolacion spline. En el dibujo de la izquierda, se tiene los puntos unidospor segmentos rectilinios, mientras que en el dibujo de la derecha unidos porsplines.

Ejercicios

1.- Considerar puntos equidistantes xi = x0+ih, h > 0. Mostrar que existeun unico spline llamado B-spline, tal que para un j fijo se tiene:

s(xj) = 1,

s(x) = 0 si |x− xj | ≥ 2h.

Dibujar.

Page 155: 2374131 Una Introduccion Al Analisis Numerico

144 III Interpolacion

2.- Desarrollar una formula para los splines periodicos.Mostrar la existencia y la unicidad del spline que pasa por (xi, yi),i = 0, . . . , n, tal que

s′(x0) = s′(xn), s′′(x0) = s′′(xn).

3.- Escribir una subrutina SPLICO(N,X,Y,DY,P,A,B).

Los datos son N, X(0:N), Y(0:N) y P(0), P(N). La subrutina debedar como valores DY(0:N-1) diferencias divididas, P(0:N) los pi,A(0:N-1) los (pi − y[xi−1, xi]) y B(0:N-1) los (pi−1 − y[xi−1, xi]).

4.- Escribir una funcion SPLIVA(N,X,Y,DY,A,B,T) que calcula el valor delspline en el punto T. Examinarla sobre varias funciones de su eleccion.

5.- Sea xi = x0+ih, i = 0, . . . , n, una division equidistante y lj(x) el splinede tipo Lagrange que satisface

1, si i = j;

0, sino;

y l′j(x0) = 0, l′j(xn) = 0. Para las pendientes pi = lj(xi) mostrar:

− 3

h< pj <

2

h;

. . . , pj−3 > 0, pj−2 < 0, pj−1 > 0, pj+1 < 0, pj+2 > 0, . . . .

6.- Los splines lj(x) del anterior ejercicio no cambian de signo en ningunintervalo [xi−1, xi].

7.- Sobre el intervalo [xi−1, xi]

n∑

i=0

|lj(x)| = ti(x)

es el spline que satisface

1 si j = i + 2k o j = i− 2k − 1 con k = 0, 1, . . . ,

−1 sino.

8.- Utilizando SPLICO y SPLIVA de los ejercicios 3 y 4. Calcular paraxi = i/n, n = 20:

a) el spline l7(x),

b) la funcion

n∑

i=0

|li(x)|,

hacer dibujos. Verificar las propiedades de los ejercicios 5, 6 y 7.

Page 156: 2374131 Una Introduccion Al Analisis Numerico

III.3 Extrapolacion

En las dos primeras secciones, se ha abordado la interpolacion polinomial yla interpolacion spline como un medio de aproximacion dentro un intervalocerrado y acotado [a,b]. Sin embargo estos procedimientos no sirven cuandose trata de determinar el valor de una funcion o el lımite de una funciondefinida en un intervalo abierto (a, b) o mas aun si la funcion esta definidaen un intervalo no compacto.

En esta seccion, se estudiara la extrapolacion por medio de funcionespolinomiales, como una consecuencia natural de los resultados obtenidos enla primera seccion de este capıtulo. Por otro lado, se vera que la extrapolacionpolinomial, no es solamente un instrumento para determinar valores fuerade cierto rango, si no tambien como un medio para acelerar la convergenciade suceciones convergentes.

Sea f : (0, 1] −→ R, se desea determinar

limx→0+

f(x), (III.3.1)

sabiendo que se puede determinar sin ningun problema f(h) para h > 0.Los otros casos de determinacion de lımite se convierten el primer caso portraslacion afın, o planteando h = 1/x si se desea determinar el lımite cuandox → ∞. Por consiguiente se supondra que f tiene un desarrollo asimtoticopor derecha de la forma

f(h) = a0 + a1h + · · ·+ anhn +O(hn+1), h > 0. (III.3.2)

Sea 1 ≥ h0 > h1 > · · · > hn > 0 una subdivision decreciente del intervalo(0, 1], por lo tanto

limx→0+

f(x) ≈ p(0), (III.3.3)

donde p(x) es el polinomio de interpolacion que pasa por (hi, f(hi)),i = 0, . . . , n. Escogiendo adecuadamente estos hi se puede obtener unalgoritmo facil y sencillo de implementar, para este efecto es necesario lasiguiente proposicion.

Proposicion III.3.1.- Sean (xi, yi), i = 0, 1, . . . , n, los xi diferentes entresi, p1(x) el polinomio de interpolacion de grado n− 1 que pasa por (xi, yi),i = 0, . . . , n − 1, y p2(x) el polinomio de interpolacion de grado n − 1 quepasa por (xi, yi), i = 1, . . . , n: entonces el polinomio p(x) de grado n quepasa por (xi, yi), i = 0, . . . , n; esta dado por

p(x) = p1(x)xn − x

xn − x0+ p2(x)

x− x0

xn − x0. (III.3.4)

Page 157: 2374131 Una Introduccion Al Analisis Numerico

146 III Interpolacion

Demostracion.- Se puede ver facilmente que p(x) es un polinomio de gradomenor o igual a n, En los nudos, excepto para i = 0 o i = n, se tiene

p(xi) =xn − xi

xn − x0p1(xi) +

xi − x0

xn − x0

= yi

(xn − xi

xn − x0+

xi − x0

xn − x0

),

para i = 0 y i = n verificacion inmediata.

Corolario III.3.2.- Con las mismas hipotesis del teorema precedente, setiene

p(0) =p1(0)xn − p2(0)x0

xn − x0

= p1(0) +p1(0)− p2(0)

xn/x0 − 1.

(III.3.5)

Demostracion.- Verificacion inmediata.

Ahora bien, volviendo al problema de extrapolacion, sea f : (0, 1] −→ R;1 ≥ h0 > h1 > · · · > hn > 0 una subdivision decreciente del intervalo (0, 1].Suponiendo que f admite el desarrollo asintotico por derecha, dado por

f(h) = a0 + a1h + · · ·+ anhn +O(hn+1),

p(x) el polinomio de interpolacion que pasa por (xi, f(xi)), i = 0, . . . , n;entonces se puede suponer

limh→0+

f(x) ≈ p(0).

Definiendo pj,k el polinomio de interpolacion de grado ≤ k que pasa por(hi, f(hi)), j − k, j; se tiene por consiguiente

p(x) = pn,n(x). (III.3.6)

Utilizando la proposicion III.3.1 y el corolario III.3.2 se tiene las siguientesrelaciones recursivas para determinar p(0):

pj0(0) =f(hj), (III.3.7a)

pj,k+1(0) =pj,k(0) +pj,k(0)− pj−1,k(0)

hj−k−1/hj − 1. (III.3.7b)

Page 158: 2374131 Una Introduccion Al Analisis Numerico

III.3 Extrapolacion 147

De donde estas relaciones recursivas pueden expresarse en un tablero, con laconvencion de llamar pj,k = Tj,k.

Tabla III.3.1. Tablero de Extrapolacion.

h0 T00

h1 T10 T11

h2 T20 T21 T22

h3 T30 T31 T32 T33

h4 T40 T41 T42 T43 T44

......

......

.... . .

Los cocientes hj−k−1/hj se deducen facilmente del tablero, se toma comonumerador el hi que se encuentra en la misma diagonal a Tk,l y comodenominador el hi que se encuentra en la misma fila que Tk,l.

Ejemplo

Un procedimiento para calcular π, es considerar la serie

π = 4

∞∑

k=0

(−1)k 1

2k + 1.

Lastimosamente esta serie converge muy lentamente para obtener unaprecision deseada de π, pero se puede acelerar la convergencia deesta serie utilizando el procedimiento de extrapolacion de Richardson,formulado anterioremente. Se define hk = 1/(2k + 1),

f(hk) = 4k∑

j=0

(−1)j 1

2j + 1,

obteniendo ası el tablero siguiente

2.6667

2.8952 3.2381

2.9760 3.1781 3.1030

3.0171 3.1607 3.1302 3.1619

3.0418 3.1533 3.1367 3.1465 3.1292

3.0584 3.1495 3.1391 3.1434 3.1391 3.1500

3.0703 3.1473 3.1401 3.1424 3.1408 3.1431 3.1356

3.0792 3.1459 3.1407 3.1420 3.1413 3.1420 3.1407 3.1461

3.0861 3.1450 3.1410 3.1418 3.1414 3.1417 3.1414 3.1422 3.1381

3.0916 3.1443 3.1411 3.1417 3.1415 3.1417 3.1415 3.1417 3.1412 3.1444

3.0962 3.1438 3.1413 3.1417 3.1416 3.1416 3.1416 3.1416 3.1415 3.1419 3.1393

Page 159: 2374131 Una Introduccion Al Analisis Numerico

148 III Interpolacion

La practica en la extrapolacion numerica muestra que es practico yconveniente utilizar sucesiones de la forma hj = 1/nj , donde nj∞j=0 es unasucesion creciente de numeros naturales, por consiguiente la formula (III.3.7)se convierte en

pj0(0) = f(hj),

pj,k+1(0) = pj,k(0) +pj,k(0)− pj−1,k(0)

nj−k−1/nj − 1.

(III.3.8)

Las tres sucesiones de enteros positivos crecientes son:i) Armonica: 1, 2, 3, 4, 5 . . .;ii) Romberg: 1, 2, 4, 8, 16, . . .;iii) Bulirsch: 1, 2, 3, 4, 6, 8, , 12, 16, . . .,

es decir los enteros de la forma 2i y 3 · 2i.

Teorema III.3.3.- Sea f : (0, 1] −→ R, supongase que f tiene el desarrolloasintotico por derecha en x = 0, para k = 0, 1, 2, . . . , ko; dado por

f(x) = a0 + a1x + · · ·+ akxk + Rk+1(x),

con |Rk+1(x)| ≤ Ck+1xk+1, para x > 0. Sea hj = 1/nj , con nj una sucesion

creciente de naturales, entonces el procedimiento de extrapolacion definidopor (III.3.8) verifica la siguiente propiedad:Si para todo j > 0 se tiene hj+1/hj ≤ r < 1, entonces

∀k con 0 ≤ k ≤ ko, Tm,k = a0 +O(hk+1m−k). (III.3.9)

Demostracion.- Escribiendo el polinomio de interpolacion de grado ≤ k,se tiene

f(x) = pmk(x) + Rk+1(x),

de donde

pmk(x)− f(x) =

m∑

i=m−k

Rk+1(hi)lm,k,i(x), (III.3.10)

con lm,k,i(h) =

m∏

j=m−kj 6=i

h− hj

hi − hj. Para x = 0, se deduce que

Tmk − a0 =

m∑

i=m−k

m∏

j=m−kj 6=i

hj/hi

hj/hi − 1Rk+1(hi).

Page 160: 2374131 Una Introduccion Al Analisis Numerico

III.3 Extrapolacion 149

Si j < i, se mayora

∣∣∣∣hj/hi

hj/hi − 1

∣∣∣∣ por1

1− ri−j , mientras que

si i < j, se mayora

∣∣∣∣hj/hi

hj/hi − 1

∣∣∣∣ porrj−i

1− rj−i, finalmente |Rk+1(hi)| por

Ck+1

(ri−m+khm−k

)k+1, deduciendo

|Tm,k − a0| ≤ C(k, r)Ck+1hk+1m−k

donde C(k, r) es una constante independiente de m.

La convergencia hacia a0 es obtenida en cada una de las columnas deltablero, para la primera columna la convergencia es O(hm), para la segundacolumna la velocidad de convergencia esta dada por O(h2

m−1), y para la

k-esima columna la velocidad de convergencia es igual a O(hk+1m−k+1). Por

consiguiente, si a1 6= 0 la convergencia de la k-esima columna es k veces masrapida que de la primera columna.

Las sucesiones de Romberg y Bulirsch satisfacen las condiciones delteorema III.3.3 con r = 1/2 y r = 3/4. Sin embargo la otra sucesion utilizadaampliamente en las extrapolaciones numericas como ser la armonica nocumple el requisito que hj+1/hj ≤ r < 1. No obstante se tiene a disposicionel siguiente teorema.

Teorema III.3.4.- Mismas hipotesis del teorema III.3.3 para la funcion f ,se define hn = 1/n. Entonces se tiene:

∀k con 0 ≤ 2k ≤ ko Tmk = a0 +O(hk+1m ). (III.3.11)

Demostracion.- Se tiene

Rk+1(h) = qk(h) + R2k+1(h) con

qk(h) = ak+1hk+1 + · · ·+ a2kh2k.

Utilizando (III.3.10), se deduce

Tmk − a0 =m∑

i=m−k

(qk(hi)lm,k,i(0) + R2k+1(hi)lm,k,i(0)

).

Por el teorema III.1.13, se tiene

qk(0)−m∑

i=m−k

qk(hi)lm,k,i(0) =1

(k + 1)!

m∏

j=m−k

(−hj)q(k+1)k (ξ),

Page 161: 2374131 Una Introduccion Al Analisis Numerico

150 III Interpolacion

lo que muestra que

m∑

i=m−k

qk(hi)lm,k,i(0) = O(hk+1m ).

Por otro lado

lm,k,i(0) =m∏

j=m−kj 6=i

hj

hj − hi=

m∏

j=m−kj 6=i

i

i− j,

de donde |R2k+1(hi)lm,k,i(0)| ≤ C2k+1h2k+1i ik ≤ C2k+1y

k0yk+1

i ,

deduciendo facilmente el teorema.

Debido al error de redondeo que se comete en el calculo del polinomiode interpolacion, y por consiguiente en el proceso de extrapolacion, se debeevitar la utilizacion de polinomios de interpolacion de grado muy elevado, lapractica aconseja no pasar de 10.

Por otro lado, la extrapolacion numerica es muy utilizada en la cons-truccion de metodos de integracion, como tambien en la construccion demetodos de resolucion de ecuaciones diferenciales.

Ejercicios

1.- Sea f : (0, 1] −→ R una funcion cuyo desarrollo asintotico por derechaen x = 0 esta dado por

f(x) = a0 + a1x2 + · · ·+ akx2k +O(x2k+2).

Modificar el algoritmo de Aitken-Naville, es decir el proceso de extra-polacion, de manera que el numero de operaciones se redusca ostensi-blemente.

2.- En esta seccion, se da un ejemplo de como acelerar la convergencia deuna sucesion para calcular π. Suponiendo que el desarrollo asintoticoes par, como en el ejercicio 1, recalcule y compare.

3.- Utilizando el procedimiento de la seccion III.1 para determinar lainfluencia de los errores de redondeo en la determinacion del polinomiode interpolacion. Estudie la influencia de los errores de redondeo enla extrapolacion, suponiendo que los unicos errores de redondeo quese comete son aquellos relativos a la evaluacion de la funcion f a serextrapolada.

4.- Calcule√

2, utilizando un procedimiento de extrapolacion, por ejemplo√1 = 1,

√1, 21 = 1, 1,

√1, 44 = 1, 2,

√1, 69 = 1, 3;

√1, 96 = 1, 4;√

1, 9881 = 1, 41, . . ..

Page 162: 2374131 Una Introduccion Al Analisis Numerico

Capıtulo IV

Ecuaciones No Lineales

En el capıtulo II, se vio diferentes metodos para resolver problemas lineales,pero tambien existen problemas no lineales, como por ejemplo ecuacionescuadraticas, polinomiales, trigonometricas y muchas otras mas. La Historiade las Matematicas muestra que los problemas lineales fueron estudiados yresueltos en tiempos inmemoriables, pero luego el hombre confronto otrostipos de problemas cuya caracterıstica no era precisamente lineal. En elcaso lineal la solucion de un problema puede darse de manera explıcita, essuficiente determinar la inversa de la matriz del sistema y multiplicar paraobtener la solucion de este problema. En el caso no lineal se continuo conesta optica, lo cual es siempre posible bajo ciertas condiciones, como ejemplose tiene el teorema de la funcion inversa, pero lastimosamente en la mayorparte de los casos esta funcion inversa no puede ser expresada como unacombinacion de funciones elementales, entendiendose como funcion elementalaquellas que uno estudia en colegio y los primeros semestres de universidad.

En este capıtulo, se intentara de cierta manera seguir este desarrollohistorico, dejando sobrentendido que el estudio de los problemas lineales entodas sus variantes es conocido por el lector. Por consiguiente, una primeraparte sera dedicada al estudio de las soluciones de ecuaciones polinomia-les, teniendo como epılogo el Teorema de Galois. Despues se abordara losmetodos iterativos para encontrar la solucion o soluciones de una ecuacion,dando condiciones para asegurar la existencia, la unicidad local y la conver-gencia de tales metodos. Como una clase de metodo iterativo, se estudiarael Metodo de Newton, enunciando: teoremas de convergencia, existencia yunicidad de soluciones, algunos problemas frecuentes que se encuentran en laimplementacion de tal metodo; como tambien modificaciones para simplificarsu utilizacion en determinadas situaciones. Finalmente, se vera el equivalentedel Metodo de los Mınimos Cuadrados, en los problemas no lineales, que esel Metodo de Gauss-Newton.

Page 163: 2374131 Una Introduccion Al Analisis Numerico

IV.1 Ecuaciones Polinomiales

Una de la clase de ecuaciones que se confronta a diario son las ecuacionespolinomiales, que son de la forma

xn + a1xn−1 + · · ·+ an−1x + an = 0, (IV.1.1)

donde los ai son numeros reales o complejos.Como C es una extension del cuerpo R, se puede suponer que el

problema consiste en determinar las raices o ceros de un polinomio p(x) ∈C[x]. La existencia de las soluciones de una ecuacion polinomial esta dadapor el Teorema Fundamental del Algebra que se lo enuncia sin demostracion.

Teorema IV.1.1.- Fundamental del Algebra. Sea p(x) ∈ C[x] de grado n,entonces p(x) tiene exactamente n ceros contando con su multiplicidad.

Comentando este teorema, se puede agregar que un polinomio a coe-fientes reales puede no tener ceros reales; pero por el teorema Fundamentaldel Algebra, este tiene exactamente n raices contando con su multiplicidad.

Por otro lado, p(x) puede ser visto como una funcion de C en C, ahorabien toda funcion polinomial es holomorfa, y si el polinomio es no nulo,entonces los ceros forman un conjunto discreto, es decir que para todo cerox0, existe un r > 0 tal que p(x) 6= 0 para todo x ∈ C tal que 0 < |x| < r.Ademas, la utilizacion del teorema de Rouche permite de determinar losdiscos donde se encuentran los ceros y complementando esta informacion elnumero exacto de ceros.

Ecuaciones Resolubles por Radicales

Tal como se dijo en la introduccion de este capıtulo, se ha buscado inicial-mente la manera de expresar la solucion de una ecuacion por medio de fun-ciones elementales. En esta subseccion, se vera precisamente esta manera deexpresar las soluciones. Se comenzara con el caso mas simple, las ecuacionescuadraticas.

Ecuaciones cuadraticas

Una ecuacion cuadratica o ecuacion polinomial de segundo grado es de laforma

ax2 + bx + c = 0, con a 6= 0;

ecuacion que es equivalente a

x2 + bx + c = 0, (IV.1.2)

Page 164: 2374131 Una Introduccion Al Analisis Numerico

IV.1 Ecuaciones Polinomiales 153

completando cuadrados se tiene

(x +

b

2

)2

+ c− b2

4= 0,

obteniendo, ası dos raices:

x1 = − b

2+

√b2

4− c, x2 = − b

2−√

b2

4− c. (IV.1.3)

Si b2

4 − c ≥ 0, se utiliza la determinacion usual de la raiz cuadrada. Encaso contrario, una determinacion donde las raices cuadradas de numerosnegativos este definida.

Ecuaciones Cubicas

Las ecuaciones cubicas o ecuaciones polinomiales de tercer grado son de laforma

ax3 + bx2 + cx + d = 0, con a 6= 0; (IV.1.4)

esta ecuacion dividiendo por a se reduce a una ecuacion de la forma

x3 + ax2 + bx + c = 0, (IV.1.5)

planteando x = x+a/3, la ecuacion se convierte en una ecuacion de la forma

x3 − 3px− 2q = 0. (IV.1.6)

Ahora bien, si se plantea x = u + v, se obtiene

u3 + 3u2v + 3uv2 + v3 − 3p(u + v)− 2q = 0,

de dondeu3 + v3 + (u + v)(3uv − 3p)− 2q = 0,

deduciendose, dos ecuaciones para u y v:

uv = p,

u3 + v3 = 2q;

por consiguiente u3v3 = p3, mostrando ası que u3, v3 son las raices delpolinomio de segundo grado

λ2 − 2qλ + p3, (IV.1.7)

Page 165: 2374131 Una Introduccion Al Analisis Numerico

154 IV Ecuaciones No Lineales

por lo tanto:

u3 = q +√

q2 − p3, v3 = q −√

q2 − p3;

para obtener finalmente la formula de Cardano

x =3

√q +

√q2 − p3 +

3

√q −

√q2 − p3. (IV.1.8)

teniendo cuidado de verificar uv = p.

Ecuaciones polinomiales de grado cuarto

Son ecuaciones que pueden escribirse de la forma

x4 + ax3 + bx2 + cx + d = 0, (IV.1.9)

planteando x = x + a/4, esta ecuacion se convierte en una ecuacion de laforma

x4 − px2 − 2qx− r = 0, (IV.1.10)

introduciendo z ∈ C en la anterior ecuacion, se obtiene la siguiente ecuacionequivalente

(x2 + z)2 = (2z + p)x2 + 2qx + z2 + r,

se elige z de manera que el segundo miembro de la ecuacion precedente seauna cuadrado perfecto, y eso ocurrre, si y solamente si

(2z + p)(z2 + r)− q2 = 0, (IV.1.11)

de donde z es raiz de una ecuacion de tercer grado, que ya ha sido resueltaanteriormente. Habiendo determinado z, se tiene:

(x2 + z)2 = (αx + β)2, con α =√

2z + p, β =√

z2 + r;

(x2 + αx + z + β)(x2 − αx + z − β) = 0,

por consiguiente, las cuatro raices de la ecuacion estan dadas por:

x1 =−α +

√α2 − 4(z + β)

2, (IV.1.12a)

x2 =−α−

√α2 − 4(z + β)

2, (IV.1.12b)

x3 =−α +

√α2 − 4(z − β)

2, (IV.1.12c)

x4 =−α−

√α2 − 4(z − β)

2. (IV.1.12d)

Page 166: 2374131 Una Introduccion Al Analisis Numerico

IV.1 Ecuaciones Polinomiales 155

Ecuaciones no Resolubles por Radicales

Se ha visto que las ecuaciones polinomiales de grado igual o menor a 4 tienensoluciones que pueden ser expresadas como una composicion de radicales.Las formulas desarrolladas en el anterior paragrafo fueron estudiadas ycomprendidas hasta mediados del siglo XVI, posteriormente se ataco alproblema de las ecuaciones de grado superior, en particular a las ecuacionesde grado quinto. Todos los intentos iban en la direccion de encontrar unaformula general que estuviese expresada con radicales. Pero a principios delsiglo pasado Galois mostro su famoso teorema que trastorno en cierta manerael mundo matematico de aquella epoca. Se enunciara este teorema sin darla demostracion.

Teorema IV.1.2.- Galois. No existe una formula general en forma deradicales para las ecuaciones polinomiales de grado superior o igual a 5.

Este resultado lejos de descorazonar el estudio de las ecuaciones polino-miales constituyo un aporte, ya que se ataco el problema utilizando metodosanalıticos que estaban emergiendo con gran fuerza a principios y mediadosdel siglo pasado. Por otro lado se abandono la idea de encontrar una formulageneral, para insistir sobre la posible ubicacion de los ceros de un polinomio.Se desarrollaron metodos iterativos para la solucion de estos problemas cuyoalcanze es mas vasto que el de las ecuaciones polinomiales.

Localizacion de Ceros

Como se dijo anteriormente, al no poder calcular explıcitamente las raices deun polinomio, es importante determinar en que region se encuentran estasraices de manera de poder aplicar un metodo iterativo.

Sea, p(x) un polinomio a coeficientes complejos de grado n, es decir

p(x) = a0xn + a1x

n−1 + · · ·+ an,

si x es una raiz, se tiene

xn = −a1

a0xn−1 − a2

a0xn−2 + · · · − an

a0.

Introduciendo la matriz de Frobenius de esta ecuacion, se tiene

x

xn−1

xn−2

...x1

=

− a1

a0− a2

a0· · · − an

a01

1. . .

1 0

︸ ︷︷ ︸F matriz de Frobenius

xn−1

xn−2

...x1

,

Page 167: 2374131 Una Introduccion Al Analisis Numerico

156 IV Ecuaciones No Lineales

de donde p(x) = 0, si y solamente si x es un valor propio de F . Por lo tantola localizacion de ceros de p(x) es equivalente a localizar los valores propiosde la matriz F . A continuacion se da un teorema cuya demostracion serahecha en el capıtulo 5.

Teorema IV.1.3.- Gerschgorin. Sean A una matriz, λ un valor propio deA, entonces existe i tal que

|λ− aii| ≤∑

j 6=i

|aij | . (IV.1.13)

Aplicando este teorema a la matrix F se tiene la siguiente estimacion:

Corolario IV.1.4.- La raices del polinomio p(x) = a0xn + · · · + an, con

a0 6= 0 verifican

|x| ≤ max

(1,

n∑

i=1

∣∣∣∣ai

a0

∣∣∣∣

). (IV.1.14)

Uno de los resultados practicos e importantes en el algebra de valorespropios, es que la propiedad de valor propio es invariante por trasposicion,por consiguiente, el:

Corolario IV.1.5.- Las mismas hipotesis del corolario precedente, dan laestimacion siguiente

|x| ≤ max0≤i≤n

(1 +

∣∣∣∣ai

a0

∣∣∣∣)

. (IV.1.15)

Utilizando el teorema de Rouche y otros, se puede encontrar masestimaciones sobre la localizacion de los ceros de un polinomio. Por ejemplo,en los ejercicios se debe mostrar la siguiente estimacion

|x| ≤ 2 max1≤i≤n−1

(i

√∣∣∣∣ai

a0

∣∣∣∣,n

√∣∣∣∣an

2a0

∣∣∣∣

). (IV.1.16)

Con el siguiente ejemplo se vera que existen mejores estimaciones que otras,esto depende sobre todo del tipo de polinomio que se tiene.

Ejemplo

Se considera la ecuacionxn − 2 = 0,

la primera estimacion, como la segunda dan |x| ≤ 2n, mientras que, latercera da |x| ≤ 2.

Debido a la aritmetica de los ordenadores, el tipo REAL es un conjuntofinito, que se asemeja mucho mas a los numeros racionales que los reales,

Page 168: 2374131 Una Introduccion Al Analisis Numerico

IV.1 Ecuaciones Polinomiales 157

por eso que se puede suponer que p(x) ∈ Q[x]. Por otro lado, cuando lospolinomios tienen raices de multipliciad mayor a 1, la mayor parte de losalgoritmos no funcionan, debido a la inestabilidades que se pueden presentar,o a las caracterısticas propias de los metodos empleados.

Sea p(x) ∈ Q[x], p′(x) su derivada, se define el polinomio q(x) utilizandoel algoritmo de Euclides, por

q(x) = mcd(p, p′), (IV.1.17)

de donde el polinomio r(x) = p(x)/q(x) tiene las mismas raices que p(x)pero todas simples. Por consiguiente, se ha visto un procedimiento simplepara reducir un polinomio p(x) a otro polinimio simple. En lo que sigue, sepuede suponer que los polinomios considerados tienen raices simples.

Metodo de Newton

Uno de los metodos comunmente utilizados en la determinacion de raices deun polinomio, consiste en el uso del metodo de Newton. Aquı se formularaeste metodo, sin estudiar la convergencia y el calculo de error, dejando estopara el siguiente paragrafo. Por lo tanto, el metodo esta dado por la relacionrecursiva siguiente

— x0 arbitrario, proximo a una solucion.

— xk+1 = xk −p(xk)

p′(xk), donde p(x) es el polinomio a determinar

sus raices.

El problema consiste en determinar todas las raices reales de p(x) =0, suponiendo que se ha encontrado la primera raiz, se podrıa utilizarnuevamente el metodo de Newton utilizando otra valor, pero existe laposibilidad de encontrar nuevamente la primera solucion. Para evitar estasituacion se puede proceder basicamente de dos maneras. La primera, unavez que se ha encontrado la raiz ξ1, se define el polinomio

q(x) =p(x)

x− ξ1, (IV.1.18)

aplicando Newton sobre q(x). El principal inconveniente de este procedi-miento radica en el hecho que ξ puede no ser racional, motivo por el cual r(x)ya no es exacto y la propagacion de errores de redondeo puede dar resultadoscompletamente alejados de la realidad. El segundo procedimiento consiste enaplicar el metodo de Newton a q(x), pero sin calcular los coeficientes de q(x).Sea p(x) el polinomio a determinar sus raices, suponiendo que se conoce deantemano ξ1, . . . , ξk raices de p(x), de donde

q(x) =p(x)

(x− ξ1) · · · (x− ξk). (IV.1.19)

Page 169: 2374131 Una Introduccion Al Analisis Numerico

158 IV Ecuaciones No Lineales

Introduciendo el logaritmo y derivando se obtiene:

log q(x) = log p(x)−k∑

i=1

log(x− ξi),

q′(x)

q(x)=

p′(x)

p(x)−

k∑

i=1

1

(x− ξi). (IV.1.20)

Aplicando el metodo de Newton a (IV.1.19), utilizando (IV.1.20), se obtienecomo m-sima iteracion.

xm+1 = xm −p(xm)

p′(xm)− p(xm)k∑

i=1

1

(xm − ξi)

. (IV.1.21)

Este ultimo procedimiento se conoce como el metodo de Maehly. Este metodoes numericamente estable, en efecto considerando el siguiente ejemplo dadopor Stoer.

Ejemplo

Se considera el polinomio p(x) definido por

p(x) =

12∏

j=0

(x− 2−j) = x13 + a1x12 + · · ·+ a12.

Calculando los coeficientes en simple precision e utilizando el metodo deNewton en sus dos variantes se obtiene la tabla IV.1.1.

Ası mismo, el metodo de Newton permite encontrar las raices comple-jas, mas precisamente las raices no reales, de una ecuacion polinomial. Paratal efecto, el punto de partida debe ser un numero complejo no real, puespuede observarse que partiendo de un punto real, los valores obtenidos por elmetodo de Newton son reales, ya sea con la primera variante, o con la mejorade Maschley. Puede suceder que una vez encontradas todas las raices realesdel polinomio, siendo estas no todas las raices; si no se tiene cuidado, seproducira un fenomeno de oscilacion con el metodo de Newton. Por lo tantohay que agregar al algoritmo que a partir de un numero determinado de it-eraciones, si no se ha alcanzado la convergencia hacia una raiz, se detenga elproceso, quedando por lo tanto dos alternativas: la primera verificar si todaslas raices reales han sido calculadas, para luego comenzar con un numerocomplejo no real; la segunda alternativa consiste en cambiar simplemente depunto inicial.

Page 170: 2374131 Una Introduccion Al Analisis Numerico

IV.1 Ecuaciones Polinomiales 159

Tabla IV.1.1. Error en el calculo de raices para un caso extremo.

METODO DIVISION METODO MAEHLY

SOL EXAC SOL NUM ERROR SOL NUM ERROR

1/1 1.00 0.0 1.000 0.0

1/2 0.500 0.950 · 10−4 0.5000 0.894 · 10−7

1/22 −0.15 0.400 0.2500 0.894 · 10−7

1/23 −0.426 0.551 0.1250 0.820 · 10−7

1/24 0.560 0.498 0.6250 · 10−1 0.138 · 10−6

1/25 −0.132 0.163 0.671 · 10−7 0.140 · 10−7

1/26 0.266 0.250 0.1562 · 10−1 0.419 · 10−8

1/27 0.157 0.149 0.7813 · 10−2 0.168 · 10−7

1/28 −0.237 ·10−1 0.028 0.1953 · 10−2 0.168 · 10−7

1/29 −0.740 0.742 0.3906 · 10−2 0.291 · 10−9

1/210 0.865 0.864 0.9766 · 10−3 0.291 · 10−10

1/211 0.140 0.140 0.4883 · 10−3 .146 · 10−10

1/212 −0.179 ·10−1 0.181 · 10−1 0.2441 · 10−3 0.728 · 10−10

Sucesiones de Sturm

La utilizacion de sucesiones de Sturm en la resolucion de ecuaciones polino-miales permite determinar las raices reales y no ası las raices no reales. Enla mayor parte de los problemas, es solo importante conocer los ceros reales,motivo por el cual los procedimientos que utilizan sucesiones de Sturm sonmuy comunes en la resolucion de ecuaciones polinomiales

Definicion IV.1.6.- Una sucesion f0, f1, . . . , fn de funciones definidas enR con valores reales, continuamente derivables es una sucesion de Sturm, si:

a) f ′0(x

∗)f1(x∗) < 0 si f0(x

∗) = 0, x∗ ∈ R.b) fj−1(x

∗)fj+1(x∗) < 0 si fj(x

∗) = 0, 1 ≤ j ≤ n− 1.c) fn(x) no cambia de signo sobre R y es positiva

Teorema IV.1.7.- Sea f0, f1, . . . , fn una sucesion de Sturm, w(x) sedenota al numero de cambios de signo de f0(x), f1(x), . . . , fn(x).

Entonces la funcion f0(x) tiene exactamente w(b) − w(a) ceros en elintervalo [a, b].

Page 171: 2374131 Una Introduccion Al Analisis Numerico

160 IV Ecuaciones No Lineales

Demostracion.- w(x) puede cambiar de valor solamente si uno de losfj(x) = 0. Por consiguiente, sea x∗ un tal numero y supongase que1 ≤ j ≤ n − 1. Estudiando en un vecindario de x∗, la funcion w estaradeterminada por los valores de las siguientes tablas:

x∗ − ǫ x∗ x∗ + ǫ

fj−1 + + +

fj ± 0 ±fj+1 − − −

x∗ − ǫ x∗ x∗ + ǫ

fj−1 − − −fj ± 0 ±

fj+1 + + +

x∗ − ǫ x∗ x∗ + ǫ

fn−1 ± ± ±fn + 0 +

de donde w(x∗ + ǫ) = w(x∗ − ǫ) cuando fj(x∗) = 0 para 1 ≤ j ≤ n.

Ahora bien, si f0(x∗) = 0, estudiando alrededor de un vecindario de x∗

se tiene las tablas:

x∗ − ǫ x∗ x∗ + ǫ

f0 + 0 −f1 − − −

x∗ − ǫ x∗ x∗ + ǫ

f0 − 0 +

f1 + + +

,

de donde w(x∗ + ǫ) = w(x∗ − ǫ) + 1.

Volviendo al problema original de encontrar los ceros reales de unpolinomio p(x) con raices simples, a coeficientes reales (racionales), elobjetivo es construir una sucesion de Sturm de tal manera que f0 = p.Se define la siguiente sucesion de polinomios de manera recursiva utilizandola division con resto, por

f0(x) := p(x),

f1(x) := −p′(x),

f0(x) = g1(x)f1(x)− γ21f2(x),

f1(x) = g2(x)f2(x)− γ22f3(x),

...

fn−1(x) = gn(x)fn(x).

(IV.1.22)

La definicion de la sucesion (IV.1.22) es el algoritmo de Euclides paradeterminar el mcd(p(x), p′(x)). Se tiene el siguiente teorema.

Page 172: 2374131 Una Introduccion Al Analisis Numerico

IV.1 Ecuaciones Polinomiales 161

Teorema IV.1.8.- Supongase que p(x) solamente tiene raices simples,entonces la sucesion definida por (IV.1.22) es una sucesion de Sturm.

Demostracion.- Puesto que p(x) tiene raices simples, si p′(x∗) = 0, se tienep(x∗) 6= 0, de donde la condicion a) es satisfecha,

a) f ′0(x

∗)f1(x∗) = −(f ′

0(x∗))2 < 0..

b) Se cumple esta condicion por construccion de la sucesion.c) fn = mcd(p, p′) = C.

Algoritmo

Con el algoritmo de biseccion se separa las raices realles de p(x), es decirse divide en la mitad un intervalo original [a, b] y se continua hasta tenertodas las raices localizadas en subintervalos [ai, bi]. Se puede continuar conel algoritmo de biseccion hasta lograr la precision deseada, o si no se mejorael resultado utilizando el metodo de Newton.

Ejercicios

1.- El polinomio x4 − 8x3 + 24x2 − 32x + a0, a0 = 16 posee una raizde multiplicidad 4 en el punto x = 2. ¿Como cambian las raices delpolinomio si se remplaza a0 por a0 = a0(1 + ǫ) con |ǫ| ≤ eps? Calcularlas raices de este polinomio, ¿es un problema bien condicionado?

2.- Sea p(x) un polinomio de grado n a coeficientes reales. Supongase quetodas las raices α1 ≥ α2 ≥ · · · ≥ αn sean reales.

a) Mostrar que el metodo de Newton converge hacia α1, si x0 > α1.Indicacion.- Para x > α1 los valores de p(x), p′(x), p′′(x) tienenel mismo signo que lim

x→∞p(x). Mostrar que xk es una sucesion

monotona.

b) Si x0 es mucho mas grande que α1, entonces el metodo de Newtonconverge muy lentamente. (xk+1 ∼ xk(1− 1/h))

3.- Considerese el polinomio

f(x) = x6 − 3x5 + 6x3 − 3x2 − 3x + 2.

Sin calcular las raices de este polinomio, determinar el numero de raicesdistintas de f(x).

4.- Encontrar un algoritmo que, para un polinomio arbitrario f ∈ Q[x],permita calcular la factorizacion

f(x) = f1(x) ·((f2(x)

)2 ·((f3(x)

)3 · · ·((fk(x)

)k,

Page 173: 2374131 Una Introduccion Al Analisis Numerico

162 IV Ecuaciones No Lineales

donde f1, . . . , fk son primos entre si y donde cada polinomio fj(x) solotiene raices simples.

5.- Para un polinomio

f(x) = a0xn + a1x

n−1 + · · · an−1x + an, a0 6= 0;

con coeficientes en C, mostrar que todas las raices ξ satisfacen laestimacion

|ξ| ≤ 2 max

∣∣∣∣a1

a0

∣∣∣∣ ,√∣∣∣∣

a1

a0

∣∣∣∣, . . . ,n−1

√∣∣∣∣an−1

a0

∣∣∣∣,n

√∣∣∣∣an

2a0

∣∣∣∣

. (IV.1.23)

Encontrar, para cada n, un polinomio tal que se tenga igualdad en(IV.1.23)

6.- Considerese el polinomio

f(x) = x5 − 5x4 + 3x3 + 3x2 + 2x + 8.

a) Determinar el numero de raices reales.b) ¿Cuantas raices son complejas?c)¿Cuantas raices son reales y positivas?Indicacion.- Utilizar una sucesion de Sturm.

7.- Sea f (p + 1) veces continuamente diferenciable en un vecindario deξ ∈ R y sea ξ una raiz de multiplicidad p. Mostrar que la sucesionxk, definida por

xk+1 = xk − pf(xk)

f ′(xk),

converge hacia ξ, si x0 es suficientemente proximo de ξ, y que se tiene

xk+1 − ξ

(xk − ξ)2−→ f (p+1)(ξ)

p(p + 1)f (p+2)(ξ).

8.- El metodo de Newton, aplicado a z3 − 1 = 0, da la iteracion

zk+1 = Φ(zk), con Φ(z) = z − z3 − 1

3z2 =2z3 + 1

3z2 .

Denotese por Aj =z0 ∈ C; zk → e2iπj/3

, j = 0, 1, 2; los canales de

atraccion. Mostrar:

a)A0 ∩ R = R− ξ0, ξ1, . . . donde ξ0 = 0 y ξk−1 = Φ(ξk),

b)Aj+1 = e2πi/3Aj ,

c)Calcular Φ−1(0) y Φ−2(0) con la formula de Cardano. Esto muestraque el sector z ∈ C| |arg(z)| < π/3 contiene puntos que no convergenhacia 1.

d) Supongase que Φk(z) = 0 para un k ∈ N. Mostrar que U ∩ Aj 6= ∅(j = 0, 1, 2) para cada vecindario U de z.

Page 174: 2374131 Una Introduccion Al Analisis Numerico

IV.2 Metodos Iterativos

En la seccion precedente, se ha visto que la mayor parte de las ecuaciones aresolver no pueden ser resueltas de manera explıcita, es decir mediante unaformula magica. Es por esta razon, que el estudio de los metodos iterativos esuna necesidad imperiosa para poder encontrar las soluciones de una ecuacion.Para tal efecto es tambien importante conocer el tipo de funciones con lasque se esta trabajando. En lo que sigue, se estudiara varios aspectos que sonfundamentales para la comprension del tema.

Posicion del Problema

Uno de los problemas mas comunes, se trata del siguiente. Supongase,que se tiene la funcion

f : I −→ R,

donde I ⊂ R intervalo. El problema, se trata de obtener con una aproxi-macion arbitraria las raices de la ecuacion

f(x) = 0. (IV.2.1)

Esta claro, que serıa ridıculo esperar obtener, en general, formulas deresolucion de (IV.2.1), del tipo de formulas clasicas resolviendo las ecuacionesde segundo grado. Se ha visto que, es imposible en el caso en que f es unpolinomio de grado ≥ 5. Incluso para el problema mas razonable planteadoaquı , no existe un metodo general conduciendo al resultado buscado, losprocedimientos teoricos de aproximacion pueden conducir, sin hipotesisadecuadas para la funcion f a calculos numericos inextricables, incluso paralos ordenadores mas potentes que existen en la actualidad.

Por otro lado, incluso si el intervalo I es acotado, puede suceder quela ecuacion (IV.2.1) tenga una infinidad de raices, por ejemplo, cuando f esidenticamente nula en un subintervalo. El ejemplo

f(x) = x3 sin1

x, (IV.2.2)

muestra que puede existir una infinidad de raices, aun cuando f no seaidenticamente nula en un subintervalo.

Por consiguiente, un primer paso consiste en descomponer el intervaloI, por un numero finito o infinito de puntos de subdivision, en subintervalosen cada uno de los cuales se sepa que, la ecuacion no tiene raiz, o la ecuaciontenga una y una sola solucion. Se estara seguro, que es ası cuando la funcion

Page 175: 2374131 Una Introduccion Al Analisis Numerico

164 IV Ecuaciones No Lineales

es monotona para el primer caso si f(x) no cambia de signo y en el segundocaso si f(x) cambia de signo. Para asegurar la existencia en el segundo caso,se exige como hipotesis suplementaria la continuidad en tal subintervalo.

Ejemplo

La funcion

f(x) =b1

x− a1+

b2

x− a2+ · · ·+ bn

x− an, (IV.2.3)

donde a1 < a2 < · · · < an y los bj son todos diferentes a 0 y delmismo signo, esta definida en cada uno de los subintervalos abiertos]∞, a1[, ]a1, a2[, . . . , ]an−1, an[, ]an, +∞[; en cada uno de estos subinter-valos es monotona, ya que su derivada tiene el signo opuesto de los bj .Por otro lado cuando x tiende por derecha a uno de los aj , f(x) tiendeen valor absoluto a ∞ y cuando x tiende por izquierda a uno de los aj ,f(x) tiende en valor absoluto a ∞, pero con signo opuesto que el lımitepor derecha. Por lo tanto, se concluye que la funcion f tiene exactamenteuna raiz en cada subintervalo.

Para obtener una descomposicion de I en intervalos del tipo consideradoanteriormente, es decir para separar las raices, se necesitarıa teoricamenteestudiar el sentido de variacion de la funcion f , agregando otra hipotesissuplementaria respecto a f , como que f sea continuamente derivable, estosignificarıa estudiar el signo de f ′(x), por consiguiente se estarıa obligadoa encontrar las raices de la ecuacion f ′(x) = 0, que salvo algunos casos, suresolucion presenta las mismas dificultades que la ecuacion original.

Por lo expuesto mas arriba, se esta en la capacidad de enunciar elsiguiente teorema de existencia y unicidad de la solucion de una ecuacioncon su algoritmo de resolucion incluido.

Teorema IV.2.1.- Sea f : I −→ R continua y monotona, entonces

la ecuacion f(x) = 0 tieneuna y una sola solucion

⇐⇒ existen a < b ∈ I, talesque f(a)f(b) < 0.

Ademas si existiese la solucion, esta puede ser aproximada de maneraarbitraria con el algoritmo de la biseccion.

La primera observacion que se puede hacer al algoritmo de la biseccionconsiste en que este algoritmo construye subintervalos encajonados re-duciendo la longitud de cada subintervalo de la mitad en cada iteracion.Pero una de las interrogantes que uno se plantea, es cuando detener el al-goritmo. En general, esto sucede cuando el valor absoluto de la funcion fevaluada en las extremidades es menor a un valor de tolerancia prefijadocon anterioridad. Ahora bien, si solamente se exige que f sea mononota ycontinua puede pasar situaciones, como las del siguiente ejemplo.

Page 176: 2374131 Una Introduccion Al Analisis Numerico

IV.2 Metodos Iterativos 165

Ejemplo

Sea f : (−1, 1) −→ R definida por

f(x) = x100g(x), (IV.2.4)

donde g es una funcion continua que no se anula en (−1, 1). Es evidenteque, x = 0 es una raiz de la ecuacion f(x) = 0. Aplicando el algoritmode la biseccion con una tolerancia de 10−6 y tomando como puntos departida a = −0, 9 y b = 0.9 puede suceder que |f(x)| < TOL, dejandouna gran eleccion para escoger la raiz de f(x).

Por lo tanto, si no se tiene la hipotesis que f(x) sea derivable y quef ′(x) 6= 0 para x raiz de la ecuacion f(x) = 0, se debe tener mucho cuidadoen la determinacion de la solucion numerica del problema, para no cometergrandes errores.

Metodo de la Falsa Posicion

En este paragrafo, se supondra que

f : [a, b] −→ R

es dos veces continuamente derivable, que f ′(x) no se anula en el intervalo]a, b[ y ademas f(a)f(b) < 0.

La idea para obtener una valor aproximado de la raiz ξ0 de la ecuacionf(x) = 0 en el intervalo I =]a, b[, consiste en remplazar f por un polinomioque toma los valores de f en determinados puntos de I. Como se ha visto enla primera seccion de este capıtulo, las ecuaciones polinomiales mas simplesde resolver son las ecuaciones de primer grado y las ecuaciones cuadraticas.Por razones de simplicidad en la formulacion, el metodo de la falsa posicionsera estudiado tomando como polinomio, uno de primer grado. Sea L(x) elpolinomio de interpolacion de primer grado, tal que:

L(a) = f(a), L(b) = f(b), (IV.2.5)

ver en la figura IV.2.1.

a by=f(x)

y=L(x)

ξ

ξ

0

Figura IV.2.1 Metodo de la Falsa Posicion.

Page 177: 2374131 Una Introduccion Al Analisis Numerico

166 IV Ecuaciones No Lineales

Las hipotesis implican que L(x) se anula en un punto ξ ∈ I, que setoma como valor aproximado de ξ0. Por consiguiente se trata de mayorar elerror cometido |ξ − ξ0|; para tal efecto se recordara el teorema III.1.13 queda el siguiente resultado

f(x)− L(x) =1

2f ′′(ζ)(x− x0)(x− x1) (IV.2.6)

con ζ ∈ I, deduciendo la siguiente proposicion.

Proposicion IV.2.2.- Si f ′ no se anula en el intervalo I, y si f(ξ0) = 0,L(ξ) = 0 para ξ, ξ0 ∈ I, entonces se tiene

ξ − ξ0 =1

2

f ′′(ζ)

f ′(ζ ′)(ξ − a)(ξ − b), (IV.2.7)

donde ζ y ζ ′ son numeros que pertenecen a I.

Demostracion.- Por (IV.2.6), se tiene

f(ξ) =1

2f ′′(ζ)(ξ − a)(ξ − b),

por el teorema del valor medio se tiene

f(ξ) = f ′(ζ ′)(ξ − ξ0)

con ζ ′ que pertenece al intervalo cuyas extremidades son ξ0 y ξ. Combinandoambos resultados se obtiene el resultado de la proposicion.

Corolario IV.2.3.- Mismas hipotesis de la proposicion precedente, yademas |f ′(x)| ≥ m > 0, y |f ′′(x)| ≤M para todo x ∈ I, entonces

|ξ − ξ0| ≤M

8m(b− a)2. (IV.2.8)

Si el error |ξ − ξ0| evaluado por la estimacion (IV.2.8) no es lo sufi-cientemente pequeno, se puede repetir el procedimiento: se calcula f(ξ) ydependiendo de su signo, la raiz ξ0 se encuentra en el intervalo [a, ξ] o [ξ, b],al cual se aplica el mismo metodo obteniendo ası un segundo valor aproxi-mado ξ′. Teoricamente, se puede aplicar indefinidamente este procedimiento,y se muestra facilmente que la sucesion de los numeros obtenidos convergehacia ξ, ver ejercicios.

Como se dijo al abordar el metodo de la falsa posicion, se puedeaproximar la raiz de la ecuacion f(x) = 0 con un polinomio de segundo grado.Con la misma notacion que antes ξ0 es la raiz de la ecuacion, suponiendo

Page 178: 2374131 Una Introduccion Al Analisis Numerico

IV.2 Metodos Iterativos 167

ademas que f(x) es tres veces continuamente diferenciable sobre el intervaloI. Se denota por c el punto medio del intervalo I. Puesto que f ′(x) no cambiade signo en este intervalo, f(c) es positivo o negativo. Sea L(x) el polinomiode interpolacion de grado 2, tal que

L(a) = f(a) L(c) = f(c) L(b) = f(b); (IV.2.9)

utilizando la formula de Newton del capıtulo III, se tiene

L(x) = f(a) +f(c)− f(a)

c− a(x− a)

+2f(b)− 2f(c) + f(a)

(b− a)2(x− a)(x− c), IV.2.10)

resolviendo esta ecuacion, sea ξ ∈ I la raiz del polinomio de segundo grado, lacual puede ser determinada utilizando el metodo de resolucion de ecuacionesde segundo grado, teniendo el cuidado de escoger la raiz que se encuentra en[a, b]. Suponiendo que sobre el intervalo [a, b], f es tres veces continuamentederivable, el teorema III.1.13 da la siguiente estimacion

f(x)− L(x) =1

6f ′′′(ζ)(x− a)(x− c)(x− b), (IV.2.11)

donde ζ ∈ [a, b]. deduciendo la siguiente proposicion.

Proposicion IV.2.4.- Si f ′ no se anula en el intervalo I, y si f(ξ0) = 0,L(ξ) = 0 para ξ, ξ0 ∈ [a, b], entonces se tiene

ξ − ξ0 =1

6

f ′′′(ζ)

f ′(ζ ′)(ξ − a)(ξ − c)(ξ − b) (IV.2.12)

donde ζ y ζ ′ son numeros que pertenecen a [a, b].

Demostracion.- Por (IV.2.11), se tiene

f(ξ) =1

6f ′′(ζ)(ξ − a)(ξ − c)(ξ − b),

por el teorema del valor medio, se tiene

f(ξ) = f ′(ζ ′)(ξ − ξ0),

con ζ ′ que pertenece al intervalo cuyas extremidades son ξ0 y ξ. Combinandoambos resultados se obtiene el resultado de la proposicion.

Page 179: 2374131 Una Introduccion Al Analisis Numerico

168 IV Ecuaciones No Lineales

Corolario IV.2.5.- Mismas hipotesis de la proposicion precedente, yademas |f ′(x)| ≥ m > 0, y |f ′′′(x)| ≤M para todo x ∈ [a, b], entonces

|ξ − ξ0| ≤M

24m(b− a)3. (IV.2.13)

Si el error |ξ − ξ0| evaluado por la estimacion (IV.2.13) no es losuficientemente pequeno, se puede repetir el procedimiento: se calcula f(ξ)y dependiendo de su signo, la raiz ξ0 se encuentra en el intervalo [a, ξ] o[ξ, c], etc, al cual se aplica el mismo metodo obteniendo ası un segundovalor aproximado ξ′. Teoricamente, se puede aplicar indefinidamente esteprocedimiento, y se muestra facilmente que la sucesion de los numerosobtenidos converge hacia ξ0, ver ejercicios.

El metodo de la Falsa Posicion es un claro ejemplo de un metodoiterativo, pues utiliza soluciones anteriormente obtenidas para calcular unanueva solucion. En general, se dira que un metodo iterativo es de orden k ode k pasos, si la iteracion puede expresarse de la forma:

xn+1 = Φ(xn, xn−1, . . . , xn−k+1). (IV.2.14)

Por lo tanto, los metodos descritos anteriormente son metodos iterativos dedos pasos, pues se sirven de 2 valores para calcular el valor de la iteracionsiguiente.

Sistemas de Ecuaciones

Los problemas que han sido estudiados mas arriba estaban relacionados afunciones de una sola variable con valores reales. Ahora bien, existe una granvariedad de problemas donde se deben resolver sistemas de ecuaciones, queen general no son lineales. La posicion del problema es por consiguiente:Dada f : U ⊂ Rn −→ Rn, encontrar ξ ∈ U tal que

f(ξ) = 0. (IV.2.15)

Reiterando lo que se dijo al inicio de esta seccion no se puede esperar deobtener una formula milagrosa para determinar ξ, lo que se debe buscares por consiguiente una aproximacion de esta solucion con la precision quese desee. La continuidad no es una condicion suficiente para determinar laexistencia de ceros, hipotesis primordial en el caso de una variable; en el casode varias variables, en la mayor parte de los casos no se puede demostrar laexistencia de ceros, contentandose con la unicidad de estos a nivel local. Unteorema muy importante, es el de la inversion local que sera enunciado sindemostracion, para el lector interesado, puede encontrarla en cualquier librode Analisis, por ejemplo en Rudin.

Page 180: 2374131 Una Introduccion Al Analisis Numerico

IV.2 Metodos Iterativos 169

Teorema IV.2.6.- Sean D ⊂ Rn abierto, f : D −→ Rn continuamentediferenciable. Si:

a) f(x∗) = 0,b) f ′

x∗ es inversible,entonces, existe dos vecindarios, U de x∗ y V de 0, tales que para todo v ∈ Vexiste un unico x ∈ U , tal que f(x) = v y la aplicacion

g :V −→ Uv −→ x(v)

es continuamente diferenciable y ademas g′v = (f ′x)

−1.

Consecuencias de este teorema son: la unicidad local de la solucion; six es solucion numerica obtenida mediante un metodo cualquiera se tiene lasiguiente estimacion del error

x− x∗ = (f ′x∗)

−1f(x) +O(‖f(x)‖2),

de donde si (f ′x∗)

−1es casi singular, x − x∗ puede ser muy grande, aun si

f(x) es pequeno.

Un metodo Iterativo simple

Existe otra clase de ecuaciones que pueden ser escritas de la forma

f(x) = x, (IV.2.17)

donde f es una funcion de varias variables con las condiciones dadas alinicio de este paragrafo. Cabe remarcar que la ecuacion (IV.2.15) puede serexpresada como x = g(x) con g(x) = x−Af(x), donde A es generalmente unamatriz. La existencia y unicidad de las ecuaciones de la forma (IV.2.17) sonresueltas utilizando el teorema del punto fijo en espacios metricos. Para sabermas sobre espacios metricos ver Schawartz. A continuacion, se enunciara elteorema del punto fijo.

Teorema IV.2.7.- Sean X un espacio metrico completo, f : X −→ X unaaplicacion verificando

d(f(x), f(y)) ≤ Cd(x, y), C < 1;

donde d denota la distancia en X. Entonces la ecuacion f(x) = x admiteuna y una sola solucion.

Demostracion.- Sea x0 ∈ X un punto arbitrario, se define la sucesion xkde manera recursiva por

xk+1 = f(xk),

Page 181: 2374131 Una Introduccion Al Analisis Numerico

170 IV Ecuaciones No Lineales

esta sucesion es de Cauchy, en efecto, si n ≥ m, se tiene:

d(xn, xm) ≤ d(xn, xn−1) + · · ·+ d(xm+1, xxm),

d(xm+1, xm) ≤ Cmd(x1, x0),

por lo tanto

d(xn, xm) ≤ Cm

1− C,

que tiende a cero, cuando n, m tienden a ∞. Sea x∗ = limn→∞

xn, se deduce

que f(x∗) = x∗. Con esto se ha demostrado la existencia de la solucion. Parala unicidad se considera x, y son soluciones del problema, por lo tanto

d(x, y) = d(f(x), f(y)) ≤ Cd(x, y),

y la unica posibilidad que suceda esto es que x = y.

Se puede dar condiciones menos fuertes sobre el espacio X o sobref , por ejemplo que f sea localmente una contraccion, con solamente estahipotesis se mantiene la unicidad, pero esta vez localmente, la existencia noesta asegurada.

Por lo expuesto, se puede formular el metodo iterativo dado en lademostracion del teorema precedente para el siguiente problema:Sea Φ : Rn −→ Rn continua, determinar x ∈ Rn tal que Φ(x) = x. El metodoiterativo esta dado por:

x0, arbitrario;

xn = Φ(xn−1).(IV.2.18)

Teorema IV.2.8.- Si xn converge hacia x∗, y Φ es continua en x∗,entonces x∗ es solucion de x = Φ(x)

Demostracion.- Se deja al lector.

El anterior teorema senala claramente que si la funcion Φ es continua,y la sucesion definida por (IV.2.18) es convergente, entonces el lımite de estasucesion es la solucion del problema Φ(x) = x. Por consiguiente, la preguntanatural que uno puede plantearse es cuando existen condiciones suficientespara tener convergencia. Definiendo el error en como

en = xn − x∗,

donde x∗ es la solucion exacta, y xn la n-sima iteracion, se obtiene:

en+1 = xn+1 − x∗ = Φ(xn)− Φ(x∗)

= Φ′(x∗)(xn − x∗) +O(‖xn − x∗‖2

),

en+1 ≈ Φ′(x∗)en. (IV.2.19)

Page 182: 2374131 Una Introduccion Al Analisis Numerico

IV.2 Metodos Iterativos 171

Si ‖en+1‖ ≤ q ‖en‖ para q < 1, entonces en → 0 cuando n → ∞.Por consiguiente la sucesion es convergente, si existe una norma tal que‖Φ′(x∗)‖ = q < 1.

Teorema IV.2.9.- a) Sea Φ(x) = Ax+ b, con A matriz, entonces el metodoiterativo (IV.2.18) converge para todo x, si y solamente si ρ(A) < 1, donde

ρ(A) = max|λ| |λ es un valor propio de A

.

b) Si Φ(x) es no lineal y dos veces continuamente diferenciable, entonces setiene convergencia si:

ρ(Φ′(x∗)) < 1,

x0 − x∗ es suficientemente pequeno.

Demostracion.- Se mostrara solamente el inciso a), dejando al lector elinciso b) con las observaciones hechas antes de enunciar el teorema.

⇒ Se supone que el metodo converge ∀x0 ∈ Rn. Sea λ un valor propio de A,y e0 un vector propio respecto a este valor propio, entonces

en = Ane0,

λne0 −→ 0,

posible solamente si |λ| < 1.⇐ Se supone que ρ(A) < 1, sea e0 ∈ Rn arbitrario, de donde en = Ane0.Por el teorema de Jordan, existe una matriz T no singular tal que

T−1AT =

λ1. . .. . . 1

λ1

0

0λ2

. . .

. . . 1λ2

. . .

.

Sea D = diag(1, ǫ, ǫ2, . . . , ǫn−1), por consiguiente

D−1T−1ATD =

λ1. . .. . . ǫ

λ1

0

0λ2

. . .

. . . ǫλ2

. . .

= J,

Page 183: 2374131 Una Introduccion Al Analisis Numerico

172 IV Ecuaciones No Lineales

si ǫ es suficientemente pequeno, se tiene ‖J‖∞ < 1, de donde el metodo esconvergente.

Para el problema f(x) = 0, se vio antes que se puede convertir enproblema de punto fijo, planteando

Φ(x) = x−Af(x), (IV.2.20)

donde A es una matriz constante A, inversible. Ahora bien, para cumplirlas condiciones del teorema precedente ρ(Φ′(x∗)) < 1, motivo por el cual essuficiente A ≈ (f ′(x∗))−1 para que Φ′(x∗) ≈ 0.

Ejemplo

Considerese la ecuacion siguiente

x2 + y2 − 1 = 0

sin x + sin y =1

2

,

se desea determinar las soluciones de esta ecuacion. Convirtiendo en unproblema de punto fijo se tiene

Φ(x, y) =

(xy

)−A

(x2 + y2 − 1

sin x + sin y − 12

)

donde la A es una matriz de 2× 2. La derivada de f en el punto (x, y),esta dada por

f ′(x,y) =

(2x 2y

cos x cos y

),

la inversa de la derivada de f , esta dada por

(f ′(x,y))

−1 =1

2(x cos y − y cos x)

(cos y −2y− cos x 2x

).

Recorriendo a travez de la circunferencia de radio 1 dada por la primeraecuacion se escogen los valores de x, y para los cuales remplazando en lasegunda ecuacion se tiene valores muy cerca a 1/2. Una vez determinadosestos valores se consigue una aproximacion de la matriz A para poderaplicar el metodo iterativo. Las soluciones obtenidas con una precisiondel orden de 10−10 son:

x = 0.3176821764792814,

x = −0.948197255188055,

y = −0, 948197255188055;

y = 0, 3176821764792814.

Page 184: 2374131 Una Introduccion Al Analisis Numerico

IV.2 Metodos Iterativos 173

Ejercicios

1.- Sea A una matriz que es diagonal dominante, es decir

|aii| >∑

j 6=i

|aij | , i = 1, . . . , n;

entonces el metodo de Jacobi, formulado en el capıtulo II, para resolverAx = b es convergente.

2.- Considerese la ecuacion integral

y(x) = f(x) +

∫ b

a

K(x, s, y(s))ds, (∗)

donde a, b, f, K estan dados, se busca y(x). Mostrar, si el nucleo K esdegenerado, es decir

K(x, s, y) =

n∑

i=1

ai(x)bi(s, y),

entonces la solucion de (∗) esta dada por

y(x) = f(x) +

n∑

i=1

ciai(x)

donde las constantes c1, . . . , cn satisfacen

ci =

∫ b

a

bi(s, f(s) +n∑

j=1

cjaj(s))ds i = 1, . . . , n.

3.- Calcular la solucion de

y(x) = 1 + λ

∫ π

0

(2 sin x sin s + sin 2x sin 2s)ey(s)ds, λ =1

10.

Resolver el sistema no lineal para c1, c2 con el metodo iterativo.

4.- Sean J = [a, b] un intervalo de R en el cual la funcion dos vecescontinuamente diferenciable f verifica las relaciones |f ′(x)| ≥ m,

|f ′′(x)| ≤ M , f(a)f(b) < 0. Mostrar que siM

4m(b − a) = q < 1 se

puede, por n aplicaciones sucesivas del metodo de la falsa posicion,encontrar un intervalo de extremidades an, bn conteniendo la unicaraiz de f(x) = 0 en [a, b], con

|bn − an| ≤4m

Mq2n.

Page 185: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton

En lo que va este capıtulo, se ha visto dos enfoques para resolver sistemas deecuaciones, el primero mediante una formula que de el resultado de maneraexplıcita en funcion de los datos del problema. El segundo enfoque consisteen utilizar metodos iterativos que permitan aproximar a la solucion de unamanera arbitraria. En la seccion precedente se vio en los diferentes teoremasde convergencia que la velocidad de convergencia es lineal, lo que puedeconstituir una desventaja, desde el momento en que se requiera resolvergrandes y muchos sistemas de ecuaciones. Lo deseable serıa cambiar el ordende convergencia, por ejemplo a una reduccion cuadratica del error.

Recordando el metodo de la Falsa Pendiente, en lugar de tomar unasecante para determinar una aproximacion del cero de la funcion estudiada,se podrıa tomar la tangente en un punto de la curva inducida por la funcion.El metodo iterativo formulado en la seccion precedente estaba basado en elteorema del punto fijo y el problema a resolver era de la forma Φ(x) = x,para el caso de las ecuaciones de la forma f(x) = 0, era suficiente considerarla funcion Φ(x) = x − Af(x), donde A es una matriz constante, ahorabien suponiendo que f ′(x) es inversible en un vecindario de una de lassoluciones de la ecuacion, en lugar de tomar A constante, se puede plantearA = (f ′(x))−1.

Las motivaciones estan dadas para formular un nuevo metodo, cuyavelocidad de convergencia sea superior a los metodos anteriormente formu-lados. Para tal efecto, considerese la funcion f : U ⊂ Rn −→ Rn, U unabierto de Rn, se supone ademas que f es continuamente derivable, y laderivada en todo punto es inversible. Por consiguiente, se tiene el problema

f(x) = 0, (IV.3.1)

cuyas soluciones, si estas existen son localmente unicas, por el teorema delas funciones inversas, dado en la seccion precedente. Supongase que esteproblema tiene al menos una solucion, denotandola por x∗. Sea x ∈ Ubastante proximo de x∗, aplicando la definicion de la derivada en el punto xse obtiene

f(x∗) = f(x) + f ′(x)(x∗ − x) +O(‖x∗ − x‖2),de donde despreciando el termino que contiene O se obtiene la ecuacion linealdada por

f ′(x)(x∗ − x) = −f(x),

que por hipotesis tiene solucion y es unica. De donde, el metodo de Newtontiene la formulacion siguiente, sea x0 un punto bastante proximo de la

Page 186: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 175

solucion buscada x∗, xm se define recursivamente, por las ecuaciones

f ′(xm−1)(xm − xm−1) = −f(xm−1). (IV.3.2)

Ejemplos

1.- Considerese la ecuacion de una sola variable dada por

f(x) = 2x− tan x,

para aplicar el metodo de Newton la derivada esta dada por

f ′(x) = 2− 1

cos2 x,

partiendo del punto inicial x0 = 1, 2 se obtiene los siguientes valoresmediante el metodo de Newton.

Tabla IV.3.1. Valores obtenidos por el metodo de Newton.

k xk f(xk) e2k/ek−1

0 1, 2 −0.172152

1 1.16934 −1.69993× 10−2

2 1.16561 −0.213431× 10−3 −3.97664

3 1.16556 −0.347355× 10−07 −3.44610

4 1.16556 −.133227× 10−14 −3.38337

2.- Considerese el sistema de ecuaciones dado por

x2 + y2 − 4 = 0

xy − 4 = 0.

Las soluciones de este sistema de ecuaciones estan dadas por la inter-seccion de una circunferencia de radio 2 y centro en el origen y unahiperbola inclinada. Realizando un grafico se puede observar que unade las raices esta proxima al punto (0.5, 2) que sera tomado como puntoinicial. La matriz derivada es igual a

f ′(x, y) =

(2x 2yy x

),

utilizando el metodo de eliminacion de Gauss para calcular los valoresde (xk, yk) se obtiene la siguiente tabla con las primeras 23 iteracionesdel metodo de Newton.

Page 187: 2374131 Una Introduccion Al Analisis Numerico

176 IV Ecuaciones No Lineales

Tabla IV.3.2. Valores obtenidos por el metodo de Newton.

k xk yk ‖f(xk)‖2 ‖ek‖22 / ‖ek−1‖20 0.5 2. 0.25

1 .516666 1.96666 0.134722

2 0.526332 1.94921 0.764322× 10−1 14.3688

3 0.532042 1.93948 0.446506× 10−1 28.3211

22 0.540690 1.92553 0.345530× 10−5 446885.

23 0.540690 1.92553 0.210661× 10−5 732995.

En las tablas IV.3.1 y IV.3.2, se observa que el metodo de Newtonconverge cuadraticamente. Es importante poder confirmar teoricamente esteresultado. Analizando el caso de una variable, se supone que f : I −→ R esdos veces continuamente derivable, x∗ una solucion del problema f(x) = 0,ademas f ′(x∗) 6= 0. Sea xk el valor de la k-esima iteracion obtenida delmetodo de Newton. El desarrollo de Taylor en xk de la funcion f y el metodode Newton para obtener xk+1 estan dados por:

0 = f(xk) + f ′(xk)(x∗ − xk) +1

2f ′′(xk) (x∗ − xk)2︸ ︷︷ ︸

e2k

+O((x∗ − xk)3),

0 = f(xk) + f ′(xk)(xk+1 − xk),

sustrayendo ambas cantidades se obtiene

0 = f ′(xk) (xk+1 − x∗)︸ ︷︷ ︸e2k+1

−1

2f ′′(xk)e2

k +O((ek)3),

de donde

ek+1 =1

2

f ′′(xk)

f ′(xk)e2k +O((ek)3),

mostrando ası el teorema siguiente:

Teorema IV.3.1.- Sea f : I −→ R, tres veces continuamente diferenciable,x∗ una solucion de la ecuacion f(x) = 0. Si f ′(x) 6= 0 en un vecindario dex∗, x0 bastante proximo de x∗, entonces

ek+1 =1

2

f ′′(xk)

f ′(xk)e2k +O((ek)3), (IV.3.3)

Page 188: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 177

donde ek = x∗ − xk.

Para el caso de una funcion de varias variables, la situacion es bastantesimilar, en efecto sea

f : U ⊂ Rn −→ Rn,

donde U es un abierto de Rn, f es una funcion tres veces continuamentederivable, cuya derivada es inversible para todo x ∈ U . La derivada de fen el punto x ∈ U es una aplicacion lineal, cuya matriz respecto a la basecanonica esta dada por

f ′(x) =

∂f1

∂x1· · · ∂f1

∂xn...

...∂fn

∂x1· · · ∂fn

∂xn

,

donde f1, . . . , fn son las componentes de la funcion f ; la segunda derivadade f en el punto x ∈ U es una aplicacion bilineal simetrica, que respecto ala base canonica, esta dada por

f ′′(x)(h, k) =∑

i,j

∂2f

∂xi∂xj(x)hi, kj ,

donde h, k ∈ Rn y los hi, kj son las componentes de h y k respecto a lasbases naturales. Para mas detalle ver Cartan. El desarrollo de Taylor en xesta dado por

f(x + h) = f(x) + f ′(x)h +1

2f ′′(x)(h, h) +O(‖h‖3).

Teorema IV.3.2.- Sean f : U ⊂ Rn −→ Rn tres veces diferenciable, conderivada inversible y x∗ ∈ U con f(x∗) = 0. Si xk es la sucesion definidapor el metodo de Newton, entonces el error ek = xk − x∗ satisface

ek+1 =1

2

(f ′(xk)

)−1f ′′(xk)(ek, ek) +O(‖h‖3). (IV.3.4)

Demostracion.- Similar a la del caso de una sola variable.

Calculo de la Derivada

Al implementar el metodo de Newton, se debe calcular la derivada de f encada punto. La primera forma de determinar la matriz f ′(xk) es de maneraanalıtica, construyendo ası una subrutina para evaluar los coeficientes dela matriz jacobiana en cada iteracion. Pero lastimosamente, no siempre

Page 189: 2374131 Una Introduccion Al Analisis Numerico

178 IV Ecuaciones No Lineales

es posible calcular las derivadas parciales de manera analıtica por variasrazones: funciones muy complicadas para derivar, calculos muy largos,etc. Otra manera de evaluar los coeficientes de f ′(xk) consiste en hacerlonumericamente. Utilizando un esquema de primer orden para evaluar laderivada parcial de fj respecto a xi, se tiene

∂fj

∂xi(x) = lim

t→0

fj(x + tei)− fj(x)

t,

donde t ∈ R, ei es el i-esimo vector de la base canonica. Ahora bien, seplantea g(t) = fj(x + tei) dejando fijo x, se tiene

∂fj

∂xi(x) = g′(0).

De donde, el problema consiste en calcular g′(0); con un esquema de primerorden se obtiene

g′(0) ≈ g(t)− g(0)

t. (IV.3.5)

Cabe recalcar, que se puede aproximar g′(0) con una mejor aproximacion,para eso se puede utilizar los polinomios de interpolacion. Una preguntanatural surge, ¿cual t escoger?, para obtener la mejor aproximacion de g′(0).El error de aproximacion esta dado por

g(t)− g(0)

t= g′(0) +

1

2g′′(0)t +O(t2),

mientras que los errores de redondeo, suponiendo que g es una funcionbien condicionada, esta dado por los siguientes resultados, suponiendo queg′(t) ≈ g′(0):

g(t(1 + ǫ1))(1 + ǫ2)− g(0)(1 + ǫ3)

t− g(t)− g(0)

t

≈1

t

g(t) + g′(0)ǫ1t(1 + ǫ2)− g(0)(1 + ǫ3)− g(t) + g(0)

≈1

t

ǫ2g(t) + g′(0)ǫ1t− ǫ3g(0)

,

donde |ǫi| ≤ eps, por consiguiente

error de redondeo ≤ 1

|t|2 |g(0)|+ |g′(0)t|

eps. (IV.3.6)

Page 190: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 179

Lo ideal sera, por lo tanto escoger un valor de t de manera que los erroresde aproximacion y de redondeo se aproximen, ver figura IV.3.1.

Err de redon.

Err de aprox

Figura IV.3.1. Error de Aproximacion vs Error de Redondeo.

Observando la figura, se tiene que el error de aproximacion es del ordende t, mientras que el error de redondeo es proporcional a eps/t, de dondeequilibrando ambos errores se obtiene

t =√

C eps, (IV.3.7)

donde C es una constante elegida de acuerdo a la funcion f .

El Teorema de Newton-Misovski

Se ha formulado el metodo de Newton de una manera general, dandoinclusive una estimacion del error cometido, deduciendo que si el metodoconverge, la convergencia es cuadratica. Pero sin embargo, no se enuncio lascondiciones suficientes para obtener convergencia de este metodo. El siguien-te teorema dara las condiciones suficientes para asegurar la convergencia delmetodo, cuando la funcion f cumple ciertas condiciones.

Teorema IV.3.3.- Newton-Misovski. Sean D ⊂ Rn abierto y convexo,f : D −→ Rn continuamente diferenciable, f ′(x) inversible para todo x ∈ D,x0 ∈ D satisfaciendo las siguientes condiciones:

a) ‖x0‖ ≤ α,

b)∥∥∥(f ′(y)−1

(f ′(x + t(x− y)

)− f ′(x)

)(y − x)

∥∥∥ ≤ ωt ‖y − x‖2, ∀x, y ∈D, t ∈ [0, 1];

c) η :=1

2αω < 1;

d) ρ :=α

1− η< 1;

e) B(x0, ρ) = x ∈ Rn| ‖x− x0‖ ≤ ρ.

Page 191: 2374131 Una Introduccion Al Analisis Numerico

180 IV Ecuaciones No Lineales

Entonces:i) La sucesion xk definida por el metodo de Newton se queda dentro

B(x0, ρ) y converge hacia una solucion x∗ de f(x) = 0.

ii) Se tiene la estimacion ‖xk‖ ≤ ω2 ‖xk−1‖2.

iii) ‖xk − x∗‖ ≤ ω

2(1− η2k

)‖xk−1‖2 .

Demostracion.- Es claro por la definicion del metodo de Newton que sixk es convergente, entonces el lımite de la sucesion es igual a x∗, dondef(x∗) = 0. Se mostraras la conclusiones por induccion. Se supone quexk, xk−1 ∈ D, para k ≥ 1, entonces

‖xk‖ ≤ω

2‖xk−1‖2 ,

en efecto

‖xk‖ =∥∥(f ′(xk))−1f(xk)

∥∥=∥∥(f ′(xk))−1

[f(xk)− f(xk−1)− f ′(xk1

)xk−1

∥∥

=

∥∥∥∥f ′(xk)

∫ 1

0

(f ′(xk−1 + txk−1)− f ′(xk−1)

)xk−1dt

∥∥∥∥

≤∫ 1

0

∥∥∥f ′(xk)(f ′(xk−1 + txk−1)− f ′(xk−1)

)xk−1

∥∥∥ dt

≤∫ 1

0

ωt ‖xk−1‖2 dt =ω

2‖xk−1‖2 .

Se define ηk recursivamente por

ηk = η2k−1, η0 =

ω

2α = η.

Si x0, x1, . . . , xk ∈ D, entonces

ω

2‖xk‖ ≤ ηk;

es cierto para k = 0, supongase cierto para k − 1, por consiguiente

ω

2‖xk‖ ≤

2‖xk−1‖

)2

≤ η2k−1 = ηk.

como η0 = η, se tiene ηk = η2k

, puesto que η < 1,

limk→∞

ηk = 0.

Page 192: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 181

El siguiente paso es mostrar que xk es una sucesion de Cauchy y quesatisface el punto i). Se supone nuevamente, que x0, . . . , xk ∈ D, 0 ≤ l ≤ k,obteniendo

‖xk+1 − xl‖ ≤ ‖xk+1 − xk‖︸ ︷︷ ︸2

ωηk

+ · · ·+ ‖xk+1 − xl‖︸ ︷︷ ︸2

ωηl

≤ 2

ω(1 + η2

l + η4l + · · ·)

≤ 2

ω

η2l

1− η2l

.

Para l = 0, se tiene ‖xk+1 − x0‖ ≤2

ω

η2

1− η2 <2

ω

η

1− η=

α

1− α= ρ, de

donde xk+1 ∈ B(x0, ρ).Por otro lado,

‖xk+1 − xl‖ ≤2

ω

η2l

1− η2l

−→ 0, cuando k ≥ l→∞.

de donde la sucesion xk es una sucesion de Cauchy, y por lo tantoconvergente. Es ası que se ha mostrado el punto i) y el punto ii) del teoremaquedando pendiente el ultimo punto. Se tiene

‖xl+1 − xk‖ ≤ ‖xl+1 − xl‖+ · · ·+ ‖xk+1 − xk‖ ,

se plantea:

ηk−1 =ω

2‖xk−1‖ , ηl = η2

l−1;

de donde ηk−1 ≤ ηk−1 y ηk ≤ ηk − η2k

, ademas

ω

2‖xl‖ ≤ ηl para l ≥ l − 1.

De donde

‖xl+1 − xk‖ ≤ω

2

‖xk−1‖2

1− η2k,

haciendo tender l al infinito queda demostrado el punto iii)

Es necesario remarcar el siguiente hecho concerniente a la hipotesis b)del teorema que se acaba de demostrar. Si f es 3 veces derivable, utilizandola formula de Taylor se tiene

[f ′(x + t(x− y))− f ′(x)

)](y − x) = f ′′(x)(t(y − x), y − x) +O(‖y − x‖3),

Page 193: 2374131 Una Introduccion Al Analisis Numerico

182 IV Ecuaciones No Lineales

por consiguiente

(f ′(y))−1[f ′(x + t(x− y))− f ′(x)

)](y− x) = t(f ′(y))−1f ′′(x)(y− x, y− x)+

O(‖y − x‖3),

si D es bastante pequeno, entonces se puede despreciar O(‖y − x‖3), dedonde

∥∥(f ′(y))−1[f ′(x + t(x− y))− f ′(x)

)](y − x)

∥∥ ≤ t∥∥(f ′(y))−1f ′′(x)

∥∥‖y − x‖2 ,

por consiguienteω ≈ sup

x,y∈D

∥∥(f ′(y))−1f ′′(x)∥∥ (IV.3.8)

Para comprender el teorema, puede ser util estudiar en un ejemplotipo, las hipotesis del teorema y deducir las conclusiones que conducen estashipotesis

Ejemplo

Sea, f : R2 −→ R2 definida por

f(x) =

(x2

1 + x22 − 1

x2 − x21

),

la solucion del problema f(x) = 0 esta dada por la interseccion de unacircunferencia de centro en el origen y radio 1 y una parabola cuyo verticese encuentra tambien en el origen. Este problema puede ser resueltograficamente, substituyendo x2, pero el proposito del ejemplo es estudiarel teorema de Misovski.La derivada de f ′ esta dada por la matriz jacobiana

f ′(x) =

(2x1 2x2

−2x1 1

),

cuya inversa es igual a

(f ′(x))−1 =1

2x1(1 + 2x2)

(1 −2x2

2x1 2x1

).

Observando una grafica del problema se escoge como dominio D a

D =

(x1, x2)|1

2< x1, x2 < 2

.

Analizando las condiciones del teorema se tiene:

Page 194: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 183

a) Se escoge como valor inicial (1, 1) ∈ D, obteniendox0 = (−1/6,−1/3), de donde

‖x0‖ =

√5

6≈ 0, 37 = α.

b) El estudio de la segunda condicion da:

(f ′(y))−1(f ′(x + t(x− y))− f ′(x)

)(y − x)

=1

2y1(1 + 2y2)

(1 −2y2

2y1 2y1

)(2t(y1 − x1) 2t(y2 − x2)−2t(y1 − x1) 0

)(y1 − x1

y2 − x2

)

=t

2y1(1 + 2y2)

((1 + y2)(y1 − x1)

2 + (y2 − x2)2

2y1(y2 − x2)2

).

Se observa inmediatamente que las componentes son positivas, mayo-rando respecto a y, se obtiene∣∣∣(f ′(y))−1

(f ′(x + t(x− y))− f ′(x)

)(y − x)

∣∣∣

≤ t

2

∣∣∣∣3(y1 − x1)

2 + (y2 − x2)2

4(y2 − x2)2

∣∣∣∣ ,

pasando a la norma de la convergencia uniforme, se obtiene∥∥∥(f ′(y))−1

(f ′(x + t(x− y))− f ′(x)

)(y − x)

∥∥∥∞≤ 2t ‖y − x‖ infty2,

de donde:b) ω = 2.c) η = 0, 37 < 1.

d) ρ =0, 37

1− 0, 37≈ 1

2. Ahora bien, B(x0, ρ) 6⊂ D, de donde no se puede

garantizar las conclusiones del teorema. Sin embargo, tomando como x0

el valor de la primera iteracion a partir del valor inicial del ejemplo setiene

x0 =

(5

6,

2

3

)t

,

obteniendo

x0 =

(−19/213−1/21

), ‖x0‖ = 0, 066 = α,

de dondeη = 0, 066, ρ = 0, 07, B(x0, ρ) ⊂ D.

Por lo tanto, las tres condiciones del teorema son verificadas, teniendogarantizada de esta manera la convergencia del metodo de Newton.

El teorema de Newton-Misovski da las ventajas de utilizar el metodode Newton para resolver el problema f(x) = 0, sin embargo:

Page 195: 2374131 Una Introduccion Al Analisis Numerico

184 IV Ecuaciones No Lineales

Desventajas del metodo de Newton

— Cada iteracion del metodo es costosa en operaciones. En efecto elcalculo de f ′(x) y la resolucion del sistema lineal adyacente cuestanmucho si la dimension del sistema es grande. Resolver el sistema LRcuesta aproximadamente n3/3 operaciones.

— Convergencia local. El metodo converge solamente si x0 esta suficien-temente proximo de la solucion x∗.

Metodo de Newton Simplificado

Una de las mayores desventajas que tiene el metodo de Newton, consiste enel hecho de calcular en cada iteracion la matriz derivada y el sistema linealasociado. Se puede simplificar el metodo de Newton de la siguiente manera:

x0 arbitrario,

xk = −(f ′(x0)

)−1f(xk),

xk+1 = xk +xk.

(IV.3.9)

Por consiguiente se debe calcular una sola vez f ′(x0) y calcular una vez ladescomposicion LR. Por lo tanto, la primera iteracion consume aproximada-mente n3/3 en el calculo de la descomposicion, y las demas iteraciones nece-sitan aproximadamente n2 operaciones. La desventaja de utilizar el metodode Newton simplificado reside en el hecho en que se pierde la convergenciacuadratica, obteniendo una convergencia lineal. En efecto, considerando estemetodo como un metodo iterativo simple, dado en la seccion precedente setiene:

xk+1 = Φ(xk), donde βΦ(x) = x−(f ′(x0)

)−1f(x);

Φ′(x) = I −(f ′(x0)

)−1f ′(x).

Ahora bien, se tiene convergencia local, si y solamente si

ρ(I −(f ′(x0)

)−1f ′(x)) < 1,

por el teorema IV.2.9 y la convergencia lineal es consecuencia directa delteorema citado.

Tanto el metodo de Newton, como su version simplificada, defineniteraciones de la forma

xk = −(M(xk))−1f(xk),

xk+1 = xk +xk,(IV.3.10)

donde M(x), es una matriz que depende de x. Para el metodo de Newtonse tiene M(x) = f ′(x) y para la version simplificada M(x) = f ′(x0). En

Page 196: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 185

el primer caso la matriz M es la derivada, en el segundo caso M es laderivada en un punto arbitrario. Existen muchos problemas, en los cualesla matriz derivada tiene ciertas particularidades que constituyen en ventajasy desventajas al mismo tiempo, que puede solucionarse convenientementesi se escoge una matriz M apropiada; por ejemplo f ′(x) puede tener unaestructura de matriz banda, con algunos elementos no nulos fuera de labanda, es decir

f ′(x) =

∗ ∗ ∗∗ ∗ ∗

. . .. . .

∗ ∗ ∗

,

planteando M(x) la matriz cuyos elementos estan dados por la bandaprincipal de f ′(x) se tiene una buena aproximacion de f ′(x), disminuyendode esta manera el costo en operaciones. Las bases teoricas de utilizar lamatriz M en lugar de f ′(x), estan dadas por el siguiente teorema.

Teorema IV.3.4.- Newton-Kantorovich. Sean D ⊂ Rn abierto y convexo,f : D −→ Rn continuamente diferenciables, M(x0) inversible y x0 ∈ D.Ademas:

a)∥∥M(x0)

−1f(x0)∥∥ ≤ α;

b)∥∥M(x0)

−1(f ′(y)− f ′(x))∥∥ ≤ ω ‖y − x‖ , ∀x, y ∈ D;

c)∥∥M(x0)

−1(f ′(x)−M(x))∥∥ ≤ δ0 + δ − 1 ‖x− x0‖,∥∥M(x0)

−1(M(x)−M(x0)∥∥ ≤ µ ‖x− x0‖;

d) δ0 < 1, σ := max(ω, µ + δ1) y

h =ασ

(1− δ0)2 ≤

1

2;

e) B(x0, ρ) ⊂ D, con

ρ =1−√

1− 2h

h

α

1− δ0;

entonces:i) M(x) es inversible para x ∈ B(x0, ρ),ii) La sucesion xk definida por (IV.3.10) se queda en B(x0, ρ) y converge

hacia una solucion x∗ de f(x) = 0,

iii) Se define h =αω

(1− δ0)2 =

ω

σh,

ρ± =1±

√1− 2h

h

α

1− δ0,

entonces x∗ ∈ B(x0, ρ−) y no hay otra solucion de f(x) = 0 enB(x0, ρ+) ∩ D.

Page 197: 2374131 Una Introduccion Al Analisis Numerico

186 IV Ecuaciones No Lineales

Antes de demostrar el teorema hay que remarcar que h ≤ h cuyaverificacion es inmediata y tambien ρ− ≤ ρ; en efecto considerando losdesarrollos en serie de Taylor se tiene:

√1− x =

j≥0

(1/2j

)(−x)j = 1− x

2− c2x

2 − c3x3 − · · · ,

con los cj ≥ 0,

1−√

1− 2h

h= 1 + 4c2h + 8c2h

2 + 16c4h3 + · · · ,

de donde ρ− ≤ ρ. Ver la figura IV.3.2.

x0ρρ

ρ

+

_D

Figura IV.3.2. Resultado del Teorema de Newton-Kantorovich.

Demostracion.- Demostrando el punto i), se tiene:

M(x) = M(x0)[I + M(x0)

−1(M(x)−M(x0))︸ ︷︷ ︸B

],

‖B‖ ≤ µ ‖x− x0‖ < µρ,

µρ = µ1−√

1− 2h

hαωσ

α

1− δ0(1− δ0)62 ≤ µ

σ(1− δ0) ≤ 1,

de donde ‖B‖ < 1, por lo tanto (I + B) es inversible y su inversa esta dadapor

(I + B)−1 =

∞∑

k=0

(−1)kBk,

Page 198: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 187

la norma de (I + B)−1, esta mayorada por

∥∥(I + B)−1∥∥ ≤ 1

1− ‖B‖ ≤1

1− µ ‖x− x0‖,

por consiguiente

∥∥M(x)−1M(x0)∥∥ ≤ 1

1− µ ‖x− x0‖‖x− x0‖ < ρ. (IV.3.11)

La demostracion del punto ii) se efectua por induccion. Si xk−1, xk ∈B(x0, ρ), entonces xk+1 existe, se tiene:

‖xk+1 − xk‖ =∥∥M(xk)−1f(xk)

∥∥≤∥∥M(xk)−1

[f(xk)− f(xk−1)− f ′(xk−1)(xk − xk1

)]∥∥

+∥∥M(xk)−1

[f ′(xk−1 −M(xk−1)

](xk − xk−1)

∥∥≤∥∥M(xk)−1

[f(xk)− f(xk−1)− f ′(xk−1)(xk − xk1

)]∥∥

+1

1− µ ‖xk − x0‖(δ0 + δ1 ‖xk−1 − x0‖

)‖xk − x0‖

≤∥∥∥∥M(xk)−1

∫ 1

0

[f ′(xk−1+t(xk−xk−1))− f ′(xk − 1)

]dt(xk − xk−1)

∥∥∥∥

+1

1− µ ‖xk − x0‖(δ0 + δ1 ‖xk−1 − x0‖

)‖xk − x0‖

≤ 1

1− µ ‖xk − x0‖ω

2‖xk − xk−1‖2

+1

1− µ ‖xk − x0‖(δ0 + δ1 ‖xk−1 − x0‖

)‖xk − x0‖ .

De donde

‖xk+1 − xk‖ ≤1

1− µ ‖xk − x0‖σ

2‖xk − xk−1‖2 +(δ0 +(σ−µ ‖xk−1 − x0‖) ‖xk − xk−1‖

.

Para resolver esta desigualdad, se remplaza ‖xk+1 − xk‖ por tk+1 − tk y‖xk − x0‖ por tk, el sımbolo de desigualdad por el de igualdad, definiendoası una sucesion tk ⊂ R, que verifica:

t0 = 0,

t1 = α,

tk+1 − tk =1

1− µtk

σ(tk − tk−1)

2 + (δ0 + (σ − µ)tk−1)(tk − tk−1)

,

Page 199: 2374131 Una Introduccion Al Analisis Numerico

188 IV Ecuaciones No Lineales

Se demuestra facilmente, por induccion que:

‖xk+1 − xk‖ ≤ tk+1 − tk,

‖xk − x0‖ ≤ tk;

en efecto, para k = 0 se cumple, supongase cierto para k−1, por consiguiente

‖xk − x0‖ ≤ ‖xk − xk−1‖+ · · ·+ ‖x1 − x0‖≤ tk − tk−1 + · · ·+ t0 = tk;

‖xk+1 − xk‖ ≤1

1− µtk

σ

2(tk − tk−1)

2 + δ0 + (σ − µ)tk−1(tk − tk − tk−1)

= tk+1 − tk.

El siguiente paso es estudiar la sucesion tk, se tiene

(1− µtk)(tk+1 − tk) =σ

2(t2k − 2tktk−1 + t2k−1) + δ0(tk − tk−1)

+ σtk−1(tk − tk−1)− µtk−1(tk − tk−1),

efectuando algunos arreglos y simplicaciones se obtiene la siguiente igualdad

(1− µtk)(tk+1 − tk)− σ

2t2k + (1− δ0)tk

= (1− µtk−1)(tk − tk−1)−σ

2t2k−1 + (1− δ0)tk−1 = α,

expresion que es constante por que no depende de k. Expresando

tk+1 = tk +σ2 t2k − (1− δ0)tk + α

1− µtk= tk +

u(tk)

v(tk)= Φ(tk),

donde las funciones u y v estan dadas por

u(t) =σ

2t2 − (1− δ0)t + α, v(t) = 1− µt.

Se debe mostrar por consiguiente que tk converge y eso sucede si y solamentesi Φ tiene un punto fijo, y el radio expectral de Φ′ en las proximidades delpunto fijo es estrictamente menor a 1.

Se tiene:

Φ(t) = t ⇐⇒ u(t) = 0 ⇐⇒ t = ρ1,2 =1− δ0

σ±√(

1− δ0

σ

)2

− 2α

σ,

Page 200: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 189

donde ρ1,2 son las raices de u(t). Expresando ambas raices en funcion de h,se obtiene

ρ1,2 =1±√

1− 2h

h

α

1− δ0,

puesto que h ≤ 1/2, las dos raices de u son positivas, siendo ρ1 la raiz maspequena, se tiene:

ρ1 ≤ ρ2, ρ1 = ρ.

Por otro lado, ambas raices son acotadas, en efecto

ρ1 + ρ2

2=

1

h

α

1− δ0=

1− δ0

σ≤ 1

µ.

Estudiando la funcion Φ(t) se tiene tres casos, que se observan en la figuraIV.3.3.

α

ρ ρ /µ11 2

ρ1 ≤ ρ2 ≤1

µ

α

/µ1

ρ1 <1

µ< ρ2

α

/µ1

ρ2 =1

µ

Figura IV.3.3. Graficas de la funcion Φ.

Para 0 < t < ρ1, se tiene que Φ′(t) > 0, en efecto:

Φ(t) = t +u(t)

v(t),

Φ′(t) =v(t) + u′(t)

v(t)+ u(t)

v′(t)

v2(t)︸ ︷︷ ︸> 0

,

v(t) + u′(t) = 1− µt + σt− (1− δ0) = δ0 + (σ − µ)t ≥ 0.

Por consiguiente, Φ es creciente sobre el intervalo (0, ρ1), y ademas tk < ρ1;para k = 0 es cierto, supongase cierto para k, entonces

tk+1 = Φ(tk) < Φ(ρ1) = ρ1,

Page 201: 2374131 Una Introduccion Al Analisis Numerico

190 IV Ecuaciones No Lineales

La sucesion tk es creciente y mayorada, por lo tanto es convergente yconverge al primer punto fijo de Φ, el cual es ρ1. De aquı, se deduce que

xk ∈ B(x0, ρ1).

Ahora se esta en condiciones de mostrar que xk es una sucesion con-vergente, para tal motivo se debe demostrar antes que es una sucesion deCauchy. Se tiene:

‖xk+1 − xl‖ ≤ ‖xk+1 − xk‖+ · · ·+ ‖xl+1 − xl‖≤ tk+1 − tk + · · ·+ tl+1 − tl

< ρ1 − tl −→ 0

cuando k ≥ l −→∞.De donde lim

k→∞= x∗ y como M(xk) es acotada se deduce inmediata-

mentef(x∗) = 0,

mostrando ası el punto ii).Para la demostracion del punto iii) son necesarias algunas convenciones

sobre la escritura de los sımbolos utilizados. La sucesion xk esta definidapor

xk+1 = xk −M(x0)−1

f(xk),

planteando:

M(x) = M(x0), α = α, ω = ω, µ = 0.

Por otro lado,∥∥∥M(x0)

−1(f ′(x)− M(x))

∥∥∥ ≤∥∥∥M(x0)

−1(f ′(x)−M(x))

∥∥∥

+∥∥∥M(x0)

−1(M(x)− M(x))∥∥∥

≤δ0 + δ1 ‖x− x0‖+ µ ‖x− x0‖=δ0 + δ1 ‖x− x0‖

con δ0 = δ0, δ1 = δ1 + µ y σ = σ. Definiendo G(x) = x −M(x0)−1

f(x), setiene:

G′(x) =I −M(x0)−1f ′(x),

‖G(y)−G(xk−1)‖ ≤‖G(y)−G(xk−1)−G′(xk−1)(y − xk−1)‖+∥∥(G′(xk−1)−G′(x0)

)(y − xk−1)

∥∥+ ‖G′(x0)(y − xk−1)‖≤∥∥M(x0)

−1(− f(y) + f(xk−1) + f ′(xk−1)(x− yk−1)

)∥∥+∥∥M(x0)

−1(f ′(xk−1)− f ′(x0))(y − xk−1)∥∥

+∥∥M(x0)

−1(M(x0)− f ′(x0))(y − xk−1)∥∥

Page 202: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 191

utilizando una integral como en el punto ii), se obtiene

‖G(y)−G(xk−1‖ ≤ω

2‖y − xk−1‖

+ω ‖xk−1 − x0‖ ‖y − xk−1‖+ δ0 ‖y − xk−1‖ ,

Sea y∗ ∈ D ∩B(x0, ρ+), remplazando y por y∗ en la ultima desigualdad, seobtiene

‖y∗ − xk−1‖ ≤ω

2‖y∗ − xk−1‖

+ω ‖xk−1 − x0‖ ‖y∗ − xk−1‖+ δ0 ‖y∗ − xk−1‖ ,

y planteando tambien y = xk, se obtiene

‖xk − xk−1‖ ≤ω

2‖xk − xk−1‖

+ω ‖xk−1 − x0‖ ‖xk − xk−1‖+ δ0 ‖xk − xk−1‖ ,

Como en el punto ii) se remplazan ‖xk − x0‖ por tk − t0 con t0 = 0 y‖y∗ − xk‖ por sk − tk, el sımbolo ≤ por la igualdad, obteniendo ası:

tk+1 − tk =ω

2(tk − tk−1)

2 + ωtk−1(tk − tk−1) + δ0(tk − tk−1),

t0 = 0, t1 = α;

sk − tk =ω

2(sk−1 − tk−1)

2 + ωtk−1(sk−1 − tk−1) + δ0(sk−1 − tk−1),

s0 = ‖y∗ − x0‖ < ρ+.

Se demuestra por induccion que:

‖xk+1 − xk‖ ≤ tk+1 − tk,

‖xk − x0‖ ≤ tk,

‖y∗ − xk‖ ≤ sk − tk

El siguiente paso en la demostracion consiste en estudiar las sucesiones tky sk. Se tiene:

tk+1 − tk =ω

2(t2k − 2tktk−1 + t2k+1) + ωtk−1(tk − tk−1) + δ0(tk − tk−1),

tk+1 −ω

2t2k − δ0tk = tk −

ω

2t2k−1 − δ0tk−1 = α,

sk− tk =ω

2(s2

k−1−2sk−1tk−1 + t2k−1)+ωtk−1(sk−1− tk−1)+δ0(sk−1− tk−1)

sk −ω

2s2

k−1 − δ0sk−1 = tk −ω

2t2k−1 − δ0tk−1 = α.

Page 203: 2374131 Una Introduccion Al Analisis Numerico

192 IV Ecuaciones No Lineales

Definiendo la funcion Ψ(t) por

Ψ(t) =ω

2t2 + δ0t + α,

entonces se obtiene, los resultados siguientes para sk y tk:

tk+1 = Ψ(tk), t0 = 0;

sk = Ψ(sk−1), s0 = ‖y∗ − x0‖ < ρ+.

Se tiene que, Ψ′(t) = ωt + δ0 ≥ 0, si t ≥ 0, para estudiar la convergencia delas sucesiones, se debe determinar los puntos fijos de Ψ, es decir resolver laecuacion

ω

2t2 + (δ0 − 1)t + α = 0,

las raices de esta, estan dadas por:

ρ± =1±

√1− 2h

h,

se puede observar, que la sucesion tk es creciente y tiende hacia ρ−, por otrolado la sucesion sk es decrecientre y tiende hacia ρ−. Ver la figura IV.3.4

t

α

ρ ρ

Ψ (t)

− +

Figura IV.3.4. Grafica de la funcion Ψ.

Como en el punto ii) se muestra que la sucesion xk es de Cauchy, porconsiguiente xk −→ x∗ y f(x∗) = 0, ademas se tiene

‖x∗ − x0‖ ≤ ρ−,

‖y ∗ −x∗‖ ≤ sk − tk −→ 0,

y∗ = x∗.

Page 204: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 193

Para ilustrar la utilizacion del teorema de Newton-Kantorovich, se tieneel:

Ejemplo

Considerese, la funcion f dada por

f(x) =

(x2

1 + x22 − 1

x2 − x21

),

partiendo del punto (1, 1) y tomando como dominio D = R2, M(x) =f ′(x), es decir el metodo de Newton en su version no modificada, setiene:

α = 0, 37; ω = 1, 2; δ0 = 0; δ1 = 0;

µ = ω; σ = 1, 2.

Verificando y efectuando calculos se obtiene:

h = 0, 444 ≤ 1/2, ρ = ρ− = 0, 554; ρ+ = 0, 981.

Metodo de Newton con Relajacion

Una de las principales desventajas del metodo de Newton, tanto en su versionoriginal, como en su version simplificada, es que es necesario estar cerca dela solucion del problema. Lamentablemente, en una gran mayorıa de casoseso no es posible. Por lo tanto, es necesario modificar el metodo de maneraa que la convergencia sea una preocupacion menor. El metodo de Newtonesta dado, por las iteraciones

xk+1 = xk − (f ′(xk))−1

f(xk),

se tiene convergencia si ‖x1 − x0‖ ≤ α suficientemente pequeno, sin embargoesta condicion no se cumple en general. Una solucion alternativa serıamodificar el metodo de la manera siguiente:

pk = −(f ′(xk))−1

f(xk),

xk+1 = xk + λkpk;

con 0 < λ ≤ 1. La base teorica de esta modificacion esta dada por la:

Proposicion IV.3.5.- Sean D ⊂ Rn, f : D → Rn continuamente diferen-ciable, x0 ∈ D, f(x0) 6= 0 y p0 = −(f ′(x0))

−1f(x0). Entonces para toda

matriz A inversible, existe λ0 > 0 tal que para todo λ, 0 < λ < λ0, se tiene

‖Af(x0 + λp0)‖ < λ ‖Af(x0)‖ .

Page 205: 2374131 Una Introduccion Al Analisis Numerico

194 IV Ecuaciones No Lineales

Demostracion.- Se define la funcion g : R −→ R para una matriz A fija einversible, como

g(λ) = ‖Af(x0 + λp0)‖22= f(x0 + λp0)

tAtAf(x0 + λp0),

calculando la derivada de g, se obtiene:

g′(λ) = 2f(x0 + λp0)tAtAf ′(x0 + λp0)p0,

g′(0) = −2f(x0)tAtAf ′(x0)(f

′(x0))−1

f(x0)

= −2 ‖Af(x0)‖22 < 0,

por consiguiente, existe λ0 con las conclusiones requeridas por la proposicion.

Otra de las motivaciones para modificar el metodo de Newton consisteen el siguiente hecho. Sean D ⊂ Rn, f : D −→ Rn continuamentediferenciable con derivada inversible para todo x ∈ D. Llamando p(x) =

−(f ′(x))−1

f(x) la direccion de Newton para la funcion f , se obtiene lasiguiente ecuacion diferencial

x′ = p(x). (IV.3.12)

Una manera de resolver numericamente esta ecuacion, ver Capıtulo VII,consiste en aproximar la solucion mediante segmentos poligonales, es decir,definir una sucesion de vertices, dados por

xk+1 = xk − λkp(xk), (IV.3.13)

este metodo de resolucion de ecuaciones diferenciales es conocido como elmetodo de Euler.

El metodo modificado se lo conococe como λ-estrategia y su formulaciones la siguiente:

∆xk = −(f ′(xk))−1

f(xk),

xk+1 = xk + λk∆xk.(IV.3.14)

Si λk = 1 para todo k, se tiene el metodo de Newton usual. La otra situaciones escoger λk, tal que

g(λ) = ‖Af(xk + λk∆xk)‖ −→ min, (IV.3.15)

presentandose dos interrogantes:¿Como escoger la matriz A?

Page 206: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 195

¿Como calcular el mınimo de g(λ)?La eleccion de A, se la realiza considerando los siguientes hechos. Se

desea que

‖xk + λk∆xk − x∗‖ −→ min,

donde x∗ es la solucion de f(x) = 0. No se conoce por el momento x∗, perose sabe f(x∗) = 0. Se tiene, las siguientes aproximaciones:

f(x)− f(x∗) ≈ f ′(x∗)(x− x∗) ≈ f ′(xk)(x− x∗)

con x = xk + λk∆xk, de donde

xk + λk∆xk − x∗ = (f ′(xk))−1

f(xk + λ∆xk),

escogiendo, de esta manera

A = (f ′(xk))−1

; (IV.3.16)

Por lo tanto (IV.3.15), se convierte en g(λ) =∥∥∥(f ′(xk))

−1f(xk + λ∆xk)

∥∥∥ y el

problema radica en determinar λ, para que g(λ) sea mınimo. A continuacionse da un algoritmo simple que permite determinar este λ:

Supongase que se conoce xk y una aproximacion λk de λk. Se tiene doscasos:

a) g(λk) ≥ 0, es decir xk + λk es peor que xk.Se busca el mas pequeno de los j > 1, tal que

g(λk2−j) < g(0),

se plantea λk = λk2−j .

b) g(λk) < 0. Se busca el j > 0 mas pequeno tal que

g(2j+1λk) > g(2j λk)

y se plantea λk = 2j λk.En ambos casos λk no debe ser mas grande que 1.

Finalmente surge la ultima interrogante, ¿Como determinar λk? Uti-lizando un desarrollo de Taylor se tiene:

(f ′(xk))−1f(xk + λ∆xk))

= (f ′(xk))−1

[f(xk) + λf ′(xk)∆xk +

λ2

2f ′′(xk)(∆xk, ∆xk) +O(λ3)

]

Page 207: 2374131 Una Introduccion Al Analisis Numerico

196 IV Ecuaciones No Lineales

Por otro lado f(xk) + λf ′(xk)∆xk = (1− λ)∆xk y (f ′(xk))−1f(xk) = ∆xk,de donde utilizando el desarrollo de Taylor, la desigualdad del triangulo ylas observaciones anteriores, se tiene

g(λ) ≤ ‖∆xk‖ (1− λ +λ2

2hk +O(λ3))

donde hk =∥∥(f ′(xk))−1f ′′(xk)(∆xk, ∆xk)

∥∥ / ‖∆xk‖ . Despreciando el ter-mino O(λ3), se obtiene un polinomio de grado 2, cuyo mınimo se encuentraen

λk =1

hk, (IV.3.17)

faltando determinar hk. Como es practicamente imposible determinar conexactitud hk solo se requiere encontrar una buena aproximacion de hk. Paratal efecto, se supone que se ha efectuado k − 1 iteraciones, teniendo:

∆xk = −(f ′(xk))−1f(xk),

∆xk = −(f ′(xk−1))−1f(xk),

∆xk −∆xk = (f ′(xk−1))−1(f ′(xk)− f ′(xk−1))∆xk

≈ (f ′(xk−1))−1f ′′(xk)(xk − xk−1, ∆xk).

Pasando a las normas se obtiene la siguiente relacion:

∥∥∥∆xk −∆xk

∥∥∥ ≈ hk

‖∆xk‖λk−1 ‖∆xk−1‖

∥∥∥∆xk

∥∥∥ ,

de donde

λk = min

1, λk−1

‖∆xk−1‖ ‖∆xk‖∥∥∥∆xk −∆xk

∥∥∥∥∥∥∆xk

∥∥∥

. (IV.3.18)

Ejemplo

Considerese, la funcion f definida por

f(x) =

(−13x1 + x2((5− x2)− 2)

−29 + x1 + x2((1 + x2)x2 − 14)

)

Tomando como valor inicial x1 = 0, 5 y x2 = 2, 24, se resolvera elproblema f(x) = 0, utilizando la λ-estrategia, el metodo de Newton ensu version original. A continuacion se presentan los resultados obtenidospara ambos:

Page 208: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 197

Tabla IV.3.3. Resultados con λ-estrategia.

Iteracion x1 x2 ‖∆x‖ λ

1 −8.5849058 3.94357758 1183.1361 7.8125× 10−3

2 4.989738 4.0012650 13.574766 1.0

3 4.9999949 4.0000006 1.03345× 10−2 1.0

4 4.9999999 4.000000 5.08213× 10−6 1.0

5 5.0 4.0 0.0 1.0

Tabla IV.3.4. Resultados sin λ-estrategia.

Iteracion x1 x2 ‖∆x‖1 −1162.367 220.297 1183.1

2 −47637.0 147.095 46474.7

3 −21035.69 98.296 26601.42

4 −9256.28 65.77062 11779.45

5 −4049.98 44.09533 5206.34

6 −1755.45 29.658 2294.57

7 −748.669 20.056 1006.82

8 −310.0149 13.688 438.7011

9 −121.126 9.5002 188.934

10 −41.5288 6.8016 79.6434

11 −9.51218 5.16002 32.05875

12 1.887 4.3114 11.4307

13 4.7248 4.03167 2.8516

14 4.9968 4.0003 0.27378

15 4.9999 4.0000 3.149× 10−3

16 4.9999 4.0 4.566× 10−7

17 5.0 4.0 0.0

Page 209: 2374131 Una Introduccion Al Analisis Numerico

198 IV Ecuaciones No Lineales

Aproximacion de Broyden

Uno de los principales problemas en la implementacion del metodo deNewton, tanto en su version con relajacion, como en su version original, esel calculo de la matriz jacobiana f ′(xk) en cada iteracion y por consiguientemediante el algoritmo de eliminacion de Gauss determinar la descomposicionLR de esta matriz. Existen muchas alternativas para evitar el calculo de lamatriz jacobiana y su descomposicion LR en cada iteracion. El siguienteanalisis permitira encontrar algunas de estas alternativas. Utilizando lasrelaciones dadas por (IV.3.17) y (IV.3.18) respecto a la determinacion de loscoeficientes de relajacion, la experiencia numerica indica que, si λkhk ≤ 10−1

se puede tomar en el lugar de f ′(xk+1) f ′(xk). En este caso se tienela version simplificada del metodo de Newton. Sin embargo, existe otraalternativa descubierta por Broyden en 1965. Se supone, que se conoce unaaproximacion Jk de f ′(xk), es decir

Jk ≈ f ′(xk) (IV.3.19)

de donde el metodo de Newton esta dado por

∆xk = −Jk−1f(xk),

xk+1 = xk + ∆xk

el objetivo es por consiguiente, encontrar Jk+1 una aproximacion simple decalcular de f ′(xk+1). Para tal efecto, la matriz Jk debe permanecer igual enlas direcciones ortogonales a ∆xk, es decir:

Jk+1p = Jkp ∀p⊥∆xk;

Jk+1∆xk = Jk∆xk + q;(IV.3.20)

por lo tanto

q = Jk+1∆xk − Jk∆xk = f(xk) + Jk+1∆xk︸ ︷︷ ︸≈ f ′(xk+1)∆xk︸ ︷︷ ︸

f(xk+1) +O‖∆x‖2

,

de dondeJk+1∆xk = Jk∆xk + f(xk+1). (IV.3.20)

Proposicion IV.3.6.- Si Jk es inversible y∥∥∆xk+1

∥∥ < ‖∆xk‖, donde

∆xk = −J−1k f(xk) ∆xk+1 = −J−1

k f(xk+1),

Page 210: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 199

entonces Jk+1 es inversible.

Demostracion.- Sean, α ∈ R y p⊥∆xk, se va mostrar que ker Jk+1 = 0.En efecto:

0 = Jk+1(α∆x + p)

= α(Jk∆xk + f(xk+1) + Jkp

= Jk(α∆xk + p) + αf(xk+1)

= α∆xk + p− α∆xk+1,

introduciendo el producto escalar, multiplicando por ∆xk, se obtiene:

α ‖∆xk‖2 − α⟨∆xk+1, ∆xk

⟩= 0,

por la desigualdad de Cauchy-Schwartz, se tiene

∣∣⟨∆xk+1, ∆xk

⟩∣∣ ≤∥∥∆xk+1

∥∥ ‖∆xk‖ < ‖∆xk‖2 ,

de donde α = 0 y por consiguiente p = 0.

La determinacion de ∆xk+1 y ∆xk se propone en los ejercicios.

Ejercicios

1.- Utilizando el teorema de Newton-Kantorovich encontrar ρ > 0 tal quela iteracion

zk+1 = zk −f(zk)

f ′(zk)f(z) = z3 − 1

converge hacia 1, si z0 ∈ C satisface |z0 − 1| < ρ.

2.- Sea D ⊂ Rn y f : D → Rn continuamente diferenciable. Para x0 ∈ Dsupongase que f(x0) 6= 0 y que f ′(x0) sea inversible. Mostrar que

p0 = −f ′(x0)−1f(x0)

es la unica direccion que tiene la propiedad siguiente:para toda matriz inversible A existe λ0 > 0 tal que para 0 < λ < λ0

‖Af(x0 + λp0)‖2 < ‖Af(x0)‖2 .

3.- En el artıculoR.S. Dembo, S.C. Eisenstat & T. Steighaug(1982): Inexact Newtonmethods. SIAM J. Numer. Anal., vol. 19,400-408.

Page 211: 2374131 Una Introduccion Al Analisis Numerico

200 IV Ecuaciones No Lineales

los autores consideran la modificacion siguiente del metodo de Newton:

f ′(xk)∆xk = −f(xk) + τk

xk+1 = x + l + ∆xk.(IV.3.22)

Las perturbaciones τk pueden ser interpretadas como la influencia delos errores de redondeo, como el error debido a una aproximacion def ′(xk),... Supongase que τk = τ (xk) y que

‖τ (x)‖ ≤ η ‖f(x)‖ (IV.3.23)

con η < 1.

a) Mostrar el resultado:Sea D ⊂ Rn abierto, f : D → Rn y τ : D → Rn continuamentediferenciables en D. Si la condicion (IV.3.23) es satisfecha con η < 1y si ‖∆x0‖ es suficientemente pequeno, entonces la iteracion (IV.3.21)converge hacia una solucion de f(x) = 0.

b) El teorema precedente no es cierto, en general, si se remplaza η < 1por η ≤ 1. Mostrarlo.Indicacion. Encontrar una matriz M(x) tal que la iteracion (IV.3.21) sevuelva equivalente a

M(xk)∆xk = −f(xk),

y aplicar el teorema de Newton-Kantorovich. Utilizar la norma

‖u‖J = ‖f ′(x0)u‖ .

4.- (U. Ascher & Osborne 1987). Considerar una funcion f : R2 → R2 quesatisfaga

f(0) = − 1

10

(4√

3− 3−4√

3− 3

),

f(u) =1

5

(4−3

),

f ′(0) =

(1 00 1

)

f ′(u) =

(1/√

3 −1/√

31 1

)

donde u = −f(0). Aplicar el metodo de Newton con el valor inicialx0 = 0. Para la sucesion xk obtenida de esta manera mostrar:a) xk+2 = xk para todo k ≥ 0;b) el test de monotonocidad

∥∥∥(f ′(xk))−1

f(xk+1)∥∥∥

2<∥∥∥(f ′(xk))

−1f(xk)

∥∥∥2

Page 212: 2374131 Una Introduccion Al Analisis Numerico

IV.3 Metodo de Newton 201

es satisfecho en cada iteracion.

5.- Sea f : Rn → Rn dos veces diferenciable. Mostrar que

‖f ′′(x)(h, k)‖∞ ≤M ‖h‖∞ ‖k‖∞

donde M = maxi

j

l

∣∣∣∣∂2fi

∂xj∂xl(x)

∣∣∣∣.

6.- Sea f : D → R2 dada por D =

(x1

x2

)| − 1 < x1, x2 < 3

,

f(x) =

(x1 − x2

(x1 − 8)x2

), x0 =

(0.1250.125

).

Calcular los valores α y ω del teorema de Newton-Misovski. Mostrarque el metodo de Newton converge hacia una solucion de f(x) = 0.

7.- Sean f : D → Rn 3 veces continuamente diferenciable, Jk una aproxi-macion de la matriz f ′(xk) y p ∈ Rn, p 6= 0. Para la aproximacion deBroyden

Jk+1 = Jk + γ(f(xk + p)− f(xk)− Jkp).pt

ptp

se tiene:

a) (Jk+1 − f ′(x0 + p))p = (1− γ)(Jk − f ′(xk))p

+(γ

2− 1)f ′′(xk)(p, p) +O(‖p‖3).

b) para γ ∈ [0, 2]

‖Jk+1 − f ′(x0 + p)‖2 ≤ ‖Jk − f ′(xk)‖2 + ‖f ′′(xk)(p, .)‖2 +O(‖p‖2).

8.- Supongase que se conoce una aproximacion J0 de f ′(x0), y su descom-posicion LR. Considere la iteracion

Jk∆xk− = f(xk)

xk+1 = xk + ∆xk

donde Jk+1 (aproximacion de Broyden), esta definido por

Jk+1∆xk = Jk∆xk + f(xk+1);

Jk+1p = Jkp, si pt∆xk = 0.

Sin calcular explicitamente J1 y J2, encontrar formulas para ∆x1 y ∆x2.

Page 213: 2374131 Una Introduccion Al Analisis Numerico

202 IV Ecuaciones No Lineales

9.- Considerese una funcion f : Rn → Rm donde m < n. El conjunto

E = x|g(x) = 0

representa una superficie en Rn.Dado x ∈ Rn. Proponer un algoritmo para calcular el punto de E el masproximo de x. Estudiar las hipotesis para que el algoritmo converga.

10.- Considerese la ecuacion integrale de Fredholm (cf. Ejercicio 3 seccionIV.3)

λy(x) =2

π

∫ π

0

(3 sin x sin t + 2 sin(2x) sin(2t))(y(t) + (y(t))3)dt

(IV.3.24)y(x) = 0 es solucion de (IV.3.24) para todo λ ∈ R. Con las ideas delejercicio 3 de la anterior seccion se puede escribir (IV.3.24) bajo la formaG(c1, c2, λ) = 0.

Calcular los λ, donde det ∂G∂C

(C, 0) = 0.Interpretar estos puntos con el teorema de las funciones implicitas.(Soluciones: λ1 = 2, λ2 = 3)

11.- Mostrar numericamente que para λ1 = λ1 + ǫ (ǫ > 0) el problema(IV.3.24) posee al menos 3 soluciones, para λ1 > λ2 al menos 5soluciones.Calcular tambien todas las soluciones de (IV.3.24) para λ = 10, (hay13).

Page 214: 2374131 Una Introduccion Al Analisis Numerico

IV.4 Metodo de Gauss Newton

El estudio de las ecuaciones realizados en las secciones precedentes, consistıanen problemas de la forma f(x) = 0 o su variante del punto fijo x = f(x),donde f : D ⊂ Rn → Rn. Sin embargo, existen muchos problemas dondeintervienen ecuaciones no lineales, que se encuentrar en una diversidad deproblemas, sobre todo en la determinacion de parametros en el analisis dedatos. El problema puede formularse de la siguiente manera. Sea

f : D ⊂ Rn → Rm con n ≤ m,

el problema consiste en encontrar x ∈ D, tal que

‖f(x)‖2 −→ min . (IV.4.1)

En el capıtulo II.5, se abordo el problema bajo su forma lineal, seformulo el metodo QR para resolver este problema, y ası mismo se introdujola nocion de pseudo-inversa de una matriz. Para el problema no lineal, sesigue el mismo esquema. Pero antes de continuar en esa direccion, existeuna alternativa de solucion. Se define la funcion g : D → Rn de la manerasiguiente

g(x) = ‖f(x)‖22 , (IV.4.2)

de dondeg′(x) = 2(f ′(x))

tf(x), (IV.4.3)

se busca, por consiguiente, los x ∈ D tales que (f ′(x))tf(x) = 0. En principio

se podrıa utilizar el metodo de Newton para resolver este problema, pero laprincipal desventaja, consiste en calcular la segunda derivada de f . Estealgoritmo da los mınimos locales.

La otra alternativa de solucion de este problema, se la dio mas arriba,es el metodo de Gauss-Newton. Al igual que en el metodo de Newton, laidea principal de este metodo consiste en linearizar el problema. Sea x0 ∈ Dun valor inicial. Utilizando un desarrollo de Taylor en x0 se obtiene

‖f(x)‖22 = ‖f(x0) + f ′(x0)(x− x0) + · · ·‖22 ,

considerando los terminos lineales del segundo miembro de la ecuacion seobtiene, al igual que en el capıtulo II.5,

x− x0 = −f ′(x0)+

f(x0), (IV.4.4)

donde f ′(x0)+

es la pseudo inversa de f ′(x).

Page 215: 2374131 Una Introduccion Al Analisis Numerico

204 IV Ecuaciones No Lineales

Por lo tanto, se puede formular el metodo de Gauss-Newton, como:

∆xk = −f ′(xk)+f(xk),

xk+1 = xk + ∆xk.(IV.4.5)

El calculo de ∆xk se lo realiza, utilizando la descomposicion QR dada enel capıtulo II.5. Como se puede observar, la implementacion del metodo deGauss-Newton es muy simple, y al igual que el metodo de Newton existenmuchas variantes o modificaciones de este.

Convergencia del Metodo de Gauss-Newton

Sea, xk la sucesion definida por el metodo de Gauss-Newton, si estasucesion es convergente cuando k →∞, se tiene

∆xk −→ 0, f ′(x)+f(xk) −→ 0,

supongase que limk→∞

xk = x∗, que el rango de f ′(x) es constante en un

vecindario de x∗, por que si no f ′(x)+

no serıa continua, ver teorema II.5.6,entonces

f ′(x∗)+

f(x∗) = 0. (IV.4.6)

Por otro lado, si x ∈ D es un mınimo local de g(x) = ‖f(x)‖22, se tiene

∂xj

(m∑

i=1

fi(x)2

)= 2

m∑

i=1

∂fi

∂xj(x) · fi(x) = 0, ∀j;

de dondef ′(x)

tf(x) = 0. (IV.4.7)

Los resultados (IV.4.6) y (IV.4.7) estan relacionados por el siguiente:

Proposicion IV.4.1.- Se tiene

f ′(x)+f(x) = 0 ⇐⇒ f ′(x)

tf(x). (IV.4.8)

Demostracion.- Por el teorema II.5.5 existen dos matrices ortogonales Uy V , tales que

f ′(x) = U

σ1

. . .

σk

0

0 0

V t,

Page 216: 2374131 Una Introduccion Al Analisis Numerico

IV.4 Metodo de Gauss Newton 205

remplazando, se tiene

f ′(x)t= V

σ1

. . .

σk

0

0 0

U t = 0,

si y solamente si las primeras k componentes de U tf son nulas, si y solamentesi

f ′(x)+V

σ−11

. . .

σ−1k

0

0 0

U t = 0.

A la diferencia del metodo de Newton, el metodo de Gauss-Newtonofrece solamente convergencia de tipo lineal, situacion que sera mostrada acontinuacion. Como antes, se define g(x) = (f ′(x))tf(x), si x∗ es soluciondel problema de minimizacion de la norma euclidiana, se tiene g(x∗) = 0.El desarrollo en serie de Taylor en punto x de la funcion g, da el siguienteresultado

0 = g(x) + g′(x)(x∗ − x) +O(‖x∗ − x‖22),por otra lado, la funcion g y sus derivadas parciales satisfacen:

gj(x) =

m∑

i=1

∂fi(x)

∂xjfi(x),

∂gj

∂xk(x) =

m∑

i=1

∂2fi(x)

∂xj∂xkfi(x) +

m∑

i=1

∂fi

∂xj(x)

∂fi

∂xk(x),

de dondeg′(x) = B(x)(f(x), ) + f ′(x)

tf ′(x),

con B(x) una forma bilineal simetrica. Por consiguiente el desarrollo deTaylor de g en xk, el k-esimo valor obtenido en la iteracion del metodo deGauss-Newton, es igual a

0 = f ′(xk)tf(xk) + f ′(xk)

tf ′(xk)(x∗ − xk) + B(xk)(f(xk), x∗ − xk)

+O(‖x∗ − xk‖22),

y por el metodo de Gauss Newton, se tiene

xk+1 − xk = −f ′(xk)+f(xk),

Page 217: 2374131 Una Introduccion Al Analisis Numerico

206 IV Ecuaciones No Lineales

multiplicando esta ultima expresion por f ′(xk)tf ′(xk) se obtiene

0 = f ′(xk)tf ′(xk)f ′(xk)

+f(xk) + f ′(xk)

tf ′(xk)(xk+1 − xk),

y utilizando el teorema II.5.7, el inciso d), se tiene finalmente

f ′(xk)tf(xk) + f ′(xk)

tf ′(xk)(xk+1 − xk);

sustrayendo esta ultima expresion con aquella concerniente al desarrollo deTaylor, se obtiene

0 = f ′(xk)tf ′(xk)(xk+1 − x∗) + B(xk)(f(xk), x∗ − xk) +O(‖x∗ − xk‖22).

Ahora bien, supongase ademas que rang f ′(xk) = n, es decir que el rangosea maximal. De donde se tiene

xk+1 − x∗ = −(f ′(xk)

tf ′(xk)

)−1

B(xk)(f(xk), x∗ − xk) +O(‖x∗ − xk‖22),

por consiguiente, el metodo de Gauss-Newton converge linealmente si

ρ

((f ′(xk)

tf ′(xk)

)−1

B(xk)(f(xk), )

)< 1;

y diverge si

ρ

((f ′(xk)

tf ′(xk)

)−1

B(xk)(f(xk), )

)> 1.

Debe observarse que si f(x∗)=0, el metodo de Gauss-Newton convergecuadraticamente, en este caso se tiene un problema compatible. Por otrolado, el problema inicial era buscar x tal que f(x) = 0, motivo por el cual sedebe esperar que la solucion encontrada por el metodo de Gauss-Newton def(x∗) bastante pequeno, de manera que el radio espectral sea mas pequenoque 1.

Al igual que en el metodo de Newton, el calculo de f ′(x) se lo real-iza en muchas ocaciones numericamente, o en los casos en que se puedaanalıticamente. Es indudable que la matriz f ′(x) en las iteraciones delmetodo de Gauss-Newton tienen un componente de error, utilizando lasrelaciones (IV.3.5) y (IV.3.6), este error es del orden de

√eps, donde eps

es la precision del computador. Por consiguiente la k-esima iteracion delmetodo de Gauss-Newton, considerando que el error cometido por redondeose encuentra solamente en el calculo de f ′(x), esta dada por

∆xk = −(f ′(xk) + E)+

f(xk),

Page 218: 2374131 Una Introduccion Al Analisis Numerico

IV.4 Metodo de Gauss Newton 207

con ‖E‖2 =√

eps. Efectuando operaciones con la pseudo inversa, dadas enel teorema II.5.7 se obtiene:

∆xk = −((f ′(xk) + E)

t(f ′(xk) + E)

)−1

(f ′(xk) + E)tf(xk),

((f ′(xk) + E)

t(f ′(xk) + E)

)∆xk = −(f ′(xk) + E)

tf(xk),

((f ′(xk) + E)

t(f ′(xk) + E)

)∆xk + (f ′(xk) + E)

tf(xk) = 0,

despreciando E en el primer termino de la ultima ecuacion, se obtiene(f ′(xk)

tf ′(xk)

)∆xk + f ′(xk)

tf(xk) + Etf(xk) = 0,

introduciendo en la serie de Taylor, como se hizo mas arriba, se obtiene

−Etf(xk) = f ′(xk)tf ′(xk)(xk+1 − x∗) + B(xk)(f(xk), x∗ − xk)

+O(‖x∗ − xk‖22),

mostrando ası que si f(x∗) 6= 0, es inutil buscar una precision superior a√eps.

Modificaciones del Metodo de Gauss-Newton

Similarmente al metodo de Newton, existen varias modificaciones del metodooriginal de Gauss-Newton. Una de las mayores dificultades en la imple-mentacion de este metodo consiste en calcular f ′(xk) en cada iteracion.Por consiguiente, una primera modificacion consiste en utilizar el metodode Gauss-Newton simplificado, el cual esta dado por:

x0 bastante proximo de la solucion,

∆xk = −f ′(x0)+

f ′(xk),

La principal ventaja de utilizar el metodo de Gauss-Newton simplificadoconsiste en calcular por una vez f ′(x0) y luego efectuar la descomposicionQR. Sin embargo existe una desventaja, que no se puede llegar a la solucionx∗, si f(x∗) 6= 0, esto se ha observado al finalizar la anterior subseccion.

Otra modificacion corrientemente utilizada en el metodo de Gauss-Newton consiste en utilizar coeficientes de relajacion o mas conocido como laλ-estrategia. Sobre todo, se utiliza la relajacion cuando los valores inicialesutilizados para activar el metodo no estan muy cerca de la solucion buscada,ademas como un medio de aceleracion de convergencia. Por lo tanto elmetodo de Gauss-Newton con λ-estrategia, esta dado por

x0 bastante proximo de la solucion;

∆xk = −f ′(x0)+

f ′(xk),

xk+1 = xk + λk∆xk, 0 < λk ≤ 1.

Page 219: 2374131 Una Introduccion Al Analisis Numerico

208 IV Ecuaciones No Lineales

El valor λk se determina de la misma manera, que para el metodo de Newton,con la unica variacion de utilizar la pseudo-inversa en el lugar de la inversa.

Ejemplos

1.- Este ejemplo esta relacionado con la subseccion concerniente a laconvergencia del metodo de Gauss-Newton. Se busca x ∈ R tal queg(t) = ext ajuste lo mejor posible m puntos (ti, yi), i = 1, . . . , m; conm ≥ 1. Por consiguiente, el problema consiste en determinar x tal que

m∑

i=1

(yi − exti) −→ min,

de donde, dentro las caracterısticas de la aplicacion del metodo deGauss-Newton se tiene:

f(x) =

ext1 − y1...

extm − ym

, f ′(x) =

t1ext1

...tmextm

,

continuando con los calculos se tiene:

f ′(x)tf ′(x) =

m∑

i=1

(tiexti)2,

B(x)(f(x), ) =

m∑

i=1

t2i exti(exti − yi).

Sea por otro lado ρ tal que

∣∣exti − yi

∣∣ ≤ ρexti i = 1, . . . , m;

obteniendo, la mayoracion siguiente

∣∣∣∣∣∣∣∣∣∣

m∑

i=1

t2i exti(exti − yi)

m∑

i=1

(tiexti)2

∣∣∣∣∣∣∣∣∣∣

≤ ρ,

se tiene convergencia si ρ < 1.

2.- Este ejemplo es una ilustracion numerica de la implementacion delmetodo de Gauss-Newton con relajacion. El problema consiste endeterminar la circunferencia que pasa lo mas cerca posible de los

Page 220: 2374131 Una Introduccion Al Analisis Numerico

IV.4 Metodo de Gauss Newton 209

siguientes puntos: (2, 3), (2, 1), (1, 2), (3, 2) y (2.5, 2.5). Ahora bien laecuacion de una circunferencia de centro (h, k) y radio r esta dada por

(x− h)2 + (x− k)2 − r2 = 0,

por consiguiente el problema consiste en determinar h, k y r de maneraque se obtenga la circunferencia mas proxima a estos puntos. Para laimplementacion del metodo de Gauss-Newton, se tiene que

f(h, k, r) =

(h− 2)2 + (k − 3)2 − r2

(h− 2)2 + (k − 1)2 − r2

(h− 1)2 + (k − 2)2 − r2

(h− 3)2 + (k − 2)2 − r2

(h− 2.5)2 + (k − 2.5)2 − r2

Despues de un simple grafico, se puede tomar como valores inicialesh = 2, k = 2 y r = 1, utilizando el metodo de Gauss-Newton conrelajacion despues de 5 iteraciones, se obtiene los siguientes valores:

h =1.95833333333295,

k =1.95833333333295,

r =0.959239125904873

En la figura IV.4.1, se tiene la grafica de la circunferencia resultante

Page 221: 2374131 Una Introduccion Al Analisis Numerico

210 IV Ecuaciones No Lineales

del metodo de Gauss-Newton.

.0 .5 1.0 1.5 2.0 2.5 3.0 3.5 4.0.0

.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

Figura IV.4.1. Circunferencia del metodo de Gauss-Newton.

Page 222: 2374131 Una Introduccion Al Analisis Numerico

IV.4 Metodo de Gauss Newton 211

El Metodo de Levenberg-Marquandt

El problema abordado en esta seccion, es resolver ‖f(x)‖ → min, dondef : Rn → Rm, con n ≤ m. El metodo propuesto en el anterior paragrafofue el metodo de Gauss-Newton. Como se ha visto, uno de los mayoresincovenientes es que para iniciar las iteraciones se debe partir de un puntoinicial bastante proximo de la solucion, por otro lado los analisis hechos sebasan en el supuesto que f ′(x) es de rango igual a n, es decir de rango ma-ximal, ademas si f(x) no es lo suficientemente pequeno el metodo de Gauss-Newton diverge. Por las razones expuestas es necesario formular un metodoalternativo que permita evitar las situaciones enumeradas anteriormente.

El metodo de Levenberg-Marquandt que constituye un metodo alterna-tivo para resolver el problema de encontrar x con ‖f(x)‖ mınima, se basa enlas siguientes ideas. Al formular el metodo de Gauss-Newton, se considerola serie de Taylor de f(x) en el punto xk, resultado de la k − 1 iteracion yse planteo

‖f(x)‖ = ‖f(xk) + f ′(xk)(x− xk) +O(‖x− xk‖)‖ −→ min,

suponiendo que x − xk es lo suficientemente pequeno, se obtenıa comoformulacion del metodo de Gauss-Newton

‖f(xk) + f ′(xk)(x− xk)‖ −→ min,

y como condicion suplementaria deseable

‖x− xk‖ −→ min,

La idea de Levenberg fue de considerar el problema siguiente para determinarel valor de xk+1

‖f(xk) + f ′(xk)(x− xk)‖22 + p ‖x− xk‖22 −→ min, (IV.4.9)

donde p > 0 es un parametro fijo. Si se deriva una vez la expresion (IV.4.9),se obtiene:

2f ′(xk)t(f(xk) + f ′(xk)(x− xk)) + 2p(x− xk) = 0,(

f ′(xk)tf ′(xk) + pI

)(xk+1 − xk) = −f ′(xk)

tf(xk). (IV.4.10)

Dependiendo de la eleccion del parametro p, el metodo de Levenberg-Marquandt, tiene los siguientes comportamientos:

Si p −→ 0, se tiene el metodo de Gauss-Newton, para ver realmente loque sucede ver el capıtulo II, seccion 5, ejercicio 5.

Page 223: 2374131 Una Introduccion Al Analisis Numerico

212 IV Ecuaciones No Lineales

Si p es muy grande, entonces

∆xk ≈= −1

pf ′(xk)

tf(xk),

de esta manera, se tiene la direccion de la pendiente mas grande, ollamada tambien del gradiente, pero en este caso la convergencia podrıaser muy lenta.

La eleccion de p puede ser variable, en el sentido siguiente, comenzar con pgrande hasta que ∆xk sea bastante pequeno y luego hacer decrecer p hastaobtener el metodo de Gauss-Newton.

Ejercicios

1.- Encontrar una elipse, una hiperbola, que pasa lo mejor posible por lospuntos (xi, yi)i=1,...,m. Por ejemplo m = 10; (−1/2, 1), (−1/2,−0.1),(2.5,−1), (1.5, 1.5), (0.3,−1.5), (0.5,−2), (3, 0.1), (3,−0.3), (2.5, 1),(0.5, 3.5).

Indicaciones.- Plantear

f(x, y) = ax2 + 2bxy + cy2 + dx + ey + g

y encontrar a, b, c, d, e, g tales que

m∑

i=1

(f(xi, yi)

)2 −→ min

bajo la condicion ac − b2 = 1 para la elipse, y ac − b2 = −1 para lahiperbola.

2.- Considerese el problema de localizar un barco en el oceano. Paravolver el calculo mas simple, se supondra que la curvatura terrestrees despreciable y que todos los puntos estan situados en el sistemade coordenadas rectangulares (x, y). Sobre el barco, se mide el anguloentre el eje x y las varias estaciones emisoras, cuyas coordenadas sonconocidas.

i xi yi αi

1 8 6 42

2 −4 5 158

3 1 −3 248

Page 224: 2374131 Una Introduccion Al Analisis Numerico

IV.4 Metodo de Gauss Newton 213

Teoricamente, la posicion (x, y) del barco satisface la relacion

arctan

(y − yi

x− xi

)= αi ∀i.

Encontrar la posicion probable de este. Las coordenadas aproximadasdel barco son x0 = 3, y0 = 2.

Atencion.- Hacer los calculos en radianes y utilizar siempre la mismarama de la funcion arctan.

Page 225: 2374131 Una Introduccion Al Analisis Numerico

Capıtulo V

Calculo de Valores Propios

La determinacion de valores propios o autovalores de una matriz A esmuy corriente en la resolucion de multiples problemas. Sus aplicaciones vandesde problemas de minimizacion y maximizacion, solucion de sistemas deecuaciones diferenciales, ecuaciones con derivadas parciales, etc. El calculode valores propios y la determinacion de vectores propios para matriz deun orden inferior o igual a 3 no presenta mayor problema, puesto que susolucion depende del polinomio caracterıstico cuyo grado en este caso esinferior o igual a 3. Sin embargo, aquellos problemas, donde se requiere saberlos valores y vectores propios, provienen de matrices cuyo orden es muchomas grande que 3 Es por eso, necesario e imprecindible formular metodos yalgoritmos, lo mas eficientes posibles, teniendo en cuenta las particularidadesde las matrices que son estudiadas. Ahora bien, la mayor parte de los metodosconsevidos sirven para matrices simetricas o matrices normales, pues sonestas, las que se encuentran en la mayor parte de los problemas.

En este capıtulo, se estudiaran y formularan tales metodos, pero secomenzara haciendo una introduccion teorica del problema de la deter-minacion de autovalores y vectores propios. Como segunda parte de estecapıtulo, se tendra la formulacion de estos metodos.

Page 226: 2374131 Una Introduccion Al Analisis Numerico

V.1 Teorıa Clasica y Condicion del Problema

En esta seccion, se tratara los aspectos teoricos indispensables para lacomprension del problema de la evaluacion de valores propios de una matrizA de orden n.

Definicion V.1.1.- Sea A una matriz de n × n a coeficientes complejos oreales. λ ∈ C es un valor propio, si existe x ∈ Cn no nulo, tal que

Ax = λx. (V.1.1)

Si este es el caso, x es un vector propio asociado al valor propio λ.

Proposicion V.1.2.- Sea A ∈ Mn(C), λ ∈ C es un valor propio, si ysolamente si

ker(A− λI) 6= 0.

Demostracion.- Resultado inmediato de la definicion.

Consecuencia de la anterior proposicion, se tiene que λ es un valor propiosi y solamente si

det(A− λI) = 0, (IV.1.2)

de donde, se tiene la:

Definicion V.1.3.- El polinomio caracterıstico de la matriz A ∈ Mn(Cn)esta dado por

χA(λ) = det(A− λI). (IV.1.3)

Por consiguiente, se deduce facilmente que λ es un valor propio de Asi y solamente si λ es una raiz de χA(λ). Por otro lado, este polinomio esa coeficientes complejos, de donde existen n valores propios, contando sumultiplicidad, de la matriz A ∈Mn(C).

Proposicion V.1.4.- Valor propio es una propiedad invariante por simila-ridad, es decir si B = T−1AT , con T inversible, entonces A y B tienen losmismos valores propios.

Demostracion.- En efecto, sea λ valor propio de A, entonces existe unvector propio asociado a λ que se lo denota por v, se tiene

BT−1v = T−1ATT−1v = T−1Av = λT−1v,

de donde λ es un valor propio de B con T−1v valor propio asociado.

Page 227: 2374131 Una Introduccion Al Analisis Numerico

V.1 Teorıa Clasica y Condicion del Problema 215

Definicion V.1.5.- Sea A ∈Mn(C), se define la adjunta de A por

A∗ij = aji.

Definicion V.1.6.- Se dice que una matriz U es unitaria si

U∗U = I.

Vale la pena recalcar, que una matriz ortogonal a coeficientes realeses unitaria, y recıprocamente una matriz unitaria a coeficientes reales esortogonal, en el caso en que existieran coeficientes complejos no reales lasituacion cambia. Por otro lado, es facil ver que el conjunto de las matricesunitarias forman un grupo para la multiplicacion de matrices.

Teorema V.1.7.- Schur. Para cada matriz A ∈ Mn(C), existe una matrizQ unitaria, tal que

Q∗AQ =

λ1 ∗ · · · ∗0 λ2 ∗

. . .

0 λn

.

Demostracion.- Sea A una matriz cualquiera, entonces existe λ1 que esraiz de det(A−λI), de donde existe v1 vector propio asociado a λ1, se puedesuponer, sin perder generalidad, que ‖v1‖2 = 1. Se plantea

Q1 = (v1, v2, . . . , vn),

con v2, . . . , vn elegidos de manera que Q1 sea unitaria. Esta eleccion esposible con el procedimiento de Gramm-Schmidt en el caso complejo. Seobserva inmediatamente, que

AQ1 = Q1

λ1 ∗ . . . ∗0...0

A(1)

.

De la misma manera se encuentra una matriz Q2 de orden n− 1, tal que

A(1)Q2 = Q2

λ2 ∗ . . . ∗0...0

A(2)

,

Page 228: 2374131 Una Introduccion Al Analisis Numerico

216 V Calculo de Valores Propios

y planteando

Q2 =

(1 00 Q2

),

se tiene

AQ1Q2 = Q2Q1

λ1 ∗0 λ2

∗ · · · ∗0...0

A(2)

.

repetiendo el procedimiento las veces que sea necesario, se tiene el resul-tado deseado. Cabe recalcar que este procedimiento da la descomposicionrequerida en a lo mas n pasos.

Teorema V.1.8.- Si A es normal, es decir A∗A = AA∗, entonces existe unamatriz unitaria Q tal que

Q∗AQ =

λ1 0. . .

0 λn

Demostracion.- Si la matriz A es normal y Q es unitaria, entonces Q∗AQes normal. En efecto

(Q∗AQ)∗(Q∗AQ) = Q∗A∗QQ∗AQ

= Q∗AA∗Q

= (Q∗AQ) (Q∗AQ)∗.

queda por demostrar, que si

B =

λ1 ∗ · · · ∗0 λ2 ∗

. . .

0 λn

es triangular y normal, entonces

B =

λ1 0...

0 λn

.

Puesto que BB∗ = B∗B, se tiene

Page 229: 2374131 Una Introduccion Al Analisis Numerico

V.1 Teorıa Clasica y Condicion del Problema 217

λ1 0 · · ·∗ λ2 0

. . .

∗ λn

λ1 ∗ · · · ∗0 λ2 ∗

. . .

0 λn

=

λ1 ∗ · · · ∗0 λ2 ∗

. . .

0 λn

λ1 0 · · ·∗ λ2 0

. . .

∗ λn

,

de donde|λ1|2 = |λ1|2 + |∗|2 + · · ·+ |∗|2 ,

dando como resultado que la primera fila fuera del coeficiente de la diagonales nulo. Se continua con el mismo procedimiento hasta mostrar que B esdiagonal.

La condicion del Problema a Valores Propios

Sea, A una matriz cualquiera a coeficientes complejos de orden n. Al igual queen capıtulo II, es importante conocer la condicion del problema planteado,es decir la determinacion de valores propios. Para tal efecto sea A la matrizcon errores de redondeo de A, repasando la seccion II.1, se tiene que loscoeficientes de A satisfacen

aij = aij(1 + ǫij) |ǫij | ≤ eps,

donde aij son los coeficientes de A, aij los coeficientes de A y eps la precisionde la computadora. Por consiguiente, el estudio de los valores propios de A

pueden estudiarse de manera, mas general, para A + ǫC, con cij =ǫij

epsde

donde |cij | ≤ |aij |. Definiendo

f(ǫ, λ) = det(A + ǫC − λI),

se tiene inmediatamente que

f(0, λ) = χA(λ).

Supongase que λ1 es una raiz simple de χA(λ), entonces se tiene

f(0, λ1) = 0,

∂f

∂λ(0, λ1) 6= 0.

Page 230: 2374131 Una Introduccion Al Analisis Numerico

218 V Calculo de Valores Propios

Por el teorema de las funciones implıcitas, se deduce que existe un vecindariode (0, λ1) en el cual existe una funcion λ(ǫ), tal que

f(ǫ, λ(ǫ)) = 0,

conλ(ǫ) = λ1 + ǫλ′

1 +O(ǫ2).

Por consiguiente, se tiene el siguiente:

Teorema V.1.9.- Sea λ1 una raiz simple de χA(λ), entonces para ǫ → 0,existe un valor propio λ(ǫ) de A + ǫC, tal que

λ(ǫ) = λ1 + ǫu∗

1Cv1

u∗1v1

+O(ǫ2) (V.1.4)

donde Av1 = λ1v1 y u∗1A = λ1u

∗1, u y v no nulos.

Demostracion.- Por el teorema, de las funciones implıcitas se tiene

(A + ǫC)v(ǫ) = λ(ǫ)v(ǫ),

mas precisamente

(A + ǫC)(v1 + ǫv′1 +O(ǫ2)) = (λ1 + ǫλ′1 +O(ǫ2))v1,

comparando los terminos de igual grado en cada miembro de la ecuacionanterior, se tiene:

ǫ0 : Av1 = λ1v1,

ǫ1 : Av′1 + Cv1 = λ1v′1 + λ′

1v1,

de donde(A− λ1I) v′1 = −Cv1 + λ′

1v1,

multiplicando esta ultima por u∗1, se obtiene

0 = −u∗1Cv1 + λ′

1u∗1v1.

Corolario V.1.10.- Si A es normal con valores propios diferentes, entonces

∣∣∣∣u∗

1Cv1

u∗1v1

∣∣∣∣ ≤ ‖C‖ ,

es decir, el problema esta bien condicionado.

Page 231: 2374131 Una Introduccion Al Analisis Numerico

V.1 Teorıa Clasica y Condicion del Problema 219

Demostracion.- A es normal, por consiguiente existe una matriz Q unitariatal que

Q∗AQ =

λ1 0. . .

0 λn

,

una verificacion inmediata muestra que v1 es la primera columna de Q, asımismo u∗

1 es la primera fila de Q∗, de donde v1 = v1, por lo tanto, se obtiene

∣∣∣∣u∗

1Cv1

u∗1v1

∣∣∣∣ ≤|u∗

1Cv1|‖v1‖2

≤‖v1‖ ‖Cv1‖‖v1‖2

≤‖C‖ .

Ejemplos

1.- Se considera la matriz A definida por

A =

(1 α0 2

).

Es muy simple darse cuenta, que λ = 1 es un valor propio de A, porconsiguiente por simple inspeccion, se obtiene:

v1 =

(10

),

u1 =1√

1 + α2

(1−α

),

de donde

u∗1v1 =

1√1 + α2

.

La matriz A es mal condicionada para el calculo de los valores propioscuando α→∞, ya que u∗

1v1 → 0.

2.- El teorema de descomposicion de Jordan indica que toda matriz Aes similar a una matriz de tipo Jordan, es decir existe una matriz Tinversible tal que

T−1AT = J,

Page 232: 2374131 Una Introduccion Al Analisis Numerico

220 V Calculo de Valores Propios

donde J es una matriz diagonal por bloques,

J =

J(n1, λ1). . .

J(nk, λk)

,

y

J(ni, λi) =

λi 1. . .

. . .

λi

.

Ahora bien, supongase que A es similar a la matriz de tipo Jordan, dadapor

1 1 0 00 1 1 00 0 1 10 0 0 1

,

entonces se tiene que

det(A + ǫC − λI) = (1− λ)4 + ǫ +O(ǫ2),

donde C es una perturbacion de A.Calculando los valores propios de A + ǫC, ver figura V.1.1, es facil verque el problema de determinar valores propios de A es un problema malcondicionado

1

Figura IV.1.1. Determinacion de los valores propios de A + ǫC

Page 233: 2374131 Una Introduccion Al Analisis Numerico

V.1 Teorıa Clasica y Condicion del Problema 221

Ejercicios

1.- Una matriz A es de tipo Frobenius, si es de la forma

A =

0 1 0 · · · 0... 0

. . ....

0 · · · 0 1−a0 −a1 · · · −an−2 −an−1

.

a) Verificar que

det(A− λI) = (−1)n(λn + an−1λ

n−1 + · · ·+ a1λ + a0

).

b) Calcular los vectores propios de A.

2.- Calcular los valores propios de la matriz tridiagonal

A =

a cb a c 0

b a c0 b · · ·

. . .

n.

Las componentes del vector propio (v1, v2, · · · , vn)t satisfacen una ecua-cion de diferencias finitas con v0 = vn+1 = 0.

Verificar que vj = Const(αj1 − αj

2) donde

α1 + α2 =a− λ

c, α1α2 =

b

c,

(α1

α2

)n+1

= 1.

3.- Mostrar que los valores propios de una matriz A satisfacen

n∑

i=1

|λi|2 ≤n∑

i,j=1

|aij |2 .

Se tiene igualdad, si y solamente si, A es diagonalizable con una matrizunitaria.

Indicacion.-

n∑

i,j=1

|aij |2 es la traza de A∗A que es invariante respecto a

la transformacion A→ Q∗AQ.

Page 234: 2374131 Una Introduccion Al Analisis Numerico

222 V Calculo de Valores Propios

4.- Supongase que los valores propios de A con aij ∈ R son: α + iβ, α− iβ,λ3, . . . , λn con β 6= 0, λ3, . . . , λn diferentes. Mostrar que existe unamatriz T inversible con coeficientes reales tal que

T−1AT =

α β−β α

0

0

λ3

. . .

λn

.

Dar una relacion entre las columnas de T y los vectores propios de A.

5.- Sea A una matriz simetrica y B una matriz cualquiera. Para cada valorpropio λB de B existe un valor propio de λA de A tal que

|λA − λB| ≤ ‖A−B‖2 .

Indicacion.- Mostrar primero para un cierto v

v = (A− λBI)−1(A−B)v,

deducir que

1 ≤∥∥(A− λBI)−1(A−B)

∥∥ ≤ ‖A−B‖∥∥(A− λBI)−1

∥∥ .

6.- Sea A una matriz simetrica. Para cada ındice i existe un valor propio λde A tal que

|λ− aii| ≤√∑

j 6=i

|aij |2.

Indicacion.- Utilizar el ejercicio 5 con una matriz B conveniente.

Page 235: 2374131 Una Introduccion Al Analisis Numerico

V.2 Determinacion de Valores Propios

En la actualidad, existen muchos metodos numericos para el calculo de valo-res propios de una matriz. Sin embargo, la mayor parte de las aplicaciones enfısica y otras disciplinas requieren en la mayorıa de los casos, la utilizacionde matrices normales. Motivo por el cual, existen metodos especıficos a estetipo de matrices. Se comenzara, esta seccion formulando el metodo de laPotencia.

El Metodo de la PotenciaSea, A una matriz de n×n con coeficientes reales o complejos, el objetivo esdeterminar el valor propio mas grande en valor absoluto. Sea y0 ∈ Rn(Cn)arbitrario, se define la sucesion yn ⊂ Rn de manera recursiva, como

yn+1 = Ayn, (V.2.1)

es evidente que yn = Any0. Esta sucesion tiene propiedades interesantes parala determinacion del valor propio mas grande, que estan dadas en el:

Teorema V.2.1.- Sea A diagonalizable, es decir que existe una matriz Tinversible tal que

T−1AT =

λ1 0. . .

0 λn

,

supongase que los valores propios satisfacen

|λ1| > |λ2| ≥ |λ3| ≥ · · · ≥ |λn|

y e∗1T−1y0 6= 0. Entonces la sucesion yk definida por yk+1 = Ayk satisface:

a) yk = λk1

[a1v1 +O

(∣∣∣∣λ2

λ1

∣∣∣∣k)]

,

donde Av1 = λ1v1, Avj = λjvj ,y0 = a1v1 + a2v2 + · · ·+ anvn, yT = (v1, · · · , vn).

b) Se tiene el cociente de Rayleigh, dado por

y∗kAyk

y∗kyk

= λ1 +O(∣∣∣∣

λ2

λ1

∣∣∣∣k)

, (V.2.2)

si ademas, la matriz A es normal, entonces

y∗kAyk

y∗kyk

= λ1 +O(∣∣∣∣

λ2

λ1

∣∣∣∣2k)

. (V.2.3)

Page 236: 2374131 Una Introduccion Al Analisis Numerico

224 V Calculo de Valores Propios

Demostracion.- Los vectores v1, · · · , vn forman una base del espacio Cn,de donde

y0 = a1v1 + a2v2 + · · ·+ anvn,

deduciendoseyk = a1λ

k1v1 + a2λ

k2v2 + · · ·+ anλk

nvn,

por consiguiente

yk

λk1

= a1v1 + a2

(λ2

λ1

)k

v2 + · · ·+ an

(λn

λ1

)k

vn,

con lo queda demostrado el punto a). Para la demostracion del punto b), setiene:

yk = λk1a1v1 + λk

2a2v2 + · · ·+ λknvn,

Ayk = λk+11 a1v1 + λk+1

2 a2v2 + · · ·+ λk+1n vn,

y∗kyk =

i,j

λki λk

j v∗i vj aiaj ,

y∗kAyk =

i,j

λki λk+1

j v∗i vj aiaj ,

obteniendo el cociente de Rayleigh, dado por

y∗kAyk

y∗kyk

= λ1 +O(∣∣∣∣

λ1

λ2

∣∣∣∣2)

,

ahora bien si A es normal, se tiene que v∗i vj = 0, si i 6= j; obteniendo para

y∗kAyk =

i

λi |λi|2k v∗i vi,

y∗kyk =

i

|λi|2k v∗i vi.

Ejemplo

Considerese, la matriz A definida por

A =

2 1 0 0 01 2 1 0 00 1 2 1 00 0 1 2 10 0 0 1 2

,

Page 237: 2374131 Una Introduccion Al Analisis Numerico

V.2 Determinacion de Valores Propios 225

utilizando el ejercicio 2 de la seccion V.1, se obtiene que el valor propiomas grande esta dado por

λ1 = 2(1 +

√3

2) ≈ 3, 73205,

Tomando y0 = (1, 1, 1, 1, 1)t, se obtiene los valores de λ1 dadas en latabla V.2.1.

Tabla V.2.1. Valores de λ1.

Iter. λ1 Iter. λ1

1 3.6 2 3.696969

3 3.721854 4 3.729110

5 3.731205 6 3.731808

7 3.731981 8 3.732031

9 3.732045 10 3.732049

11 3.732050 12 3.732051

13 3.732051 14 3.732051

Las componentes del valor propio respecto a λ1 estan dados por

v =

1.077350261.866025402.15470051.866025

1.07735026

.

Uno de los inconvenientes de utilizar el metodo de la potencia es quela convergencia puede ser muy lenta si |λ1/λ2| ≈ 1. Sin embargo, existe unamodificacion del metodo de la potencia para acelerar la convergencia. Estemetodo es mas conocido como el:

Metodo de la Potencia Inversa

La modificacion consiste en aplicar el metodo de la potencia a

(µI −A)−1 ,

donde µ es una aproximacion del valor propio λ buscado de la matriz A. Lajustificacion teorica esta dada por la siguiente proposicion:

Proposicion V.2.2.- λ es valor propio de A, si y solamente si,

1

µ− λ(V.2.4)

Page 238: 2374131 Una Introduccion Al Analisis Numerico

226 V Calculo de Valores Propios

es valor propio de (µI −A)−1.

Demostracion.- λ es valor propio de A, si y solamente si existe v 6= 0 talque

Av = λv,

si y solamente si

(µI −A)v = (µ− λ)v,

(µI −A)−1v =1

µ− λv.

Por otro lado aplicando, el teorema V.2.1 se tiene que la convergenciaes del orden

O(∣∣∣∣

µ− λ1

µ− λ2

∣∣∣∣k)

.

Sea λ el valor propio mas grande de (µI −A)−1, entonces se tiene que

λ1 = µ− 1

λ. (V.2.5)

El metodo de la potencia da una relacion recursiva para los yk, que esta dadapor

yk+1 = (µI −A)−1yk,

pero en lugar de calcular la inversa de la matriz, se puede resolver la ecuacion

(µI −A)yk+1 = yk, (V.2.6)

utilizando para tal efecto el algoritmo de eliminacion de Gauss.En el anterior ejemplo se tenia como valor de λ1 = 3.697 despues de

2 iteraciones del metodo de la potencia inversa. Aplicando el metodo de lapotencia inversa con µ = 3.697, se obtiene despues de dos iteraciones:

λ = −232.83,

λ1 = 3.7334052.

Puede suceder que la matriz A sea a coeficientes reales, sin embargo, elvalor propio buscado no sea real si no que contenga una parte imaginaria.Supongase que µ = α + βi sea una aproximacion del valor propio buscado.Entonces aplicando el metodo de la potencia inversa, se tiene

((α + βi)I −A

)yk+1 = yk, (V.2.7)

Page 239: 2374131 Una Introduccion Al Analisis Numerico

V.2 Determinacion de Valores Propios 227

por otro lado los vectores yk pueden ser descompuestos en un vector real yotro imaginario, de la manera siguiente

yk = uk + ivk, uk, vk ∈ Rn,

de donde, se obtiene una nueva formulacion para el metodo de la potenciainversa, dada por

(αI −A −βI

βI αI −A

)(uk+1

vk+1

)=

(uk

vk

),

y el cociente de Rayleigh esta dado por

y∗kyk+1

y∗kyk

=(ut

k − ivtk)(uk+1 + ivk+1)

utkuk + vt

kvk

=(ut

kuk+1 + vtkvk+1 + i(ut

kvk+1 − vtkuk+1)

utkuk + vt

kvk

. (V.2.8)

Formas Tridiagonales y Matrices de Hessenberg

El metodo de la potencia y su version de la potencia inversa son metodosaplicables a matrices, donde el valor propio mas grande en valor absolutolo es estrictamente. Por otro lado es necesario darse un vector inicial cuyaproyeccion sobre el espacio propio, respecto a este valor propio sea no nula,es decir se debe tener una idea clara de la posible ubicacion de los vectorespropios. Ahora bien, en muchos casos es necesario conocer los diferentesvalores propios, situacion que no es posible con las dos versiones del metodode la potencia estudiados mas arriba.

Una gran clase de metodos de calculo de valores propios estan disenadospara operar con matrices tridiagonales, sobre todo si estas son simetricas.El objetivo de este paragrafo es construir algoritmos que permitan tridiago-nalizar una matriz arbitraria, conservando las propiedades originales en loscasos en que sea posible.

Sea, A una matriz arbitraria de orden n × n, se busca una transfor-macion, T tal que

T−1AT = H =

∗ · · · ∗∗

.... . .

.... . .

...∗ ∗

.

H es conocida bajo el nombre de matriz de Hessenberg. A continuacion, sepropone como algoritmo de reduccion a la forma de Hessenberg, utilizandomatrices de tipo L, del algoritmo de eliminacion de Gauss.

Page 240: 2374131 Una Introduccion Al Analisis Numerico

228 V Calculo de Valores Propios

Algoritmo 1.

1.- Sea A una matriz arbitraria,se busca |ak1| = max

j=2,...,n|aj1|,

se intercambia las filas k y 2 y tambien las columnas k y 2,se define la matriz L2 por

L2 =

1 00 10 −l32 1

.... . .

0 −ln2 1

, li2 =ai1

a21, i = 2, . . . , n;

se obtiene

L2AL−12 =

∗ ∗ · · · ∗∗0...0

A(1)

.

2.- Se aplica el paso 1 a la matriz A(1), y se continua hasta obtener unamatriz de Hessenberg.

La principal desventaja de utilizar este primer algoritmo propuesto esque, si A es una matriz simetrica, H no lo es en general. Recordando elcapıtulo II.5, existe el algoritmo QR para reducir una matriz A a la formatriangular. Es facil verificar que H = QtAQ es simetrica, si Q es ortogonaly A es simetrica. Por consiguiente, el segundo algoritmo propuesto utilizamatrices de Householder para convertir una matriz A en una matriz deHessenberg.

Algoritmo 2.

1.- Sea A una matriz arbitraria, que puede escribirse, como

A =

(a11 · · · a1n

A′1 · · · A′

n

),

por consiguiente A′k ∈ Rn−1.

Se define Q2 por

Q2 =

(1 00 Q′

2

),

donde Q′2 = I − 2u2u

t2, u2 esta determinado por la condicion, ver

Capıtulo V.2,

Q′2A

′1 =

α2

0...0

, α2 = signo a21 ‖A′

1‖2 ;

Page 241: 2374131 Una Introduccion Al Analisis Numerico

V.2 Determinacion de Valores Propios 229

obteniendo

Q2AQ−12 =

∗ ∗ · · · ∗∗0...0

A(1)

.

2.- Se procede como en 1, hasta obtener la forma de Hessenberg.

Teorema de Sturm y Metodo de la Biseccion

Al utilizar el algoritmo 2, de la anterior subseccion, a una matriz A simetricase obtiene una matriz tridiagonal simetrica, que se la denota nuevamente porA, para no cargar la notacion. Por consiguiente, A es de la forma

A =

d1 e2

e2 d2 e3

e3. . .

. . .. . .

. . . en

en dn

. (V.2.9)

Se define, el polinomio p0(x) por

p0(x) = 1, (V.2.10)

y los polinomios pi(x) i = 1, . . . , n, como

pi(x) = det(Ai − xI), (V.2.11)

donde

A =

(Ai 00 ∗

),

Ai es la matriz formada por las primeras i filas y columnas de A. Por lotanto, se tiene

Pn(x) = det(A− xI). (V.2.12)

Por otro lado, los determinantes que definen estos polinomios cumplen lasiguiente relacion recursiva

det(Ai−xI) = (di−x) det(Ai−1−xI)− e2i det(Ai−2−xI), i = 2, 3, . . . , n;

de donde

pi(x) = (di − x)pi−1(x)− e2i pi−2(x), i = 2, 3, . . . , n. (V.2.13)

Page 242: 2374131 Una Introduccion Al Analisis Numerico

230 V Calculo de Valores Propios

Teorema V.2.3.- Sea A una matriz tridiagonal y simetrica con los coefi-cientes ei 6= 0 para i = 2, . . . , n. Entonces:

a) Las raices de pn(x) = χA(x) son simples,b) p′n(λi) · pn−1(λi) < 0 si λi es una raiz de pn(x),c) pj(x

∗) = 0 (1 ≤ j ≤ n− 1, x∗ ∈ R)⇒ pj−1(x∗)pj+1(x

∗) < 0,d) p0(x) ≥ 0 para todo x ∈ R.

Demostracion.- El punto d) se verifica inmediatamente puesto que p0(x) =1 por definicion.

La demostracion del punto c) se la realiza por el absurdo, en efecto,si se tuviera pj(x

∗) = 0 y pj+1(x∗) = 0, utilizando (V.2.13), se tendrıa

p0(x∗) = 0 lo cual contradice el hecho que p0(x

∗) = 1. Ahora bien, utilizandonuevamente (V.2.13) se tiene en el caso en que pj(x

∗) = 0

pj−1(x∗) = −e2

n−j+1pj+1(x∗).

El punto b) implica el punto a), ya que p′n(λi) 6= 0 conduce a que λi searaiz simple. Solo queda el punto b) por demostrar.

Se define, los polinomios:

qi(x) = (−1)ipi(x)1

e2e3 · · · ei+1, i = 1, . . . , n;

q0(x) = p0(x);

donde en+1 = 1. Efectuando calculos sobre los polinomios qj(x), se tiene

(−1)iqi(x)e2 · · · ei+1 =(di − x)(−1)i−1qi−1(x)e2 · · · ei

− e2i (−1)i−2qi−2(x)e2 · · · ei−1,

de donde

ei+1qi(x) + (di − x)qi−1(x) + eiqi−2(x) = 0, i = 2, . . . , n.

Esta ultima relacion puede escribirse de manera matricial, como

d1 − x e2

e2 d2 − x e3

e3. . .

. . .

. . .. . . en

en dn − x

︸ ︷︷ ︸A− xI

q0(x)q1(x)

...qn−1(x)

︸ ︷︷ ︸q(x) 6= 0

=

0...0

−qn(x)

.

Si λi es valor propio de A, entonces q(λi) es un vector propio, derivandola relacion matricial, se obtiene

Page 243: 2374131 Una Introduccion Al Analisis Numerico

V.2 Determinacion de Valores Propios 231

−q(x) + (A− xI)q′(x) =

0...0

−q′n(x)

,

multiplicando por la traspuesta de q(x), se tiene

−qt(x)q(x) + qt(x)(A− xI)q′(x)︸ ︷︷ ︸= 0 si x = λi

= qt(x)

0...0

−q′n(x)

,

de donde

−q′n(λi)qn−1(λi) = −‖q(λi)‖2 < 0,

dando por consiguiente

p′n(λi)pn−1(λi) < 0.

Cabe remarcar que los polinomios pi(x) i = 0, . . . , n; forman unasucesion de Sturm, cuyo estudio y calculo de raices estan dados en laprimera seccion del capıtulo IV concerniente a la resolucion de ecuacionespolinomiales. Por consiguiente el numero de valores propios de la matriz Aen el intervalo [a, b], esta dado por

w(b)− w(a),

donde w(x) indica los cambios de signo de los polinomios pi(x). Ladeterminacion exacta de los valores propios se efectua mediante el algoritmode la biseccion, ya estudiado en la seccion IV.1. Ahora bien, el problemaconsiste en encontrar un algoritmo simple que permita evaluar w(x).

Algoritmo para calcular w(x)

Se define la sucesion fi(x), i = 1, . . . , n; por

fi(x) =pi(x)

pi−1(x), (V.2.14)

obteniendo de inmediato, la siguiente relacion recursiva para fi(x):

f1(x) = (d1 − x);

fi(x) = (di − x)− e2i

1

fi−1(x), i = 2, . . . , n.

(V.2.15)

Page 244: 2374131 Una Introduccion Al Analisis Numerico

232 V Calculo de Valores Propios

Ahora bien, si por azar, existe x ∈ R, i = 2, . . . , n con fi(x) = 0, (V.2.15)puede ser modificado para evitar la division por 0, de la manera siguiente:

fi(x) =

(di − x)− e2i

1

fi−1(x), si fi−1(x) 6= 0;

(di − x)− |ei|eps

, si fi−1 = 0.

(V.2.16)

La justificacion de utilizar la sucesion fi(x) esta en la siguiente proposicion.

Proposicion V.2.4.- w(x) es igual al numero de elementos negativos de

f1(x), f2(x), . . . , fn(x)

Demostracion.- La demostracion tiene sus bases teoricas en el Teoremade Sylvester, que indica que si A es una matriz, T una matriz no singular,entonces la matriz B = T tAT tiene el mismo numero de valores propiosnegativos que la matriz A. Aplicando este teorema a la proposicion ademostrar, se tiene

A− xI =

1e2/f1(x) 1

. . .

en/fn−1 1

f1(x)f2(x). . .

fn(x)

1 e2/f1(x). . .

1 en/fn−1(x)1

,

de donde A− xI tiene el mismo numero de valores propios negativos que elconjunto f1(x), f2(x), . . . , fn(x). Por otro lado este numero esta dado porw(x), quedando demostrada la proposicion.

Para poder aplicar el algoritmo de la biseccion es necesario conocer losintervalos, donde pueden estar localizados los valores propios, para evitarbusquedas inutiles. El siguiente teorema es muy util para determinar lasregiones donde se encuentran estos.

Teorema V.2.5.- Gerschgorin. Sea λ un valor propio de A matriz, Entoncesexiste i tal que

|λ− aii| ≤∑

j 6=i

|aij | . (V.2.17)

Demostracion.- Sea x 6= 0, el vector propio asociado a λ, por consiguientex = (x1, x2, . . . , xn)t. Sea i, tal que

|xi| ≥ |xj | ∀j,

Page 245: 2374131 Una Introduccion Al Analisis Numerico

V.2 Determinacion de Valores Propios 233

puesto que x 6= 0, se tiene necesariamente que xi 6= 0. Efectuando calculosse obtiene:

n∑

j=1

aijxj = λxi,

j 6=i

aijxj = (λ− aii)xi,

pasando a valores absolutos se tiene:

|λ− aii| |xi| ≤∑

j 6=i

|aij | |xj | ,

|λ− aii| ≤∑

j 6=i

|aij | .

Generalizacion del Metodo de la Potencia

Al formular el metodo de la potencia, se buscaba el valor propio, cuyovalor absoluto era maximo, de una matriz A. Ahora bien, existen muchosproblemas en los cuales se requiere conocer no solamente el valor propio masgrande en valor absoluto, sino tambien los otros valores propios. El propositode esta subseccion es formular un metodo que permita calcular los dos valorespropios mas grandes en modulo. Para tal efecto, es necesario suponer queλ1,λ2, . . . , λn valores propios de A satisfacen

|λ1| > |λ2| > |λ3| ≥ · · · |λn| .Recordando el metodo de la potencia, se tiene la sucesion de los yk

definida poryj+1 = Ayj ,

si y0 cumple ciertas condiciones, se tiene

yj = λj1[a1v1 +O

(∣∣∣∣λ2

λ1

∣∣∣∣j)

,

donde v1 es el vector propio asociado a λ1 y a1 la componente de y0

respecto a v1. Para evitar explosiones en los calculos de los yj se puedemejorar el algoritmo de la potencia exigiendo que ‖yj‖2 = 1, y ademas paraevitar oscilaciones en los yj , se plantea por consiguiente

yj+1 =Ayj

‖Ayj‖2signo

((Ayj)1(yj)1

), (V.2.18)

donde (yj)1 es la primera componente de yj . Puesto que los yj son denorma igual a 1, haciendo referencia a vectores ortonormales, se cambia lanotacion de yj por qj , dando por consiguiente la siguiente definicion recursivapara los qj :

Page 246: 2374131 Una Introduccion Al Analisis Numerico

234 V Calculo de Valores Propios

q0 arbitrario, tal que ‖q0‖2 = 1;

‖qj‖2 = 1;

λ(j+1)1 qj+1 = Aqj .

(V.2.19)

Por el teorema V.2.1, se tiene que:

limj→∞

qj = v1,

limj→∞

λ(j)1 = λ1,

con v1 valor propio de norma unitaria respecto a λ1. Por otro lado lavelocidad de convergencia de (V.2.19), esta dada por O

((λ2/λ1)

j).

Por consiguiente, el problema consiste en calcular λ1 y λ2, si es posibleal mismo tiempo. Supongase que conoce de antemano λ1 y v1. Considerandoel subespacio vectorial V de Cn definido por

V =u ∈ Cn|u∗v1 = 0

,

espacio de dimension n− 1. La matriz A induce una aplicacion lineal que sela denota por la letra A tambien, la cual esta definida por

A : Cn −→ Cn

y −→ Ay,

definiendo la aplicacion lineal f : V −→ V como f = p A|V donde p esla proyeccion ortogonal de Cn en V , y A|V es la restriccion de A sobre elespacio V se tiene el:

Teorema V.2.6.- Los valores propios de f son: λ2, . . . , λn, mas precisa-mente se tiene

f(v) = U

λ1 0 0λ2 r22 · · · r2n

. . .

λn

U∗v,

donde v ∈ V y

U∗AU =

λ1 r12 · · · r1n

. . .. . .

λn

es la descomposicion de Schur dada en teorema V.1.7.

Page 247: 2374131 Una Introduccion Al Analisis Numerico

V.2 Determinacion de Valores Propios 235

Demostracion.- Sea U = (u1, u2, . . . , un) matriz unitaria con u1 = v1,entonces cualquier elemento v ∈ V se escribe, como

v =n∑

i=2

αiui,

por consiguiente

v = Uα, con α =

0α2...

αn

;

de donde f(v) = AUα.Ahora bien, si U es la matriz unitaria de la descomposicion de Schur de

A, se tiene

f(v) = U

λ1 r12 · · · r1n

. . .. . .

λn

U∗Uα,

como Uα = v, se tiene despues de una simple verificacion que

f(v) = U

λ1 0 0λ2 r22 · · · r2n

. . .

λn

U∗v.

El teorema precedente proporciona un medio teorico para calcular λ2,el cual es el metodo de la potencia a f . Por lo tanto, si se tiene determinadoλ1 y v1 el algoritmo de la potencia, se lo formula de la siguiente manera:

r0, tal que v∗1r0 = 0 y ‖r0‖2 = 1;

αj = v∗1Arj ;

‖rj‖2 = 1;

Arj − αjv1 = λ(j+1)2 rj+1.

(V.2.20)

Es facil verificar que

limj→∞

λ(j)2 = λ2,

limj→∞

rj = u2;

Page 248: 2374131 Una Introduccion Al Analisis Numerico

236 V Calculo de Valores Propios

donde v2 es el vector propio de norma unitaria respecto a λ2.Serıa interesante poder calcular λ1 y λ2 al mismo tiempo, sin necesidad

de determinar primero λ1 y luego λ2, esto es posible mediante el siguientealgoritmo.

Se da, como vectores iniciales: q0 y r0, tales que:

‖q0‖ = 1, ‖r0‖ = 1, y r∗0q0 = 0. (V.2.21)

Se supone, que se ha calculado

qj , con ‖qj‖ = 1; rj , con ‖rj‖ = 1 y r∗j qj = 0;

entonces se aplica el algoritmo de la potencia de la siguiente manera

Aqj = λ(j+1)1 qj+1,

‖qj+1‖ = 1;

∣∣∣∣∣∣∣

αj+1 = q∗j+1Arj ,

Arj − αj+1qj+1 = λj+12 rj+1,

‖rj+1‖ = 1.

(V.2.22)

Se puede demostrar que tambien

limj→∞

λ(j)2 = λ2,

limj→∞

rj = u2,

donde u2 es la segunda columna de la matriz U de la descomposicion deSchur de A. Vale la pena recalcar, el siguiente hecho

A (qj , rj)︸ ︷︷ ︸Uj

= (qj+1, rj+1)︸ ︷︷ ︸Uj+1

(j+1)1 α(j+1)

0 λ(j+1)2

)

︸ ︷︷ ︸Rj+1

,

de donde planteando U0 = (q0, r0) con U∗0 U0 =

(1 00 1

), el algoritmo de la

potencia generalizada, se expresa de manera matricial como

AUj = Uj+1Rj+1,

donde el segundo miembro no es nada mas que la descomposicion QR, peroesta vez utilizando matrices unitarias.

Si la matriz A tiene sus n valores propios diferentes, y ademas queverifican

|λi| > |λ2| > · · · > |λn| ,

Page 249: 2374131 Una Introduccion Al Analisis Numerico

V.2 Determinacion de Valores Propios 237

el metodo de la potencia puede ser aplicado para calcular de manerasimultanea los n autovalores. Se toma U0 una matriz unitaria arbitrariaque puede ser por ejemplo U0 = I. Supongase que se ha calculado Rj y Uj ,entonces se tiene

AUj = Uj+1Rj+1. (V.2.23)

Se puede demostrar que:

Rj −→ R =

λ1 · · · ∗. . .

λn

,

Uj −→ U,

cuando j →∞, donde AU = UR es la descomposicion de Schur.

El Metodo QR

Al finalizar la ultima subseccion, se dio una generalizacion del metodo de lapotencia. Por razones de presentacion, se vera en esta seccion un algoritmoequivalente a este ultimo, conocido como el metodo QR.

La version simple del algoritmo QR es aplicable a matrices, cuyos valorespropios son reales y diferentes en valor absoluto, se lo define recursivamentede la siguiente manera:

A1 = A = Q1R1,

Aj+1 = RjQj = Qj+1Rj+1,(V.2.24)

donde Qj es una matriz ortogonal, y R es una matriz triangular superior. Dedonde, este algoritmo es equivalente al metodo de la potencia generalizada.En efecto, planteando

Uj = Q1 · · ·Qj ,

se tieneUj+1Rj+1 = Q1Q2 · · ·Qj Qj+1Rj+1︸ ︷︷ ︸

RjQj

,

llegando finalmente a

Uj+1Rj+1 = Q1R1︸ ︷︷ ︸A

Q1Q2 · · ·Qj︸ ︷︷ ︸Uj

.

Puesto que el metodo QR y el algoritmo de la potencia son equivalentes, esfacil ver que

Rj −→ R =

λ1 · · · ∗. . .

λn

,

Qj −→ I.

Page 250: 2374131 Una Introduccion Al Analisis Numerico

238 V Calculo de Valores Propios

Por otro lado, las matrices Aj+1 y Aj tienen los mismos valores propios, pues

Aj+1 = Q∗jAjQj

Indudablemente, el metodo QR es aplicable a toda matriz cuyos valorespropios son diferentes en modulo, sin embargo es conveniente reducir lamatriz A a una de tipo Hessenberg, ya que si A es una matriz de Hessenberg,las matrices Ak construidas a partir del algoritmo QR lo son tambien, verejercicio 5, ademas el costo de operaciones es menor.

El siguiente resultado, enunciado sin demostracion, indica la velocidadde convergencia del metodo QR donde A es una matriz de tipo Hessenberg.Esta relacion esta dada por

a(j+1)n,n−1

a(j)n,n−1

∼(

λn

λn−1

), (V.2.25)

es decir

a(j)n,n−1 = O

((λn

λn−1

)j)

. (V.2.26)

Uno de los problemas con que se confronta es que la convergencia puedeser demasiado lenta, sobre todo si |λn| ≈ |λn−1|; pero este inconvenientepuede superarse aplicando el algoritmo QR, en lugar de la matriz A, a

A− pI, (V.2.27)

donde p ≈ λn. p se lo conoce con el nombre de shift. En este caso la velocidadde convergencia esta dada por

a(j)n,n−1 = O

((λn − p

λn1− p

)j)

. (V.2.28)

El algoritmo QR con shift

Antes de comenzar el algoritmo QR, se supone que la matriz A estaexpresada bajo la forma de una matriz de Hessenberg. El algoritmo QRcon shift, se lo define de manera recursiva como:

A1 = A,

QjRj = Aj − pjI,

Aj+1 = RjQj + pjI.

(V.2.29)

Las dos maneras mas corrientes de elegir el shift pk son:

Page 251: 2374131 Una Introduccion Al Analisis Numerico

V.2 Determinacion de Valores Propios 239

1.- Se plantea pk = a(k)n,n.

Este procedimiento funciona bien, si todos los valores propios de lamatriz A son reales.

2.- Se toma pk, al valor propio de la matriz

(a(k)n−1,n−1 a

(k)n−1,n

a(k)n,n−1 a

(k)n,n

),

que es mas proximo al coeficiente a(k)n,n.

Una interrogante muy importante surge, cuando detener el algoritmoQR. Uno de los criterios mas usados es el siguiente. Si

∣∣∣a(k)n,n−1

∣∣∣ ≤ eps(∣∣∣a(k)

nn

∣∣∣+∣∣∣a(k)

n−1,n−1

∣∣∣)

, (V.2.30)

se planteaλn = a(k)

nn . (V.2.31)

Luego se continua con la matriz A(k) de dimension n − 1 resultante, hastaobtener todos los valores propios de la matriz A.

La experiencia numerica muestra que el algoritmo QR converge lineal-mente, mientras que el algoritmo QR con shift tiene convergencia cuadratica.

Ejemplos

1.- Considerese, la matriz A definida por

A =

10 7 60.1 5 30 0.1 1

matriz de tipo Hessenberg. Por lo tanto lista, para ser aplicado el metodoQR y el metodo QR con shift. A continuacion, se mostrara las iteracionesresultantes del metodo QR sin shift

A2 =10.070493 7.0701525 5.8875209.49305211− 001 4.9895287 2.8589253.00000000 .19067451− 001 .93997833

A3 =10.105227 7.0677632 5.8742925.24258892− 001 4.9656988 2.8145741.00000000 .35752960− 002 .92907381

A4 =10.122222 7.0596308 5.8759333.11880000− 001 4.9507267 2.7975584.00000000 .66976513− 003 .92705007

Page 252: 2374131 Una Introduccion Al Analisis Numerico

240 V Calculo de Valores Propios

Puede observarse que la convergencia es lineal y ademas se tiene

a(k+1)21

a(k)21

∼ 1

2,

a(k+1)32

a(k)32

∼ 1

5,

por consiguiente se necesitan por lo menos 10 iteraciones para obtener

a(k)32 ∼ 10−8 y por lo menos 23 iteraciones para tener a

(k)21 ∼ 10−8.

Para poder observar la verdadera potencia de aplicar el metodo QR conshift, a continuacion se muestran las 6 iteraciones que son necesarias,para obtener los valores propios de la matriz A.

p1 = 1.0

A2 =10.078261 7.0950933 5.8540158.43358029− 001 4.9964769 2.8312527.00000000 −.19045643− 002 .92526107

p2 = .92526107

A3 =10.112141 7.0679606 5.8707690.19226871− 001 4.9612733 2.8312527.00000000 −.62453559− 006 .92526107

p3 = .92526107

A4 =10.126953 7.0571468 5.8766286.84142592− 002 4.9464609 2.7929532.00000000 −.67414063− 013 .92658424

p4 = .84142592− 002

A5 =10.138415 7.0571468−.18617346− 004 4.9349986

p5 = −.18617346− 004

A6 =10.138390 7.0497319−.90446847− 010 4.9350238

obteniendo, ası los siguientes valores propios:

λ1 = 10.138390,

λ2 = 4.9350238,

λ3 = 0.92658424.

2.- Puede observarse en el ejemplo anterior que la convergencia del metodoQR con shift es cuadratica, para ilustrar este hecho, considerese

A =

(2 aǫ 1

),

Page 253: 2374131 Una Introduccion Al Analisis Numerico

V.2 Determinacion de Valores Propios 241

con ǫ bastante pequeno. Aplicando el metodo QR con shift se tiene p1 = 1y

A− p1I =

(1 aǫ 0

),

obteniendo

Q1R1 =

(1/√

1 + ǫ2 −ǫ/√

1 + ǫ2

ǫ/√

1 + ǫ2 1/√

1 + ǫ2

)(√1 + ǫ2 a/

√1 + ǫ2

0 −ǫa/√

1 + ǫ2

),

lo que da

A1 =

(∗ ∗

−ǫ2/1 + ǫ2 ∗

),

de donde la convergencia es cuadratica, si a es arbitrario. Si la matrizes simetrica, se puede observar que la convergencia serıa cubica en esteejemplo, tomar a = ǫ.

Ejercicios

1.- Calcular los valores propios y vectores propios de

A =

2 11 2 120 1 2 11 2

,

utilizando el metodo de la potencia inversa de Wielandt.

2.- Sea

A =

88− 7√

6360

296− 169√

61800

−2 + 3√

6225

296 + 169√

61800

88 + 7√

6360

−2− 3√

6225

16−√

636

16 +√

636

19

.

Calcular α, β, λ y una matriz T a coeficientes reales, tal que

T−1 =

α β 0−β α 00 0 λ

.

La matriz A define un metodo de Runge-Kutta.

3.- Sea A una matriz de orden s que es diagonalizable, y sea J una matrizde orden n. Se define el producto tensorial A⊗ J por

A⊗ J =

a11J · · · a1sJ...

...as1J · · · assJ

.

Page 254: 2374131 Una Introduccion Al Analisis Numerico

242 V Calculo de Valores Propios

Encontrar un algoritmo eficaz para resolver un sistema lineal con lamatriz

I −A⊗ J.

Indicaciones:a) Mostrar que

(A⊗B)(C ⊗ C) = (AC)⊗ (BD).

b) Supongase que

T−1AT = Λ =

λ1

. . .

λs

y utilizar la descomposicion

I −A⊗ J = (T ⊗ I)(I − Λ⊗ J)(T−1 ⊗ I) (V2.32)

c) estimar el numero de multiplicaciones necesarias, si:— se calcula la descomposicion LR de I − A⊗ J ,— se utiliza (V.2.32); el trabajo principal es el calculo de la descom-posicon LR de I − Λ⊗ J .

4.- Calcular todos los valores propios de

A =

1 −1−1 2 −1

. . .. . .

. . .

−1 2 −1−1 3

n

para n = 10 y n = 20. Utilizar el metodo de la biseccion.

5.- Mostrar que si la matriz A = A1 es una matriz de Hessenberg, lasmatrices Ak, k = 2, construidas en el metodo QR son igualmentematrices de Hessenberg.

Page 255: 2374131 Una Introduccion Al Analisis Numerico

Capıtulo VI

Integracion Numerica

En muchos problemas aparecen integrales, ya sean estas simples, multiplesy de otras clases. En los cursos elementales de Calculo, la determinacion deprimitivas es un topico de bastante importancia. Por consiguiente, existen loselementos teoricos para evaluar primitivas. Sin embargo la mayor parte de lasaplicaciones numericas donde interviene la integracion, presenta integralescuyo calculo de primitivas es imposible en terminos de funciones elementales,o por las caracterısticas propias de los problemas solo se requiere unacomputo aproximado de estas.

En este capıtulo se tratara las base teoricas de la integral de Riemann,luego se abordara la nocion de formula de cuadratura y como consecuencialogica se definira el orden de una formula de cuadratura. El segundotema que sera estudiado, como parte integrante del Analisis Numerico,esta relacionado con la estimacion del error cometido por la utilizacion demetodos numericos de integracion. Se comparara, diferentes formulas decuadratura haciendo hincapie en aquellas de orden elevado. Las formulasde cuadratura de Gauss seran estudiadas como un caso de formulas de ordenelevado y para comprenderlas mejor se introducira la nocion de polinomiosortogonales. Despues, se formulara un metodo adaptativo para determinarintegrales y como corolario se hara un tratamiento de singularidades, es decirse implementara metodos para resolver integrales impropias. Como ultimotopico, se vera la interpolacion trigonometrica, es decir se hara un estudiode las Transformadas de Fourier discretas, como tambien la Transformadade Fourier Rapida, mas conocida como FTP.

Page 256: 2374131 Una Introduccion Al Analisis Numerico

VI.1 Bases Teoricas

En esta seccion, se veran las bases teoricas de la teorıa de la integracion,pero esta limitada a la integral de Riemann. Por otro lado, tambien seranabordados las motivaciones para tener la integral como un instrumentomatematico de Calculo.

Uno de los problemas con el cual el hombre ha confortado desde epocaslejanas, ha sido el calculo de areas, volumenes y otros, tanto por la necesidadcotidiana, como tambien dentro el espıritu de reflexion e investigacion quelo ha caracterizado siempre.

La integral mas utilizada, desde el punto de vista de calculo y practico,es la integral de Riemann, cuya definicion permitio que el calculo integraltuviese bases teoricas cimentadas. En lo que sigue, se hara una presentacionteorica de esta importante nocion.

Definicion VI.1.1.- Sea, [a, b] un intervalo compacto de la recta real. Sellama subdivision del intervalo [a, b] un conjunto S ⊂ [a, b] finito.

Por consiguiente S puede ser ordenado, como una sucesion finita depuntos de [a, b] expresada de la manera siguiente

S =x0 < x1 < · · · < xn

⊂ [a, b].

Definicion VI.1.2.- Sea S una subdivision de [a, b], se llama paso de lasubdivision S a

δ(S) = maxi=1,...,n

|xi − xi−1| .

Ahora bien, la nocion de integral esta definida para funciones cuyodominio son intervalos compactos, ademas se exige que la funcion seaacotada. Como no es proposito del libro hacer una exposicion sobre la teorıade la integracion, se dara una de las definiciones de una funcion integrableen el sentido de Riemann.

Definicion VI.1.3.- Sea f : [a, b] → R una funcion acotada sobre unintervalo compacto. Se dira que f es Riemann integrable si

limδ(S)→0

n∑

i=1

f(ξi)(xi − xi−1) existe,

con ξi ∈ [xi−1, xi], independientemente de S y de los ξi. Si este es el caso,este lımite se lo denota por ∫ b

a

f(x)dx.

Page 257: 2374131 Una Introduccion Al Analisis Numerico

VI.1 Bases Teoricas 245

Se puede demostrar que las funciones monotonas, continuas y en escalerason Riemann integrables. El calculo de la integral como un lımite puede serbastante tedioso, motivo por el cual, los cursos de Calculo en los nivelesbasicos universitarios y ultimos cursos de colegio, dan un enfasis al calculode primitivas, que para recordar es:

Definicion VI.1.4.- Dada una funcion ϕ sobre un intervalo I de R. Se diceque una funcion φ : I → R es una primitiva de ϕ si, en todo punto x de I,la funcion φ es derivable y si φ′(x) = ϕ(x).

Sea f : [a, b] → R una funcion integrable en el sentido de Riemann, sedefine para todo x ∈ [a, b]

F (x) =

∫ x

a

f(t)dt.

Proposicion VI.1.5.- La funcion F es continua, ademas si la funcionf es continua en un punto x de [a, b], la funcion F es derivable en x yF ′(x) = f(x).

Corolario VI.1.6.- Una funcion continua sobre un intervalo compactoadmite una primitiva.

Las demostraciones de la proposicion y el corolario precedentes se laspuede encontrar en cualquier libro de Analisis. A continuacion, se enunciauno de los teoremas fundamentales del calculo.

Teorema VI.1.7.- Sea f : [a, b] → R una funcion integrable en el sentidode Riemann que, ademas admite una primitiva G. Para todo x ∈ [a, b], setiene:

G(x)−G(a) =

∫ x

a

f(t)dt.

Ahora bien, desde el punto de vista numerico, el calculo de primitivasno tiene mayor utilidad practica, pues en la mayor parte de los casosla determinacion analıtica de estas es costosa en tiempo. El tratamientonumerico que se realiza en el calculo de integrales esta basado en la mismadefinicion de integral. Por consiguiente utilizando la definicion, se tiene que∀ǫ > 0, existe S ⊂ [a, b] y ξi ∈ [xi−1, xi] tal que

∣∣∣∣∣n∑

i=1

f(ξi)(xi − xi−1)−∫ b

a

f(x)dx

∣∣∣∣∣ < ǫ,

de donde el enfoque numerico consiste en aproximar la integral utilizando,sumas finitas de Riemann. Por otro lado, una de las tareas del AnalisisNumerico en lo que respecta el calculo de integrales, esta dada en la cons-truccion de formulas de cuadratura con un costo razonable en operaciones,y una precision aceptable en la determinacion de la integral.

Page 258: 2374131 Una Introduccion Al Analisis Numerico

246 VI Integracion Numerica

A continuacion, se mostrara las formulas de cuadratura o de integracionmas rudimentarias.

a) Regla del Punto Medio

Consiste en utilizar la suma de Riemann con ξi =xi−1 + xi

2 , porconsiguiente

n∑

i=1

f

(xi−1 + xi

2

)(xi − xi−1) ≈

∫ b

a

f(x)dx.

La regla del punto medio, da resultados exactos cuando f es unpolinomio de grado menor o igual a 1. Ver figura VI.1.1.

x0 x1 x2 x3 xn-1 xnFigura VI.1.1. Regla del Punto Medio.

b) Regla del Trapecio

Consiste en aproximar f(ξi)(xi−1 − xi) con el area de un trapecio dealturas f(xi−1) y f(xi). Por consiguiente

n∑

i=1

f(xi−1) + f(xi)

2(xi − xi−1) ≈

∫ b

a

f(x)dx,

de donde, esta suma puede expresarse de manera mas simple, como

∫ b

a

f(x)dx ≈ f(x0)x1 − x0

2+ f(x1)

x2 − x0

2+ · · ·

· · ·+ f(xn−1)xn − xn−2

2+ f(xn)

xn − xn−1

2.

Page 259: 2374131 Una Introduccion Al Analisis Numerico

VI.1 Bases Teoricas 247

x0 x1 x2 x3 xn-1 xnFigura VI.1.2. Regla del Trapecio.

Esta formula es exacta para polinomios de grado igual o inferior a 1.Ver figura VI.1.2.

c) Regla de Simpson

Consiste en aproximar f(ξi)(xi−1−xi), con el area de la superficie cuyolado superior, ver figura VI.1.3, esta dada por la parabola que pasa por

los puntos (xi−1, f(xi−1), (xi−1 + xi

2 , f(xi−1 + xi

2 )) y (xi, f(xi)). Parasimplificar los calculos se toma para x0, y x1, obteniendo como polinomiode interpolacion

p(x) = f(x0) + 2f(x0) + f((x0 + x1)/2)

x1 − x0(x− x0)

+2f(x0)− 2f((x0 + x1)/2) + f(x1)

(x1 − x0)2 (x− (x0 + x1)/2)(x− x1).

Ahora bien, integrando este polinomio de segundo grado entre x0 y x1,se obtiene

∫ x1

x0

f(x)dx ≈(

1

6f(x0) +

4

6f

(x0 + x1

2

)+

1

6f(x1)

)h1,

para finalmente tener

∫ b

a

f(x)dx ≈n∑

i=1

(1

6f(xi−1) +

4

6f

(xi−1 +

hi

2

)+

1

6f(xi)

)hi.

La formula de Simpson es exacta para polinomios de grado igual o

Page 260: 2374131 Una Introduccion Al Analisis Numerico

248 VI Integracion Numerica

inferior a 3.

x0 x1Figura VI.1.3. Regla de Simpson.

d) Regla de NewtonConsiste en aproximar f(ξi)(xi−1−xi), con el area de la superficie cuyolado superior, ver figura VI.1.4, esta dada por la parabola cubica que

pasa por los puntos (xi−1, f(xi−1), (2xi−1 + xi

3 , f(2xi−1 + xi

3 )),

(xi−1 + 2xi

3 , f(xi−1 + 2xi

3 )) y (xi, f(xi)). De la misma manera que en laregla de Simpson, se calcula esta parabola cubica utilizando por ejemplola formula de Newton para determinar polinomios de interpolacion,luego se integra para obtener

∫ x1

x0

f(x)dx≈[1

8f(x0)+

3

8f

(x0 +

h1

3

)+

3

8f

(x0 +

2h1

3

)+

1

8f(x1)

]h1.

La regla de Newton es exacta para polinomios de grado menor o iguala 3.

x0 x1Figura VI.1.4. Regla de Newton.

Formulas de Cuadratura

Page 261: 2374131 Una Introduccion Al Analisis Numerico

VI.1 Bases Teoricas 249

En los cuatro ejemplos precedentes de la anterior subseccion, puede obser-varse claramente que las reglas de integracion formuladas tienen la mismaestructura, la cual define tacitamente una formula de cuadratura. La mayorparte de los metodos numericos estan basados en este principio.

Se desea integrar la funcion f : [a, b] → R, donde f es Riemannintegrable. Para tal efecto se considera una subdivision

S = a = x0 < x1 < · < xn = b .

La integral puede ser aproximada mediante la formula de cuadratura si-guiente

n∑

j=1

(s∑

i=1

bif(xj−1 + cihj)

), (VI.1.1)

los ci se llaman nudos de la formula de cuadratura y los bi son los coeficientesde la formula de cuadratura.

Para la regla del Trapecio, se tiene s = 2, b1 = b2 = 1/2 y c1 = 0, c2 = 1.Ası mismo, para la regla de Simpson se tiene s = 3, b1 = b3 = |1/6, b = 4/6y c1 = 0, c2 = 1/2, c3 = 1.

Dada una formula de cuadratura, uno de los objetivos principales esmedir la precision de esta. Por razones de simplicidad, es preferible estudiarla formula de cuadratura en una funcion f : [0, 1]→ R y considerar h1 = 1, esdecir integrar numericamente con un paso de integracion. Por consiguiente,se analizara el problema

s∑

i=0

bif(ci) ≈∫ 1

0

f(x)dx.

El Orden de una Formula de Cuadratura

Definicion VI.1.8.- Una formula de cuadratura tiene orden p, si y sola-mente si, p es el entero mas grande, tal que

s∑

i=0

bif(ci) =

∫ 1

0

f(x)dx, (VI.1.2)

donde f es un polinomio de grado ≤ p− 1.

Proposicion VI.1.9.- Una formula de cuadratura es de orden p, si ysolamente si

s∑

i=0

bicq−1i =

1

q, q = 1, . . . , p. (VI.1.3)

Page 262: 2374131 Una Introduccion Al Analisis Numerico

250 VI Integracion Numerica

Demostracion. La integracion es una operacion lineal, por lo tanto essuficiente mostrar que (VI.1.2) se cumple para f(x) = xq−1, donde q =1, . . . , p− 1. Ahora bien,

∫ 1

0

xp−1dx =1

q.

Por simple verificacion, puede comprobarse que la formula de cuadraturade la regla del Trapecio es p = 2, la de la regla de Simpson es p = 4.

Definicion VI.1.10.- Una formula de cuadratura se dice simetrica, si:

ci = 1− cs+1−i,

bi = bs+1−i,i = 1, . . . , s. (IV.1.3)

Teorema VI.1.11.- Una formula de cuadratura simetrica tiene un ordenpar.

Demostracion.- Supongase que la formula de cuadratura sea exacta paraf(x) polinomio de grado ≤ 2k. Por consiguiente se debe demostrar que laformula de cuadratura es exacta para los polinomios de grado igual a 2k +1.Sea f(x) un polinomio de grado igual a 2k + 1. Ahora bien, f(x) puedeexpresarse de la siguiente manera

f(x) = c

(x− 1

2

)2k+1

+ g(x),

donde g(x) es un polinomio de grado a lo mas 2k. Por otro lado

∫ 1

0

c

(x− 1

2

)2k+1

dx = 0.

Por consiguiente, es suficiente mostrar que

s∑

i=1

bi

(ci −

1

2

)2k+1

= 0,

esto es cierto debido a la simetrıa de la formula de cuadratura.

Estimacion del Error

Dada una funcion f : [a, b] → R, se quiere tener una estimacion del errorcometido por la utilizacion de una formula de cuadratura. Sea c1, . . . , cs y

Page 263: 2374131 Una Introduccion Al Analisis Numerico

VI.1 Bases Teoricas 251

b1, . . . , bs los coeficientes y los nudos respectivamente, de una formula decuadratura dada. Por consiguiente, se tiene

∫ b

a

f(x)dx =

n∑

j=1

hj

s∑

i=1

bif(xj + cihj) =

n∑

j=1

h

[∫ xj

xj−1

f(x)dx− hj

s∑

i=1

bif(xj + cihj)

].

Para poder determinar el error, es decir la diferencia entre la integral y laformula de cuadratura que aproxima la integral, se define

E(f) =

∫ x0+h

x0

f(x)dx− hs∑

i=1

bif(x0 + cih). (VI.1.4)

Habiendo definido E(f), se puede determinar su valor, el cual esta dado enel siguiente:

Teorema VI.1.12.- Sea f ∈ Ck[a, b], es decir f k veces continuamentederivable. Entonces, se tiene

E(f) =

k−1∑

j=0

hj+1

j!

[1

j + 1−

s∑

i=1

bicji

]+ hk+1

∫ 1

0

Pk(t)f (k)(x0 + th)dt

(VI.1.5)donde

Pk(t) = E

((x− t)k−1

+

(k − 1)!

), αk−1

+ =

αk−1 α ≥ 0

0 α < 0.

Demostracion.- Se tiene, efectuando un cambio de variable en la integral,que

E(f) = h

∫ 1

0

f(x0 + th)dt− h

s∑

i=1

bif(x0 + cih),

por otro lado, el desarrollo en serie de Taylor de f(x0 + τh) con resto enforma de integral esta dado por

f(x0 + h) =k−1∑

j=0

hj

j!f (j)(x0) + hk

∫ 1

0

(1− τ )k−1

(k − 1)!f (k)(x0 + τh)dτ,

por lo tanto

f(x0 + th) =

k−1∑

j=0

hj

j!f (j)(x0)t

j + hk

∫ t

0

(t− τ )k−1

(k − 1)!f (k)(x0 + τh)dτ,

Page 264: 2374131 Una Introduccion Al Analisis Numerico

252 VI Integracion Numerica

introduciendo esta serie en E(f), se obtiene

E(f) =

k−1∑

j=0

hj+1

j!f (j)(x0)

[ ∫ 1

0

tjdt

︸ ︷︷ ︸1

j+1

−s∑

i=1

bicji

]

+ hk+1

[∫ 1

0

∫ t

0

(t− τ )k+1+

(k − 1)!f (k)(x0 + τh)dτdt

−s∑

i=1

bi

∫ ci

0

(ci − τ )k−1+

(k − 1)!f (k)(x0 + τh)dτ

]

remplazando en el lımite de integracion t por 1, se tiene que el ultimo terminodel lado derecho de la anterior relacion, esta dado por

hk+1

∫ 1

0

[∫ 1

0

(t− τ )k+1+

(k − 1)!dt−

s∑

i=1

bi(ci − τ )k−1

+

(k − 1)!

]f (k)(x0 + τh)dτ.

La funcion Pk(t) definida en el teorema, es conocida por el nombre deNucleo de Peano de la formula de cuadratura c1, . . . , cs; b1, . . . , bs.

Teorema VI.1.13.- El nucleo de Peano de una formula de cuadratura dada,tiene las siguientes propiedades:

Pk(τ ) =(1− τ )k

k!−

s∑

i=1

(ci − τ )k−1+

(k − 1)!a);

P ′k(τ ) = −Pk−1(τ ), para k ≥ 2;b)

Pk(1) = 0, para k ≥ 2, si ci ≤ 1;c)

Pk(0) = 0, para 2 ≤ k ≤ p, si ci ≥ 0 y p orden de la f.q.;d)

e) Si la formula de cuadratura es 0 ≤ c1 < . . . < cs ≤ 1 y

s∑

i=1

bi = 1,

entonces P1(τ ) es lineal por trozos, con las siguientes propiedades: P1(0) = 0,P1|(ci−1,ci)(x) = −x + di, donde di es una constante, ademas P1(ci+) −P1(ci−) = bi, ver figura VI.1.4.

0 1c c c1 2 s

Figura VI.1.5. Grafica de P1(τ )

Page 265: 2374131 Una Introduccion Al Analisis Numerico

VI.1 Bases Teoricas 253

Demostracion.- Para el punto a), se tiene que

Pk(τ ) =

∫ 1

0

(x− τ )k−1+

(k − 1)!dx−

s∑

i=1

bi(x− τ )k−1

+

(k − 1)!

=

∫ 1

τ

(x− τ )k−1

(k − 1)!dx−

s∑

i=1

bi(x− τ )k−1

+

(k − 1)!

=(1− τ )k

k!−

s∑

i=1

bi(x− τ )k−1

+

(k − 1)!.

El punto b), se obtiene del punto a), derivando para k ≥ 2. El punto c) esverificacion inmediata, remplazando en τ = 1, siempre que los ci ≤ 1.

La demostracion del punto d) se basa en que la formula de cuadratura,es exacta para los polinomios de grado inferior a p y

Pk(0) =1

k!−

s∑

i=1

bick−1i

(k − 1)!

=1

(k − 1)!

[1

k−

s∑

i=1

bick−1i

].

El punto e) es una verificacion sencilla que se deja al lector.

EjemploLa regla de Simpson es una formula de cuadratura, dada por

c1 = 0, c2 = 1/2, c3 = 1;b1 = 1, /6 b2 = 4, /6 b3 = 1/6.

Utilizando las propiedades dadas en el teorema precedente, se tiene:

P1(τ ) =

1

6− τ, 0 ≤ τ ≤ 1

2;

(1− τ )− 1

6,

1

2≤ τ ≤ 1.

P2(τ ) se obtiene integrando P1(τ ) por el punto b) del teorema prece-dente. Por consiguiente

P2(τ ) =

− τ

6+

τ2

2, 0 ≤ τ ≤ 1

2;

(1− τ )2

2− (1− τ )

6,

1

2< τ ≤ 1.

Page 266: 2374131 Una Introduccion Al Analisis Numerico

254 VI Integracion Numerica

De la misma manera, se obtiene P3(τ ) de P2(τ ), dando como resultado:

P3(τ ) =

τ2

12− τ3

6, 0 ≤ τ ≤ 1

2;

− (1− τ )3

6− (1− τ )2

12,

1

2< τ ≤ 1;

P4(τ ) =

− τ3

36+

τ4

24, 0 ≤ τ ≤ 1

2;

(1− τ )4

24− (1− τ )3

36,

1

2< τ ≤ 1.

Ver los graficos en la figura IV.1.6.

Consecuencia inmediata del teorema VI.1.12, se tiene el siguiente:

Teorema VI.1.14.- Sean, f ∈ Ck[a, b], c1, . . . , cs; b1, . . . , bs una formula decuadratura cuyo orden p ≥ k, entonces

|E(f)| ≤ hk+1

∫ 1

0

|Pk(τ )| dτ maxx∈[x0,x0+h]

∣∣∣f (k)(x)∣∣∣ . (VI.1.6)

.0 .5 1.0

−.6

−.4

−.2

.0

.2

.4

.6

P1

.0 .5 1.0

−.1

.0

.1 P2

.0 .5 1.0

−.01

.00

.01P3

.0 .5 1.0

−.004

−.003

−.002

−.001

.000

.001

.002

.003

.004 P4

Page 267: 2374131 Una Introduccion Al Analisis Numerico

VI.1 Bases Teoricas 255

Figura VI.1.6. Nucleos de Peano, para la formula de Simpson.

Para el ejemplo precedente, se tiene que la formula de Simpson es unaformula de cuadratura de orden 4, por consiguiente

∫ 1

0

|P4(τ )|dτ = −2

∫ 1/2

0

P4(τ )dτ =1

2880,

de donde, si f es cuatro veces continuamente derivable, se tiene que el errorverifica

|E(f)| ≤ h5

2880max

x∈[x0,x0+h]

∣∣∣f (4)(x)∣∣∣ .

Teorema VI.1.15.- Si f ∈ Ck[a, b], k ≤ p , donde p es el orden de la formulade cuadratura, entonces

∣∣∣∣∣∣

∫ b

a

f(x)dx−n∑

j=1

hj

s∑

i=1

bif(xj−1 + cihj)

∣∣∣∣∣∣

≤ hk(b− a)

∫ 1

0

|Pk(τ )|dτ maxx∈[a,b]

∣∣∣f (k)(x)∣∣∣ , (VI.6.7)

donde h = max hi.

Demostracion.- Se tiene

∫ b

a

f(x)dx−n∑

j=1

hj

[s∑

i=1

bif(xj−1 + cihj)

]=

=

n∑

j=1

[∫ xj

xj−1

f(x)dx− hj

s∑

i=1

bif(xj−1 + cihj)

]

≤ hk+1j

∫ 1

0

|Pk(τ )|dτ maxx∈[a,b]

∣∣∣f (k)(x)∣∣∣ ,

por otro lado, se tiene

n∑

i=1

hk+1j =

n∑

i=1

hjhkj ≤ (b− a)hk.

Page 268: 2374131 Una Introduccion Al Analisis Numerico

256 VI Integracion Numerica

Por lo tanto, la Regla de Simpson da la siguiente estimacion para el errorglobal

|error| ≤ h4(b− a)

2880max

x∈[a,b]

∣∣∣f (4)(x)∣∣∣ .

Los teoremas VI.1.13 a VI.1.15 dan estimaciones teoricas del errorcometido, cuando se utiliza una formula de cuadratura. Sin embargo, es im-portante comprobar estas estimaciones teoricas con experimentos numericos.Suponiendo que la subdivision del intervalo [a, b] es uniforme, de la formula(VI.1.7), suponiendo f suficientemente derivable, se deduce,

∫ b

a

f(x)dx =n∑

j=1

hs∑

i=1

bif(xj−1 + cih) + Chp +O(hp+1), (VI.1.8)

donde C depende solamente de a, b y f(x). Por consiguiente, el error satisface

Error ≈ Chp. (VI.1.9)

Introduciendo logaritmos, se tiene

log10(Error) = log10 C + p log h,

denotando fe, la cantidad de evaluaciones de la funcion f(x), en el procesode integracion numerica, se tiene

fe =C ′

h,

donde C ′ es una constante, Por lo tanto, se obtiene

− log10(Error) = C + p log10 fe. (VI.1.10)

De esta ultima relacion, se deduce que − log10(Error) y log10 fe tienenuna relacion lineal de pendiente p, donde p es el orden de la formula decuadratura. En la figura VI.1.7, se comprueba este hecho, utilizando comointegral test

∫ 1

0

cos(πex)exdx =1

πsin(πe).

Page 269: 2374131 Una Introduccion Al Analisis Numerico

VI.1 Bases Teoricas 257

100 10−1 10−2 10−3 10−4 10−5 10−6 10−7 10−8 10−9 10−10100

101

102

103

104

105

106

fefe

err globerr glob

Metodo de Euler

Metodo de Runge

Metodo de Heun

Metodo de Kutta

Metodo 3/8Figura VI.1.7. Grafica del Error vs fe.

Ejercicios

1.- Calcular el orden de la regla de Newton:

(ci) = (0,1

3,2

3, 1), (bi) = (

1

8,3

8,3

8,1

8).

2.- Sean 0 ≤ c1 < c2 < · · · < cs ≤ 1 dados. Mostrar que existe una formulade cuadratura unica con nudos ci y con un orden ≥ s.

Page 270: 2374131 Una Introduccion Al Analisis Numerico

258 VI Integracion Numerica

3.- Mostrar que si la formula de cuadratura satisface

ci = 1− cs+1−i,

y si es de orden ≥ s, entonces se tiene tambien

bi = bs+1−i.

4.- ¿Como se debe elegir c1, c2? para que la formula de cuadratura

b1f(c1) + b2f(c2)

tenga un orden maximal. ¿Cual es el orden?, ¿La formula de cuadraturaes simetrica?

5.- Calcular

∫ 2

1

dx

x= ln 2 mediante la regla del trapecio, la regla de Simpson

y la regla de Newton. ¿Cual formula es la mejor? Hacer un graficologarıtmico para el numero de evaluaciones de la funcion f respectoal error.

6.- Lo mismo que el ejercicio 5, pero para∫ 2π

0

exp(sin x)dx.

7.- Calcular π utilizando

π = 4

∫ 1

0

dx

1 + x2 y π = 4

∫ 1

0

√1− x2dx.

¿Por que el segundo resultado es menos bueno?

8.- Mostrar que el resultado obtenido por la regla del trapecio, o por la reglade Simpson, es una suma de Riemann.

9.- Sean h = (b− a)/n, xi = a + ih y

T (h) = h

[1

2f(x0) + f(x1) + · · ·+ f(xn−1) +

1

2f(xn)

].

Demostrar que para f suficientemente derivable∫ b

a

f(x)dx− T (h) = −h2

12(f ′(b)− f ′(a)) +O(h3).

10.- Calcular los nucleos de Peano para la formula del ejercicio 4 y hacer susgraficas.

11.- Calcular la expresion (∫ b

af(x)dx− T (h)

)

h2 ,

para f(x) = 1/x, a = 1, b = 10; con varios valores de h. Verificar laformula del ejercicio 9.

Page 271: 2374131 Una Introduccion Al Analisis Numerico

VI.2 Cuadraturas de Orden Elevado

En esta seccion, se daran las herramientas teoricas, para construir formulasde cuadratura de orden elevado. El interes que se tiene para utilizar formulasde cuadratura del mayor orden posible, reside sustancialmente en el hechode aumentar la precision en el calculo de integrales definidas, como tambiende disminuir el numero de evaluaciones de la funcion a integrar, ver la figuraVI.1.7.

Mediante el ejercicio 2, de la seccion precedente, se demuestra que sic1, . . . , cs dados, existe una unica formula de cuadratura que es de orden≥ s, es decir

s∑

i=1

bicq−1i =

1

q, (VI.2.1)

para q = 1, . . . , s.Sea m un entero no negativo, la formula de cuadratura c1, . . . , cs;

b1, . . . , bs; es de orden ≤ s + m, si y solamente si, la formula de cuadraturaes exacta para polinomios de grado ≤ s + m − 1. Ahora bien, se define elpolinomio M(x) de grado s, por

M(x) = (x− c1)(x− c2) · · · (x− cs), (VI.2.2)

donde los ci son los nudos de la formula de cuadratura estudiada. Sea f(x)un polinomio de grado ≤ s + m− 1, por la division con resto se tiene que

f(x) = q(x)M(x) + r(x),

donde q(x) y r(x) son polinomios con deg q ≤ m − 1 y deg r ≤ s − 1. Porconsiguiente

∫ 1

0

f(x)dx =

∫ 1

0

q(x)M(x)dx +

∫ 1

0

r(x)dx.

Utilizando la formula de cuadratura en la anterior expresion, se obtiene

s∑

i=1

bif(ci) =s∑

i=1

biq(ci)M(ci)

︸ ︷︷ ︸= 0

+s∑

i=1

bir(ci),

suponiendo que el orden de la formula de cuadratura sea ≥ s, se acaba dedemostrar el:

Page 272: 2374131 Una Introduccion Al Analisis Numerico

VI.2 Cuadraturas de Orden Elevado 259

Teorema VI.2.1.- Sea (bi, ci), i = 1, . . . , s; una formula de cuadratura conorden ≥ s. Entonces

el orden de la formula decuadratura es ≥ s + m

⇐⇒

∫ 1

0

q(x)M(x)dx = 0,

para todo polinomio q(x)con deg q ≤ m− 1.

Ejemplo

El ejercicio 4 de la seccion precedente demanda la construccion de unaformula de cuadratura del orden mas elevado posible. En consecuencia,se define

M(x) = (x− c1)(x− c2).

Se tiene que la formula de cuadratura es de orden ≥ 3 si y solamente si

∫ 1

0

M(x)dx = 0,

1

3− 1

2(c1 + c2) + c1c2 = 0,

la formula de cuadratura es de orden mas grande o igual a 4, si ademas

∫ 0

1

xM(x)dx = 0,

1

4− 1

3(c1 + c2) +

1

2c1c2 = 0,

obteniendo ası un sistema de dos ecuaciones y dos incognitas. Una vezdeterminados los ci, el siguiente paso es determinar los bi.

Polinomios Ortogonales

Uno de los mayores inconvenientes en la construccion de formulas decuadratura de orden elevado utilizando el teorema VI.2.1, consiste en el hechosiguiente: se deben resolver sistemas de ecuaciones no lineales para determi-nar los nudos de la formula de cuadratura. Esta claro que para formulas decuadratura con una cantidad no muy grande de nudos esto es posible, sinembargo para s ya mas grande esto presenta una desventaja. En esta sub-seccion se estudiaran polinomios ortogonales, cuyas raices son precisamentelos nudos.

Page 273: 2374131 Una Introduccion Al Analisis Numerico

260 VI Integracion Numerica

Se iniciara esta subseccion, definiendo un conjunto de funciones particu-lares. Sea ω : (a, b)→ R una funcion, llamada funcion de peso. Sea

E =

f : (a, b)→ R|

∫ b

a

ω(x) |f(x)|2 dx <∞

. (VI.2.3)

Puede mostrarse que E es un espacio vectorial para la adicion de funciones yla multiplicacion por escalares reales. Para las aplicaciones en general, puedesuponerse que f es una funcion continua.

Suponiendo que ω(x) > 0, puede definirse un producto escalar sobre E ,de la siguiente manera,

〈f, g〉 =

∫ b

a

ω(x)f(x)g(x)dx. (VI.2.4)

Hay que remarcar dos hechos importantes; el primero E es en realidadun conjunto de clases de equivalencia de funciones, donde la relacion deequivalencia esta definida por

f ∼ g ⇐⇒ f(x) 6= g(x) en un conjunto de medida nula.

La segunda observacion es consecuencia de la primera, se puede suponerpor lo tanto que E esta constituida por funciones continuas, a lo sumo porfunciones continuas por trozos, y con ciertas condiciones impuestas a ω(x)puede demostrarse que

〈f, f〉 = 0 ⇐⇒ f = 0.

Definicion VI.2.2.- f es ortogonal a g, que se denota por f ⊥ g, si

〈f, g〉 = 0. (VI.2.5)

El objetivo central sera, por consiguiente, encontrar M(x) ⊥ q(x) sideg q ≤ m− 1.

Teorema VI.2.3.- Sea ω(x) dado, entonces existe una sucesion de poli-nomios p0(x), p1(x), p2(x), . . ., tal que:

deg pj = j;

〈pk, q〉 = 0, ∀q polinomio de grado ≤ k − 1.

Si se supone que pk(x) = xk + r(x) con deg r(x) ≤ k− 1, los polinomios sonunicos.

Page 274: 2374131 Una Introduccion Al Analisis Numerico

VI.2 Cuadraturas de Orden Elevado 261

Los polinomios satisfacen la siguiente relacion recursiva:

p−1(x) := 0, p0(x) = 1, (VI.2.6a)

pk+1 = (x− δk+1)pk(x)− γ2k+1pk−1(x), (VI.2.6b)

donde

δk+1 =〈xpk, pk〉〈pk, pk〉

, γ2k+1 =

〈pk, pk〉〈pk−1, pk−1〉

. (VI.2.6c)

Demostracion.- El primer punto del teorema, se obtiene a partir delproceso de ortogonalizacion de Gramm-Schmidt. Las relaciones entre los dife-rentes polinomios ortogonales se demuestra por induccion. Por consiguiente,se supone cierto para los polinomios p0, p1, . . . , pk. Ahora bien, se tiene

pk+1(x) = xpk(x) +

k∑

j=0

cjpj(x),

por que el coeficiente dominante de pk es 1. Aplicando el producto escalarse tiene

0 = 〈pk+1, pk〉

= 〈xpk, pk〉+k∑

j=0

cj〈pj , pk〉

= 〈xpk, pk〉+ ck〈pk, pk〉,de donde

ck = −〈xpk, pk〉〈pk, pk〉

.

Por otro lado, aplicando nuevamente el producto escalar se tiene

0 = 〈pk+1, pk−1〉

= 〈xpk, pk−1〉+k∑

j=0

cj〈pj , pk−1〉

= 〈xpk, pk−1〉+ ck−1〈pk−1, pk−1〉

Ahora bien, se verifica facilmente, utilizando la definicion del productoescalar definido en E , que

〈xpk, pk−1〉 = 〈pk, xpk−1〉,

Page 275: 2374131 Una Introduccion Al Analisis Numerico

262 VI Integracion Numerica

con la hipotesis de induccion, se verifica inmediatamente que

〈pk, xpk−1〉 = 〈pk, pk〉,de donde

ck−1 =〈pk, pk〉

〈pk−1, pk−1〉.

Los restantes cj , son nulos, utilizando la hipotesis de induccion sobre laortogonalidad.

Consecuencia de este teorema, es que si los nudos de una formula decuadratura son las raices del polinomio ps, definido en el teorema precedente,se tiene M(x) = ps(x) y por el teorema VI.2.1 el orden de la formula decuadratura es igual o mayor a 2s.

Teorema VI.2.4.- Sean los pk, como en el teorema VI.2.3, entonces lasraices de pk(x) son reales, simples y estan localizadas en el intervalo (a, b).

Demostracion.- Se donota por τ1, . . . , τT las raices distintas de pk dondela funcion pk(x) cambia de signo. Se define el polinomio g(x) por

g(x) = (x− τ1) · · · (x− τT ),

por consiguiente, se tiene que

g(x)pk(x)

no cambia de signo, de donde

〈g(x), pk(x)〉 6= 0,

por lo tanto deg g ≥ k, y por la hipotesis inicial se tiene necesariamente queT = k.

En la tabla VI.2.1, se tienen los diferentes tipos de polinomios ortonor-males para diferentes tipos de funcion de peso ω(x).

Tabla VI.2.1. Ejemplos de Polinomios Ortonormales

ω(x) (a, b) Notacion Nombre

1 (−1, 1) Pk(x) Polinomios de Legendre

1√1− x2

(−1, 1) Tk(x) Polinomios de Chebichef

(1− x)α(1 + x)β (−1, 1) P(α,β)k (x) Jacobi, α, β > −1

xαe−x (0,∞) L(α)k (x) Pol. de Laguerre, α>−1

e−x2

(−∞,∞) Hk(x) Polinomios de Hermite

Page 276: 2374131 Una Introduccion Al Analisis Numerico

VI.2 Cuadraturas de Orden Elevado 263

Teorema VI.2.5.- Formula de Rodriguez. Sea ω(x) una funcion de pesodefinida como antes. Entonces

pk(x) = Ck1

ω(x)

dk

dxk

ω(x)(x− a)k(b− x)k

. (VI.2.7)

Demostracion.- Una verificacion simple sobre pk(x), muestra que se tratanefectivamente de polinomios. Para la relacion de ortogonalidad con k dado,es suficiente mostrar que si q(x) es un polinomio de grado ≤ k − 1 entoncesq ⊥ pk. En efecto

∫ b

a

ω(x)pk(x)q(x)dx =

∫ b

a

dk

dxk

ω(x)(x− a)k(b− x)k

q(x)dx

=dk−1

dxk−1

ω(x)x− a)k(b− x)k

q(x)

∣∣∣∣b

a︸ ︷︷ ︸= 0

−∫ b

a

dk−1

dxk−1

ω(x)x− a)k(b− x)k

q′(x)dx

...

= ±∫ b

a

ω(x)x− a)k(b− x)k

q(k)dx

= 0.

La mayor parte de los calculos de integrales definidas, tienen como funcion depeso ω(x) = 1. A continuacion se estudiara con mayor detalle los polinomiosde Legendre.

Los Polinomios de Legendre

Los polinomios de Legendre son los polinomios ortogonales para la funcionde peso ω(x) = 1 definida en el intervalo (−1, 1), ver la tabla VI.2.1. Por otrolado, utilizando la formula de Rodriguez se puede elegir los Ck de maneraque Pk(1) = 1. Por consiguiente, se tiene

1 = Pk(1) = Ckdk

dxk

(1− x)k(1 + x)k

∣∣∣∣x=1

= Ck(−2)kk!,

de donde

Ck =(−1)k

2kk!,

Page 277: 2374131 Una Introduccion Al Analisis Numerico

264 VI Integracion Numerica

por lo tanto

Pk(x) =(−1)k

2kk!

dk

dxk

((1− x2)k

). (VI.2.8)

Los polinomios de Legendre pueden ser calculados mediante la formulade Rodriguez, o mediante una relacion recursiva, ver ejercicio 1. En la tablaVI.2.2, se da los cuatro primeros polinomios de Legendre.

Tabla VI.2.2. Polinomios de Legengre

k Pk(x)

0 1

1 x

23

2x2 − 1

2

35

2x3 − 3

2x

Puede observarse que si k es par, entonces Pk(x) = Q(x2) donde Q es unpolinomio; de la misma manera si k es impar, se tiene que Pk(x) = xQ(x2).

Las Formulas de Cuadratura de Gauss

La verificacion del orden de una formula de cuadratura, se la realiza en elintervalo [0, 1]. Efectuando una transformacion afın, se tiene que M(x) delteorema VI.2.1, es igual a

M(x) = (x− c1) · · · (x− cs) = Ps(2x− 1) (VI.2.9)

con Ps el s-simo polinomio de Legendre, si se desea que orden de la formulacuadratura sea al menos s. El siguiente teorema, tiene una importancia enlo concerniente al orden de una formula de cuadratura.

Teorema VI.2.6.- El orden de una formula de cuadratura dada por (bi, ci),i = 1, . . . , s; es menor o igual a 2s.

Demostracion.- Por el absurdo. Supongase que existe una formula decuadratura de orden superior o igual a 2s+1, de donde para todo polinomiol(x) de grado s, se tiene ∫ 1

0

l(x)M(x)dx,

Page 278: 2374131 Una Introduccion Al Analisis Numerico

VI.2 Cuadraturas de Orden Elevado 265

sin embargo, tomando l(x) = M(x) se tiene

∫ 1

0

M2(x)dx = 0,

lo que conduce a una contradiccion

El objetivo, sera por consiguiente, encontrar una formula de cuadraturade orden maximo, es decir 2s. Por la observacion hecha al inicio de estaultima subseccion, los nudos ci de la formula de cuadratura de orden s sonlas raices de Ps(2x − 1) polinomio de Legendre. Como consecuencia de loanteriormente expuesto se tiene el siguiente teorema formulado por Gaussen 1814.

Teorema VI.2.7.- Una formula de cuadratura (ci, bi), i = 1, . . . , s; es deorden 2s si y solamente si c1, . . . , cs son las raices de Ps(2x − 1), Ps(t)polinomio de Legendre y los bi estan determinados por

s∑

i=1

bicq−1i =

1

q, q = 1, . . . , s. (VI.2.10)

Por otro lado, debe observarse que los coeficientes de una formula decuadratura de Gauss son extrictamente positivos, en efecto, se define

li(x) =

s∏

j=1j 6=i

x− cj

ci − cj

el i-esimo polinomio de Lagrange para la subdivsion c1 < · · · < cs. El gradode este polinomio es igual a s− 1 y verifica

li(cj) =

0, j 6= i;

1, j = i.

Ahora bien, se tiene

bi =s∑

j=1

bj(li(cj))2 =

∫ 1

0

(li(x))2dx > 0,

ya que, deg l2i = 2s− 2 < 2s.El calculo de los coeficientes bi de una formula de cuadratura de Gauss,

pueden ser resueltos mediante el sistema lineal dado por (VI.2.10). Sinembargo este procedimiento no es el mejor, debido a la acumulacion de los

Page 279: 2374131 Una Introduccion Al Analisis Numerico

266 VI Integracion Numerica

errores de redondeo. Existe un procedimiento que determina los bi de unamanera sencilla, el esta dado en el:

Teorema VI.2.8.- Para la formula de cuadratura de Gauss de orden 2s, setiene

bi =1

(1− x2i )P

′s(xi)

2 , i = 1, . . . , s; (VI.2.11)

donde xi = 2ci − 1.

Demostracion.- Se tiene,

bi =s∑

j=1

bj li(cj) =

∫ 1

0

li(t)dt,

realizando la transformacion x = 2t− 1, se obtiene

bi =1

2

∫ 1

−1

li

(x + 1

2

)dx,

por otro lado, se tiene

li

(x + 1

2

)= C

Ps(x)

x− xi,

de donde pasando al lımite, se obtiene

limx→xi

CPs(x)

x− xi= CP ′

s(xi) = 1,

despejando C, bi esta dado por

bi =1

2

∫ 1

−1

Ps(x)

(x− xi)P′s(xi)

dx. (VI.2.12)

Ademas,

bi =

s∑

j=1

bj li(cj) =1

2

∫ 1

−1

(Ps(x)

(x− xi)P′s(xi)

)2

dx, (VI.2.13)

esta integral se la resulve por partes, obteniendo ası

bi =1

2(P ′s(xi))

2

∫ 1

−1

(Ps(x))21

(x− xi)2 dx

Page 280: 2374131 Una Introduccion Al Analisis Numerico

VI.2 Cuadraturas de Orden Elevado 267

=1

2(P ′s(xi))

2

[ −1

1− xi+

1

−1− xi

]+

∫ 1

−1

P ′s(x)

P ′s(xi)

(Ps(x)

(x− xi)P′s(xi)

)

︸ ︷︷ ︸= li

(x + 1

2

)dx

=1

2(P ′s(xi))

2

−1

1− x2i

+s∑

j=1

bjP ′

s(xj)

P ′s(xi)

li

(xj + 1

2

)

=1

2(P ′s(xi))

2

−1

1− x2i

+ 2bi

En el ejercicio 1 de esta seccion, se mostrara que los polinomios deLegendre verifican la siguiente relacion recursiva

(1− x2)P ′s(x) = −sxPs(x) + sPs−1(x),

de donde(1− x2

i )P′s(xi) = sPs−1(xi),

obteniendo

bi =1− x2

i

s2(Ps−1(xi))2 . (VI.2.14)

En la tabla VI.6.3, se dan las primeras formulas de cuadratura de Gauss.

Tabla VI.6.3. Primeras Formulas de Cuadratura de Gauss.

s c1 c2 c3 b1 b2 b3

11

21

21

2−√

3

6

1

2+

√3

6

1

2

1

2

31

2−√

15

10

1

2

1

2+

√15

10

5

18

8

18

5

18

Ejercicios

1.- Para los polinomios de Legendre, demostrar que:

(k + 1)Pk+1(x) = (2k + 1)xPk(x)− kPk−1(x);

(1− x2)P ′k(x) = −kxPk(x) + kPk−1(x).

Page 281: 2374131 Una Introduccion Al Analisis Numerico

268 VI Integracion Numerica

2.- Los polinomios de Chebychef estan definidos por

Tk(x) = cos(k arccosx).

Verificar que:

T0(x) = 1; T1(x) = x;

Tk+1(x) = 2xTk(x)− Tk−1(x);∫ 1

−1

1√1− x2

Tk(x)Tj(x), para i 6= j.

3.- Calcular las raices de P8(x) con un metodo iterativo, como por ejemploel metodo de la biseccion.

4.- Mostrar que el nucleo de Peano Pk(t) de una formula de cuadraturasatisface ∫ 1

0

Pk(t)dt =1

k + 1−

s∑

i=1

bicki .

5.- Sea p el orden de una formula de cuadratura y supongase que el nucleode Peano Pp(t) no cambia de signo sobre [0, 1]. Mostrar que

∫ x0+h

x0

f(x)dx−h

s∑

i=1

bif(x0 +cih) = hp+1

(1

p + 1− h

s∑

i=1

bicpi

)f (p)(ξ),

con ξ ∈ (x0, x0 + h).

Indicacion.- Utilizar el teorema VI.1.15 con k = p.

6.- Mostrar que para las formulas de cuadratura de Gauss de orden 2s, elnucleo de Peano P2s(t) no cambia de signo.

Page 282: 2374131 Una Introduccion Al Analisis Numerico

VI.3 Implementacion Numerica

El calculo numerico de integrales definidas, requiere la implementacion delas formulas de cuadratura en forma de programas o subrutinas. Dada unafuncion f : [a, b]→ R, el calculo de

∫ b

a

f(x)dx, (VI.3.1)

se lo realiza teniendo en cuenta el error que se desea cometer. Generalmentese da una tolerancia que se la denota por TOL, por consiguiente se busca unaaproximacion I, tal que

∣∣∣∣∣

∫ b

a

f(x)dx− I

∣∣∣∣∣ ≤ TOL

∫ b

a

|f(x)| dx. (VI.3.2)

Ahora bien, una manera de conseguir (VI.3.2), es subdividir el intervalo[a, b] en subintervalos y aplicar el teorema VI.1.16 de manera de obtenerun h optimo. Sin embargo este procedimiento presenta dos incovenientes:es necesario conocer de antemano este h optimo; ademas de conocer laspropiedades de la funcion f a integrar. La segunda manera de resolver(VI.3.2) es de concevir un algoritmo, donde el calculo del error se haga demanera automatica es decir utilizando un metodo adaptativo.

Lo primero que se debe tener en la implementacion de un programa quepermita evaluar la integral de una funcion f , es una estimacion del error. Sea(bi, ci) i = 1, . . . , s, una formula de cuadratura y a = x0 < x1 < · · · < xn = b,una subdivision de [a, b]; se define el error en cada subintervalo [xi, xi+1] a

E(f, xi, xi+1) =

∫ xi+1

xi

f(x)dx− (xi+1 − xi)

s∑

j=1

bjf(xi + cj(xi+1 − xi)).

(VI.3.3)Por lo tanto, el programa que va calcular numericamente la integral debetener en cuenta dos aspectos:

1.- Estimacion del error.2.- Eleccion de la subdivision de [a, b], x0 < x1 < · · · < xn; tal que

n∑

j=0

|E(f, xj, xj+1)| ≤ TOL

∫ b

a

|f(x)| dx.

Page 283: 2374131 Una Introduccion Al Analisis Numerico

270 VI Integracion Numerica

Por consiguiente, denotando por:

res[a,b] = I, resabs[a,b] =

∫ b

a

|f(x)| dx, err[a,b] =

∣∣∣∣∣

∫ b

a

f(x)dx− I

∣∣∣∣∣ ,

se tiene el siguiente algoritmo.

Algoritmo

— Calcular: res[a,b], resabs[a,b] y err[a,b].err[a,b] ≤ TOL resabs[a,b]: si es cierto se ha terminado, si no continuarel siguiente paso.

— Plantear c = c =a + b

2y calcular:

res[a,c], err[a,c], resabs[a,c],

res[c,b], err[c,b], resabs[c,b];

(err[a,c] + err[c,b]

)≤ TOL

(resabs[a,c] + resabs[c,b]

): si es cierto se ha

terminado, si no dividir el subintervalo con error maximal y continuarcon el siguiente paso.

— Continuar hasta que

∑err[aj ,cj ] ≤ TOL

(∑resabs[aj ,cj ]

).

Una vez planteado el algoritmo, el principal problema consiste en estimarel error cometido en el calculo de la integral, en cada subintervalo [xi, xi+1].El teorema VI.1.12 da una estimacion cuando la formula de cuadratura tieneun orden p, la cual esta dada por

E(f, x0, x1) = hp+1

∫ 1

0

Pp(t)f(p)(x0 + th)dt,

donde Pp(t) es el k-simo nucleo de Peano, para la formula de cuadratura. Elprincipal inconveniente de utilizar esta estimacion radica en que el calculode la derivada de orden p de f puede ser tan complicado, como encontraruna primitiva de f , y por otro lado, determinar el nucleo de Peano no es unatarea nada simple, motivos por los cuales, la estimacion del teorema VI.1.12no es nada practica desde el punto de vista computacional.

Ahora bien, existen dos metodos numericos que permiten encontrar unaestimacion del error cometido en cada subintervalo, sin necesidad de conocerlas propiedades del nucleo de Peano y de las derivadas de la funcion a

Page 284: 2374131 Una Introduccion Al Analisis Numerico

VI.3 Implementacion Numerica 271

integrar. Por consiguiente sea (ci, bi), una formula de cuadratura dada deorden p, se desea estimar

E(f, x0, x1) =

∫ x1

x0

f(x)dx− (x1 − x0)

s∑

i=1

bi(f(x0 + ci(x1 − x0)).

El primer metodo para estimar E es conocido como QUADPACK, algoritmoimplementado en algunas bibliotecas de programas. La idea central de estemetodo es tomar una segunda formula de cuadratura (ci, bi) con un ordenp > p y estimar E(f, x0, x1), como

E(f, x0, x1)=(x1−x0)

[s∑

i=1

bif(x0 + ci(x1 − x0)−s∑

i=1

bif(x0 + ci(x1 − x0))

],

(VI.3.4)Para evitar demasiadas evaluaciones de la funcion f , es deseable que

c1, . . . , cs ⊂ c1, . . . , cs ,

es decirc1, . . . , cs = c1, . . . , cs ∪ cs+1, . . . , cs+m ,

con s + m = s. Sin embargo m debe ser mas grande que s, si la formula decuadratura (ci, bi) es una de tipo Gauss; en efecto, si m ≤ s, se tiene:

s+m∑

i=1

bicj−1i =

1

j, j = 1, . . . , s + m;

s∑

i=1

bicj−1i =

1

j, j = 1, . . . , 2s;

lo cual conduce a que

bi =

bi, i = 1, . . . , s;

0, i = s + 1, . . . , s + m;

obteniendo ası, la misma formula de cuadratura. Por consiguiente es nece-sario elegir m > s, por ejemplo m = s + 1.

Por otro lado, se pueden elegir los ci restantes de manera que la formulade cuadratura (ci, bi), i = 1, . . . , 2s + 1; tenga un orden igual a 3s + 2.Esta formula de cuadratura lleva el nombre de Konrad, en honor a sudescubridor. El metodo QUADPACK, toma como resultado de la integral alresultado numerico proporcionado por la formula de cuadratura de Konrad,es decir

res = (x1 − x0)2s+1∑

i=1

bif(x0 + ci(x1 − x0)), (VI.3.5)

Page 285: 2374131 Una Introduccion Al Analisis Numerico

272 VI Integracion Numerica

la estimacion del error cometido es de la formula de cuadratura de Gauss yno ası de la de Konrad. No obstante, se puede obtener una estimacion deeste error. En efecto los errores de las formulas de cuadratura estan dadospor:

errGauss = Ch2s+1 + . . . ,

errKonrad = Ch3s+3 + . . . .

Para simplificar los calculos se puede suponer que tanto C, como C soniguales y valen 1, obteniendo ası, cuando h tiende a 0

(h2s+1

)3/2 ≈ h3s+3,

de donde la estimacion del error de la formula de cuadratura multiplicadapor una constante de seguridad esta dada por:

err =

[(x1 − x0)

(2s+1∑

i=1

bif(x0 + cih)−s∑

i=1

bif(x0 + cih)

)]3/2

· 100,

(VI.3.6)finalmente se tiene

resabs = (x1 − x0)

2s+1∑

i=1

bi |f(x0 + ci(x1 − x0))| . (VI.3.7)

El segundo metodo es conocido como GAUINT,GAUSS. Al igual que en elmetodo QUADPACK, se considera una formula de cuadratura de tipo Gauss(ci, bi), i = 1, . . . , s; pero s impar, de manera que uno de los nudos sea iguala 1/2. Luego se considera la formula de cuadratura de orden al menos s− 1obtenida de la formula original, cuyos nudos estan dados por

c1, . . . , cs−1 = c1, . . . , cs \ 1/2 .

Con los mismos argumentos desarrollados para el metodo QUADPACK, peroesta vez tomando el resultado numerico proporcionado por la formula decuadratura de Gauss, se obtiene:

res = (x1 − x0)

s∑

i=1

bif(x0 + cih), (VI.3.8)

err =

[(x1 − x0)

(s∑

i=1

bif(x0 + cih)−s∑

i=1

bif(x0 + cih)

)]2

· 100, (VI.3.9)

resabs = (x1 − x0)s∑

i=1

bi |f(x0 + cih)| . (VI.3.10)

Las experiencias numericas muestran que en la mayorıa de los casos lasestimaciones del error cometido son demasiado pesimistas, ver en la tablaVI.3.1, las experiencias numericas han sido realizadas por el metodo GAUINT.El programa GAUINT, para estas experiencias numericas, utiliza una formulade cuadratura de Gauss de orden 30.

Page 286: 2374131 Una Introduccion Al Analisis Numerico

VI.3 Implementacion Numerica 273

Tabla VI.3.1 Error exacto vs Error estimado.

f(x) [a, b] Error exacto err

1

x4 + x2 + 1[0, 2] 0.23× 10−10 0, 90× 10−10

25e−25x [0, 1] 0, 14× 10−11 0.23× 10−5

√x [0, 1/2] 0, 98× 10−5 0.14× 10−8

Puede observase que la tercera funcion a ser integrada es una excepcion de laregla anteriormente formulada, eso se debe a que

√x no es lo suficientemente

derivable, y el algoritmo ha sido concebido para funciones lo suficientementelisas.

Tratamiento de singularidades

Los metodos desarrollados en la anterior subseccion, tal como se puedeobservar en la tabla precedente, son utilizables para funciones lo suficiente-mente derivables. Por lo tanto, no son muy eficientes para resolver integralesdefinidas de funciones no muy lisas, ademas existen integrales impropias cuyocalculo es frecuente en diversas aplicaciones, como por ejemplo integrales delos tipos: ∫ 1

0

f(x)√x

dx,

∫ 1

0

(log x)f(x)dx.

Ejemplo

Considerese, la funcion

f(x) = − 4x log x

x4 + 100,

se desea calcular∫ 1

0f(x)dx. Esta integral es impropia, no obstante que

una formula de cuadratura de tipo Gauss proporciona resultados quese aproximan al valor exacto de esta integral. Esto se debe a que losnudos de la formula utilizada son diferentes de 0 y que la funcion f(x)es singular en x = 0. Ahora bien, el error exacto al integrar sobre elintervalo [0, 1] es del orden de 0.18× 10−4, el cual esta cerca del 5% del

Page 287: 2374131 Una Introduccion Al Analisis Numerico

274 VI Integracion Numerica

valor exacto, valor muy grande. Un procedimiento para obtener un errorque este en el orden de TOL, es definir la sucesion Sk dada por

Sk =

k∑

j=0

∫ bj

aj

f(x)dx,

donde bj = 2j−k y aj = bj/2, para j > 0. Con este procedimiento,solamente se debe calcular la integral en el intervalo mas pequeno.Para poder comparar los resultados obtenidos con el metodo numerico,el valor exacto de la integral, calculada mediante series, es igual a

∫ 1

0

− 4x log x

x4 + 100dx =

∫ 1

0

1

100

−4x log x

1 + x4/100dx

=1

100

∫ 1

0

(−4x log x)∞∑

k=0

(−1)k x4k

100kdx

=−4

100

∞∑

k=0

(−1)k

100k

∫ 1

0

x4k+1 log xdx

1

100

∞∑

k=0

(−1)k

100k

1

(2k + 1)2,

lo que es igual con 16 cifras de precision a

∫ 1

0

− 4x log x

x4 + 100dx = 9.9889286860336184× 10−03.

Aplicando el procedimiento mencionado mas arriba, se obtiene la tablaVI.3.2.

Tabla VI.3.2. Calculo Integral.

Sk Error Exacto

S0 1.748733098830973E − 07

S1 4.371832748595316E − 08

S2 1.092958187148829E − 08

S3 2.732395467872073E − 09

S4 6.830988674016991E − 10

S5 1.707747172841056E − 10

S6 4.269368018838815E − 11

Sk Error Exacto

S7 1.067342048077790E − 11

S8 2.668355120194476E − 12

S9 6.670896474103571E − 13

S10 1.667728455334582E − 13

S11 4.169407874510255E − 14

S12 1.042395336714463E − 14

S13 2.605554660917164E − 15

Page 288: 2374131 Una Introduccion Al Analisis Numerico

VI.3 Implementacion Numerica 275

Se puede observar inmediatamente, que la convergencia para calcular laintegral es muy lenta, es necesario, efectuar 13 subdivisiones para obtenerun error igual o inferior a 2.61 × 10−15. Cada utilizacion del programaGAUINT requiere 15 evaluaciones de la funcion f , por consiguiente paraobtener el error mencionado, es necesario por lo menos 14 × 15 evalua-ciones de la funcion f .

Para evitar tantas evaluaciones de la funcion f , es necesario construirun algoritmo que permita acelerar la convergencia. Una forma de hacerlo esutilizar procedimientos de extrapolacion al lımite dado en el capıtulo III.3.Ahora bien, el metodo que sera estudiado para acelerar la convergencia enel calculo de estas integrales sera tratado con un procedimiento equivalente,el cual consiste en utilizar diferencias finitas.

A partir de la tabla precedente puede observarse, el siguiente hecho:Denotese por S el valor exacto de la integral, entonces

Sn+1 − S ≈ 1

4(Sn − S),

es decirSn+1 − S ≈ ρ(Sn − S). (VI.3.11)

Supongase, que se conoce tres valores consecutivos de la sucesion Sk, pordecir: Sn, Sn+1 y Sn+1, utilizando la notacion de diferencias finitas dada enel capıtulo III.1, se tiene el siguiente sistema lineal

Sn+1 − S = ρ(Sn − S)

Sn+2 − S = ρ(Sn+1 − S), (VI.3.12)

de donde sustrayendo ambas ecuaciones, se obtiene

∆Sn+1 = ρ∆Sn,

por consiguiente

ρ =∆Sn+1

∆Sn. (VI.3.13)

Despejando S de la segunda ecuacion de (VI.3.12), se tiene

S =Sn+1 −1

ρ− 1∆Sn+1

=Sn+1 −∆Sn∆Sn+1

∆Sn+1 −∆Sn,

obteniendo ası

S′n = Sn+1 −

∆Sn∆Sn+1

∆2Sn

. (VI.3.14)

Page 289: 2374131 Una Introduccion Al Analisis Numerico

276 VI Integracion Numerica

El metodo que acaba de ser formulado por (VI.3.14), es conocido por elprocedimiento ∆2 de Aitken. En la tabla VI.3.3, se dan los valores obtenidospor este procedimiento, para el ejemplo precedente.

Tabla VI.3.3. Procedimiento ∆ de Aitken.

S′k Valor integral Error Exacto

S′0 9.988928686033609E − 03 0.35E − 14

S′1 9.988928686033618E − 03 0.26E − 14

S′2 9.988928686033618E − 03 0.26E − 14

Con la finalidad de comparar la eficiencia, del procedimiento ∆2 de Aitken,para obtener un error del orden de 0.26 × 10−14 solo se necesitan 3 evalua-ciones de integrales de f , mientras que, sin el procedimiento de aceleraciones necesario 14 evaluaciones de integral.

El siguiente paso en lograr una convergencia mas rapida en el calculo deintegrales, consiste en generalizar el procedimiento ∆2 de Aitken, para talefecto se supuso que

Sn+1 − S = ρ(Sn − S),

por consiguienteSn − S = Cρn.

Ahora bien, para ser mas precisos se puede suponer que

Sn − S = C1ρ1 + C2ρ2 + · · ·Ckρk, (VI.3.15)

con los ρi diferentes dos a dos, de donde la diferencia µn = Sn − S satisfaceuna ecuacion de diferencias finitas o relacion recursiva de la forma

µn+k + a1µn+k−1 + · · ·+ akµn = 0. (VI.3.16)

La teorıa de ecuaciones de diferencias finitas, tiene como resultado central,que los ρi, i = 1, . . . , k; son raices del polinomio caracterıstico de (VI.3.16)dado por

λk + a1λk−1 + · · ·+ ak. (VI.3.17)

Se tiene un problema inverso, pues no se conocen los valores de los ak, perosi los valores de µn, los cuales pueden servir para determinar los valores delos ak a partir del sistema lineal

Sn − S · · · Sn+k − S...

...Sn+k − S · · · Sn+2k − S

ak...

a1

= 0. (VI.3.18)

Page 290: 2374131 Una Introduccion Al Analisis Numerico

VI.3 Implementacion Numerica 277

Este sistema tiene soluciones no triviales para el sistema lineal homogeneo,por lo tanto el determinante de la matriz es nulo. Efectuando sustraccionessobre las filas de la matriz, se obtiene

det

Sn − S Sn+1 − S · · · Sn+k − S∆Sn ∆Sn+1 · · · ∆Sn+k

......

∆Sn+k−1 · · · · · · ∆Sn−k−1

= 0,

luego, se tiene

∣∣∣∣∣∣∣∣

Sn Sn+1 · · · Sn+k

∆Sn ∆Sn+1 · · · ∆Sn+k

......

∆Sn+k−1 · · · · · · ∆Sn−k−1

∣∣∣∣∣∣∣∣=

= S

∣∣∣∣∣∣∣∣

1 1 · · · 1∆Sn ∆Sn+1 · · · ∆Sn+k

......

∆Sn+k−1 · · · · · · ∆Sn−k−1

∣∣∣∣∣∣∣∣,

efectuando sustracciones sobre la columna de la matriz del lado derecho dela ecuacion, se obtiene finalmente

S =

∣∣∣∣∣∣∣∣

Sn Sn+1 · · · Sn+k

∆Sn ∆Sn+1 · · · ∆Sn+k

......

∆Sn+k−1 · · · · · · ∆Sn−k−1

∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣

∆2Sn · · · ∆2Sn+k−1

......

∆2Sn+k−1 · · · ∆2Sn+k−2

∣∣∣∣∣∣∣

(VI.3.19)

Por ultimo la relacion (VI.3.19), puede mejorarse si al determinante delnumerador se agrega la primera linea a la segunda linea, la segunda linea ala tercera y ası sucesivamente, convirtiendose en

S(k) =

∣∣∣∣∣∣∣∣

Sn Sn+1 · · · Sn+k

Sn+1 Sn+1 · · · Sn+k+1

......

Sn+k · · · · · · Sn−k

∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣

∆2Sn · · · ∆2Sn+k−1

......

∆2Sn+k−1 · · · ∆2Sn+k−2

∣∣∣∣∣∣∣.

(VI.3.20)

Page 291: 2374131 Una Introduccion Al Analisis Numerico

278 VI Integracion Numerica

Este resultado constituye una joya desde el punto de vista teorico, pero es unacatastrofe, si se quiere implementar numericamente, las razones son obvias.Por lo tanto es necesario construir un algoritmo que permita determinarS(k), sin necesidad de calcular explıcitamente los determinantes encontradosen la ultima expresion. El metodo que sera explicado constituye el algoritmoepsilon o mas simplemente ǫ-algoritmo.

Algoritmo Epsilon

El siguiente teorema formulado por Wynn en 1956, permite calcular S(k).

Teorema VI.3.1.- Dados S0, S1, S2, . . . , se define la sucesion ǫ(n)k k =

−1, 0, . . . ; n = 0, 1, . . . , de manera recursiva, como

ǫ(n)−1 = 0,

ǫ(n)0 = Sn,

ǫ(n)k+1 = ǫ

(n+1)k−1 +

1

ǫ(n+1)k − ǫ

(n)k

;

(VI.3.21)

entonces

ǫ(n)2 = S′

n, ǫ(n)4 = S′′

n, ǫ(n)6 = S(3)

n , . . . (VI.3.22)

Demostracion.- Una demostracion completa y una explicacion detalladapuede encontrarse en Brezinski.

La sucesion definida por el teorema precedente permite formular el ǫ-algoritmo en forma de una tablero, ver la figura VI.3.1.

ǫ(0)−1

ǫ(0)0

ǫ(1)−1

ց−−−−−−→ր

ǫ(0)1

ǫ(1)0

ց−−−−−−→ր

ǫ(0)2

ǫ(2)−1

ց−−−−−−→ր

ǫ(1)1

ց−−−−−−→ր

ǫ(0)3

ǫ(2)0

ց−−−−−−→ր

ǫ(1)2

ց−−−−−−→ր

ǫ(0)4

ǫ(3)−1

ց−−−−−−→ր

ǫ(2)1

ց−−−−−−→ր

ǫ(1)3

ց−−−−−−→ր

ǫ(0)5

ǫ(3)0

ց−−−−−−→ր

ǫ(2)2

ց−−−−−−→ր

ǫ(1)4

ց−−−−−−→ր

ǫ(0)6

Figura VI.3.1. Esquema ǫ-algoritmo.

Page 292: 2374131 Una Introduccion Al Analisis Numerico

VI.3 Implementacion Numerica 279

En la figura VI.3.4, podra apreciarse la verdadera potencia del ǫ-algoritmo. La sucesion definida por

Sn = 4

n∑

k=0

(−1)k

2k + 1, (VI.3.23)

converge hacia π, sin embargo la convergencia de esta sucesion es muylenta. Para obtener una precision de 10−35, son necesarias por lo menos 1035

evaluaciones de esta sucesion, lo cual es imposible: por el tiempo de calculoy por el error de redondeo. Aplicando el epsilon-algoritmo, se obtiene la

precision requerida, los errores de ǫ(n)k son dados en la figura VI.3.4.

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1510−20

10−18

10−16

10−14

10−12

10−10

10−8

10−6

10−4

10−2

100

k=0

k=2

k=4

k=6

k=8

k=10

k=24 k=22

Figura VI.3.4. Error de ǫ(n)k en funcion de n.

Otro medio para acelerar la convergencia en el calculo de integralesimpropias, consiste en efectuar un cambio de variable conveniente. A conti-nuacion se presentara algunos ejemplos donde el calculo de la integralconverge con mas rapidez o mayor lentitud dependiendo del cambio devariable elegido.

Ejemplos

Page 293: 2374131 Una Introduccion Al Analisis Numerico

280 VI Integracion Numerica

a) Considerese, la integral impropia

∫ 1

0

log x

x2 + 100dx.

Se observa inmediatamente que f(x) no esta acotada en las proximidadesdel origen. Aplicando la funcion GAUINT con una tolerancia igual aTOL = 10−14. Si se desea obtener el valor exacto de esta integral conun error exacto inferior a 10−13 son necesarias 69 × 15 evaluaciones dela funcion f .Efectuando el cambio de variable x = t2, se obtiene la integral

∫ 1

0

4t log t

t4 + 100dt,

integral que ha sido ya evaluada, ver la tabla VI.3.2. La funcion a integrares acotada, y son necesarias 27×15 evaluaciones de la funcion integrada.Si nuevamente se realiza otro cambio de variable, como por ejemplo,t = s2, se obtiene la integral

∫ 1

0

16s3 log s

s8 + 100ds,

denotando por h(s) a la funcion integrada, se puede mostrar que h(s)es dos veces continuamente diferenciable. Resolviendo por la funcionGAUINT son necesarias 7× 15 evaluaciones de h.

b) Las integrales de la forma

∫ 1

0

f(x)√x

dx,

pueden ser calculadas con menos evaluaciones, si se hace el cambio devariable x = t2, obteniendo ası

2

∫ 1

0

f(t2)dt.

c) Las integrales impropias del tipo

∫ ∞

1

f(x)dx,

mediante el cambio de variable x = 1/t se convierten en

∫ 1

0

f(1/t)1

t2dt.

Page 294: 2374131 Una Introduccion Al Analisis Numerico

VI.3 Implementacion Numerica 281

Por lo tanto, para acelerar la convergencia, puede utilizarse de maneracombinada el ǫ-algoritmo, con un cambio de variable adecuado. Vale la penarecalcar que el objetivo principal del cambio de variable es volver la funcionintegrada mas lisa, es decir que sea lo suficientemente derivable para poderaplicar la subrutina GAUINT en el maximo de su eficiencia. Sin embargo elcambio de variable puede volver mas complicada la funcion a integrar, motivopor el cual la ganancia obtenida en una disminucion de evaluaciones de lafuncion integrada puede perderse con las mismas evaluaciones de la funcion.

Uno de los tipos de integral donde mejor se ajusta los metodos deaceleracion propuestos, como el cambio de variable conveniente o el algoritmoepsilon consiste en:

Funciones con Oscilaciones

Escapando un poco a la rutina del libro de presentar las bases teoricas dela solucion de un problema, para luego tratar algunos ejemplos, se analizaraeste tipo de evaluacion de integral impropia con un ejemplo.

Considerese la integral de Fresnel, dada por

∫ ∞

0

sin(x2)dx =1

2

√π

2.

La funcion sin(x2) se anula en x2 = kπ con k ∈ N, definiendo ası una sucesionde numeros positivos xk, dada por

xk =√

kπ.

Planteando

Ik =

∫ xk+1

xk

sin(x2)dx, k = 0, 1, 2, . . . ;

donde Ik pueden ser calculadas por GAUINT se define la sucesion Sk, por

Sk =k∑

j=0

Ij ,

teniendo como resultado

∫ ∞

0

sin(x2)dx = limk→∞

Sk.

Ahora bien la convergencia de Sk es muy lenta, utilizando ǫ-algoritmola velocidad de la convergencia hacia la integral, se aumenta de maneraostensible. Ver la tabla VI.3.4.

Page 295: 2374131 Una Introduccion Al Analisis Numerico

282 VI Integracion Numerica

Tabla VI.3.4. Calculo de la integral de Fresnel

k Sk S′k S′′

k S(3) S(4) S(5)

0 .89483147 .63252334 .62682808 .62666213 .62665722 .62665721

1 .43040772 .62447449 .62660885 .62665582 .62665582

2 .78825896 .62773451 .62667509 .62665746 .62665746

3 .48624702 .62603581 .62664903 .62665692

4 .75244267 .62705261 .62666112 .62665713

5 .51172983 .62638728 .62665483

6 .73311637 .62685063 .62665838

7 .52703834 .62651269

8 .72060138 .62676812

9 .53751806

10 .71165881

Ejercicios

1.- Para una sucesion Snn≥0, el ǫ-algoritmo esta definido por:

ǫ(n)−1 = 0,

ǫ(n)0 = Sn,

ǫ(n)k+1 = ǫ

(n+1)k−1 +

1

ǫ(n+1)k − ǫ

(n)k

.

Si la aplicacion del ǫ-algoritmo a Snn≥0 y a Snn≥0 = aSn + bproporciona respectivamente las cantidades ǫ

(n)k y ǫ

(n)k . Mostrar que

ǫ(n)2l = aǫ

(n)2l + b, ǫ

(n)2l+1 =

1

aǫ(n)2l+1. .

2.- Utilizar el ǫ-algoritmo para el calculo de las integrales:

a)1

100

∫ 1

0

x−0.99dx, b)

∫ 1

0

log x√x

dx.

Page 296: 2374131 Una Introduccion Al Analisis Numerico

VI.3 Implementacion Numerica 283

3.- Supongase que la sucesion Sn satisface

Sn+1 − S = (ρ + αn)(Sn − S)

con |ρ| < 1, limn→∞

αn = 0 y considerese el procedimiento ∆2 de Aitken

S′n = Sn+1 −

∆Sn∆Sn+1

∆2Sn

, n = 0, 1, . . . .

Demostrar que la sucesion S′n converge mas rapidamente hacia S que

la sucesion Sn; es decir

limn→∞

S′n − S

Sn − S= 0.

Indicacion.- Verificar que ∆Sn = (ρ− 1 + αn)(Sn − S) y encontrar unaformula similar para ∆2Sn

Page 297: 2374131 Una Introduccion Al Analisis Numerico

VI.4 Transformacion de Fourier

En esta seccion sera abordado el calculo numerico de las transformadas deFourier, es decir los coeficientes de las series de Fourier para una determinadafuncion. Se iniciara un repaso teorico sobre las series de Fourier, luego seintroducira la transformada discreta de Fourier, cuya abreviacion usual esTDF , para finalmente ver la transformacion rapida de Fourier mas conocidacomo FFT .

Las motivaciones de la utilizacion de series de Fourier estan dadas porsus diferentes aplicaciones en numerosas areas de la ciencia, como de latecnologıa; para citar algunas de ellas, se tiene el tratamiento de senales, laresolucion de ecuaciones diferenciales, la construccion de metodos espectralesen la resolucion de ecuaciones a derivadas parciales, etc.

La teorıa de la transformacion de Fourier esta ıntimamente ligada alas funciones 2π-periodicas e integrables. En este libro se supondra que lasfunciones son integrables en el sentido de Riemann, y no se considerara elcaso mas general. Recordando la:

Definicion VI.4.1.- La serie de Fourier de una funcion 2π- periodica eintegrable, esta dada de manera formal por

f(x) ∼∑

k∈Z

f(k)eikx, (VI.4.1)

donde los coeficientes de Fourier estan definidos por

f(k) =1

∫ 2π

0

f(x)e−ikxdx. (VI.4.2)

Denotando por E , el espacio de las funciones 2π-periodicas, tales que

∫ 2π

0

f(x)f(x)dx <∞, ∀f ∈ E ,

se tiene que E es un espacio vectorial provisto del producto sesquilinial, dadopor

〈f, g〉 =

∫ 2π

0

f(x)g(x)dx. (VI.4.3)

Una simple verificacion muestra que las funciones definidas por

ϕk(x) = eikx, (VI.4.4)

Page 298: 2374131 Una Introduccion Al Analisis Numerico

VI.4 Transformacion de Fourier 285

constituyen una familia ortogonal de funciones, es decir

〈ϕk, ϕj〉 = 0, si j 6= k.

Para conocer mas respecto a las propiedades de espacios de Hilbert, familiasortonormales y series de Fourier existe una ambundante bibliografıa, porejemplo Rudin.

La definicion VII.4.1 es una definicion formal, es decir la serie de Fourierde una funcion dada, no necesariamente debe converger hacia la funcion.Sin embargo existen condiciones suficientes sobre la funcion f , para quela serie de Fourier converga hacia f o por lo menos en casi todos lospuntos. A continuacion se enunciara estas condiciones suficientes y el tipode convergencia que uno puede esperar obtener.

Teorema VI.4.2.- Dirichlet. Sea f : R → C una funcion de clase C1 portrozos y periodica de periodo 2π. La serie de Fourier de f es convergente entodo punto de R. En un punto x donde la funcion es continua, el lımite dela serie es f(x). En un punto x donde f no es continua, la suma de la seriees

1

2(f(x−) + f(x+)). (VI.4.5)

Ademas, la convergencia de la serie de Fourier de f es uniforme en todointervalo compacto que no contiene ningun punto de discontinuidad de f .

Demostracion.- Una demostracion de este teorema puede encontrarse enGramain.

Con la formulacion de este teorema, se conoce la clase de funcionesde las cuales la serie de Fourier es igual a la funcion, en todo caso en lospuntos donde la funcion es continua. Es proposito de esta seccion estudiarlos metodos numericos que permitan calcular los coeficientes de Fourier, ypor ende la serie de Fourier asociada. Una primera alternativa de calculo deestos coeficientes consiste en utilizar un metodo de integracion propuesto enlas secciones precedentes de este capıtulo. Sin embargo existen alternativasmenos costosas y mas simples que dan excelentes resultados.

Sea f : [0, 2π] → C, supongase que la funcion f(x) es conocida para losx dados por la subdivision equidistante

xl =2πl

N, l = 0, 1, . . . , N. (VI.4.6)

Como f(xN ) = f(x0) por hipotesis, el calculo de (VI.4.2) puede realizarse

mediante la regla del trapecio, obteniendo como aproximacion de f(k)

fN (k) =1

N

N−1∑

l=0

f(xl)e−ikxl . (VI.4.7)

Page 299: 2374131 Una Introduccion Al Analisis Numerico

286 VI Integracion Numerica

Ahora bien, (VI.4.7) induce las definiciones siguientes.Considerese, el espacio de las sucesiones N -periodicas

PN = (yk)k∈Z|yk ∈ C, yk+N = yk. (VI.4.8)

Definicion VI.4.3.- La transformada discreta de Fourier (DFT) de y ∈ PN

es la sucesion (zk)k∈Z, donde

zk =1

N

N−1∑

l=0

yle−ikxl =

1

N

N−1∑

l=0

ylω−kl, con ω = e2iπ/N .

Se la denota z = FNy.

Proposicion VI.4.4.- La transformada discreta de Fourier satisface lassiguientes propiedades:a) Para y ∈ PN , se tiene que FNy ∈ PN .b) La aplicacion Fn : PN → PN es lineal y biyectiva.c) La aplicacion inversa de FN esta dada por

F−1N = N · FN , (VI.4.9)

donde

(FNz)k := (FN z)k =1

N

N−1∑

l=0

zlωkl. (VI.4.10)

Demostracion.- Utilizando el hecho que ωN = e2πi = 1 y ω−lN =(ωN )−l = 1, se obtiene

zk+N =1

N

N−1∑

l=0

ylω−(k+N)l =

1

N

N−1∑

l=0

ylω−kl = zk,

mostrando ası la periocidad de zk. La linearidad de FN resulta de unaverificacion inmediata. Para mostrar la biyectividad y al mismo tiempo laformula (VI.4.10), se calcula

(FNFNy)j =1

N

N−1∑

k=0

(FNy)kωkj

=1

N2

N−1∑

k=0

N−1∑

l=0

ylω−klωkj

=1

N2

N−1∑

l=0

yl

(1

N

N−1∑

k=0

ωk(j−l)

)

=1

Nyj .

Page 300: 2374131 Una Introduccion Al Analisis Numerico

VI.4 Transformacion de Fourier 287

La ultima igualdad de este calculo, es consecuencia de

N−1∑

k=0

ωkm =N−1∑

k=0

(ωm)k =

N si m = 0modN

ωmN−1ωm−1 = 0 si no.

Hay que remarcar que ωm = 1 si m = 0modN .

Estudio del Error

Supongase que

yl = f(xl), xl =2πl

N, l = 0, 1, . . . , N ;

para una funcion f : R → C que es 2π-periodica. La formula siguiente des-cribe como la transformada de Fourier discreta dada por (VI.4.7) aproximalos coeficientes de Fourier dados por (VI.4.2).

Teorema VI.4.5.- Si la serie∑

k∈Z

f(k) es absolutamente convergente, en-

tonces

fn(k)− f(k) =∑

j∈Z

j 6=0

f(k + jN). (VI.4.11)

Demostracion.- La hipotesis sobre los coeficientes de Fourier implica quese tenga igualdad en la formula (VI.4.1), ver Gramain. Por lo tanto, se tiene

fN (k) =1

N

N−1∑

l=0

(∑

n∈Z

f(n)einxl

)ω−kl =

n∈Z

f(n)

(1

N

N−1∑

l=0

ω(n−k)l

)

︸ ︷︷ ︸=

1 si n = k((mod)N0 si no

=∑

j∈Z

f(k + jN)

Corolario VI.4.6.- Sea f : R→ C, p veces continuamente derivable (p ≥ 2)y 2π-periodica. Entonces,

fN (k)− f(k) = O(N−p), para |k| ≤ N

2. (VI.4.12)

Page 301: 2374131 Una Introduccion Al Analisis Numerico

288 VI Integracion Numerica

En particular, con h = 2π/N , se tiene

h

N−1∑

j=0

f(xj)−1

∫ 2π

0

f(x)dx = O(hp), (VI.4.13)

lo que significa que, para funciones lisas y periodicas, la formula del trapecioes muy precisa.

Demostracion.- Se mostrara primero que los coeficientes de Fourier satis-facen ∣∣∣f(k)

∣∣∣ ≤ C.k−p. (VI.4.14)

En efecto, varias integraciones por partes dan

f(k) =1

∫ 2π

0

f(x)e−ikxdx

= f(x)e−ikx

−ik

∣∣∣∣2π

0︸ ︷︷ ︸0

+(iπ)−1

∫ 2π

0

f ′(x)e−ikxdx

...

=(ik)−p

∫ 2π

0

f (p)(x)e−ikxdx

teniendo ası, (VI.4.14) con C =1

∫ 2π

0

∣∣∣f (p)(x)∣∣∣ dx.

Para |k| ≤ N/2 y j 6= 0 se tiene que |k + jN | ≥ (|j| − 1/2)N , utilizando(VI.4.11), se obtiene

∣∣∣fN (k)− f(k)∣∣∣ ≤

j≥1

C(j − 1/2)−pN−p = C1 ·N−p.

Observese que la serie en esta formula converge para p > 1.

Es muy importante remarcar que fn(k) es una sucesion N -periodica,

propiedad de la transformada discreta de Fourier, y que por otro lado f(k)converge muy rapidamente hacia 0 por (VI.4.14). Por consiguiente para k

grande, por ejemplo k ≈ N , fN es una mala aproximacion de f(k); mientrasque para |k| ≤ N/2 la aproximacion es en general muy buena.

Interpolacion Trigonometrica

Para la division equidistante (VI.4.6) del intervalo [0, 2π] y paray0, y1, . . . , yN−1 dados, se busca un polinomio trigonometrico, es decir una

Page 302: 2374131 Una Introduccion Al Analisis Numerico

VI.4 Transformacion de Fourier 289

combinacion lineal finita de funciones eikx, que pase por (xl, yl), paral = 0, 1, . . . , N − 1. La existencia de tal polinomio trigonometrico estaasegurada por el siguiente:

Teorema VI.4.7.- Sea y ∈ PN y z = FNy su transformada discreta deFourier. Entonces, el polinomio trigonometrico

pN (x) =

N/2∑

k=−N/2

zkeikx :=1

2

(z−N/2e

−iNx/2 + zN/2eiNx/2

)+

|k|<N/2

zkeikx,

(VI.4.15)satisface pn(xl) = yl para l = 0, 1, . . . , N − 1.

Hay que remarcar que si los yk son reales, zk es una sucesion hermıtica,es decir z−k = zk y por lo tanto el polinomio pN (x) es un polinomio acoeficientes reales.

Demostracion.- Para l fijo, la sucesion zkeikxl es N -periodica, porconsiguiente

pN (xl) =

N−1∑

k=0

zkeikxl = N · (FNz)l = N(FNFNy)l = yl.

El siguiente teorema a ser enunciado provee una estimacion del errorde la interpolacion trigonometrica con consecuencias importantes, que seranexplicadas posteriormente.

Teorema VI.4.8.- Sea f : R→ C una funcion 2π-periodica tal que∑

k∈Z

f(k)

sea absolutamente convergente. Entonces, el polinomio trigonometrico dadopor (VI.4.15), para yl = f(xl) satisface para todo x ∈ R

|pN (x)− f(x)| ≤ 2pN (x) =∑

|k|≥N/2

′∣∣∣f(k)

∣∣∣ . (VI.4.16)

Demostracion.- Restando (VI.4.1) de (VI.4.15) se obtiene

pN (x)− f(x) =

N/2∑

k=−N/2

′(fN (k)− f(k)

)eikx −

|k|≥N/2

′f(k)eikx.

La asercion es pues consecuencia de (VI.4.11) y de la desigualdad deltriangulo

Page 303: 2374131 Una Introduccion Al Analisis Numerico

290 VI Integracion Numerica

Este teorema permite una interpretacion interesante. Considerese unafuncion 2π-periodica de frecuencia maximal M , es decir f(k) = 0 para|k| > M . Entonces, el polinomio trigonometrico da el resultado exactopN (x) = f(x) para todo x, si

N > 2M. (VI.4.17)

Este resultado, el Teorema del Muestreo, da una formula para el numero demuestras necesarias para obtener una representacion exacta de una funcion.

La evaluacion de FN requiere N2 multiplicaciones y adiciones, si sela realiza directamente. Sin embargo existe un procedimiento que permitedescender el costo en operaciones a N log2 N . Este procedimiento sera vistoen la siguiente subseccion.

Transformacion Rapida de Fourier (FFT)

El algoritmo que sera estudiado, se debe a Cooley & Tukey en 1965, se basasobre las ideas de Runge 1925. Para poder formular este, es necesario lasiguiente:

Proposicion VI.4.9.- Sean u = (u0, u1, . . . , uN−1) ∈ PN ,v = (v0, v1, . . . , vN−1) ∈ PN y defınase

y = (u0, v0, u1, v1. . . . , uN−1, vN−1) ∈ P2N . (VI.4.18)

Entonces, para k = 0, 1, . . . , N − 1, se tiene (ω2N = e2iπ/2N = eπi/N )

2N(F2Ny)k = N(FNu)k + ω−k2NN(FNv)k,

2N(F2Ny)k+N = N(FNu)k − ω−k2NN(FNv)k.

(VI.4.18)

Demostracion.- Utilizando el hecho que ω22N = ωN , un calculo directo da

para k arbitrario

2N(F2Ny)k =

2N−1∑

j=0

yje−2πijk/2n

=2N−1∑

j=0

yjω−jk2N

=N−1∑

l=0

y2l︸︷︷︸ul

ω−2lk2N︸ ︷︷ ︸

ω−lk

N

+N−1∑

l=0

y2l+1︸ ︷︷ ︸vl

ω−(2l+1)k2N︸ ︷︷ ︸

ω−k

2N···ω−lk

N

= N(FNu)k + ω−k2NN(FNv)k.

Page 304: 2374131 Una Introduccion Al Analisis Numerico

VI.4 Transformacion de Fourier 291

La segunda formula de (VI.4.18) resulta de ω−N2N = −1.

La formula (VI.4.18) permite calcular, con N multiplicaciones y 2Nadiciones, la transformada discreta de Fourier de y ∈ P2N a partir de FNuy FNv. El mismo procedimiento puede ser aplicado recursivamente a lassucesiones u y v, si estas tienen una longitud par.

Si se supone que N = 2m, se obtiene el algoritmo presentado en elesquema siguiente (para N = 8 = 23).

FN

y0

y1

y2

y3

y4

y5

y6

y7

FN/2

y0

y2

y4

y6

FN/4

(y0

y4

)⟨FN/8y0 = y0

FN/8y4 = y4

FN/4

(y2

y6

)⟨FN/8y2 = y2

FN/8y6 = y6

FN/2

y1

y3

y5

y7

FN/4

(y1

y5

)⟨FN/8y1 = y1

FN/8y5 = y5

FN/4

(y3

y7

)⟨FN/8y3 = y3

FN/8y7 = y7

(VI.4.19)

Figura VI.4.1. Esquema para Calculo de FFT.

La programacion de este algoritmo se la realiza en dos etapas. Laprimera, se ordena los yi en el orden exigido por (VI.4.19), es decir esnecesario invertir los bits en la representacion binaria de los indices:

0=(0, 0, 0) 0=(0,0,0)1=(0, 0, 1) 4=(1,0,0)2=(0, 1, 0) 2=(0,1,0)3=(0, 1, 1) ←→ 6=(1,1,04=(1, 0, 0) 1=(0,0,1)5=(1, 0, 1) 5=(1,0,1)6=(1, 1, 0) 3=(0,1,1)7=(1, 1, 1) 7=(1,1,1)

Despues, se efectua las operaciones de (VI.4.18) de la manera como indicael esquema (VI.4.19).

Page 305: 2374131 Una Introduccion Al Analisis Numerico

292 VI Integracion Numerica

Para pasar de una columna a otra en el esquema (VI.4.19) son necesariasN/2 multiplicaciones complejas y de otras N adiciones o sustracciones. Comom = log2 N pasajes son necesarios, entonces se tiene el:

Teorema VI.4.10.- Para N = 2m, el calculo de FNy puede ser realizadocon:

N

2log2 N multiplicaciones complejas y

N log2 N adiciones complejas.

Para ilustrar mejor la importancia de este algoritmo, ver la tabla VI.4.1para comparar el calculo de FNy con o sin FFT.

Tabla VI.4.1. Comparacion de FFT con DFT.

N N2 N log2 N cociente

25 = 32 ≈ 103 160 ≈ 6.4

210 ≈ 103 ≈ 106 ≈ 104 100

220 ≈ 106 ≈ 1012 ≈ 2 · 107 5· ≈ 104

Aplicaciones de la FFT

La transformada rapida de Fourier, tiene una gran cantidad de aplicaciones,desde el calculo de espectrogramas, resolucion de ecuaciones diferencialesordinarias o a derivadas parciales, hasta la solucion de sistemas lineales.

Definiendo el producto de convolucion de dos sucesiones N -periodicasy ∈ PN y z ∈ Pn, por

(y ∗ z)k =

N−1∑

l=0

yk−lzl. (VI.4.20)

Se tiene la siguiente propiedad, ver ejercicio 1,

FN (y ∗ z) = N · FNy · FNz, (VI.4.21)

de donde (VI.4.20) puede ser calculado mediante O(N log2 N) operaciones.La resolucion de un sistema lineal con una matriz de Toeplitz circular

puede ser resuelto utilizando FFT. En efecto, un tal sistema es de la forma

a0 aN−1 aN−2 · · · a1

a1 a0 aN−1 · · · a2

a2 a1 a0 · · · a3...

...... · · ·

...aN−1 aN−2 aN−3 · · · a0

x0

x1

x2...

xN−1

=

b0

b1

b2...

bN−1

. (VI.4.22)

Page 306: 2374131 Una Introduccion Al Analisis Numerico

VI.4 Transformacion de Fourier 293

Evidentemente, el sistema lineal (VI.4.22) es equivalente a a ∗ x = b, si seconsidera (ai), (xi) y (bi) como sucesiones de PN .

La multiplicacion de una matriz de Toeplitz arbitraria con un vector

a0 a−1 a−2 · · · a−N+1

a1 a0 a−1 · · · a−N+2

a2 a1 a0 · · · aN+3

......

... · · ·...

aN−1 aN−2 aN−3 · · · a0

x0

x1

x2...

xN−1

=

b0

b1

b2...

bN−1

, (VI.4.23)

puede ser resuelta utilizando FFT, considerando las sucesiones en P2N

a = (a0, a1, . . . , aN−1, 0, a−N+1, a−N+2, . . . , a−1),

x = (x0, x1, . . . , xN−1, 0, 0, . . . , 0).

Se puede verificar facilmente que el resultado del producto (VI.4.23) es laprimera mitad del producto de convolucion a∗x. Por consiguiente, el calculocon FFT da un algoritmo rapido para efectuar el producto (VI.4.23).

Ejercicios

1.- Mostrar queFn(y ∗ z) = N · FNy · FNz,

para el producto de convolucion

(y ∗ z)k =

N−1∑

l=0

yk−lzl,

de dos suceciones N -periodicas. Deducir que

y ∗ z = N · F−1N (FNy · FNz).

2.- Resolver la ecuacion diferencial con valores en la frontera

u′′(x) = −1 u(0) = u(2π) = 0,

graficar la solucion.

Page 307: 2374131 Una Introduccion Al Analisis Numerico

Capıtulo VII

Ecuaciones Diferenciales

El estudio de una gran cantidad de fenomenos de las mas diversas ca-racterısticas se traducen en ecuaciones diferenciales. La descripcion de unfenomeno mediante ecuaciones diferenciales tiene un proposito primordialque es la predecibilidad. Por otro lado, permite obtener conclusiones decaracter local, que seran extrapoladas para tener informaciones globalesdel modelo estudiado. El enfasis que se hace a la resolucion analıtica delas ecuaciones diferenciales en los cursos de Ecuaciones Diferenciales quese dictan en los primeros niveles de las universidades, tienen el objetivo deencontrar soluciones generales a los diversos problemas diferenciales que seencuentran en el transcurso de los estudios universitarios, como tambien enel ejercicio profecional. Este hecho se debe fundamentalmente que hasta haceno mucho, no se contaban con los medios tecnologicos que permitan resolverecuaciones diferenciales con la precision que se requerıa. Por consiguiente, elobjetivo de estos cursos eran esencialemte obtener las soluciones en forma deformulas, perdiendose ası el caracter esencial de las ecuaciones diferencialesque es el estudio local de los fenomenos. Ademas cuestiones como existenciay unicidad no son abordadas por falta de tiempo.

Este capıtulo tiene como objetivo principal la formulacion de metodosnumericos de resolucion de problemas diferenciales a valores iniciales oproblemas de Cauchy. La primera parte tratara sobre cuestiones de existenciay unicidad de las ecuaciones diferenciales. Luego se abordara los metodos aun paso y como expresion de estos; los metodos de Runge-Kutta, desde laconstruccion de estos, estimaciones de error y como corolario los metodosencajonados del tipo Dormand & Prince. La tercera parte de este capıtulotratara los metodos numericos a paso multiple, se vera la construccion deestos, cuestiones de estabilidad y convergencia.

Page 308: 2374131 Una Introduccion Al Analisis Numerico

VII.1 Generalidades

En este capıtulo I, I0 designan intervalos abiertos de R no reducidos a unpunto y t0 un punto fijo de I0; se da una funcion f definida y continua sobreI0 ×Rm con valores en Rm, un elemento y0 ∈ Rm, y se desea encontrar unafuncion y continua y derivable sobre el intervalo I0, con valores en Rm, talque:

y′(t) = f(t, y(t)), ∀t ∈ I0; (VII.1.1)

y(t0) = y0. (VII.1.2)

Este problema se lo conoce con el nombre de problema de Cauchy para elsistema diferencial (VII.1.1); la condicion (VII.1.2) se llama una condicionde Cauchy. Una funcion y que satisface el sistema (VII.1.1) es llamada unaintegral del sistema (VII.1.1). En numerosos ejemplos fısicos, la variable trepresenta el tiempo, el instante t0, es por consiguiente, llamado instanteinicial y la condicion (VII.1.2) llamada condicion inicial.

Se puede remarcar que si se denota por y1, y2, . . . , ym las componentesde y, por f1(t, y1, . . . , ym), . . . , fm(t, y1, . . . , ym) las componentes de f(t, y)la ecuacion (VII.1.1) es equivalente al sistema

y′1(t) = f1(t, y1(t), . . . , ym(t))

y′2(t) = f2(t, y1(t), . . . , ym(t))

...

y′m(t) = fm(t, y1(t), . . . , ym(t))

. (VII.1.3)

Las ecuaciones del sistema VII.1.3 son de primer orden, pues en estas, elorden de derivacion mas alto que aparece es el primero. Considerese ahoraun problema diferencial de orden p, de la forma

y(p)(t) = f(t, y(t), y′(t), . . . , y(p−1)), (VII.1.4)

el cual puede convertirse en problema de la forma (VII.1.1), planteando

z1(t) = y(t), z2(t) = y′(t), . . . , zp(t) = y(p−1)(t);

el problema diferencial (VII.1.4), por consiguiente es equivalente al sistema

z′1(t) = z2(t)

...

z′p−1(t) = zp(t)

z′p(t) = f(t, z1(t), . . . , zp(t))

.

Page 309: 2374131 Una Introduccion Al Analisis Numerico

VII.1 Generalidades 297

de donde planteando

z = (z1, z2, . . . , zp)t y F (t, z) = (z2, . . . , zp, f(t, z1, . . . , zp))

t,

se tienez′(t) = F (t, z(t)). (VII.1.5)

La condicion de Cauchy para el problema (VII.1.5) esta dada pory(t0), y

′(t0), . . . , y(p−1)(t0).

Ahora bien, en este capıtulo no sera tratado el problema diferencialgeneral de orden p, dado por

F (t, y(t), y′(t), . . . , y(n)(t)) = 0, ∀t ∈ I0. (VII.1.6)

Cuando se puede aplicar el teorema de las funciones implicitas, (VII.1.6) eslocalmente equivalente a la ecuacion de la forma (VII.1.4) y la teorıa quesera desarrollada en este capıtulo podra ser aplicada a este tipo de problemasin inconvenientes. Si el teorema de las funciones implicitas no es aplicable,serias dificultades matematicas y numericas pueden aparecer, en este caso sehabla de ecuaciones diferenciales algebraicas, para saber mas sobre este tipode ecuaciones referirse a Hairer & Wanner.

Finalmente es necesario remarcar que, si bien I0 es un intervalo abierto,el estudio de las soluciones de los problemas diferenciales permite considerarlos intervalos de la forma [t0, t0 + T ) y (t0 − T, t0], obteniendo el intervaloabierto por recolamiento de ambos subintervalos semiabiertos.

Teoremas de Existencia y Unicidad

En esta subseccion se supondra que la terminologıa basica es conocida porel lector. No obstante, se enunciara dos teoremas muy importantes en lo queconcierne el analisis numerico de ecuaciones diferenciales. El primer teoremaa enunciarse da condiciones suficientes para asegurar la existencia y unicidadde las soluciones de los problemas a valores iniciales. El segundo teoremaesta relacionado con la condicion misma del problema, pues cuando se tratanumericamente un problema es de suponer que se trabaja con una solucionaproximada del problema.

Teorema VII.1.1.- Cauchy-Lipschitz. Supongase que f es continua sobreI0 × Rm y que satisface una condicion de Lipschitz, es decir que existe unreal L tal que

‖f(t, z)− f(t, y)‖ ≤ L ‖z − y‖ ∀(t, y) y (t, z) ∈ I0 × Rm; (VII.1.7)

entonces el problema (VII.1.1,2) admite una solucion y una sola.

Demostracion.- Se dara una demostracion directa que tiene la ventaja deser valida cuando se remplaza Rn por un espacio de Banach.

Page 310: 2374131 Una Introduccion Al Analisis Numerico

298 VII Ecuaciones Diferenciales

Paa fijar las ideas, supongase que I0 = [t0, t + t0] y considerese laaplicacion Φ que a y ∈ C0([t0, t + t0]) asocia Φ(y) ∈ C0([t0, t + t0]) definidapor

Φ(y)(t) = y0 +

∫ t

t0

f(s, y(s))ds.

Introduciendo la norma

‖y‖L = maxs∈I0

(e−2L(s−t0) ‖y(s)‖)

que dota C0(I0) de una estructura de espacio de Banach. Se tiene

‖(Φ(y)− Φ(y∗))(t)‖ ≤∫ t

t0

‖f(s, y(s))− f(s, y∗(s))‖ ds

≤∫ t

t0

Le2L(s−t0)ds ‖y − y∗‖L

≤ 1

2e2L(t−t0) ‖y − y∗‖L ,

deduciendose

‖Φ(y)− Φ(y∗)‖L ≤1

2‖y − y∗‖L .

El teorema del punto fijo implica que Φ tiene un solo punto fijo en C0(I0),de donde se tiene el resultado.

Teorema VII.1.2.- Sea f : V → Rn continua, donde V ⊂ Rn+1 abierto.Supongase que: y(x) es una solucion de y′ = f(x, y) sobre [x0, x], tal quey(x0) = y0; v(x) una solucion aproximada de la ecuacion diferencial sobre[x0, x0] tal que

‖v′(x)− f(x, v(x))‖ l ≤ δ (VII.1.8)

y f satisface una condicion de Lipschitz sobre un conjunto que contenga(x, y(x)), (x, z(x)), es decir

‖f(x, y)− f(x, z)‖ ≤ L ‖y − z‖ . (VII.1.9)

Entonces

‖y(x)− v(x)‖ ≤ ‖y0 − v(x0)‖ eL(x−x0) +δ

L

(eL(x−x0) − 1

). (VII.1.10)

Demostracion.- Se tiene:

y(x)− v(x) = y(x0)− v(x0) +

∫ x

x0

(y′(s)− v′(s))ds

= y(x0)− v(x0) +

∫ x

x0

(f(s, y(s))− f(s, v(s)) + f(s, v(s))− v′(s)) ds,

Page 311: 2374131 Una Introduccion Al Analisis Numerico

VII.1 Generalidades 299

pasando a las normas y aplicando las hipotesis (VII.1.8) y (VII.1.9), seobtiene

‖y(x)− v(x)‖ ≤ ‖y0 − v(x0)‖+

∫ x

x0

(L ‖y(s)− v(s)‖+ δ) ds.

Planteando

u(x) = ‖y0 − v(x0)‖+

∫ x

x0

(L ‖y(s)− v(s)‖+ δ) ds,

se deduceu′(x) = L ‖y(x)− v(x)‖+ δ ≤ Lu(x) + δ,

de esta manera se obtiene la desigualdad diferencial

u′(x) ≤ Lu(x) + δ

u(x0) = ‖y0 − v(x0)‖ .(VII.1.11)

Para resolver este desigualdad, se considera la familia de ecuaciones:

w′n(x) = Lwn(x) + δ, wn(x0) = u(x0) +

1

n, (VII.1.12)

cuyas soluciones estan dadas por:

wn(x) = wn(x0)eL(x−x0) +

δ

L

(eL(x−x0) − 1)

).

El siguiente paso en la demostracion es mostrar que

u(x) ≤ wn(x). (VII.1.13)

Supongase lo contrario, es decir que existe un n y s > x0, tales queu(s) > wn(s). Considerese el conjunto

A = x > x0|u(x) > wn(x)

y sea x1 = inf A. Por continuidad se tiene u(x1) = wn(x1). De donde:

wn(x1)− wn(x0) =

∫ x1

x0

w′n(s)ds =

∫ x1

x0

(Lwn(s) + δ)ds

≥∫ x1

x0

(Lu(s) + δ)ds ≥∫ x1

x0

u′(s)ds

= u(x1)− u(x0),

Page 312: 2374131 Una Introduccion Al Analisis Numerico

300 VII Ecuaciones Diferenciales

por lo tantow(x0) ≤ u(x0),

llegando a una contradiccion con −1/n ≥ 0.

Problemas con Valores en la Frontera

La teorıa de existencia y unicidad de ecuaciones diferenciales son general-mente formuladas para problemas de Cauchy o problemas a valores iniciales,sin embargo existe una gran variedad de problemas diferenciales de otras ca-racterısticas que seran tratados en esta subseccion.

Toda ecuacion diferencial puede expresarse como un sistema de ecua-ciones diferenciales de primer orden de la manera siguiente

y′ = f(x, y), (VII.1.14)

donde f : R× Rn → Rn.Un problema diferencial con valores en la frontera es darse una ecuacion

diferencial del tipo (VII.1.14) con n condiciones para y(a) y y(b), dondea, b ∈ R. Existe una gama de problemas diferenciales con valores en lafrontera. A continuacion se mostrara los ejemplos mas representativos.

Ejemplos

a) Problemas a valores iniciales. Son de la forma

y′ = f(x, y),

y(x0) = y0.

Este tipo de problema tiene solucion unica si f es continua y verifica lascondiciones de Lipschitz.

b) Considerese el problema

y′′ = y;y(a) = A,

y(b) = B.

La ecuacion diferencial de segundo orden puede reducirse al siguientesistema de primer orden

y′1 = y2,

y′2 = y1;

con condiciones de borde dadas por y1(a) = A y y1(b) = B. Esteproblema siempre tiene solucion unica cuando a 6= b.

Page 313: 2374131 Una Introduccion Al Analisis Numerico

VII.1 Generalidades 301

c) Encontrar una solucion T periodica de una ecuacion diferencial, porejemplo

y′ = y + cosx.

Es muy facil deducir que T = 2πk, con k entero. El problema es encontraruna solucion de la ecuacion diferencial que satisfaga

y(x) = y(x + T ).

d) Determinar el parametro λ ∈ Rp de la ecuacion

y′ = f(x, y, λ),

donde la solucion buscada verifica y(a) = ya y g(y(a)) con g : Rn → Rp.Ahora bien, este problema puede expresarse como el problema diferencialequivalente

y′ = f(x, y, λ),

λ′ = 0,

con condiciones de frontera

y(a) = ya,

g(y(b)) = 0.

e) Problemas a frontera libre, son de la forma

y′′ = f(x, y, y′);

y(0) = A,

y(l) = B,

y′(l) = 0;

con l desconocido. Este problema mediante una transformacion afın dex, puede expresarse de la siguiente forma

z′′ = l2f

(lt, z,

z′

l

),

l′ = 0,

con condiciones de borde dadas por

z(0) = A, z(1) = B, z′(1) = 0.

En base a los ejemplos expuestos mas arriba, el problema diferencial convalores en la frontera puede expresarse como

y′ = f(x, y),

r(y(a), y(b)),(VII.1.15)

Page 314: 2374131 Una Introduccion Al Analisis Numerico

302 VII Ecuaciones Diferenciales

donde f : R× Rn → R y r : Rn × Rn → Rn.Por consiguiente la funcion r en los diferentes ejemplos, sera igual a:

r(y(a), y(b)) = y(a)− ya ejemplo a),

r

((y1(a)y2(a)

),

(y1(b)y2(b)

))=

(y1(a)−Ay1(b)−B

)ejemplo b),

r(y(x0), y(x0 + T )) = y(x0)− y(x0 + T ) ejemplo c),

Introduciendo la notacion siguiente

y(x, a, ya) (VII.1.16)

para expresar la solucion y(x) que satisface y(a) = ya, el problema diferencialcon condiciones en la frontera consiste en encontrar ya, tal que

r(ya, y(b, a, ya)) = 0. (VII1.17)

Definiendo la funcion F : Rn → Rn por

F (ya) = r(ya, y(b, a, ya)), (VII.1.18)

resumiendose el problema diferencial con valores en la frontera a encontrarya tal que

y′ = f(x, y),

F (ya) = 0.(VII.1.19)

Supongase que y∗(x) sea una solucion de (VII.1.19), es decir y∗a = y∗(a),

ademas que F ′(y∗a) sea inversible, por el teorema de la inversion local la

solucion y∗a es localmente unica y por consiguiente y∗(x) lo es tambien.

La ecuacion F (ya) se resuelve generalmente por un metodo iterativo,si F no es lineal, se utiliza por ejemplo el metodo de Newton. Para poderaplicar el metodo de Newton es necesario conocer F ′(ya). Ahora bien, setiene

F ′(ya) =∂r

∂ya(ya, y(b, a, ya)) +

∂r

∂yb(ya, y(b, a, ya))

∂y

∂ya(b, a, ya). (VII.1.20)

Diferenciabilidad respecto a los Valores Iniciales

En la expresion (VII.1.20) puede observarse que existe una expresion que esderivada respecto al valor inicial ya. Retomando la notacion de la seccionprecedente se tiene y(x, x0, y0) es la solucion que pasa por (x0, y0) de la

Page 315: 2374131 Una Introduccion Al Analisis Numerico

VII.1 Generalidades 303

ecuacion diferencial y′ = f(x, y), donde f : R × Rn → Rn. El problemaconsiste en determinar

∂y

∂y0(x, x0, y0). (VII.1.21)

En el caso lineal, se tiene que la ecuacion diferencial es de la forma

y′ = A(x)y (VII.1.22)

donde A(x) es una matriz de coeficientes (aij(x) continuos. La soluciongeneral de (VII.1.22) esta dada por

y(x, x0, y0) =

n∑

i=1

y(x, x0, ei)y0i = R(x, x0)y0 (VII.1.23)

donde los ei son los vectores de la base canonica de Rn. La matriz R(x, x0)se llama el nucleo resolvente o la resolvente de la ecuacion (VII.1.22). Esfacil de verificar que

∂y

∂y0(x, x0, y0) = R(x, x0) (VII.1.24)

Para el caso no lineal la situacion es un poco mas complicada. Se tiene

∂y

∂x(x, x0, y0) = f(x, y(x, x0, y0)) (VII.1.25)

suponiendo que ∂y/∂y0 existe y el orden de derivacion conmuta, se obtiene

∂x

(∂y

∂y0(x, x0, y0)

)=

∂f

∂y(x, y(x, x0, y0))

∂y

∂y0(x, x0, y0)

con∂y

∂y0(x0, x0, y0) = I,

de donde∂y

∂y0(x, x0, y0) es la resolvente de la ecuacion diferencial lineal

Ψ′ =∂f

∂y(x, y(x, x0, y0))Ψ. (VII.1.26)

Shooting Simple

Retomando el problema con valores en la frontera formulado bajo la formade las ecuaciones (VII.1.18) y (VII.1.19) puede ser resuelto utilizando elmetodo conocido como shooting simple, que en sıntesis es utilizar un metodo

Page 316: 2374131 Una Introduccion Al Analisis Numerico

304 VII Ecuaciones Diferenciales

numerico para resolver (VII.1.19). Este metodo puede ser Newton u otrometodo numerico adaptado al problema. Sin pretender dar una teorıa quejustifique tal metodo, para tal efecto referirse a Stoer, se mostrara estemetodo implementado en ejemplos.

Ejemplos

a) Considerese el problema con valores en la frontera dado por:

y′′ = −ey,

y(0) = 1,

y(1) =1

2.

(VII.1.27)

Utilizando la notacion de la subseccion precedente, se plantea

y(x, α),

la solucion del problema diferencial a valores iniciales

y′′ = −ey,

y(0) = 1,

y′(0) = α.

(VII.1.27b)

El problema (VII.1.27) se traduce en encontrar α, tal que

y(1, α) =1

2.

En la figura VII.1.1, puede observarse en la grafica los valores de y(1) enfuncion de α.

0 2 4 6 8 10

−1

0

1

2

α

y(1)

Figura VII.1.1. Valores de y(1) en funcion de α.

Page 317: 2374131 Una Introduccion Al Analisis Numerico

VII.1 Generalidades 305

Observando la grafica, se puede deducir que el problema (VII.1.27) tienedos soluciones. El siguiente paso es aplicar el metodo del shooting simple,obteniendo de esta manera dos soluciones. La primera con

α = 0.9708369956661049,

la segunda solucion con

α = 7.93719815816973.

Puede apreciarse las graficas de las dos soluciones, en la figura (VII.1.2)

0 10

1

2

3

4

5

0

1

2

3

4

5

Figura VII.1.2. Soluciones del Problema (VII.1.26).

b) En este ejemplo se analizara un problema de soluciones periodicas.Considerese la ecuacion diferencial de Van der Pol, dada por

y′′ = (1− y2)y′ − y. (VII.1.28)

El problema consiste en determinar si existe una solucion periodica ysobre todo como es esta. Ahora bien, (VII.1.28) puede escribirse comoel sistema de ecuaciones diferenciales

y′1 = y2,

y′2 = (1− y2

1)y2 − y1.(VII.1.29)

Planteando y(x) = (y1(x), y2(x)), el problema se resume en encontrarT > 0, tal que y(T ) = y(0), que puede formularse de la siguiente manera

F (T, y0) = y(T, 0, y0)− y0 = 0. (VII.1.30)

Page 318: 2374131 Una Introduccion Al Analisis Numerico

306 VII Ecuaciones Diferenciales

Supongase que T, y0 sean una aproximacion de la solucion del problema(VII.1.30), de donde

F (T + ∆T, y0 + ∆y0) = 0,

con ∆T , ∆y0 escogidos convenientemente. Desarrollando en serie deTaylor, se deduce:

F (T, y0) +∂F

∂T(T, y0)∆T +

∂F

∂y0(T, y0)∆y0 = 0,

y(T, 0, y0)− y0 + f(y(T, 0, y0))∆T +

(∂y

∂y0(T, 0, y0)− I

)∆y0 = 0.

Por consiguiente, se tiene n ecuaciones lineales, con n + 1 incognitas,agregando la condicion suplementaria

∆y0 ⊥ f(y(T, 0, y0)), (VII.1.31)

se obtiene

( ∂y

∂y0(T, 0, y0)− I f(y(T, 0, y0))

f t(y(T, 0, y0)) 0

)(∆y0

∆T

)= −

(y(T, 0, y0)− y0

0

).

(VII.1.32)Partiendo de los valores iniciales

y1(0) = 1.,

y2(0) = 2.,

T = 7.;

luego de 14 iteraciones se obtiene con una precision del orden de 10−13,los valores iniciales y el periodo

y1(0) = 2.00861986087296,

y2(0) = 0.,

T = 6.66328685933633.

La solucion periodica de la ecuacion Van der Pol puede apreciarse en la

Page 319: 2374131 Una Introduccion Al Analisis Numerico

VII.1 Generalidades 307

figura VII.1.3

−3 −2 −1 0 1 2 3

−3

−2

−1

0

1

2

3

Figura VII.1.3. Soluciones Periodica de Van der Pol.

Shooting Multiple

La solucion del problema con valores en la frontera

y′ = f(x, y), r(y(a), y(b)) = 0,

requiere que para todo punto x de la region donde esta definida la solucion yse tenga una aproximacion numerica de y(x). En el metodo shooting descritoen la anterior subseccion, solamente el valor inicial y(a) = ya es determinado.En muchos problemas es suficiente conocer este valor, sin embargo en unagran variedad de problemas con valores en la frontera conocer este valor noes nada fiable. Para ilustrar esto, considerese la ecuacion diferencial.

y′′ − y′ + 110y = 0, (VII.1.33)

cuya solucion general esta dada por

y(x) = C1e−10x + C2e

11x, (VII.1.34)

Page 320: 2374131 Una Introduccion Al Analisis Numerico

308 VII Ecuaciones Diferenciales

donde C1 y C2 son constantes reales arbitrarias. El problema a valor inicialy(0) = y0 y y′(0) = y′

0 tiene como solucion

y(x) =11y0 − y′

0

21e−10x +

y′0 + 10y0

21e11x. (VII.1.35)

Ahora bien, considerese el problema con valores en la frontera dado por

y(0) = 1, y(10) = 1;

la solucion de este problema consiste en determinar y′0 de la formula

(VII.1.35). Por consiguiente, resolviendo la ecuacion lineal

11− y′0

21e−100 +

10 + y′0

21e110 = 1;

se obtiene

y′0 =

21− 10e110 − 11e−100

e110 − e100 .

Debido a la aritmetica de punto flotante que las computadoras poseen, enlugar de y′

0, se manipula la cantidad

y′0 = −10(1 + ǫ), con |ǫ| ≤ eps. (VII.1.36)

Suponiendo que los calculos se hacen en doble precision, se puede tomar porejemplo ǫ = 10−16. Remplazando y′

0 en (VII.1.35), se obtiene

y(100) ≈ 10−15

21e110 ≈ 2.8× 1031.

Otra de las dificultades mayores en la implementacion del metodoshooting en su version simple, es la necesidad de contar con una buenaaproximacion de ya, lo que en general no sucede. Por otra lado, los valoresque pueden tomar los ya, en muchas situaciones, estan confinados a regionesdemasiado pequenas; por ejemplo considerese el problema

y′′ = y3,

y(0) = 1,

y(100) = 2;

(VII.1.37)

los valores que puede tomar y′(0), para que y(x) este definida en el intervalo[0, 100], estan restringidos a un intervalo de longitudo no mayor a 10−6. Poreste motivo puede deducirse la dificultad de implementar el metodo shootingsimple.

Page 321: 2374131 Una Introduccion Al Analisis Numerico

VII.1 Generalidades 309

El remedio a estas dificultades enumeradas mas arriba esta en la im-plementacion del metodo shooting multiple, que consiste en subdividir elintervalo [a, b] en subintervalos de extremidades xi, es decir tomar una sub-division a = x0 < x1 · · · < xn = b. Luego, se denota por yi = y(xi). De estamanera se obtiene el sistema de ecuaciones

y(x1, x0, y0)− y1 = 0

y(x2, x1, y1)− y2 = 0

...

y(xn, xn−1, yn−1) = 0

r(y0, yn) = 0.

(VII.1.38)

La solucion de (VII.1.38) se la encuentra utilizando un metodo iterativo,que puede ser Newton si el problema no es lineal. Como ilustracion de esteMetodo se tiene los siguientes dos ejemplos.

Ejemplos

a) Considerese el problema (VII.1.37). Para su resolucion se ha subdivi-dido equidistantemente en 100 subintervalos. La solucion del sistema(VII.1.38) se la hecho utilizando el metodo de Newton. Las iteracionesy las graficas pueden apreciarse en la figura VII.1.4.

Page 322: 2374131 Una Introduccion Al Analisis Numerico

310 VII Ecuaciones Diferenciales

0 20 40 60 80 1000

1

2

3iter=0

0 20 40 60 80 1000

1

2

3iter=1

0 20 40 60 80 1000

1

2

3iter=2

0 20 40 60 80 1000

1

2

3iter=3

0 20 40 60 80 1000

1

2

3iter=4

0 20 40 60 80 1000

1

2

3iter=11

Figura VII.1.4. Implementacion Multiple Shooting.

b) Este ejemplo esta relacionado con un problema ingenıeril. Un granjerodesea un silo cuya base sea un cırculo de radio 5 m, de altura 10 m yel techo sea un cırculo de radio 2.5 m, la capacidad del silo debe serexactamente de 550 m3. Suponiendo que el costo es proporcional al areadel silo. ¿Cual es la forma de este?Matematicamente el problema puede ser formulado como:

area lateral −→ min,

volumen = 550.

Por la simetrıa del problema, se puede deducir que el silo es una superficiede revolucion, por lo tanto el problema puede expresarse de la manera

Page 323: 2374131 Una Introduccion Al Analisis Numerico

VII.1 Generalidades 311

siguiente: Encontrar una funcion y(x), tal que

∫ 10

0

y√

1 + y′2dx −→ min,

π

∫ 10

0

y2dx = 550,

y(0) = 5,

y(10) = 2.5.

Planteando

L(λ, y, y′) = y√

1 + y′2 − λ

(y2 − 55

π

),

el problema es equivalente, por los Multiplicadores de Lagrange a

∫ 10

0

L(λ, y, y′)dx→ min .

Este problema es de tipo variacional. Aplicando las ecuaciones de Euler-Lagrange se convierte en el problema diferencial siguiente

d

dx

(∂

∂y′

(y√

1 + y′2 − λ(y2 − 55

π

))−

∂y

(y√

1 + y′2 − λ(y2 − 55

π)

)= 0.

La solucion de este problema ha sido efectuada utilizando el meto deshooting multiple. Como solucion inicial se ha utilizado una parabolaque satisfaga las condiciones de contorno y la condicion de volumen. Elintervalo [0, 10] ha sido subdivido en 10 subintervalos de igual longitud.Despues de 5 iteraciones se llega a una precision de 10−10. Las iteraciones

Page 324: 2374131 Una Introduccion Al Analisis Numerico

312 VII Ecuaciones Diferenciales

del metodo pueden apreciarse en la figura VII.1.5.

0 10012345678

iter=0

0 10012345678

iter=1

0 10012345678

iter=2

0 10012345678

iter=3

0 10012345678

iter=4

0 10012345678

iter=5

Figura VII.1.4. Determinacion del Silo optimo.

A continuacion se presenta una serie de ejercicios, cuya finalidad esrecordar las nociones basicas sobre las ecuaciones diferenciales.

Ejercicios

1.- Resolver:y′ = −x signo(y)

√|x|,

y′ = exp(y) sin(x),

y′ = (x− y + 3)2.

Dibujar los campos de vectores.

2.- Dibujar el campo de vectores de la ecuacion

xy′ =√

x2 − y2 + y.

Page 325: 2374131 Una Introduccion Al Analisis Numerico

VII.1 Generalidades 313

Encontrar una formula explicita para las soluciones.

3.- La ecuacion de un cuerpo en caida libre esta dada por

r′′ = −γM

r2 , r(0) = R, r′(0) = v0. (VII.1.39)

Plantear r′ = p(r), deducir una ecuacion diferencial para p y resolverla.Encontrar una condicion para v0, tal que r(t) → ∞ si t → ∞. Calcular lassoluciones de (VII.1.39) que tienen la forma a(b± x)α.

4.- Transformar la ecuacion de Bernoulli

y′ +y

1 + x+ (1 + x)y4 = 0,

en una ecuacion lineal. Plantear y(x) = z(x)q con q conveniente.

5.- Resolver la ecuacion de Riccati

y′ = y2 + 1− x2. (VII.1.40)

Dibujar el campo de vectores considerando las curvas donde y′ = cons,las isoclinas. Deducir una solucion particular φ(x) de (VII.1.40). Calcularlas otras soluciones mediante la transformacion z(x) = y(x)− φ(x).

6.- Encontrar la solucion de

y′′ − 3y′ − 4y = g(x), g(x) =

cos x, 0 ≤ x ≤ π/2;

0, π/2 ≤ x;

que satisface y(0) = y′(0) = 0.

7.- Resolver las ecuaciones lineales

y′ =

(3 6−2 −3

)y, y′ =

(1 −14 −3

).

Page 326: 2374131 Una Introduccion Al Analisis Numerico

VII.2 Metodo de Euler

En esta seccion sera estudiado el metodo mas sencillo de resolucion deecuaciones diferenciales con valores iniciales.

Se considera el problema a valor inicial o problema de Cauchy dado por

y′ = f(x, y),

y(t0) = y0,(VII.2.1)

donde f : V → Rn continua, con V ⊂ R×Rn. Se desea determinar y(t0 +T ),para eso se considera la subdivision del intervalo [t0, t0 + T ] dada por

t0 < t1 < t2 < · · · < tn = t0 + T,

definiendohi = xi+1 − xi, i = 0, . . . , n− 1. (VII.2.2)

La idea fundamental del metodo de Euler consiste en aproximar la solucionexacta en x1, utilizando una tangente que pase por (x0, y0), es decir

y1 = y0 + h0f(x0, y0). (VII.2.3)

De manera generalxi+1 = xi + hi,

yi+1 = yi + hif(xi, yi).(VII.2.4)

La solucion numerica proporcionada por el metodo de Euler es, por consi-guiente una funcion poligonal, ver figura VI.2.1, denotada por yh(x), llamadapolıgono de Euler; esta funcion esta definida por:

h = (h0, . . . , hn),

x ∈ [xk, xk+1],

yh(x) = yk + (x− xk)f(xk, yk).

(VII.2.5)

y

yy

yy

yy

0

1

2

3

4

56

x x x x x x1 2 3 4 5 6

y(x)

Figura VII.2.1. El Polıgono de Euler

Page 327: 2374131 Una Introduccion Al Analisis Numerico

VII.2 Metodo de Euler 315

Una pregunta muy natural, que uno puede plantearse, consiste en determinarbajo que condiciones el metodo de Euler converge hacia la solucion exactadel problema diferencial de Cauchy, cuando n→∞.

Considerese el problema

y′ = f(x, y),

y(x0) = y0,(VII.2.6)

donde f : U → Rn, con U ⊂ R× Rn abierto. Se define

|h| = maxi=0,...,n−1

hi. (VII.2.7)

Proposicion VII.2.1.- Sea D = (x, y)|x ∈ [x0, x0 +a], ‖y − y0‖ ≤ b ⊂ U .Supongase que f |D continua, A = max

(x,y)∈D‖f(x, y)‖, α = min(a, b/A).

Entonces para cada division h del intervalo [x0, x0 + α] se tiene:a) ‖yh(x)− yh(x)‖ ≤ A ‖x− x‖; x, x ∈ [x0, x0 + α].b) si ‖f(x, y)− f(x0, y0)‖ ≤ ǫ sobre D, entonces‖yh(x)− (y0 + (x− x0)f(x0, y0))‖ ≤ ǫ |x− x0| .

Demostracion.-El punto a) es trivial, ya que es consecuencia de ladefinicion de yh, A y la desigualdad del triangulo aplicada una cantidadfinita de veces.

La demostracion del punto b) es la siguiente. Sea x ∈ [x0, x0 + α], porconsiguiente x ∈ [xk−1, xk], de donde

yh(x) = yk + (x− xk−1)f(xk−1, yk−1)

= y0 + h0f(x0, y0) + h1f(x1, y1) + · · ·+ hk−2f(xk−2, yk−2)

+ (x− xk−1)f(xk−1, yk−1).

Ahora bien,

y0 + (x− x0)f(x0, y0) = y0 + h0f(x0, y0) + . . . hk−2f(x0, y0)

+ (x− xk−1)f(xk−1, yk−1),

obteniendo finalmente b).

Proposicion VII.2.2.- Sea h una division del intervalo I. Sean yh(x) elpolıgono de Euler para (x0, y0) y zk(x) el polıgono de Euler para (x0, z0). Si

‖f(x, y)− f(x, z)‖ ≤ L ‖y − z‖ , ∀(x, y), (x, z) ∈ D; (VII.2.8)

entonces‖yh(x)− zh(x)‖ ≤ ‖x0 − z0‖ eL(x−x0). (VII.2.9)

Page 328: 2374131 Una Introduccion Al Analisis Numerico

316 VII Ecuaciones Diferenciales

Antes de demostrar esta proposicion vale la pena recalcar que si fsatisface una condicion de Lipschitz, es decir (VII.2.8), el polıgono de Euleres unico paa h dado.

Demostracion.- Se tiene:

y1 = y0 + h0f(x0, y0),

z1 = z0 + h0f(x0, z0),

obteniendo como desigualdad

‖y1 − z1‖ ≤ ‖y0 − z0‖+ h0L ‖y0 − z0‖≤ (1 + h0L) ‖y0 − z0‖≤ eh0L,

procediendo de manera recursiva, se obtiene

‖yk − zk‖ ≤ eLhk−1 ‖yk−1 − zk−1‖≤ eL(x−x0) ‖y0 − z0‖ .

Teorema VII.2.3.- Cauchy. Sea D = (x, y)|x0 ≤ x ≤ x0 + a, ‖y − y0‖ ⊂U ; supongase:i) f |D continua, A = max

(x,y)∈D‖f(x, y)‖, α = min(a, b/A),

ii) ‖f(x, y)− f(x, z)‖ ≤ L ‖y − z‖ si (x, y), (x, z) ∈ D;entonces:a) Si |h| → 0, entonces los polıgonos de Euler yh(x) convergen uniforme-

mente sobre [x0, x0 + α] hacia una funcion ϕ(x).b) ϕ(x) es solucion de y′ = f(x, y), y(x0) = y0.c) La solucion es unica sobre [x0, x0 + α].

Demostracion.- Inicialmente se mostrara, que si hk es una sucesion de sub-divisiones de [x0, x0 + α] con |hk| → 0, entonces la sucesion de poligonos deEuler asociada, es una sucesion de Cauchy para la norma de la convergenciauniforme. Para tal efecto, se mostrara que

∀ǫ > 0∃δ > 0 tal que |h| < δ,∣∣∣h∣∣∣ < δ

=⇒ ∀x ∈ [x0, x0 + α] se tiene∥∥yh(x)− yh(x)

∥∥ < ǫ.

donde h es una division con |h| < δ y h una division mas fina que h.

Page 329: 2374131 Una Introduccion Al Analisis Numerico

VII.2 Metodo de Euler 317

Sea ǫ > 0 dado, entonces existe δ > 0 tal que si |x− x| ≤ δ y‖y − y‖ ≤ Aδ implica que ‖f(x, y)− f(x, y)‖ ≤ ǫ. Esto es cierto por quef es uniformemente continua sobre D.

Por la proposicion VII.2.1, se tiene

‖yh(x)− y0 + (x− x0)f(x0, y0)‖ ≤ ǫ |x− x0| ,

de donde

∥∥yh(x)− yh(x)∥∥ ≤ ǫ

[(x1 − x0)e

L(x−x1) + · · ·+ (x− xk)eL(x−xk)]

≤∫ x

x0

eL(x−s)ds = ǫeL(x−x0) − 1

L

≤ ǫeLα − 1

L,

por consiguiente, yh(x) es una sucesion de Cauchy, con δ que no dependede x. Como consecuencia inmediata, se tiene que la sucesion converge haciauna funcion ϕ(x) que ademas es continua.

La demostracion del punto b) se basa en los siguientes hechos: yh(x0) =y0 implica que ϕ(x0) = y0, se considera el modulo de continuidad de f ,definido por

ǫ(δ) = sup‖f(x, y)− f(x, y)‖ | |x− x| ≤ δ, ‖y − y‖ ≤ Aδ,

se observa inmediatamente, que ǫ(δ)→ 0 si δ → 0. Utilizando la proposicionVII.2.2, se obtiene

‖yh(x + δ)− yh(x)− δf(x, yh(x))‖ ≤ δǫ(δ),

de donde, se tiene

‖ϕ(x + δ)− ϕ(x)− δf(x, ϕ(x))‖ ≤ δǫ(δ),

efectuando el pasaje al lımite, se obtiene

ϕ′(x) = f(x, ϕ(x)).

La unicidad del punto c) ha sido ya demostrada en el corolario VII.1.12

Corolario VII.2.4.- f : U → Rn (U ⊂ ×Rn) continuamente diferenciable.

D = (x, y)|x0 ≤ x ≤ x0 + α, ‖y − y0‖ ≤ b ⊂ U .

Page 330: 2374131 Una Introduccion Al Analisis Numerico

318 VII Ecuaciones Diferenciales

Sobre D se tiene ‖f(x, y)‖ ≤ A,

∥∥∥∥∂f

∂y(x, y)

∥∥∥∥ ≤ L,

∥∥∥∥∂f

∂x(x, y)

∥∥∥∥ ≤M .

Entonces

‖y(x)− yh(x)‖ ≤ M + AL

L

(eL(x−x0) − 1

)|h| , (VII.2.10)

donde y(x) es solucion de y′ = f(x, y), y(x0) = y0.

Demostracion.- Remontando la demostracion del teorema precedente, setiene

‖yh(x)− y(x)‖ ≤ ǫeL(x−x0) − 1

L.

Puesto que f es diferenciable, se tiene

‖f(x, y)− f(x, y)‖ ≤ L ‖y − y‖+ M |x− x|≤ A |h|+ |h| ,

de donde planteando ǫ = (LA + M) |h| se tiene (VII.2.10).

Efectos de los Errores de Redondeo

Generalmente no se puede calcular la solucion exacta del esquema (VII.2.4);se calcula solamente la solucion del esquema perturbado dado por

y∗n+1 = y∗

n + hnf(tn, y∗n) + hnµn + n (VII.2.11)

donde µn designa el error con el cual es calculado la funcion f y n los erroresde redondeo cometidos por la computadora. Se supondra que |µn| ≤ µ y|n| ≤ .

Con la hipotesis suplementaria que f es continuamente diferenciable,como en en el corolario VII.2.4, se tiene planteando en = y∗

n − yn ysustrayendo (VII.2.11) con (VII.2.4),

e∗n+1 = e∗n + hn[f(tn, y∗n)− f(tn, yn)] + hnµn + n. (VII.2.12)

Puesto que f es diferenciable, se obtiene de (VII.2.12) el siguiente esquema

e∗n+1 = e∗n + hn[∂f

∂y(tn, yn)e∗n] + hnµn + n +O(‖e∗n‖2). (VII.2.13)

Planteando zn = hne∗n, despreciando O(‖e∗n‖2) y suponiendo que hn = hconstante, se obtiene el siguiente esquema para zn, con

zn+1 = zn + h[∂f

∂y(tn, yn)zn] + h(hµn + n), (VII.2.14)

Page 331: 2374131 Una Introduccion Al Analisis Numerico

VII.2 Metodo de Euler 319

de donde zn es la solucion numerica exacta obtenida a partir del metodo deEuler de la ecuacion

z′(t) = [∂f

∂y(t, y(t))]z(t) + (hµ(t) + (t)). (VII.2.15)

En lugar de estudiar la solucion numerica de (VII.2.15), se estudiara lasolucion de este problema cuando h tiende a 0. Qualquier solucion dela ecuacion diferencial (VII.2.15) no puede ser identicamente nula porla existencia del termino no homogeneo no nulo, para h suficientementepequeno este termino no homogeneo es no nulo. Sea C = max ‖z(t)‖ cuandoh = 0, por otro lado denotando zh(t) la solucion de (VII.2.15) para un h fijo,se tiene que zh(t) converge uniformente hacia z0(t) cuando h tiende a 0. Porlo tanto, existe un intervalo cerrado J ⊂ [t0, t0 + T ] y h0 para los cuales

‖zh(t)‖ ≥ C

2∀t ∈ J, ∀h ≤ h0.

Puesto que e∗n ≈ z(tn)/h, se tiene que

limh→0

e∗n =∞.

Acaba de observarse que cuando la longitud de paso hn tiende a 0,el error debido al redondeo toma un lugar preponderante, distorsionandocompletamente cualquier resultado numerico. En la figura VII.2.2 puedeverse un comportamiento aproximado del error de redondeo en funcion deh.

h

Err

or

Figura VII.2.2. Error de Redondeo en el Metodo de Euler.

La pregunta natural que surge es: ¿Cual es el h mınimo que se puedetomar sin que el error de redondeo sea preponderante? La respuesta a esta

Page 332: 2374131 Una Introduccion Al Analisis Numerico

320 VII Ecuaciones Diferenciales

pregunta tiene dos fuentes, la primera que radica en la practica numerica,y la segunda en un analisis sobre el origen de los otros errores que ocurrendurante la implementacion del metodo. Ambos estudios llegan a la conclusionde

hmin ≥ C√

eps, (VII.2.16)

donde eps es la precision de la computadora.Las mayoraciones que se acaban de dar son por lo general demasiado

pesimistas, por ser rigurosos matematicamente, uno se situa en la situacionmas desfavorable posible. Por otro lado si se toma h muy pequeno, inferiora eps, el algoritmo se mantiene estacionario.

Estabilidad del Metodo de Euler

En la anterior subseccion se pudo observar la incidencia directa del error deredondeo. En esta parte se analizara la propagacion del error de redondeoen la solucion numerica. Considerese el problema siguiente

y′ = λy, y(0) = y0. (VII.2.17)

El metodo de Euler con paso constante, da el siguiente esquema

yn+1 = yn + hλyn, (VII.2.18)

supongase que en lugar de y0, se introduce una aproximacion y0, planteandoen = yn − yn donde yn es la solucion numerica de la ecucion (VII.2.17) convalor inicial y0. Los en verifican la siguiente relacion:

en+1 = en + hλen, e0 = (y0 − y0),

de dondeen = (λh + 1)ne0. (VII.2.19)

Por consiguiente, el esquema (VII.2.17) sera estable siempre y cuando

limn→∞

en = 0,

situacion que sucede cuando |λh + 1| < 1. Por consiguiente, para obtener unmetodo estable es necesario que

hmax =2

|λ| . (VII.2.20)

Por lo expuesto en la anterior subseccion y en esta, se tiene necesariamenteque la longitud de paso esta acotada inferiormente e superiormente. Lacota inferior impide que el error de redondeo distorsione completamente

Page 333: 2374131 Una Introduccion Al Analisis Numerico

VII.2 Metodo de Euler 321

la solucion numerica del problema, mientras que la cota superior en losproblemas lineales impide que el metodo diverga. La idea de estabilidadpuede generalizarse a problemas diferenciales lineales de mayor dimension.Por ejemplo, considerese el problema

y′ = Ay, y(0) = y0.

Con el procedimiento utilizado anterioremente e introduciendo normas enlos lugares apropiados es facil mostrar que el metodo de Euler es estable si

ρ(A + I)h < 1, (VII.2.21)

donde ρ(A + I) es el radio espectral de la matriz A + I. Planteando z = λh,se tiene estabilidad en el metodo, si y solamente si |z + 1| < 1. De donde, setiene definida una region de estabilidad, dada en la figura VII.2.3, la parteachurada del cırculo corresponde a la region donde el metodo es estable.

1−1

i

−i

Figura VII.2.3. Region de Estabilidad del Metodo de Euler

El siguiente ejemplo ilustra, que el metodo de Euler no es un metodomuy apropiado para resolver ciertos problemas diferenciales a valor inicial.Considerese, el problema

y′(x) = −100y(x) + cosx,

y(0) = 0.(VII.2.22)

La solucion de este problema, esta dada por

y(x) =100

10001cos x +

1

10001sin x + Ce−100x,

con C una constante determinada por la condicion inicial. Puede observarseque para x = π, se tiene

y(π) ≈ − 100

10001≈ −0, 01. (VII.2.23)

Page 334: 2374131 Una Introduccion Al Analisis Numerico

322 VII Ecuaciones Diferenciales

Aplicando el metodo de Euler con paso constante se tiene:

h1 =π

165→ yh(π) = −9.999× 10−3,

h2 =π

155→ yh(π) = −60.101.

No obstante que h2 − h1 ≈ 1.2 × 10−3, la diferencia de los resultados esabismal. La explicacion de este fenomeno de inestabilidad ha sido explicadomas arriba.

El problema dado por (VII.2.22) esta dentro una categorıa de problemasdiferenciales conocidos con el nombre de ecuaciones diferenciales rigidas, verHairer & Wanner. Para evitar aberraciones en los resultados numericos enla resolucion numerica de esta clase de problemas, el metodo de Euler puedemodificarse, obteniendo ası el:

Metodo de Euler Implıcito

En lugar de utilizar el esquema dado por (VII.2.4); el metodo de Eulerimplıcito, esta dado por el esquema

yk+1 = yk + hkf(xk+1, yk+1). (VII.2.24)

Puede observarse inmediatamente, que para determinar yk+1 se debe resolveruna ecuacion, que en lo general no es lineal. Comparando con la versionexplıcita del metodo de Euler, esto constituye una dificultad adicional, puespara evaluar yk+1 debe utilizarse un metodo de resolucion de ecuaciones,como ser el metodo de Newton. Puede mostrarse, ver Hairer & Wanner,que si hk es lo suficientemente pequeno, la convergencia del metodo deNewton, o de otro metodo de resolucion esta asegurada. Se ha expuestola desventaja principal del metodo de Euler implıcito, respecto al metodode Euler explıcito. A continuacion se expondra la principal motivacionde utilizar la version implıcita en determinadas situaciones. La principaldesventaja del metodo de Euler explıcito en radica en la falta de estabilidadcuando h no es los suficientemente pequeno, ver el ejemplo en el cual para2 pasos muy proximos, las soluciones numericas del problema (VII.2.22)difieren de manera significativa. El analisis de estabilidad del metodo deEuler implıcito es muy similar a la del metodo de Euler explıcito, enefecto considerando el problema (VII.2.18), se tiene que el metodo implıcitosatisface la siguiente relacion recursiva para el error

en+1 = en + λhen+1, (VII.2.25)

de donde, se obtiene de manera explıcita

en+1 =1

1− λhen, (VII.2.26)

Page 335: 2374131 Una Introduccion Al Analisis Numerico

VII.2 Metodo de Euler 323

teniendo de esta manera estabilidad en la propagacion de los errores deredondeo, si y solamente si

|1− λh| > 1. (VII.2.27)

Para los problemas de la forma y′ = Ay, (VII.2.27) y remplazando z = λh,se obtiene el dominio de estabilidad dado por

|z − 1| > 1, (VII.2.28)

el cual esta dado en la figura VII.2.3.

1

Figura VII.2.3. Region de Estabilidad del Metodo de Euler Implıcito.

Ejercicios

1.- Aplicar el metodo de Euler al problema

y′ = y2, y(0) = 1.

Evaluar y(1/4).Utilizar pasos constantes, (por ejemplo h=1/6). Estimar el error con elcorolario VII.2.4. Comparar esta estimacion con el error exacto.

2.- Demostrar el resultado siguiente: Si el problema

y′ = f(x, y), y(x0) = y0,

con f : U → Rn continua, U ⊂ ×Rn abierto y (x0, y0) ∈ U posee unay una sola solucion sobre el intervalo I, entonces los polıgonos de Euleryh(x) convergen uniformemente sobre I hacia esta solucion.

3.- Aplicar el metodo de Euler al sistema

y′1 = −y2,

y′2 = y1,

y1(0) = 1,

y2(0) = 0.

Utilizar pasos constantes para encontrar una aproximacion de la solucionen el punto x = 0.4. Estimar el error como en el ejercicio 1 y compararlacon el error exacto. La solucion exacta es y1(x) = cosx, y2(x) = − sin x.

Page 336: 2374131 Una Introduccion Al Analisis Numerico

VII.3 Metodos de Runge-Kutta

En la anterior seccion se formulo el metodo de Euler en su version explıcitacomo en su version implıcita. Uno de los grandes problemas con el cualse debe confrontar en la utilizacion de este metodo, consiste en la faltade precision de este, ver el corolario VII.2.4, motivo por el cual, los pasosde integracion deben ser demasiado pequenos, induciendo de esta maneragrandes perturbaciones debido al error de redondeo.

En esta seccion se pretende construir metodos cuya precision sea maselevada, permitiendo ası menos evaluaciones y una menor incidencia delerror de redondeo en los calculos. Se estudiara los metodos conocidos comometodos a un paso, en contraposicion a los metodos multipasos que serantratados en la siguiente seccion.

Se pretende calcular una aproximacion de la solucion de

y′ = f(x, y), y(x0) = y0, (VII.3.1)

sobre el intervalo [x0, xe]. Se procede como sigue: De la misma manera queen el metodo de Euler, se particiona [x0, xe] en subintevalos x0 < x1 < · · · <xN = xe, se denota hn = xn+1−xn y se calcula yn ≈ y(xn) por una formulade la forma

yn+1 = yn + hnΦ(hn, xn, yn). (VII.3.2)

Una tal formula se llama metodo a un paso, por que el calculo de yn+1 utilizalos valores de hn, xn, yn de un paso solamente.

Puede observarse facilmente que el metodo de Euler corresponde bien aesta categorıa de metodos a un paso. Vale la pena recalcar que los metodosde la forma (VII.3.2) no solamente son metodos a un paso, si no que tambienexplıcitos. Para saber mas referirse a Hairer & Wanner. Para simplificar lanotacion, solamente se considerara el primer paso, es decir cuando n = 0 en(VII.3.2) y escribir h en lugar de h0.

Para obtener otros metodos numericos se integra (VII.3.1) de x0 a x0+h.La expresion que se obtiene, esta dada por

y(x0 + h) = y0 +

∫ x0+h

x0

f(t, y(t))dt. (VII.3.3)

La idea central consiste en remplazar la integral de (VII.3.3) por unaexpresion que la aproxime. Por ejemplo, si se utiliza h(f(x0, y0)) comoaproximacion se tiene el metodo de Euler Explıcito. Por consiguiente, laidea sera utilizar formulas de cuadratura que tienen un orden mas elevado.

Page 337: 2374131 Una Introduccion Al Analisis Numerico

VII.3 Metodos de Runge-Kutta 325

Como ejemplo de la utilizacion de este ingenioso argumento, se tiene elmetodo de Runge. Se toma la formula del punto medio que es una formulade cuadratura de orden 2. Obteniendo ası

y(x0 + h) ≈ y0 + hf

(x0 +

h

2, y(x0 +

h

2)

), (VII.3.4)

obteniendo posteriormente el valor desconocido y(x0 + h/2) mediante elmetodo de Euler. Esto da

y1 = y0 + hf

(x0 +

h

2, y0 +

h

2f(x0, y0)

). (VII.3.5)

La interpretacion geometrica del metodo de Runge, ver figura VII.3.1,consiste en hacer pasar una recta tangente por el punto medio de las curvasintegrales de la ecuacion diferencial, obteniendo este punto medio medianteuna tangente que sale de (x0, y0). Ver la figura VII.3.1.

x x x0 0 0+h/2 +h

Figura VII.3.1 Metodo de Runge

Kutta en 1901, generalizo la idea de Runge, conduciendo a la definicionsiguiente de los metodos que llevan sus nombres.

Definicion VII.3.1.- Un metodo de Runge-Kutta a s pisos, esta dada por:

k1 = f(x0, y0),

k2 = f(x0 + c2h, y0 + ha21k1),

k3 = f(x0 + c3h, y0 + h(a31k1 + a32k2)),

...

ks = f(x0 + csh, y0 + h(as1k1 + · · ·+ as,s−1ks−1));

y1 = y0 + h(b1k1 + · · ·+ bsks);

(VII.3.6)

Page 338: 2374131 Una Introduccion Al Analisis Numerico

326 VII Ecuaciones Diferenciales

donde los ci, aij , bj son coeficientes. El metodo se representa por el esquema

c1 = 0

c2 a21

c3 a31 a32

......

.... . .

cs as1 as2 · · · as,s−1

b1 b2 · · · bs−1 bs

(VII.3.7)

Los metodos de Euler, como tambien los metodos de Runge y Heun estandados en la tabla III.3.1

Tabla III.3.1. Primeros metodos de Runge-Kutta

0

1

Euler

0

1/2 1/2

0 1

Runge

0

1/3 1/3

2/3 0 2/3

1/4 0 3/4

Heun

Por razones de cuadratura, se supondra siempre que los ci satisfacen siempre

c1 = 0, ci =

i−1∑

j=1

aij , i = 2, . . . , s. (VII.3.8)

La definicion de orden de cuadratura para las formulas de cuadratura,puede extenderse a los metodos de Runge-Kutta de la siguiente manera.

Definicion VII.3.2.- Se dice que el metodo de Runge-Kutta dado por(VII.3.6) tiene el orden p si, para cada problema y′ = f(x, y), y(x0) = y0

con f suficientemente derivable, el error despues de un paso satisface

y1 − y(x0 + h) = O(hp+1), cuando h→ 0. (VII.3.9)

La diferencia (VII.3.9) se llama error local del metodo.

El metodo de Euler es un metodo de orden 1, por que

y(x0 + h) = y0 + hy′(x0) +O(h2) = y0 + hf(x0, y0) +O(h2) = y1 +O(h2).

Page 339: 2374131 Una Introduccion Al Analisis Numerico

VII.3 Metodos de Runge-Kutta 327

El metodo de Runge esta basado sobre la formula del punto medio que esuna formula de cuadratura de orden 2:

y(x0 + h) = y0 + hf (x0 + h/2, y(x0 + h/2)) +O(h3).

Remplazando y(x0 + h/2) por el valor y0 + (h/2)f(x0, y0) del metodo deEuler, se agrega un termino de tamano O(h3). Entonces, este metodo tieneorden p = 2.

El metodo de Heun, ver tabla VII.3.1, se obtiene a partir de la formulade cuadratura

y(x0 + h) = y0 +h

4

(f(x0, y0) + 3f

(x0 +

2h

3, y(x0 +

2h

3)

))+O(h4),

si se remplaza y(x0 + 2h/3) por la aproximacion del metodo de Runge. Dedonde el metodo de Heun tiene el orden p = 3.

Utilizando la suposicion (VII.3,8) que es una condicion simplificadora,se tiene la siguiente proposicion.

Proposicion VII.3.3.- La condicion (VII.3.8) implica que es suficienteconsiderar problemas autonomos de la forma y′ = f(y) para verificar lacondicion de orden.

Demostracion.- Se supone que (VII.3.9) es satisfecha para los problemasautonomos de la forma y′ = F (y), y(x0) = y0.

Considerese un problema de la forma y′ = f(x, y), y(x0) = y0, el cual esequivalente al problema

y = f(x, y),

x = 1,

y(0) = y0,

x(0) = 0,

obteniendo ası

Y ′ = F (Y ), donde Y =

(xy

), F (Y ) =

(1

f(x, y),

)(VII.3.10)

con valor inicial Y0 = (x0, y0)t. La aplicacion del metodo de Runge-Kutta al

problema (VII.3.10) da

Ki = F

Y0 + h

i−1∑

j=1

aijKj

=

(1ki

), Y1 = Y0 + h

s∑

i=1

biKi =

(x1

y1

),

lo que es equivalente a (VII.3.6), por que

Y0 + h

i−1∑

j=1

aijKj =

(x0

y0

)+ h

i−1∑

j=1

aij

(1kj

)=

(x0 + cih

y0 + h∑i−1

j=1 aijkj

).

Page 340: 2374131 Una Introduccion Al Analisis Numerico

328 VII Ecuaciones Diferenciales

El siguiente paso, es de estudiar un procedimiento que permita deter-minar metodos de Runge-Kutta de ordenes mas elevados. Un buen ejerciciosera construir el metodo de Kutta que es de orden 4.

Construccion de un metodo de orden 4

La idea principal de la construccion del metodo de Runge, es considerar losdesarrollos en serie de Taylor de la solucion exacta y(x0+h), como tambien dela solucion numerica obtenida a partir del metodo, que se la denota por y1(h).Luego comparar las series, para obtener condiciones sobre los coeficientes delmetodo.

Serie de Taylor de la solucion exacta

Considerese el problema de Cauchy

y′ = f(y), y(x0) = y0. (VII.3.11)

derivando la ecuacion (VII.3.11), se obtiene para la solucion exacta

y′′ =f ′yy′ = f ′

yf(y)

y′′′ =f ′′y (y′, f(y)) + f ′

yf ′yy′ = f ′′

y (f(y), f(y)) + f ′yf ′

yf(y)

y(4) =f ′′′y (f(y), f(y), f(y)) + 3f ′′

y (f ′yf(y), f(y) + f ′

yf ′′y (f(y), f(y))

+ f ′yf ′

yf ′yf(y),

de donde la serie de Taylor de la solucion exacta esta dada por

y(x0 + h) = y0 + hf(y0) +h2

2!f ′

yf(y0)

+h3

3!

(f ′′

y (f(y0), f(y0)) + f ′yf ′

yf(y0))

+(f ′′′

y (f(y), f(y), f(y)) + 3f ′′y (f ′

yf(y), f(y)

+ f ′yf ′′

y (f(y), f(y)) + f ′yf ′

yf ′yf(y)

)+O(h5).

(VII.3.12)

Serie de Taylor de la solucion numerica

Para calcular la serie de Taylor de y1, es suficiente determinar las series delos

ki = f(x0 + hi−1∑

j=1

aijkj). (VII.3.13)

Ahora bien, se puede considerar (VII.3.13) como una ecuacion a punto fijo,pudiendo ası aproximar los ki por el metodo de las aproximaciones sucesivas.Comenzando la primera aproximacion de ki, se tiene

ki = f(y0) +O(h),

Page 341: 2374131 Una Introduccion Al Analisis Numerico

VII.3 Metodos de Runge-Kutta 329

utilizando (VII.3.8), se obtiene

ki = f(y0) + cihfyf(y0) +O(h2).

La segunda iteracion da como resultado

ki = f(y0 + hcif(y0) + h2∑

j

aijcjfyf(y0) +O(h3))

= f(y0) + cihfyf(y0) + h2∑

j

aijcjfyfyf(y0) +h2

2c2i f

′′y (f(y0), f(y0))

+O(h3).

Efectuando todavıa una vez mas una iteracion, e introduciendo los valoresobtenidos en la definicion (VII.3.5) de yi, se obtiene

y1 = y0 + h

(∑

i

bi

)f0 +

h2

2

(2∑

i

bici

)(f ′f)0 (VII.3.14)

+h3

3!

(

3∑

i

bic2i

)(f ′′(f, f))0 +

6∑

ij

biaijcj

(f ′f ′f)0

+h4

4!

(∑

i

bic3i

)(f ′′′(f, f, f))0 +

8∑

ij

biciaijcj

(f ′′(f ′f ′f))0

+

24

ijk

biaijajkck

(f ′f ′f ′f)0

+O(h5),

donde el subındice 0 indica que las evaluaciones deben ser hechas en el puntoy0.

Comparando los coeficientes de (VII.3.12) y (VII.3.14), se encuentranlas condiciones que deben satisfacer los coeficientes ci, bi y aij para contarcon un metodo de orden 4. Estas condiciones se las enuncia en el:

Teorema VII.3.4.- Condiciones de Orden. El metodo de Runge-Kutta(VII.3.6) tiene el orden 4 si los coeficientes satisfacen (VII.3.8) y

i

bi = 1, (VII.3.15a)

i

bici =1

2, (VII.3.15b)

i

bic2i =

1

3, (VII.3.15c)

Page 342: 2374131 Una Introduccion Al Analisis Numerico

330 VII Ecuaciones Diferenciales

ij

biaij =1

6, (VII.3.15d)

i

bic3i =

1

4, (VII.3.15e)

ij

biciaijcj =1

8, (VII.3.15f)

ij

biaijc2j =

1

12, (VII.3.15g)

ijk

biaijajkbk =1

24. (VII.3.15h)

Es necesario remarcar que si el metodo satisface solamente (VII.3.15a),(VII.3.15a,b) o (VII.3.15,a,b,c) tiene el orden 1, 2 o 3 respectivamente.

El siguiente paso es la resolucion del sistema (VII.3.15), para s = 4.Este sistema consiste de 8 ecuaciones no lineales para 10 parametros bi,aij ; los ci estan determinados por la condicion (VII.3.8). Las condiciones(VII.3.15a,b,c,e) traducen el hecho que (bi, ci) es una formula de cuadraturade orden 4. Por consiguiente los bi pueden ser determinados si los ci sonconocidos. En particular, se obtiene

b3c3(c3 − c2)(c4 − c3) = −c2c4

2+

c2 + c3

3− 1

4. (VII.3.16)

Por otro lado (VII.3.15g)−c2·(VII.3.15d) da

b4a43c3(c3 − c2) =1

12− c2

6, (VII.3.17)

y c4·(VII.3.15d)−(VII.3.15f) implica que

b3(c4 − c3)a32c2 =c4

6− 1

8. (VII.3.18)

Si se multiplica (VII.3.17) con (VII.3.18), luego (VII.3.16) con (VII.3.15h),se obtiene para la misma expresion, las dos formulas:

b4a43a32c2 · b3c3(c3 − c2)(c4 − c3) =

(1

12− c2

6

)(c4

6− 1

8

),

b4a43a32c2 · b3c3(c3 − c2)(c4 − c3) =

(−c2c4

2+

c2 + c3

3− 1

4

)/24,

lo que es equivalente ac2(1− c4) = 0.

Page 343: 2374131 Una Introduccion Al Analisis Numerico

VII.3 Metodos de Runge-Kutta 331

Puesto que c2 6= 0, consecuencia de la condicion (VII.3.15h), se tienenecesariamente que c4 = 1. La solucion general del sistema (VII.3.16), sela obtiene de la manera siguiente.

Metodo de Resolucion.- Plantear c1 = 0, c4 = 1; c2 y c3 son parametroslibres; calcular b1, b2, b3, b4 tales que la formula de cuadratura sea de orden4; calcular a32 utilizando (VII.3.18), a43 utilizando (VII.3.19) y a42 provienede (V II.3.15d); finalmente calcular a21, a31, a41 de (VII.3.8) para i = 2, 3, 4.

Entre los metodos de orden 4, los mas conocidos estan dados en la tablaVII.3.2.

Tabla VII.3.2. Metodos de Kutta

0

1/2 1/2

1/2 0 1/2

1 0 0 1

1/6 2/6 2/6 1/6

Metodo de Runge-Kutta

0

1/3 1/3

2/3 −1/3 1

1 1 −1 1

1/8 3/8 3/8 1/8

Regla 3/8

Metodos Encajonados

Para resolver un problema realista, un calculo a paso constante es engeneral ineficiente. Existen diversas causas para esta ineficiencia: la primeraes que se debe conocer a priori una estimacion del error local cometido,lo cual es complicado en general ocasionando una perdida de generalidaden los programas a implementarse. La otra razon fundamental que existenintervalos donde los pasos de integracion pueden ser de longitud mayor. Elprincipal problema reside en como escoger los pasos de integracion. La ideaque puede resolver satisfactoriamente estos problemas consiste en escogerpasos de integracion de manera que el error local sea en todo caso inferior oigual a Tol dado por el utilizador. Motivo por el cual es necesario conoceruna estimacion del error local. Inspirados en el programa GAUINT descritoen VI.3, se construye un metodo de Runge-Kutta con y1 como aproximacionnumerica, y se utiliza la diferencia y1 − y1 como estimacion del error localdel metodo menos preciso.

Se da un metodo de orden p a s pisos, con coeficientes ci, aij , bj . Se buscaun metodo de orden p < p que utiliza las mismas evaluaciones de f , es decir

y1 = y0 + h(b1k1 + · · ·+ bsks), (VII.3.19)

Page 344: 2374131 Una Introduccion Al Analisis Numerico

332 VII Ecuaciones Diferenciales

donde los ki estan dados por (VII.3.3). Para tener mas libertad, se agrega amenudo un termino que contenga f(x1, y1) a la formula (VII.3.19), de todasmaneras se debe calcular f(x1, y1) para el paso siguiente, determinando asıy1, como

y1 = y0 + h(b1k1 + · · ·+ bsks + bs+1f(x1, y1)). (VII.3.20)

Un tal metodo encajonado puede ser representado en forma de un esquema,ver la tabla VII.3.3.

Tabla VII.3.3. Metodos encajonados

c1 = 0

c2 a21

c3 a31 a32

......

.... . .

cs as1 as2 · · · as,s−1

(1) b1 b2 · · · bs−1 bs

b1 b2 · · · bs−1 bs (bs+1)

El siguiente paso es la determinacion del h optimal. Si se aplica el metodocon un valor h, la estimacion del error satisface

y1− y1 = (y1−y(x0 +h))+(y(x0 +h)− y1) = O(hp+1)+O(hp+1) ≈ Chp+1.(VII.3.21)

El h optimal, denotado por hopt, es aquel donde esta estimacion es proximade Tol, es decir

Tol ≈ Chp+1opt . (VII.3.22)

Eliminando C de las dos ultimas formulas, se obtiene

hopt = 0.9 · h · p+1

√Tol

‖y1 − y1‖. (VII.3.23)

El factor 0.9 se lo agrega para volver el programa mas seguro.

Algoritmo para la seleccion automatica de paso.

Al iniciar los calculos, el utilizador provee una subrutina que calcule el valorde f(x, y), los valores iniciales x0, y0 y una primera eleccion de h.

A) Con h, calcular y1, err = ‖y1 − y1‖ y hopt dado por (VII.3.23).

B) Si err ≤ Tol, el paso es aceptado, entonces

x0 := x0 + h, y0 := y1, h := min(hopt, xend − x0);

Page 345: 2374131 Una Introduccion Al Analisis Numerico

VII.3 Metodos de Runge-Kutta 333

si no el paso es rechazado

h := hopt.

C) Si x0 = xend se ha terminado, si no se recomienza por (A) y se calculael paso siguiente.

La practica numerica muestra que es aconsejable remplazar (VII.3.23)por

hopt = h ·min(5, max(0.2, 0.9(Tol/err)1/p+1

).

Para la norma dada en la relacion (VII.3.23), se utiliza en general

‖y1 − y1‖ =

√√√√ 1

n

n∑

i=1

(yi1 − yi1

sci

)2

, donde sci = 1 + max(|yi0| , |yi1|).

(VII.3.24)

En la literatura especializada, estos metodos encajonados con controlde paso automatico, se los denota por RKpp donde RK son las inicialesde Runge-Kutta y p, p son los ordenes de los metodos encajonados. En laactualidad la utilizacion de tales metodos es muy comun. En la tabla VII.3.4se da el esquema del metodo de Dormand-Prince RK54; este metodo esanalizado minuciosamente en Hairer & Wanner.

Tabla VII.3.4. Metodo Dormand-Prince 5(4)

0

1

5

1

5

3

10

3

40

9

40

4

5

44

45−56

15

32

9

8

9

19372

6561−25360

2187

64448

6561−212

729

19017

3187−355

33

46732

5247

49

176− 5103

18656

135

3840

500

1113

125

192−2187

6784

11

84

y135

3840

500

1113

125

192−2187

6784

11

840

y15179

576000

7571

16695

393

640− 92097

339200

187

2100

1

40

Page 346: 2374131 Una Introduccion Al Analisis Numerico

334 VII Ecuaciones Diferenciales

En el ejemplo siguiente se detallara la construccion de un metodoencajonado con seleccion de paso automatico. Por razones de simplicidad, seconsiderara un metodo RK32.

Ejemplo

Tomese un metodo de orden p = 3 a s = 3 pisos, que en este caso sera elmetodo de Heun, ver tabla VII.1.1 y se buscara un metodo encajonado deorden p = 2 de la forma (VII.3.20), es decir se aumenta s de 1, agregandoun (s + 1)-emo piso con los coeficientes as+1,i, para i = 1, . . . , s.De esta manera se obtiene el siguiente sistema de ecuaciones para loscoeficientes bi, el cual esta dado por:

b1 + b2 + b3 + b4 = 1

1

3b2 +

2

3b3 + b4 =

1

2.

Puedo observarse que para que el metodo encajonado tenga un ordenigual a 2, se requieren 2 condiciones, quedando ası dos grados de libertad.Al igual que en el metodo de Heun, puede plantearse b2 = 0, b4 puedeescogerse libremente, por ejemplo b4 = 1/2 de donde por la segunda

ecuacion se deduce facilmente que b3 = 0 y por la primera ecuacionb1 = 1/2. Por lo tanto se obtiene el esquema dado en la tabla VII.3.5.

Tabla VII.3.5. Ejemplo de Metodo Encajonado

0

1/3 1/3

2/3 0 2/3

1 1/4 0 3/4

1/2 0 0 1/2

Soluciones Continuas

Uno de los incovenientes mayores de los metodos formulados en esta seccionconsiste en el hecho que estos dan las soluciones en un conjunto discretode puntos. Una primera alternativa es unir estas soluciones con polıgonos,si los puntos donde el metodo ha dado las soluciones. El resultado no essatisfactorio desde varios puntos de vista. Si el metodo es de orden elevadola interpolacion lineal, vista en el Capıtulo III, tiene como efecto la perdidade precision. Desde el punto de vista grafico las soluciones dejan de ser

Page 347: 2374131 Una Introduccion Al Analisis Numerico

VII.3 Metodos de Runge-Kutta 335

lisas. Debido a estas dos razones expuestas es necesario complementar estosmetodos con alternativas que permitan dar soluciones densas.

Existen varias alternativas validas que permiten subsanar esta falenciade los metodos de Runge-Kutta. La primera consiste en la construccion de losmetodos de Runge-Kutta Continuos. Para tal efecto, se considera un metodode Runge-Kutta dado de antemano. Se desea evaluar utilizando este esquemaen el punto x∗ = x0 + θh con 0 < θ ≤ 1. Los coeficientes de este metodose los denota por ci(θ), aij(θ), bj(θ). Ahora bien, el metodo sera interesantedesde el punto de vista numerico, si los coeficientes ci(θ), aij(θ) no dependende θ coincidiendo de esta manera con los del metodo dado de antemano. Sinembargo no es nada raro que el metodo obtenido a partir de los bi(θ) tengaun orden inferior. Esto se debe a que los aij , ci ya estan prescritos. Parailustrar esta construccion considerese el ejemplo siguiente.

Ejemplo

Se considera nuevamente el metodo de Heun dado en la tabla VII.3.1.Utilizando el teorema VII.3.4, remplazando y(x0 + h) por y(x0 + θh) seobtienen las siguientes condiciones de orden para los coeficientes bi(θ):

b1 + b2 + b3 = θ,

1

3b2 +

2

3b3 =

θ2

2,

1

9b2 +

4

9b3 =

θ3

3,

4

9b3 =

θ3

6.

Como puede observarse es imposible que los coeficientes bi puedansatisfacer las condiciones para obtener un metodo de orden 3, por lotanto, uno debe contentarse con obtener un metodo de orden 2 para θdiferente de 1 y para θ = 1 un metodo de orden 3. Tomando las dosprimeras ecuaciones y planteando b2 = 0, como en el metodo de Heun,

se tiene para b3 =3

4θ2 y para b1 = θ(θ− 3

4θ). obteniendo ası, el esquema

dado en la tabla VII.5.6.

Tabla VII.5.6. Ejemplo de Metodo Continuo.

0

1/3 1/3

2/3 0 2/3

θ(θ − 34θ) 0 3

4θ2

Page 348: 2374131 Una Introduccion Al Analisis Numerico

336 VII Ecuaciones Diferenciales

La segunda estrategia para construir soluciones continuas, consiste enutilizar la interpolacion de Hermite con polinomios cubicos, tomando comoextremidades y0, y1 y como derivadas f(x0, y0) y f(x1, y1). Es facil ver,que a diferencia de la primera alternativa es necesario evaluar y1. Viendoel capıtulo III, la interpolacion de Hermite tiene un error del orden O(h4),equivalente a un metodo de tercen orden.

Convergencia de los Metodos de Runge-Kutta

En las subsecciones precedentes, se ha hecho un analisis del error local,intimamente ligado al orden del metodo. Pero no se ha analizado que sucedecon el error global de la solucion numerica. Para analizar este tipo de errores necesario introducir alguna notacion adicional.

Considerese un metodo a un paso

yn=1 = yn + hnΦ(xn, yn, hn), (VII.3.25)

aplicado a una ecuacion diferencial y′ = f(x, y), con valor inicial y(x0) =y0. Es natural plantearse sobre la magnitud del tamano del error globaly(xn)− yn. A continuacion se enunciara un teorema general sobre esta clasede error.

Teorema VII.3.5.- Sea y(x) la solucion de y′ = f(x, y), y(x0) = y0 sobreel intervalo [x0, xe]. Supongase que:a) el error local satisface para x ∈ [x0, xe] y h ≤ hmax

‖y(x + h)− y(x)− hΦ(x, y(x), h)‖ ≤ C · hp+1, (VII.3.26)

b) la funcion Φ(x, y, z) satisface una condicion de Lipschitz

‖Φ(x, y, h)− Φ(x, z, h)‖ ≤ Λ ‖y − z‖ , (VII.3.27)

para h ≤ hmax y (x, y), (x, z) en un vecindario de la solucion.Entonces , el error global admite para xn ≤ xe la estimacion

‖y(xn)− yn‖ ≤ hp C

Λ

(eΛ(xn−x0) − 1

), (VII.3.28)

donde h = maxi

hi, bajo la condicion que h sea lo suficientemente pequno.

Demostracion.- La idea central de la demostracion es estudiar la influenciadel error local, cometido en el paso i-esimo a la propagacion de yn. Enseguida,adicionar los errores acumulados. Ver figura VII.3.2.

Sean yn y zn dos soluciones numericas obtenidas por (VII.3.25) convalores iniciales y0 y z0 respectivamente. Utilizando la condicion de Lipschitzdada por (VII.3.27), su diferencia puede ser estimada como

‖yn+1 − zn+1‖ ≤ ‖yn − zn‖+ hnΛ ‖yn − zn‖= (1 + Λhn) ‖yn − zn‖ ≤ ehnΛ ‖yn − zn‖ .(VII.3.29)

Page 349: 2374131 Una Introduccion Al Analisis Numerico

VII.3 Metodos de Runge-Kutta 337

Recursivamente, se obtiene

‖yn − zn‖ ≤ ehn−1Λehn−2Λ · · · ehiΛ ‖yi − zi‖ .

y el error propagado Ei, ver figura VII.3.2, satisface

‖Ei‖ ≤ eΛ(xn−xi) ‖ei‖ ≤ Chp+1i−1 eΛ(xn−xi), (VII.3.30)

y

0 1 2 3 n

yE

y(x )EE

nn

n−1

1

ee

en−1

2

1

0

x x x x x

Figura VII.3.2. Estimacion del error global.

La desigualdad del triangulo, ası como (VII.3.30) da, ver la figura VII.3.3,para la estimacion de la suma

‖y(xn)− yn‖ ≤n∑

i=1

‖Ei‖ ≤n∑

i=1

hp+1i−1 eΛ(xn−xi)

≤ Chp(h0e

Λ(xn−x1) + · · ·+ hn−2eΛ(xn−xn−1) + hn−1

)

≤ Chp

∫ xn

x0

eΛ(xn−t)dt =Chp

Λ

(eΛ(xn−x0) − 1

).

x

x

x x x x0 1 2

n−1 n

eΛ( x x)n −

Figura VII.3.3. Estimacion de la suma de Riemann.

Page 350: 2374131 Una Introduccion Al Analisis Numerico

338 VII Ecuaciones Diferenciales

Solo queda justificar la implicacion de (VII.3.25) en (VII.3.27), ya que laestimacion (VII.3.25) es valida solamente en un vecindarioU = (x, y)| ‖y − y(x)‖ ≤ b de la solucion exacta. Si se supone que h es losuficientemente pequeno, mas precisamente, si h es tal que

Chp

Λ

(eΛ(xe−x0) − 1

)≤ b,

se estara seguro que todas las soluciones numericas de la figura VII.3.2 sequedaran en U .

Supongase que (VII.3.25) representa un metodo de Runge-Kutta, severificara las hipotesis del teorema precedente. La condicion (VII.3.26) essatisfecha para un metodo de orden p. Solo queda por verificar la condicionde Lipschitz (VII.3.27), para la funcion

Φ(x, y, h) =

s∑

i=1

biki(y), (VII.3.31)

donde

ki(y) = f

x + cih, y + h

i−1∑

j=1

aijkj(y)

. (VII.3.32)

Proposicion VII.3.6.- Si f(x, y) satisface una condicion de Lipschitz‖f(x, y)− f(x, z)‖ ≤ L ‖y − z‖ en un vecindario de la solucion de y′ =f(x, y), la expresion Φ(x, y, h) de (VII.3.31) verifica la condicion (VII.3.27)con

Λ = L

i

|bi|+ (hmaxL∑

ij

|biaij |+ (hmaxL)2∑

ijk

|biaijajk|+ · · ·

.

(VII.3.33)

Demostracion.- La condicion de Lipschitz para f(x, y) aplicado a(VII.3.32) da

‖k1(y)− k1(z)‖ = ‖f(x, y)− f(x, z)‖ ≤ L ‖y − z‖‖k2(y)− k2(z)‖ ≤ L ‖y − z + ha21(k1(y)− k1(z))‖

≤ L(1 + hmaxL |a21|) ‖y − z‖ ,

(VII.3.34)

etc. Las estimaciones (VII.3.34) introducidas en

‖Φ(x, y, h)− Φ(x, z, h)‖ ≤s∑

i=1

|bi| ‖ki(y)− ki(z)‖ ,

Page 351: 2374131 Una Introduccion Al Analisis Numerico

VII.3 Metodos de Runge-Kutta 339

implican (VII.3.27) con Λ dado por (VII.3.33).

Experiencias Numericas

En esta subseccion se mostrara varios ejemplos donde los metodos de Runge-Kutta actuan. Se comparara varios metodos.

1.- Se considera la ecuacion diferencial, con valor inicial,

y′ = −y + sin x, y(0) = 1; (VII.3.35)

la solucion de este problema, esta dada por

y(x) =3

2e−x − 1

2cos x +

1

2sin x. (VII.3.36)

En la figura VII.3.4, se muestra las graficas de diferentes metodos deRunge-Kutta. El intervalo de integracion es [0, 10]. Puede comprobarse,que al igual que en los metodos de integracion, existe una relacion linealentre − log10(Error Global) y el numero de evaluaciones de la funcion,fe. Esta relacion lineal tiene una pendiente 1/p, donde p es el orden delmetodo.

100 10−1 10−2 10−3 10−4 10−5 10−6 10−7 10−8 10−9 10−10100

101

102

103

104

105

106

fefe

err globerr glob

Metodo de Euler

Metodo de Runge

Metodo de Heun

Metodo de Kutta

Metodo 3/8

Figura VII.3.4. Relacion del error global vs fe.

Page 352: 2374131 Una Introduccion Al Analisis Numerico

340 VII Ecuaciones Diferenciales

2.- En esta experiencia numerica, se implementa un metodo encajonado,para este efecto, se toma el metodo dado en uno de los ejemplosprecedentes. La ecuacion diferencial sobre la cual es examinada talmetodo, es una ecuacion diferencial de una reaccion quımica, conocidacomo Brusselator. Por consiguiente, se debe resolver:

y′1 = 1 + y2

1y2 − 4y1,

y′2 = 3y1 − y2

1y2,

y1(0) = 1.5,

y2(0)3,(VII.3.37)

sobre el intervalo [0, 10]. Los resultados obtenidos con Tol = 10−5

son presentados en la figura VII.3.5. En la grafica superior, las doscomponentes de la solucion utilizando la solucion continua del metodode Heun, ver metodos continuos. En la grafica del medio, la longitudde los pasos, los pasos aceptados estan ligados, mientras que los pasosrechazados indicados por ×. En la grafica inferior, la estimacion del errorlocal, como tambien los valores exactos del error local y global.

0 5 10

1

2

3

4

5

6

y1

y2

0 5 10

10−2

10−1

100

10−8

10−7

10−6

10−5

10−4

10−3 Error global

Error local exacto Error local estimado

Figura VII.3.5. Experiencia numerica de un metodo encajonado.

Page 353: 2374131 Una Introduccion Al Analisis Numerico

VII.3 Metodos de Runge-Kutta 341

Ejercicios

1.- Aplicar el metodo de Runge al sistema

y′1 = −y2,

y′2 = y1,

y1(0) = 1,

y2(0) = 0,

con h = 1/5. Comparar el trabajo necesario y la precision del resultadocon el metodo de Euler.

2.- Considerese un metodo de Runge-Kutta a s pisos y de orden p. Mostrarque

s∑

i=1

bicq−1i =

1

qpara q = 1, . . . , p.

es decir, la formula de cuadratura asociada tiene al menos el orden p.

3.- Aplicar un metodo de Runge-Kutta de orden p = s, s es el numero depisos, al problema y′ = λy, donde λ es una constante compleja. Mostrarque la solucion numerica esta dada por

y1 =

s∑

j=0

zj

j!

y0, z = λh.

4.- Construir todos los metodos de Runge-Kutta de orden 3 con s = 3 pisos.

5.- Considerese el problema

y′ =λ

xy + g(x), y(0) = 0

con g(x) suficientemente derivable y λ ≤ 0. Mostrar que este problemaadmite una y una sola solucion. Las derivadas de la solucion en el puntox = 0 son

y(j)(0) =

(1− λ

j

)−1

g(j−1)(0).

6.- Aplicar un metodo de Runge-Kutta al problema del ejercicio anterior,

utilizar la definicion f(x, y) =(1− λ

j

)−1

g(0), para x = 0.

a) Mostrar que el error del primer paso satisface

y(h)− y1 = C2h2g′(0) +O(h3)

donde C2 depende solamente de los coeficientes del metodo.c) Calcular C2 para uno de los metodos de Kutta.

Page 354: 2374131 Una Introduccion Al Analisis Numerico

VII.4 Metodos Multipasos

Los metodos a un paso calculan un valor aproximado yn+1, en el ins-tante tn+1, utilizando unicamente el valor aproximado yn. La utilizacionde varios valores aproximados yn, yn−1, . . ., permite obtener a precisionigual metodos de costo menos elevado; estos metodos son comunmentellamados multipasos, mas precisamente cuando los calculos utilizan r va-lores precedentes: yn, yn−1, . . . , yn−r+1, es decir concernientes los r pasos:hn, hn−1, . . . , hn−r+1, se habla de metodos a r pasos. Entre estos metodos,los metodos de Adams son aquellos que parecen ser a la hora actual los maseficaces cuando el problema diferencial es bien condicionado, seran estudia-dos en esta subseccion. Los algoritmos modernos utilizan estos metodos conun numero variable de pasos y un tamano de paso variables. La variaciondel numero de pasos y la longitud de los pasos permite adaptar el metodoa la regularidad de la solucion, permite tambien de levantar las dificultadesde arranque que presentan los metodos a numero de pasos fijo.

Metodos de Adams Explıcitos

Sea una division x0 < x1 < · · · < xn = xe del intervalo sobre el cual sebusca resolver la ecuacion diferencial y′ = f(x, y) y supongase que se conoceaproximaciones yn, yn−1, . . . , yn−k−1 de la solucion para k pasos consecutivos(yi ≈ y(xj)). De la misma forma que para la derivacion de los metodos deRunge-Kutta, se integra la ecuacion diferencial, para obtener

y(xn+1) = y(xn) +

∫ xn+1

xn

f(t, y(t))dt. (VII.4.1)

Pero en lugar de aplicar una formula de cuadratura standard a la integral(VII.4.1), se remplaza f(t, y(t)) por el polinomiio de grado k−1, que satisfaga

p(xj) = fj , para j = n, n− 1, . . . , n− k + 1; (VII.4.2)

donde fj = f(xj , yj). Ver la figura VII.4.1.

xn−k+1 xn−1 xn xn+1

f f fn−k+1 n−1 n

p(t)

Figura VII.4.1. Metodo de Adams.

Page 355: 2374131 Una Introduccion Al Analisis Numerico

VII.4 Metodos Multipasos 343

Por consiguiente, la aproximacion de y(xn+1) esta definida por

yn+1 = yn +

∫ xn+1

xn

p(t)dt. (VII.4.3)

Si se representa el polinomio p(t) por la formula de Newton, ver el teoremaIII.1.9,

p(t) =

k−1∑

j=0

(j−1∏

i=0

(t− xn−i)

)f [xn, xn−1, . . . , xn−j ], (VII.4.4)

el metodo (VII.4.3) se convierte en

yn+1 = yn +

k−1∑

j=0

(∫ xn+1

xn

j−1∏

i=0

(t− xn−i)

)f [xn, xn−1, . . . , xn−j ]. (VII.4.5)

El caso mas simple de estas formulas de Adams explıcitas consiste cuandola division es equidistante. En esta situacion se tiene xj = x0 + jh, lasdiferencias divididas pueden ser expresadas bajo la forma

f [xn, xn−1, . . . , xn−j ] =∇jfn

j!hh, (VII.4.6)

donde ∇0fn = fn,∇fn = fn − fn−1,∇2fn = ∇(∇fn), . . . son las diferenciasfinitas regresivas.

La formula (VII.4.5), planteando t = xn + sh, se convierte en

yn+1 = yn + h

k−1∑

j=0

γj∇jfn, (VII.4.7)

donde

γj =1

j!

∫ 1

0

j−1∏

i=0

(i + s)ds =

∫ 1

0

(s + j − 1

j

)ds.

Los primeros coeficientes γj estan dados en la tabla VII.4.1.

Tabla VII.4.1. Coeficientes para los metodos de Adams Explıcitos.

j 0 1 2 3 4 5 6 7 8

γj 11

2

5

12

3

8

251

720

95

288

19087

60480

5257

17280

1070017

3628800

Page 356: 2374131 Una Introduccion Al Analisis Numerico

344 VII Ecuaciones Diferenciales

Casos particulares de los metodos de Adams explıcitos son:

k = 1 : yn+1 = yn + hfn, (metodo de Euler);

k = 2 : yn+1 = yn + h

(2

3fn −

1

2fn−1

);

k = 3 : yn+1 = yn + h

(23

12fn −

16

12fn−1 +

5

12fn−2

);

k = 4 : yn+1 = yn + h

(55

24fn −

59

24fn−1 +

37

24fn−2 −

9

24fn−3

).

Si se quiere aplicar este metodo, por ejemplo para k=4, a la resolucionde y′ = f(x, y), y(x0) = y0, es necesario conocer y0, y1, y2 y y3. Despuesse puede utilizar la formula de recurrencia para determinar y4, y5, . . .. Alformular Adams sus metodos, el utilizaba la serie de Taylor de la solucionen el punto inicial, sin embargo es mas comodo empezar con un metodoa un paso del tipo de Runge-Kutta y luego utilizar el metodo multipasocorrespondiente.

En la construccion del metodo de Adams explıcito dado por (VII.4.5),se ha utilizado el polinomio de interpolacion p(t) fuera del intervalo[xn−k+1, xn]. Esta situacion puede provocar grandes errores, ver nuevamenteIII.1. Por lo tanto, este inconveniente puede modificarse considerando los:

Metodos de Adams Implıcitos

La idea central de estos metodos consiste en considerar el polinomio p∗(t)de grado k, que satisface

p∗(t) = fj para, j = n + 1, n, n− 1, . . . , n− k + 1. (VII.4.9)

A diferencia de la version explıcita fn+1 = f(xn+1, yn+1) es todavıa descono-cido. El siguiente paso es definir la aproximacion numerica por

yn+1 = yn +

∫ xn+1

xn

p∗(t)dt. (VII.4.10)

De la misma manera que en el caso explıcito, la formula de Newton da

p∗(t) =k∑

j=0

(j−1∏

i=0

(t− xn−i+1)dt

)f [xn+1, xn, . . . , xn−j+1], (VII.4.11)

de donde el metodo esta dado por

yn+1 = yn +k∑

j=0

(∫ xn+1

xn

j−1∏

i=0

(t− xn−i+1)

)f [xn+1, xn, . . . , xn−j+1].

(VII.4.12)

Page 357: 2374131 Una Introduccion Al Analisis Numerico

VII.4 Metodos Multipasos 345

El caso mas simple de estas formulas de Adams implıcitas consistecuando la division es equidistante, el metodo esta dado por

yn+1 = yn + h

k∑

j=0

γ∗j∇jfn+1, (VII.4.13)

donde

γ∗j =

1

j!

∫ 1

0

j−1∏

i=0

(i + s− 1)ds =

∫ 1

0

(s + j − 2

j

)ds. (VII.4.14)

Los primeros coeficientes γ∗j estan dados en la tabla VII.4.2.

Tabla VII.4.2. Coeficientes para los metodos de Adams Implıcitos.

j 0 1 2 3 4 5 6 7 8

γ∗j 1 −1

2− 1

12− 1

24− 19

720− 3

160− 863

60480− 375

24192− 33953

3628800

Casos particulares de los metodos de Adams implıcitos son:

k = 0 : yn+1 = yn + hfn+1 = yn + hf(xn+1, yn+1);

k = 1 : yn+1 = yn + h

(1

2fn+1 +

1

2fn

);

k = 2 : yn+1 = yn + h

(5

12fn+1 +

8

12fn −

1

12fn−1

);

k = 2 : yn+1 = yn + h

(9

24fn+1 +

19

24fn −

5

24fn−1 +

1

24fn−2

).

Cada una de estas formulas representa una ecuacion no lineal para yn+1, quees de la forma

yn+1 = ηn + hβf(xn+1, yn+1). (VII.4.15)

que puede ser resuelta por el metodo de Newton o simplemente por el metodoiterativo simple.

Metodos Predictor-Corrector

Los metodos de Adams implıcitos tienen la gran ventaja sobre la versionexplıcita, por que las soluciones provistas son mas realistas. Sin embargo lagran dificultad de estos metodos es la resolucion de (VII.4.15). En algunoscasos particulares, como en el caso de los sistemas lineales, esta resolucion

Page 358: 2374131 Una Introduccion Al Analisis Numerico

346 VII Ecuaciones Diferenciales

podra hacerse directamente, pero en el caso general la utilizacion de unmetodo iterativo para resolver el sistema no lineal es necesaria. Por otro lado,es necesario recalcar que yn+1 es una aproximacion de la solucion exacta,motivo por el cual es natural pensar que un calculo muy preciso de yn+1

tal vez no sea necesario. Es por eso, que una mejora de esta situacion puededarse de la manera siguiente. Primero calcular una primera aproximacion porun metodo explıcito, luego corregir este valor, una o varias veces, utilizandola formula (VII.4.15). Con este algoritmo, un paso de este metodo toma laforma siguiente:

P: se calcula el predictor yn+1 = yn + h∑k−1

j=0 γj∇jfn por el metodo deAdams explıcito; yn+1 es ya una aproximacion de y(xn+1).

E: evaluacion de la funcion: se calcula fn+1 = f(xn+1, yn+1).

C: la aproximacion corregida esta dada por yn+1 = ηn + hβfn+1.

E: calcular fn+1 = f(xn+1, yn+1).

Este procedimiento, que se lo denota PECE, es el mas utilizado. Otrasposibilidades son: efectuar varias iteraciones, por ejemplo PECECE, o deomitir la ultima evaluacion de f , es decir PEC, y de tomar fn+1 en el lugarde fn+1 para el paso siguiente.

Metodos BDF

Se ha visto que los metodos de Adams, tanto en su version explıcita, comoen su version implıcita consideran polinomios de interpolacion que pasanpor los fj . Esta manera de abordar el problema de la aproximacion de lassoluciones de un problema diferencial es eficaz cuando el problema diferenciales bien condicionado, pero estos pueden volverse muy costosos desde elpunto de vista computacional para los problemas diferenciales rıgidos. Porconsiguiente, puede ser interesante de utilizar el metodo de las diferenciasretrogradas que sera descrito en esta subseccion.

La idea central de los metodos BDF consiste en considerar el polinomioq(t) de grado k, ver figura VII.4.2, definido por

q(xj) = yj , para j = n + 1, n, . . . , n− k + 1; (VII.4.16)

y se determina yn+1, de manera que

q′(xn+1) = f(xn+1, q(xn+1)). (VII.4.17)

Como en la formula (VII.4.11), la formula de Newton da

q(t) =

k∑

j=0

(j−1∏

i=0

(t− xn−i+1)

)y[xn+1, xn, . . . , xn−j+1]. (VII.4.18)

Page 359: 2374131 Una Introduccion Al Analisis Numerico

VII.4 Metodos Multipasos 347

Cada termino de esta suma contiene el factor (t − xn+1), de donde es muyfacil calcular q′(xn+1), obteniendo ası

k∑

j=0

(j−1∏

i=1

(xn+1 − xn−i+1)

)y[xn+1, xn, . . . , xn−j+1] = f(xn+1, yn+1).

(VII.4.19)

x x x xn−k+1 n−1 n n+1

yq(t)

y

yy

n−k+1n−1

n

n+1

Figura VII.4.2. Metodo de tipo BDF

Para el caso equidistante, (VII.4.19) utilizando (VII.4.6) se convierte en

k∑

j=1

1

j∇jyn+1 = hfn+1. (VII.4.20)

Obteniendo de esta manera, los siguientes casos particulares:

k = 1 : yn+1 − yn = hfn+1;

k = 2 :3

2yn+1 − 2yn +

1

2yn−1 = hfn+1;

k = 3 :11

6yn+1 − 3yn +

3

2yn−1 −

1

3yn−2 = hfn+1;

k = 4 :25

12yn+1 − 4yn + 3yn−1 −

4

3yn−2 +

1

4yn−3 = hfn+1.

De nuevo, cada formula define implıcitamente la aproximacion numericayn+1.

Estudio del Error Local

Al igual de los metodos a un paso, como los metodos de Runge-Kutta, existela nocion de orden para los metodos multipasos, el cual esta ıntimamenteligado al estudio del error local.

Page 360: 2374131 Una Introduccion Al Analisis Numerico

348 VII Ecuaciones Diferenciales

Los metodos multipasos pueden expresarse bajo la forma siguiente

k∑

i=0

αiyn+i = h

k∑

i=0

βifn+i, (VII.4.21)

donde αk 6= 0 y |α0| + |β0| > 0. El metodo es explıcito si βk = 0, si no elmetodo es implıcito.

Definicion VII.4.1.- Sea y(x) una solucion de y′ = f(x, y(x)) y seayn+k el valor obtenido por el metodo (VII.4.21) utilizando yi = y(xi) parai = n, . . . , n + k − 1, ver figurar VII.4.3. Entonces

error local = y(xn+k)− yn+k. (VII.4.22)

Se dice que el metodo (VII.4.21) tiene el orden p si el error local es O(hp+1).

x x x x

y(x)

y

y

yy

n n+1 n+k−1 n+k

n+k

n+k−1

n+1

n

Figura VII.4.3. Definicion del error local.

Para estudiar el error local de un metodo multipaso, se utiliza el operadorL definido por:

L(y, x, h) =k∑

i=0

(αiy(x + ih)− hβiy′(x + ih)) . (VII.4.23)

Como yi = y(xi), para i = n, . . . , n + k− 1 en la definicion dada mas arriba,se tiene que fi = f(xi, y(xi)) = y′(xi) para i = n, . . . , n + k− 1 y la formula(VII.4.21) puede ser expresada bajo la forma

k∑

i=0

αiy(xn + ih) + αk(yn+k − y(xn+k)) =h

k∑

i=0

βiy′(xn + ih)

+ hβ(fn+k − f(xn+k, y(xn+k))),

lo que es equivalente a

L(y, xn, h) =

(αkI − hβk

∂f

∂y(. . .)

)(y(xn+k)− yn+k), (VII.4.24)

Page 361: 2374131 Una Introduccion Al Analisis Numerico

VII.4 Metodos Multipasos 349

el argumento de ∂f/∂y puede ser diferente para cada linea de esta matriz,ver el teorema del valor medio o incrementos finitos. La formula muestra queel error local del metodo (VII.4.21) es O(hp+1) si y solamente si L(y, x, h) =O(hp+1) para toda funcion y(x) que es suficientemente derivable.

Teorema VII.4.2.- Un metodo multipaso tiene el orden p, si y solamentesi sus coeficientes satisfacen

k∑

i=0

αi = 0 yk∑

i=0

αiiq = q

k∑

i=0

βiq−1 para q = 1, . . . , p. (VII.4.25)

Demostracion.- En la formula (VII.4.23), se desarrolla las expresionesy(x + ih) y y′(x + ih) en serie de Taylor y obteniendo

L(y, x, h) =

k∑

i=0

αi

g≥0

y(q)(x)(ih)q

q!− h

k∑

i=0

βi

r≥0

y(r+1)(x)(ih)r

r!

= y(x)

(k∑

i=0

αi

)+∑

g≥1

y(q)(x)hq

q!

(k∑

i=0

αiiq − q

k∑

i=0

βiq−1

).

La condicion L(y, x, h) = O(hp+1) da la condicion (VII.4.25).

Ejemplo

Considerese el metodo de Adams explıcito a k pasos. Para q ≤ k, seconsidera la ecuacion diferencial y′ = qxq−1 cuya solucion es y(x) = xq.En esta situacion, el polinomio p(t) de (VII.4.2) es igual a f(t, y(t)) y elmetodo de Adams explıcito da el resultado exacto. Por consiguiente, setiene L(y, x, h) = 0, ver la formula (VII.4.24) lo que implica

k∑

i=0

(αi(x + ih)q − qβi(x + ih)q−1h

)= 0

y por lo tanto (VII.4.25), planteando x = 0. Entonces, el orden de estemetodo es ≥ k. Se puede mostrar que efectivamente el orden es igual ak.De la misma manera, se muestra que el metodo de Adams implıcito tieneel orden p = k + 1 y el metodo BDF el orden p = k.

Estabilidad

A simple vista la relacion (VII.4.25) permite formular metodos multipaso conun numero dado de pasos con un orden optimal. Sin embargo la experiencia

Page 362: 2374131 Una Introduccion Al Analisis Numerico

350 VII Ecuaciones Diferenciales

numerica mostro que los resultados obtenidos no siempre eran validos. Espor eso necesario introducir una nueva nocion en el estudio de estos metodos.Esta nocion esta intimamente ligada a la estabilidad del metodo. Paracomprender mejor el problema que se plantea con los metodos multipaso,es necesario referirse al siguiente ejemplo enunciado por Dahlquist en 1956.

Se plantea k = 2 y se construye un metodo explicito, β2 = 0, α2 = 1con un orden maximal. Utilizando las condiciones dadas por (VII.4.25) conp = 3, se llega al siguiente esquema:

yn+2 + 4yn+1 − 5yn = h(4fn+1 + 2fn). (VII.4.26)

Una aplicacion a la ecuacion diferencial y′ = y con y(0) = 1 da la formulade recurrencia

yn+2 + 4(1− h)yn+1 + (5 + 2h)yn = 0. (VII.4.27)

Para resolver la ecuacion precedente, se calcula el polinomio caracterısticode esta, obteniendo

ζ2 + 4(1− h)ζ − (5 + 2h) = 0, (VII.4.28)

ecuacion de segundo grado cuyas soluciones son

ζ1 = 1 + h +O(h2), ζ2 = −5 +O(h).

La solucion de (VII.4.27) tiene la forma

yn = C1ζn1 + C2ζ

n2 (VII.4.29)

donde las constantes C1 y C2 estan determinadas por y0 = 1 y y1 = eh. Paran grande, el termino C2ζ

n2 ≈ C2(−5)n es dominante y sera muy dificil que

la solucion numerica converga hacia la solucion exacta. Ver figura VII.4.4.

.0 .5 1.0

1.0

2.0

3.0

h=0.1

h=0.05

h=0.025

h=0.01

Figura VII.4.4. Inestabilidad del metodo VII.4.26.

Page 363: 2374131 Una Introduccion Al Analisis Numerico

VII.4 Metodos Multipasos 351

La razon de la divergencia de la solucion numerica en el ejemplo precedente,es que el polinomio

(ζ) =

k∑

i=0

αiζi, (VII.4.30)

tiene una raiz que es mas grande que 1 en valor absoluto.Para encontrar una condicion necesaria para la convergencia, se consi-

derara el problema y′ = 0 con valores iniciales y0, y1, . . . , yk−1 perturbados.La solucion numerica yn satisface:

αkyn+k + · · ·+ α0yn = 0, (VII.4.31)

y esta dada por una combinacion lineal de:ζn . . . . . . . . . . . . . . . . . . . . si ζ es una raiz simple de (ζ) = 0,ζn, nζn . . . . . . . . . . . . . . . si ζ es una raiz doble de (ζ) = 0,ζn, nζn, . . . , nlζl . . . . . . si ζ es una raiz de multiplicidad l.

Para que la solucion numerica quede acotada, es necesario que lascondiciones de la definicion siguiente sean satisfechas.

Definicion VII.4.3.- Un metodo multipaso es estable, si las raices delpolinomio (ζ) satisfacen

i) si (ζ) = 0 entonces∣∣∣ζ∣∣∣ ≤ 1,

ii) si (ζ) = 0 y∣∣∣ζ∣∣∣ = 1 entonces ζ es una raiz simple de (ζ).

Se puede mostrar facilmente que los metodos de Adams tienen comopolinomio caracterıstico

(ζ) = ζk−1(ζ − 1).

Por consiguiente los metodos de Adams son estables para la definicion queacaba de ser enunciada. Por otro lado se muestra igualmente que los metodosBDF son estables solamente para k ≤ 6.

Existe un resultado muy importante en la teorıa de la estabilidad de losmetodos multipaso, cuya demostracion escapa a los objetivos del libro. Esteresultado es conocido como la primera barrera de Dahlsquist.

Teorema VII.4.4.- Primera barrera de Dahlsquist. Para un metodo mul-tipaso estable, el orden k satisface p ≤ k + 2 si k es par, p ≤ k + 1 si k esimpar y p ≤ k si el metodo es explıcito.

Convergencia de los Metodos Multipaso

Debido a la complejidad de la demostracion, en esta subseccion setratara, solamente el caso equidistante.

Page 364: 2374131 Una Introduccion Al Analisis Numerico

352 VII Ecuaciones Diferenciales

Teorema VII.4.5.- Supongase que los k valores de partida satisfagan‖y(xi)− yi‖ ≤ C0h

p, para i = 0, 1, . . . , k − 1. Si el metodo multipaso(VII.4.21) es de orden p y estable, entonces el metodo es convergente deorden p, es decir el error global satisface

‖y(xn)− yn‖ ≤ Chp, para xn − x0 = nh ≤ Const. (VII.4.34)

Demostracion.- El punto esencial de la demostracion es el siguiente: Seescribe formalmente el metodo multipaso (VII.4.21) bajo la forma de unmetodo a un paso. El metodo multipaso es de la forma, suponiendo αk = 1

yn+k = −k−1∑

i=0

αiyn+i + hΨ(xn, yn, . . . , yn+k−1, h). (VII.4.35)

Para un metodo explıcito βk = 0, Ψ esta dada por

Ψ(xn, yn, . . . , yn+k−1, h) =k−1∑

i=0

βif(xn+i, yn+i),

y para un metodo general, Ψ esta definida implıcitamente por

Ψ(xn, yn, . . . , yn+k−1, h) =

k−1∑

i=0

βif(xn+i, yn+i) (VII.4.36)

+ βkf

(xn+k, hΨ(xn, yn, . . . , yn+k−1, h)−

k−1∑

i=0

αiyn+i

).

Luego se considera los supervectores

Yn = (yn+k−1, . . . , yn+1, yn)t,

pudiendo de esta manera escribir el metodo dado por (VII.4.35), bajo laforma

Yn+1 = AYn + hΦ(xn, Yn, h), (VII.4.37)

donde

A=

−αk−11 −αk−21 · · · −α11 −α011 0 · · · 0 01 . . . O. . .

. . ....1 0

, Φ(x, Y, h)=

Ψ(x, Y, h)00...0

.

(VII.4.37)

Page 365: 2374131 Una Introduccion Al Analisis Numerico

VII.4 Metodos Multipasos 353

El siguiente paso en la demostracion es introducir el error local. Se consideralos valores yn, . . . , yn+k−1 sobre la solucion exacta, denotando

Y (xn) = (y(xn+k−1, . . . , y(xn+1), y(xn))t , (VII.4.38)

y aplicando una vez el metodo multipaso. Esto da

Yn+1 = AY (xn) + hΦ(xn, Y (xn), h).

La primera componente de Yn+1 − Y (xn+1) es exactamente el error localdado por (VII.4.22), mientras que las otras componentes son iguales a cero.Como el metodo es de orden p, por hipotesis, se tiene

∥∥∥Yn+1 − Y (xn+1)∥∥∥ ≤ C1h

p+1, para xn+1 − x0 = (n + 1)h ≤ Const.

(VII.4.39)A continuacion se debe analizar la propagacion del error, es decir introducirla estabilidad del metodo. Considerese una segunda solucion numerica,definida por

Zn+1 = AZn + hΦ(xn, Zn, h)

y estimar la diferencia Yn+1 − Zn+1. Como ilustracion del siguiente pasoen la demostracion se considerara solamente los metodos de Adams, pues elcaso general requiere de la utilizacion de otra norma, cuyo estudio escapa elalcanze de este libro. Por consiguiente

yn+k − zn+k

yn+k−1 − zn+k−1

...yn+1 − zn+1

=

yn+k−1 − zn+k−1

...yn+1 − zn+1

yn − zn

+h

Ψ(xn, Yn, h)−Ψ(xn, Zn, h)0...0

.

Utilizando la norma infinita y condicion de Lipschitz para Ψ que es conse-cuencia de la de f(x, y), se obtiene

‖Yn+1 − Zn+1‖ ≤ (1 + hΛ) ‖Yn − Zn‖ . (VII.4.40)

Ahora se vera la acumulacion de los errores propagados. Esta parte de lademostracion es exactamente igual que para los metodos a un paso, ver el

Page 366: 2374131 Una Introduccion Al Analisis Numerico

354 VII Ecuaciones Diferenciales

paragrafo VII.3 y la figura VII.4.5.

y

0 1 2 3 n

yE

y(x )EE

nn

n−1

1

ee

en−1

2

1

0

x x x x x

Figura VII.3.2. Estimacion del error global para metodos multipaso.

Ejercicios

1.- Para los coeficientes del metodo de Adams explıcito, demostrar laformula de recurrencia siguiente:

γm +1

2γm−1 +

1

3γm−2 + · · ·+ 1

m + 1γ0 = 1.

Indicacion.-Introducir la serie

G(t) =∞∑

j=0

γjtj , γj = (−1)j

∫ 1

0

(−sj

)ds

y demostrar que

G(t) =

∫ 1

0

(1− t)−sds y − log(1− t)

tG(t) =

1

1− t,

enseguida, desarrollar la segunda formula en serie de Taylor y compararlos coeficients de tm.

2.- Considerese la identidad

y(xn+1) = y(xn−1 +

∫ xn+1

xn−1

f(t, y(t))dt

para la solucion de la ecuacion diferencial y′ = f(x, y).

Page 367: 2374131 Una Introduccion Al Analisis Numerico

VII.4 Metodos Multipasos 355

a) Remplazar en la identidad la funcion desconocida f(t, y(t)) por elpolinomio p(t), como se ha hecho para construir el metodo de Adamsexplıcito. Deducir la formula de Nystron

yn+1 = yn−1 + hk−1∑

j=0

κj∇jfn.

b) Calcular los primeros κj .

c) Verificar la identidad κj = 2γj − γj−1, donde γj son los coeficientesdel metodo de Adams explıcito.

3.- Mostrar que el metodo BDF a k pasos tiene orden k.

4.- Calcular el orden para la formula de Nystron, ver ejercicio 2.

5.- Un metodo multipaso se dice simetrico, si

αj = −αk−j , βj = βk−j .

Mostrar que un metodo simetrico siempre tiene un orden par.6.- Dado un predictor de orden p− 1

k∑

i=0

αPi yn+1 = h

k−1∑

i=0

βPi fn+1, (P )

y un corrector de orden p

k∑

i=0

αiyn+1 = h

k∑

i=0

βifn+1. (C)

a) Escribir el metodo P (EC)ME bajo la forma

Yn+1 = AYn + hΦ(xn, Yn, h).

b) Mostrar que este metodo es convergente de orden p, si el corrector esestable, no es necesario que el predictor sea estable.

Page 368: 2374131 Una Introduccion Al Analisis Numerico
Page 369: 2374131 Una Introduccion Al Analisis Numerico

Bibliografıa

Al final de cada libro o artıculo, se indica entre corchetes y caracteres italicosel capıtulo y/o seccion al que hace referencia.

J.H Ahlberg, E.N. Nilson & J.L. Walsh (1967): The Theory of Splinesand Their Applications. Academic Press, New York. [III.2]

G. Arfken (1985): Mathematical Methods for Physicists. Academic Press,London. [I.3], [VI.2].

V.I. Arnol’d (1992): Ordinary Differential Equations. Springer-Text-book. [VII.1].

K.E. Atkinson (1978): An Introduction to Numerical Analysis. JohnWiley & Sons. [I], [III], [VI].

O.A Axelsson (1976): A class of iterative methods for finite elementequations. Comp. Math. in Appl. Mech. and Eng. 9. [II.4].

N. Bakhbalov (1976): Methodes Numeriques. Editions Mir, Moscou. [I],[III], [VI].

C. de Boor (1978): A Practical Guide to Splines. Springer-Verlag, Berlin.[III.2].

C. Brezinski (1977): Acceleration de la Convergence en Analyse Numeri-que. Lectures Notes in Mathematics, Nr. 584, Springer-Verlag. [III.3], [VI.3].

J.C Butcher (1987): The Numerical Analysis of Ordinary DifferentialEquations. John Wiley & Sons. [VII].

H. Cartan (1977): Cours de Calcul Differentiel. Hermann, Paris. [IV.2],[IV.3].

P.G Ciarlet (1982): Introduction a l’analyse numerique matricielle et al’optimisation. Mason, Paris. [II].

M. Crouzeix & A.L. Mignot (1984): Analyse Numerique des EquationsDifferentielles. Mason, Paris. [III], [VI] , [VII].

G. Dahlquist & A. Bjorck (1974): Numerical Methods. Prentice-Hall. [I],[III], [VI].

R. Dautray & J.L. Lions (1988): Mathematical Analysis and NumericalMethods for Science and Technology, volume 2, Functional and VariationalMethods. Springer-Verlag. [VI.4].

P.J. Davis & P. Rabinowitz (1975): Methods of Numerical Integration.Academic Press, New York. [VI].

Page 370: 2374131 Una Introduccion Al Analisis Numerico

358 Bibliografıa

J. Dieudonne (1980): Calcul Infinetisimal. Hermann, Paris. [IV.1],[IV.2], [VI.4].

J.J. Dongarra, C.B. Moler, J.R. Bunch & G.W. Stewart (1979): LIN-PACK Users’ Guide. SIAM, Philadelphia. [II].

A. Gramain (1988): Integration. Hermann, Paris. [VI.1], [VI.4].

R.P. Grimaldi (1989): Discrete and Combinatorial Mathematics. Addi-son-Wesley Publishing Company. [II.3].

E. Hairer, S.P. Nørsett & G. Wanner (1987): Solving Ordinary Differen-tial Equations I. Nonstiff Problems. Springer Series in Comput. Math., vol.8. it [VII].

E. Hairer & G. Wanner. Solving Ordinary Differential Equations. StiffProblems. Springer Series in Comput. Math., vol. 11. [VII].

P. Henrici (1962): Discrete Variable Methods in Ordinary DifferentialEquations. John Wiley & Sons. [VII].

R.A. Horn & C.R. Johnson (1985): Matrix Analysis. Cambridge Univer-sity Press. [II.1], [V.1].

G.H Golub & C.F. Van Loan (1989): Matrix Computations. The JohnsHopkins University Press, Baltimore and London. [II].

K.L. Kantorovitch & G. Akilov (1981): Analyse Fonctionnelle, Volume2.Editions Mir, Moscou. [IV.2], [IV.3]

V.I. Krylov (1962): Approximate calculation of integrals. Macmillan, NewYor. [VI].

S. Lang (1987): Linear Algebra. Springer-Verlag. [II], [V].

M. Marden (1966): Geometry of Polinomials. American MathematicalSociety, Providence, Rhede Island, 2nd Edition. [IV.1]

J.M. Ortega & W.C. Rheinboldt (1970): Iterative Solution of NonlinearEquations in Several Variables. Academic Press, New York. [IV].

A.M. Ostrowski (1966): Solution of Equations and Systems of Equations.Academic Press, New York, 2nd edition. [IV].

B.N. Parlett (1980): The Simmetric Eigenvalue Problem. Prentice-Hall,Englewood Cliffs, New Jersey. [V].

R. Piessens, E. de Doncker-Kapenga, C.W. Uberhuber & D.K. Kahaner(1983): QUAD-PACK. A Subroutine Package for Automatic Integration.Springer Series in Comput. Math., vol. 1. [VI].

W.H Press, B.R. Flannery, S.A Teukolsky & W.T Vetterling (1989):Numerical Recipies. The Art of Scientific Computing (Version FORTRAN).Cambridge University Press, Cambridge. [VI.4].

C.R. Rao: (1973): Linear Statistical Inference and Its Applications.John Wiley & Sons. [II.5]

Page 371: 2374131 Una Introduccion Al Analisis Numerico

Bibliografıa 359

W. Rudin (1976): Principles of Mathematical Analysis. MacGraw Hill,trird edition. [IV.2], [VI.1].

A.A Samarski & E.S. Nikolaev (1982): Metodos de solucion de lasecuaciones reticulares, Tomo I y II. Editorial Mir, Moscou. [III.3], [III.4]

B.T. Smith, J.M. Boyle, Y. Ikebe, V.C. Klema & C.B Moler (1970):Matrix Eigensystem Routines: EISPACK Guide. 2nd ed., Springer-Verlag,New York. [V]

J. Stoer & R. Bulirsch (1980): Introduction to Numerical Analysis.Springer-Verlag, New York. [I], [III], [VI].

G.H. Stewart (1973): Introduction to Matrix Computations. AcademicPress, New York. [II].

L. Swhwartz (1970): Analyse, Topologie generale et analyse fonction-nelle. Hermann, Paris. [IV.2].

R.A. De Vore & G.G. Lorentz (1991): Constructive Approximation.Springer-Verlag. [III.2].

J.H. Wilkinson (1963): The Algebraic Eigenvalue Problem. ClarendonPress, Oxfordd. [V].

J.H. Wilkinson (1965): Rounding Errors in Algebraic Process. Prentice-Hall, New York. [I].

J.H. Wilkinson (1969): Rundungsfehler. Springer-Verlag, Berlin. [I], [II].

J.H. Wilkinson & C. Reinsch (1971): Handbook for Automatic Compu-tation, Volume II, Linear Algebra. Springer-Verlag, New York. [II], [V].

FORTRAN/9000 Reference (1991): Hewlett-Packard Company. [I.2].

Page 372: 2374131 Una Introduccion Al Analisis Numerico
Page 373: 2374131 Una Introduccion Al Analisis Numerico

Indice de Sımbolos

Los sımbolos matematicos que aparecen en el libro, estan enunciados en esteglosaria de la manera siguiente. En la primera columna el sımbolo mismo, almedio el nombre de este y a la derecha la pagina donde esta definido.

P(x) problema, 2.arr(x) redondeo de x, 8.eps precision de la computadora, 8.‖ ‖ norma de vector, 25.‖ ‖ norma de matriz, 26.1 vector 1, 29.cond(A) condicion de la matriz A, 29.LR descomposicion de Gauss, 37.diag(r1, r2, . . . , rn) matriz diagonal, 45.D1/2 matriz raiz cuadrada, 45.ω coeficiente de relajacion, 56.⊗ producto tensorial de matrices, 60.‖x‖A norma natural, 72.Q matriz ortogonal, 87.A+ pseudo inversa de una matriz, 93.y[xi0 , . . . , xik

] diferencia dividida de orden k, 107.∇kyi diferencia finita progresiva, 109.∇kyi diferencia finita regresiva, 109.Tn(x) polinomio de Chebichef, 113.li(x) polinomio de Lagrange, 116.Λn constante de Lebesgue, 116.f ′

x aplicacion derivada, 168.ρ(A) radio espectral, 171.ker nucleo de una aplicacion lineal, 214.χA(λ) polinomio caracterıstico, 214.A∗ matriz adjunta, 215.U matriz unitaria, 215.Pk(τ ) nucleo de Peano de orden k, 251.Pk(x) polinomio de Legendre, 262.FN transformada discreta de Fourier, 286.y ∗ k producto de convolucion, 292.

Page 374: 2374131 Una Introduccion Al Analisis Numerico
Page 375: 2374131 Una Introduccion Al Analisis Numerico

Indice Alfabetico

acelerador de convergencia, 147,276

Adamsmetodo explıcito, 341metodo implıcito, 343

Aitken, 276algoritmo, 2

biseccion, 161, 164Cholesky, 43epsilon, 278Euclides, 157Gauss, 37Horner, 3,7

aplicacion de spline, 142aproximacion de Broyden, 198armonica, sucesion, 148axiomas de Moore-Penrose, 96

BDF, metodos, 345Broyden, 198Brusselator, 339Bulirsch, sucesion, 148busqueda

de Fibonacci, 129de pivote parcial, 41

calculo derivada, 177calculo variacional, 310Cardano, 154Cauchy, 297cero

localizacion, 155multiplicidad, 105

Chebichefpolinomio, 73, 113puntos, 116teorema, 74

cociente de Rayleigh, 223,227

constantede Lebesgue, 116

condiciondel problema a valores propios, 217del problema lineal,30,33de un problema, 10de una matriz, 29,30Lipschitz, 297,298

construccionpolinomio de interpolacion, 106metodo de orden 4, 327spline, 133

convergenciaacelerador, 147interpolacion, 119metodo de Gauss-Newton, 204metodo de Gauss-Seidel, 49metodo de Jacobi, 49metodos de Runge-Kutta, 335metodos multipaso, 350spline, 133

costo, 3descomposicion LR, 39descomposicion QR, 90transformada rapida de Fourier, 291

Cramer, regla de, 35

Dahlsquist, primera barrera, 350descomposicion

Cholesky, 44, 45Jordan, 219LR, 37, 38, 39QR, 87Schur, 215, 234valores singulares, 94

diferenciasdivididas, 107finitas, 109

direccionconjugada, 69, 70Newton, 194

dispositivoideal de calculo, 2material de calculo, 8

Dormand & Prince, 332

Page 376: 2374131 Una Introduccion Al Analisis Numerico

364 Indice Alfabetico

ecuacionescon derivadas parciales, 59cuadraticas, 152cubicas, 153de grado cuarto, 154diferenciales, 296Euler-Lagrange, 310no resolubles por radicales, 155resolubles por radicales, 152

eficiencia, 3ǫ-algoritmo, 278error

de aproximacion, 5de la aproximacion spline, 136de interpolacion, 111del metodo, 5de truncacion, 4formula de cuadratura, 250extrapolacion, 149metodo gradiente, 68metodo gradiente condicionado, 72metodo Gauss-Newton, 205,metodo Multipaso, 346metodo Newton, 176transformada discreta de Fourier,

287errores de redondeo, 115estabilidad

algoritmo de Gauss, 41,42,43backward analysis, 13forward analysis, 12metodo de Euler, 319metodo de Euler explıcito, 322metodo multipaso, 348numericamente estable, 12

Eulerefecto de los errores de redondeo,

317estabilidad, 319metodo, 313metodo implıcito, 321polıgono, 313

extrapolacionpolinomial, 145tablero, 147error, 149

factorizacion,incompleta de Cholesky, 77

fenomeno de Runge, 124FFT, 290Fibonacci, busqueda, 129formas tridiagonales, 227formula

de Cardano, 154de Newton, 107de Nystrom, 354

de Rodrıguez, 262formula de cuadratura, 248

error, 250Gauss,

264–266orden, 249orden elevado, 259simetrica, 249

Fouriererror, 287serie de, 284transformada, 284transformada discreta, 286transformada rapida, 290

funcionintegrable, 244modelo, 83ortogonal, 260peso, 259funciones con oscilaciones, 281

Galois, teorema, 155GAUINT, 272Gauss,

algoritmo de eliminacion, 36, 37formulas de cuadratura,

264–266convergencia Gauss-Newton, 204metodo Gauss-Newton, 203

Gerschgorin, teorema, 156, 232grado de aproximacion, 120grafo dirigido, 49

Hermite, 104, 138Heun, 325

Page 377: 2374131 Una Introduccion Al Analisis Numerico

Indice Alfabetico 365

Interpolacionconvergencia, 119de Lagrange, 104–108de Hermite, 104trigonometrica, 289

Kantorovich, ver teoremaKonrad, 271

Lagrange, 104λ-estrategia, 194Lebesgue, 116Levenberg-Marquandt, 210Lipschitz, 297

mantisa, 8matriz

adjunta, 215definida positiva, 43Frobenius, 155, 221Hessenberg, 227Hilbert, 31, 87Householder, 88, 228irreducible, 49, 50no-negativa, 50normal, 216ortogonal, 30pseudo-inversa de una, 92simetrica, 43tridiagonal, 227Toeplitz, 292unitaria, 215Vandermonde, 31

metodo,Adamas explıcitos, 341Adamas implıcitos, 343a un paso, 323BDF, 345de la biseccion, 229de la potencia, 223de la potencia generalizada, 233de la potencia inversa, 225Dormand & Prince, 332encajonados, 330Euler, 313, 325falsa posicion, 165Gauss Newton, 203-205Gauss Seidel, 48–56Gradiente, 67Gradiente Conjugado, 69Gradiente Conjugado

Precondicionado, 75

Heun, 325iterativos, 163–172iterativo simple, 169Jacobi,48–56Levenberg-Marquandt, 210Maehly, 158Multipaso, 341Newton, 157, 174–199Newton con Relajacion, 193Newton Simplificado, 184predictor-corrector, 344QR, 237QR con shift, 238Sobrerelajacion SOR, 56, 58Runge-Kutta, ver Runge-KuttaSSOR precondicionado, 78

mınicmos cuadrados, 83interpretacion estadıstica, 84interpretacion geometrica, 85

Misovski,ver teorema Newton-Misovski

modificaciones de Gauss-Newton, 207modulo de continuidad, 121

Newtondireccion, 194Kantorovich, 185metodo, 157, 174–199metodo con Relajacion, 193metodo simplificado, 184Misovski, 179regla de, 247

norma,absoluta, 26ciudad-bloque, 25de la convergencia uniforme, 25de una matriz, 26de un vector, 25euclidiana, 25Frobenius, 33monotona, 26natural, 72

Nucleo de Peano, 251–254nucleo resolvente, 303

operacion elemental, 2orden

formula de cuadratura, 249metodo de Runge-Kutta, 325construccion de

un metodo de orden 4, 327

Page 378: 2374131 Una Introduccion Al Analisis Numerico

366 Indice Alfabetico

Peano, 251–254Pearson, 99Perron-Frobenius, 52pivote, 40polıgono de Euler, 313polinomio

caracterıstico, 214Chebichef, 73, 113, 262Hermite, 104interpolacion de Hermite, 104, 138, 262interpolacion de Lagrange, 104Jacobi, 262ortonormales, 260Lagrange, 104, 105Laguerre, 262Legendre, 262, 263

precision de la computadora, 8primitiva, 245problema, 2

a valor inicial, 296bien condicionado, 10con valores en la frontera, 300de Cauchy, 296de minimizacion, 66mal condicionado, 10

potencia inversa de Wielandt, 225procedimienteo ∆2 de Aitken, 276producto

de Kronecker, 65escalar de funciones, 260sesquilineal, 284tensorial de matrices, 60

Property A de Young, 55punto

flotante, 8de Chebichef, 117punto fijo, 169

pseudo-inversa de una matriz, 92

QUADPACK, 271

Rayleigh, 223,227redondeado, 8

region de estabilidad, 320regla

del punto medio, 246del trapecio, 246de Newton, 247de Simpson, 247Cramer, 35

resolvente, 303Rodriguez, 262Romberg, 148Runge-Kutta

condiciones de orden, 327,328convergencia, 335error glogal, 335error local, 325Dormand-Prince, 332esquema, 325Euler, 325Heun, 325Kutta, 330metodos, 324metodos encajonados, 330orden, 325regla 3/8, 330Runge, 325soluciones continuas, 333

Schur, 215,234serie de Fourier, 284Shooting

multiple, 307simple, 303

soluciones continuas, 333SOR, 56Spline

aplicacion,142construccion, 133cubico, 131,132error, 136fijo en los bordes, 132natural, 132

SSOR precondicionado, 78radio espectral, 58

Page 379: 2374131 Una Introduccion Al Analisis Numerico

Indice Alfabetico 367

ω optimal, 58Sturm, 159

sucesionesarmonica, 148Bulirsch, 148Romberg, 148Sturm, 159

Sylvester, 232

tablero de extrapolacion, 147teoremaCauchy-Lipschitz, 297, 315

Chebichef, 74Dirichlet, 285del Muestreo, 289Fundamental del Algebra, 152Galois, 155Gerschgorin, 156, 232Jordan, 219Newton-Kantorovich, 185Newton-Misovski, 179Pearson, 99Perron-Frobenius, 52punto fijo, 169Schur, 215Sylvester, 232Weirstrass, 124Wilkinson, 42Wynn, 278

transformadadiscreta de Fourier, 286rapida de Fourier, 290

valor absoluto de un vector, 26valor propio, 215valores singulares, 94Van der Pol, 305vector propio, 215

Weirstrass, 124Wilkinson, 42Wynn, 278

Page 380: 2374131 Una Introduccion Al Analisis Numerico

368 Indice Alfabetico

Una Introduccion al Analisis Numerico es un libroque pretende dar un enfoque moderno de los topicosintroductorios de esta disciplina. Las nociones deestabilidad y error son analizadas minuciosamente en cadatema. La formulacion de metodos y algoritmos es tratadade una manera construccionista, evitando de esta maneralas recetas y trucos que aperecen en otros libros.

El libro cuenta con siete capıtulos que dan una idea delo que constituye actualmente el Analisis Numerico. Estosson: Preliminares, Sistemas Lineales, Interpolacion,Ecuaciones No Lineales, Calculo de Valores Propios,Integracion Numerica y Ecuaciones Diferenciales.

Por sus caracterısticas, este libro puede utilizarse comotexto base, o bien como un complemento bibliografico.Esta destinado a alumnos o profesionales interesados enel Analisis Numerico. Como prerequisito para una buenautilizacion de este libro, se requiere tener los conocimientosbasicos de analisis y algebra lineal