Índicegeneral - Inicio - Departamento de Matemáticasmatematicas.unex.es/~montalvo/Grado en...

118
Índice general 1. El Espacio Normado R n 1 1. Normas equivalentes ....................... 6 2. Continuidad y limites de funciones ............... 9 2.1. Reglas de cálculo para límites .............. 13 2.2. Límites iterados y límites direccionales ......... 15 3. Funciones continuas sobre compactos .............. 20 Ejercicios ............................. 21 2. La Diferencial de Fréchet 25 1. Funciones diferenciables ..................... 25 1.1. Derivadas parciales .................... 26 1.2. Derivadas direccionales ................. 28 1.3. Diferenciabilidad en un punto .............. 29 1.4. Operaciones con funciones diferenciables ........ 34 1.5. Interpretación geométrica de la diferenciabilidad ... 38 Ejercicios ............................. 40 2. El teorema del valor medio ................... 45 2.1. Consecuencias ...................... 50 Ejercicios ............................. 53 3. Derivadas parciales de orden superior .............. 55 Ejercicios ............................. 58 3. Teoremas de Taylor 59 1. Teoremas de Taylor ........................ 61 1.1. Teorema global de Taylor ................ 62 1.2. Teorema local de Taylor ................. 63 1.3. Unicidad del polinomio de Taylor ............ 65 2. ANEXO: El álgebra de los desarrollos de Taylor ........ 68 Ejercicios ............................. 70 1

Transcript of Índicegeneral - Inicio - Departamento de Matemáticasmatematicas.unex.es/~montalvo/Grado en...

Índice general

1. El Espacio Normado Rn 11. Normas equivalentes . . . . . . . . . . . . . . . . . . . . . . . 62. Continuidad y limites de funciones . . . . . . . . . . . . . . . 9

2.1. Reglas de cálculo para límites . . . . . . . . . . . . . . 132.2. Límites iterados y límites direccionales . . . . . . . . . 15

3. Funciones continuas sobre compactos . . . . . . . . . . . . . . 20Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2. La Diferencial de Fréchet 251. Funciones diferenciables . . . . . . . . . . . . . . . . . . . . . 25

1.1. Derivadas parciales . . . . . . . . . . . . . . . . . . . . 261.2. Derivadas direccionales . . . . . . . . . . . . . . . . . 281.3. Diferenciabilidad en un punto . . . . . . . . . . . . . . 291.4. Operaciones con funciones diferenciables . . . . . . . . 341.5. Interpretación geométrica de la diferenciabilidad . . . 38Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

2. El teorema del valor medio . . . . . . . . . . . . . . . . . . . 452.1. Consecuencias . . . . . . . . . . . . . . . . . . . . . . 50Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

3. Derivadas parciales de orden superior . . . . . . . . . . . . . . 55Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3. Teoremas de Taylor 591. Teoremas de Taylor . . . . . . . . . . . . . . . . . . . . . . . . 61

1.1. Teorema global de Taylor . . . . . . . . . . . . . . . . 621.2. Teorema local de Taylor . . . . . . . . . . . . . . . . . 631.3. Unicidad del polinomio de Taylor . . . . . . . . . . . . 65

2. ANEXO: El álgebra de los desarrollos de Taylor . . . . . . . . 68Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

1

4. Funciones Implícitas 731. Teorema de punto fijo . . . . . . . . . . . . . . . . . . . . . . 732. El problema de las funciones implícitas . . . . . . . . . . . . . 74

2.1. Existencia de funciones implícitas . . . . . . . . . . . . 762.2. Funciones implícitas: derivación . . . . . . . . . . . . . 80Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

5. Subvariedades Diferenciables de Rk 871. Variedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 872. Variedad tangente . . . . . . . . . . . . . . . . . . . . . . . . 89

Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

6. Funciones Inversas 931. Derivada de funciones inversas . . . . . . . . . . . . . . . . . 932. Inversión local . . . . . . . . . . . . . . . . . . . . . . . . . . 96

Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

7. Extremos de funciones de varias variables 991. Extremos relativos . . . . . . . . . . . . . . . . . . . . . . . . 99

1.1. Condiciones necesarias de extremo . . . . . . . . . . . 1001.2. Caso particular . . . . . . . . . . . . . . . . . . . . . . 104

2. Extremos condicionados . . . . . . . . . . . . . . . . . . . . . 107Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

2. Integración de Funciones de Varias variables 251. Medida de Lebesgue en Rn . . . . . . . . . . . . . . . . . . . 25

9. Cálculo Integral 1591. El Teorema de la Convergencia Dominada . . . . . . . . . . . 1592. Integrales dependientes de un parámetro . . . . . . . . . . . . 162

Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1643. El Teorema de Fubini-Tonelli . . . . . . . . . . . . . . . . . . 166

Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1714. Cambio de Variables en la Integral Múltiple . . . . . . . . . . 173

Transformación de conjuntos medibles . . . . . . . . . 173El teorema del cambio de variables . . . . . . . . . . . 176

Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

10.Integrales de línea 1831. Curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

Bibliografía 187

Capítulo 1

El Espacio Normado Rn

En este curso supondremos conocida la estructura de R y su topología,así como las propiedades de las funciones continuas o derivables de una va-riable. Todo este bagaje inicial se usará, sin necesidad de hacer las demostra-ciones que correspondan. Nuestro objetivo fundamental serán las funcionesde varias variables, más exactamente el cálculo diferencial para funcionesdefinidas en subconjuntos de Rn. Muchos de los resultados serán extensio-nes a las varias variables de otros ya estudiados en una variable, otros encambio serán nuevos por responder a problemas que no tienen sentido en1-variable.

A pesar de que sólo estamos interesados en las funciones de un númerofinito de variables, muchos conceptos y demostraciones se establecerán parafunciones definidas entre espacios vectoriales reales de cualquier dimensión,sentando así las bases para un Cálculo Diferencial en espacios funcionalesy, evitando además el uso de coordenadas, cuando éstas no sean necesarias.Consideramos pues funciones f : A ⊂ E → F , siendo E y F espacios vecto-riales sobre el cuerpo de los números reales de dimensión ≥ 1 . Cuando Esea de dimensión n diremos que f es una función de las n-variables reales(x1, x2, . . . , xn). En tal caso, puesto que E es isomorfo a Rn, estamos iden-tificando E y Rn. También es habitual decir que una función que toma susvalores en R (i.e. F = R ) es una función escalar, mientras que la función sedice vectorial cuando dim(F ) > 1. En el caso en que F sea el producto deun número finito de espacios vectoriales,

f : A ⊂ E → F1 × F2 × · · ·Fp,

si se denota por fi(x) la i-ésima coordenada de f(x), escribiremos f =(f1, . . . , fp) y diremos que las funciones fi : A ⊂ E → Fi; i = 1, 2, . . . , p, sonlas funciones coordenadas de f .

1

2 El Espacio Normado Rn 1.1

Sea E un espacio vectorial sobre un cuerpo K = R ó C indistintamente.Una norma sobre E es una aplicación de E en R que satisface las trespropiedades siguientes:

NOR1. ‖x‖ = 0 si y sólo si x = 0

NOR2. ‖λx‖ = |λ| ‖x‖, ∀λ ∈ K, ∀x ∈ E

NOR3. ‖x+ y‖ ≤ ‖x‖+ ‖y‖, ∀x, y ∈ E

Al número real ‖x‖ se le denomina norma del vector x y se dice queel par (E, ‖ ‖) es un espacio normado. En lo sucesivo, todos los espaciosvectoriales serán reales, es decir K = R.

Ejemplos 1.1 (1) Las únicas normas sobre R son el valor absoluto y susmúltiplos positivos. En efecto, sea ‖ ‖ una norma cualquiera sobre R y seak = ‖1‖. Entonces

‖x‖ = ‖x·1‖ = |x|‖1‖ = k|x|.

Para probar que k debe ser un número real mayor estrictamente que 0,sólo hay que tener en cuenta que toda norma sobre un espacio vectorial Esatisface las propiedades:

NOR4. Toda norma es simétrica, es decir ‖ − x‖ = ‖x‖, para todox ∈ E,NOR5. La norma de todo vector de E es un número real positivo,

La propiedad NOR4 se obtiene trivialmente de la segunda condición denorma. NOR5 se demuestra así:

0 = ‖x− x‖ ≤ ‖x‖+ ‖ − x‖ = 2‖x‖ ⇒ ‖x‖ ≥ 0.

(2) En Rn las normas más utilizadas son

‖(x1, . . . , xn)‖p =(

n∑i=1|xi|p

)1/p

, p ≥ 1

‖(x1, . . . , xn)‖∞ = max|x1|, . . . , |xn|.

La comprobación, en las del tipo p, de la tercera propiedad de norma se basaen la desigualdad de Hölder (Ver ejercico 1A , aunque para el caso p = 2cabe una demostración alternativa, basada en la desigualdad de Cauchy-Schwartz, que veremos a continuación. La ‖ ‖2 es la norma de la geometríaeuclídea, ella forma parte del importante grupo de normas que se derivan

1.1 El Espacio Normado Rn 3

de un producto escalar las Normas Euclídeas. La norma ‖ ‖∞ es conocidacomo la norma producto.

Como es bien conocido mediante la igualdad

(x, y) · (u, v) = xu+ yv,

se define una aplicación bilineal de R2×R2 en R, el producto escalar euclídeo(ejercicio). Obviamente, se tiene que el producto escalar de un vector porsí mismo es justamente el cuadrado de su norma euclídea: (x, y) · (x, y) =x2 + y2 = ‖(x, y)‖2.

Vamos a ver que se satisface la desigualdad,∣∣(x, y) · (u, v)∣∣ ≤ ‖(x, y)‖‖(u, v)‖,

conocida como Desigualdad de Cauchy-Schwartz.Es obvio que esta desigualdad es cierta sii

(xu+ yv)2 ≤ (x2 + y2)(u2 + v2) sii2xyuv ≤ x2v2 + y2u2 siix2v2 + y2u2 − 2xvyu ≥ 0,

y es claro que esto último es cierto pues x2v2 + y2u2 − 2xvyu = (xv− yu)2.Deducimos entonces que

‖(x, y) + (u, v)‖2 =(

(x, y) + (u, v))·(

(x, y) + (u, v))

= (x, y) · (x, y) + 2(x, y) · (u, v) + (u, v) · (u, v)

≤ ‖(x, y‖2 + 2‖(x, y)‖‖(u, v)‖+ ‖(u, v)‖2 =(‖(x, y)‖+ ‖(u, v)‖

)2.

Las normas anteriores pueden definirse sobre productos finitos de espaciosnormados, o sea si E en en vez de Rn es un producto de los espacios normadosEi, i = 1, . . . , n, entonces sobre el espacio vectorial E = E1 × · · · × Enpodemos considerar de forma análoga la norma producto y las normas p.

Ejercicio. Una norma ‖ ‖ sobre Rn la llamaremos monótona si satisface lacondición:

|xi| ≤ |yi|, i = 1, . . . , n ⇒ ‖(x1, . . . , xn)‖ ≤ ‖(y1, . . . , yn)‖.

4 El Espacio Normado Rn 1.3

1. Probar que las normas ‖ ‖p y la norma producto son normas monótonasde Rn.

2. Probar que la norma ‖(x, y)‖ = |x|+ |x−y| no es una norma monótonade R2.

3. Si Ei, i = 1, . . . , n son espacios normados y ‖ ‖∗ es una norma monó-tona de Rn, entonces mediante la fórmula

‖(x1, . . . , xn)‖ =∥∥(‖x1‖, . . . , ‖xn‖

)∥∥∗se define una norma en E = E1 × E2 × · · · × En.

4. Si ‖ ‖1, . . . , ‖ ‖n son normas sobre el mismo espacio vectorial E y ‖ ‖∗

es una norma monótona de Rn, entonces mediante la fórmula

‖x‖ =∥∥(‖x‖1, . . . , ‖x‖n

)∥∥∗se define una norma en E.

5. Utilizar uno de los dos apartados anteriores para justificar que lassiguientes expresiones son normas

en R2:

‖(x, y)‖ = |x|+ |y|+√x2 + y2

‖(x, y)‖ =√

(max|x|, |y|)2 + x2 + y2 + (|x|+ |y|)2

en R3:

‖(x, y, z)‖ = 2|x|+ 3|y|+ |z|

‖(x, y, z)‖ = max|x|, 3√|y|3 + |z|3

‖(x, y, z)‖ =√x2 + y2 + z2 + (|x|+ |y|+ |z|)2

6. Procediendo de la misma forma, construir más normas.

1.5 El Espacio Normado Rn 5

1.2 Toda norma lleva asociada de forma natural una distancia d definidapor d(x, y) = ‖x− y‖. En particular, en R la distancia asociada a la norma“valor absoluto” es la usual d(x, y) = |x − y|. Para E = R2 la distanciaasociada a ‖ ‖2 es la distancia euclídea. Para ‖ ‖∞ es fácil ver que si P,Qson dos puntos del plano situados en un rectángulo de lados paralelos a losejes de medidas s, t, entonces d∞(P,Q) ≤ maxt, s.

Definición 1.3 En un espacio normado (E, ‖ ‖),i) al conjunto de puntos de E que distan de un punto a menos que r > 0

lo llamaremos bola abierta de centro a ∈ E y radio r > 0 y se denotarápor B(a, r). Luego B(a, r) = x ∈ E : ‖x − a‖ < r. Análogamente la bolacerrada será, B[a, r] = x ∈ E : ‖x− a‖ ≤ r y la esfera, S[a, r] = x ∈ E :‖x− a‖ = r;

ii) un subconjuntoA ⊂ E se dirá acotado si existe alguna constante α ≥ 0tal que ‖x‖ ≤ α para todo x ∈ A. Equivalentemente si A está contenido enalguna bola.

1.4 Algunas de las propiedades elementales de las bolas en un espacio nor-mado son las siguientes:

1. “La geometría” de las bolas no depende del centro ni del radio. Estoes debido a la igualdad B(a, r) = a+ rB(0, 1) (ejercicio), que nos diceque toda bola se obtiene mediante la traslación de una homotética dela bola unidad (de centro 0 y radio 1).

2. Cada bola tiene infinitos puntos. En efecto, consideremos la bolaB(a, r).Entonces para cada de los infinitos puntos b ∈ E, b 6= 0; b 6= a es in-mediato ver que los infinitos puntos a + tb, con t ∈ (−r/‖b‖, r/‖b‖)pertenecen a B(a, r).

3. Para cada par de puntos distintos a, b ∈ E existes dos bolas centradasen a y en b respectivamente que son disjuntas: Si a 6= b entoncesr = 1/2‖a−b‖ es mayor estrictamente que 0 y las bolas B(a, r) y B(b, r)son disjuntas, pues si x ∈ B(a, r) entonces ‖a−b‖ ≤ ‖a−x‖+‖x−b‖ <r + ‖x− b‖, lo que implica que ‖x− b‖ > r y por tanto x 6∈ B(b, r).

Ejercicio. Dibujar en R2 una bola respecto a la normas ‖ ‖∞, ‖ ‖1, ‖ ‖2 ytambién respecto a la norma ‖(x, y)‖ = |x|+ |x− y|.

6 El Espacio Normado Rn 1.8

1. Normas equivalentes

Análogamente a cómo se hacía en R, a partir de la distancia asociada auna norma, podemos dar la definición de sucesión convergente en espaciosnormados . Concretamente:

Definición 1.5 La sucesión de puntos del espacio normado (E, ‖ ‖) se diceque converge (o que ‖ ‖-converge, si pudiera haber confusión) al punto x,xp → x, si para cada ε > 0 existe un índice ν tal que si p ≥ ν entonces‖xp − x‖ < ε. En otras palabras, si a partir de ν todos los términos de lasucesión están en la bola B(x, ε).

Por tanto, es claro que una sucesión no puede converger a dos puntosdistintos. Si la sucesión xp convergiese a los dos puntos distintos x1 6= x2,tomando ε tal que B(x1, ε)∩B(x2, ε) = ∅, todos los términos de la sucesión apartir de uno en adelante deberían estar en ambas bolas, lo cual es absurdo.Cuando la sucesión xp converge a x, también se dice que x es el puntolímite de la misma y se escribirá lım

p→∞xp = x.

Es inmediato comprobar que si xp es una sucesión convergente enton-ces también es de Cauchy, i.e para cada ε > 0 existe un índice ν tal que sip, q ≥ ν entonces ‖xp − xq‖ ≤ ε.

Ejemplo 1.6 Es fácil ver que en R2 respecto a la norma producto, una suce-sión (xp, yp) converge al punto (x, y) si y sólo si las sucesiones coordenadasxp y yp convergen respectivamente a x e y. Igualmente en Rn.

Puesto que el concepto de sucesión convergente lo hemos expresado entérminos de la norma, parece posible que una misma sucesión de puntos delespacio vectorial E pueda ser convergente o no dependiendo de cuál sea lanorma con la que trabajemos. De hecho, como veremos a continuación, dosnormas sobre E que proporcionan las mismas sucesiones convergentes sonjustamente las que denominaremos equivalentes.

Definición 1.7 Dos normas ‖ ‖, ‖ ‖∗ sobre el mismo espacio vectorial E sedicen equivalentes si existen dos números reales α, β mayores estrictamenteque 0 tales que ‖x‖ ≤ α‖x‖∗; ‖x‖∗ ≤ β‖x‖,∀x ∈ E.

Proposición 1.8 Sean ‖ ‖, ‖ ‖∗ dos normas sobre el mismo espacio vectorialE. Los enunciados siguientes son equivalentes:

1) Las normas ‖ ‖, ‖ ‖∗ son equivalentes,

1.9 El Espacio Normado Rn 7

2) Cada sucesión que converge respecto a una de ellas converge tambiénrespecto a la otra y al mismo límite,

3) Cada sucesión que converge respecto a una de ellas converge tambiénrespecto a la otra.

Demostración. 1) implica 2) Supongamos que las normas son equivalentesi.e existen α, β mayores estrictamente que 0 tales que ‖x‖ ≤ α‖x‖∗; ‖x‖∗ ≤β‖x‖,∀x ∈ E, y sea xp una sucesión ‖ ‖-convergente a x. Luego dadoε > 0, a partir de un cierto índice, los términos de la sucesión ‖ ‖-distan dex menos que ε. Se deduce entonces que, a partir de ese índice, ‖xp − x‖∗ ≤β‖xp − x‖ < βε. Es decir la sucesión xp también ‖ ‖∗-tiende a x.

2) implica 1) Recíprocamente, supongamos que las normas no son equi-valentes, por ejemplo que no se satisface ‖ ‖∗ ≤ β‖ ‖ para ningún β > 0. Enparticular, que para cada p ∈ N existe xp ∈ E tal que ‖xp‖∗ > p‖xp‖. O loque es lo mismo, que

‖xp‖‖xp‖∗

< 1/p,

lo que significa que la sucesión, xp

‖xp‖∗, ‖ ‖-converge a 0. Pero, en cambio,

esta sucesión no ‖ ‖∗-converge a 0, pues∥∥ xp

‖xp‖∗

∥∥∗ = 1.Trivialmente 2) implica 3).3) implica 2) Teniendo en cuenta que una sucesión xp converge a a

si y sólo si la sucesión xp − a converge a 0, bastará probar que si xpes una sucesión que ‖ ‖-converge a 0 entonces esta sucesión ‖ ‖∗-converge a0. Por 3) xp debe ser ‖ ‖∗-convergente. Lo que se trata de probar es queademás debe hacerlo a 0. En efecto, supongamos que xp ‖ ‖∗-converge ab, entonces es obvio que la sucesión 2xp ‖ ‖-converge a 0 y ‖ ‖∗-convergea 2b. Sea yp la sucesión definida por yp = xp si p es impar e yp = 2xpsi p es par. Obviamente yp ‖ ‖-converge a 0, por lo que según 3), debeser ‖ ‖∗-convergente a algún c. Pero la subsucesión de los términos impares‖ ‖∗-converge a b mientras que la de los términos pares converge a 2b. Portanto c = b = 2b que implica b = 0 como queríamos probar.

Teorema 1.9 En Rn todas las normas son equivalentes.

Demostración. Vamos a probar que cada norma ‖ ‖ sobre Rn es equivalentea la norma ‖ ‖∞.

8 El Espacio Normado Rn 1.10

1) Denotemos por ei = (0, . . . , 1, . . . , 0) entonces

‖x‖ = ‖(x1, . . . , xn)‖ == ‖n∑i=1

xiei‖

≤n∑i=1|xi|‖ei‖ ≤

∑(‖x‖∞‖ei‖) = (

∑‖ei‖)‖x‖∞.

Entonces, si β =∑‖ei‖, se ha probado que para todo x ∈ Rn, ‖x‖ ≤ β‖x‖∞.

2) Para probar la otra desigualdad razonaremos por inducción sobre n.Ya sabemos que es cierta para n = 1, pues las únicas normas sobre R sonlos múltiplos positivos del valor absoluto. Supongamos cierto en Rn−1 laexistencia de una desigualdad en este sentido entre cada norma y la normaproducto. Para probar esto mismo sucede en Rn, observemos que si v =(x1, x2, . . . , xn) es un vector no nulo, entonces para cada xj 6= 0 podemosescribir v = xj(x1/xj , . . . , 1, . . . , xn/xj), de lo que se deduce que ‖v‖ =‖v‖∞‖u‖, donde u es un vector que tiene un 1 en alguna de sus coordenadas.La desigualdad que buscamos se obtendría si fuese cierto que existe algunaconstante α > 0 tal que para cada vector u de este tipo ‖u‖ fuese mayorque α. Denotemos por L1, L2, . . . los conjuntos formados por los puntos quetienen un 1 en la 1a coordenada, un 1 en la 2a coordenada,. . . y veamos que encada uno de ellos es cierto lo anterior. Supongamos que no y que por ejemploexiste una sucesión de vectores up = (1, yp2 , . . . , ypn) ∈ L1, p = 1, 2, . . . tal que‖up‖ ≤ 1/p. Teniendo en cuenta que

‖up‖ = ‖(1, yp2 , . . . , ypn)‖ = ‖(1, 0, . . . , 0) + (0, yp2 , . . . , ypn)‖,

eso significaría que la sucesión (0, yp2 , . . . , ypn) ‖ ‖-converge a (−1, 0, . . . , 0)(luego también es ‖ ‖-Cauchy).

Denotemos por ‖ ‖∗ a la norma sobre Rn−1 definida así: ‖(y2, . . . , yn)‖∗ =‖(0, y2, . . . , yn)‖ (comprobar que es norma). Por hipótesis de inducción debeexistir una constante s > 0 tal que ‖(y2, . . . , yn)‖∞ ≤ s‖(y2, . . . , yn)‖∗ =s‖(0, y2, . . . , yn)‖. De esta desigualdad se deduce entonces que el carác-ter ‖ ‖-Cauchy de la sucesión (0, yp2 , . . . , ypn) implicaría que la sucesión(yp2 , . . . , ypn) es ‖ ‖∞-Cauchy, equivalentemente que las sucesiones coor-denadas son sucesiones de Cauchy de números reales, luego convergentes.Si c2, c3, . . . , cn fuesen sus límites entonces la sucesión (yp2 , . . . , ypn) con-vergería respecto a la norma ‖ ‖∞ al punto c = (c2, . . . , cn), pero enton-ces, teniendo en cuenta que (según vimos en 1) ‖ ‖ ≤ β‖ ‖∞, la sucesión(0, yp2 , . . . , ypn) ‖ ‖-convergería a ‖(0, c2, . . . , cn)‖. Habríamos obtenido doslímite diferentes para la misma sucesión.

1.13 El Espacio Normado Rn 9

Corolario 1.10 Rn es un espacio normado completo (un espacio de Ba-nach) respecto a cualquier norma i.e., cada sucesión de Cauchy en (Rn, ‖ ‖)es convergente cualquiera que sea la norma ‖ ‖.

Demostración. Puesto que en Rn todas las normas son equivalente, unasucesión es ‖ ‖-Cauchy si y sólo es ‖ ‖∞-Cauchy y, por tanto, si y sólo si cadasucesión coordenada es una sucesión de números reales de Cauchy (luegoconvergente, pues suponemos conocido que R es completo). Se tiene puesque dicha sucesión, según veíamos antes, es ‖ ‖∞-convergente lo que, segúnla proposición 1.8, equivale a ser ‖ ‖-convergente.

2. Continuidad y limites de funcionesComenzamos aquí con el estudio de las funciones de varias variables, y

más generalmente con el de las funciones del tipo f : A ⊂ E → F con E yF espacios normados. Para ello necesitaremos definir previamente algunosconceptos de topología:

Definición 1.11 Un subconjunto A de un espacio normado (E, ‖ ‖) se diráentorno del punto a (o equivalentemente que a es un punto interior de A:a ∈

oA) si existe un número real r > 0 tal que B(a, r) ⊂ A. Un subconjunto

U se dirá abierto cuando sea entorno de todos sus puntos o dicho de otraforma si

oU= U . A los complementarios de abiertos se les llama cerrados.

Nos referiremos a la familia τ de los abiertos como a la topología del espacionormado.

Es obvio que todo conjunto que contenga un entorno de un punto a estambién entorno de a y que la intersección de dos entornos del punto a estambién entorno de a. Asimismo es claro que la unión arbitraria de abiertosy la intersección finita de abiertos es un abierto.

Proposición 1.12 Un conjunto U es abierto del espacio normado E si ysólo si U es unión de bolas abiertas.

Demostración. Si U es abierto entonces U =⋃x∈U B(x, rx). Recíproca-

mente, cada B(a, r) es un conjunto abierto. En efecto si x ∈ B(a, r) y0 < rx < r − ‖x − a‖ entonces cada y ∈ B(x, rx) verifica que ‖y − a‖ ≤‖y − x‖+ ‖x− a‖ < rx + ‖x− a‖ < r.

Proposición 1.13 Dos normas sobre el espacio vectorial E son equivalentessi y sólo si inducen la misma topología sobre E. También, si y sólo si losentornos de cada punto son los mismos para las dos normas.

10 El Espacio Normado Rn 1.15

Demostración. De acuerdo a la definición de abierto, bastará probar la se-gunda de las afirmaciones. Sean ‖ ‖ y ‖ ‖∗ dos normas sobre E y para a ∈ E,denotemos por V (a) y V∗(a) a la familia de entornos de a respecto a esasnormas. Supongamos que son equivalentes y que U ∈ V (a), es decir queexiste B(a, r) ⊂ U . Al ser equivalentes ambas normas existe α > 0 tal que‖x − a‖ ≤ α‖x − a‖∗ para todo x. Por tanto si ‖x − a‖∗ < r/α enton-ces ‖x − a‖ < r o sea que B∗(a, r/α) ⊂ B(a, r) ⊂ U , lo que implica queU ∈ V∗(a).

Recíprocamente, supongamos que los entornos de cada punto son los mis-mos para ambas normas y veamos que entonces las sucesiones convergentesa cada punto son también las mismas para ambas normas. Supongamosque xp es una sucesión que ‖ ‖-convergente a b, y sea ε > 0, como labola B∗(b, ε) es un entorno de b (respecto a ambas normas) debe existirB(b, ε′) ⊂ B∗(b, ε). Se deduce pues que todos los términos de la sucesión apartir de uno en adelante están en B(b, ε′) y por tanto en B∗(b, ε), lo quesignifica que xp es una sucesión que ‖ ‖∗-converge a b.

Ejercicio. Probar que todo subespacio vectorial de Rn es cerrado.

Definiciones 1.14 La función f : A ⊂ E → F se dice:1) continua en el punto a ∈ A, si para cada ε > 0 existe un δ > 0 tal que

si ‖x− a‖ < δ (x ∈ A) entonces ‖f(x)− f(a)‖ < ε.Es fácil ver que un toda función continua en un punto es secuencialmente

continua en ese punto, i.e. si la función f es continua en el punto a y xpes una sucesión de puntos que converge al punto a, entonces la sucesión desus imágenes f(xp) converge a f(a).

2) continua en A, cuando sea continua en todos los puntos de A.3) uniformemente continua en A, si para cada ε > 0 existe un δ > 0 tal

que si ‖x− y‖ < δ (x, y ∈ A) entonces ‖f(x)− f(y)‖ < ε.De la definición se deduce que si f es uniformemente continua en A

entonces es continua en A, es decir continua en cada punto x ∈ A, pero conla particularidad de que el δ no depende más que de ε, es decir δx puedetomarse el mismo para todo x.

4) lipschitziana, si existe una constante k > 0 tal que ‖f(x) − f(y)‖ ≤k‖x− y‖.

Obviamente cada función lipschitziana es uniformemente continua.

Ejemplos 1.15 1. Cada función constante es trivialmente continua.2. En todo espacio normado (E, ‖ ‖) la aplicación norma, ‖ ‖ : E → R ,

es continua.

1.18 El Espacio Normado Rn 11

En efecto, de hecho esta aplicación es lipschitziana, pues como es fácilde comprobar se tiene la siguiente desigualdad (ejercicio):∣∣∣‖x‖ − ‖y‖∣∣∣ ≤ ‖x− y‖

3. Sean (Ei, ‖ ‖), i = 1, 2, . . . , p espacios normados. Consideremos sobreE = E1 × E2 × · · · × Ep la norma producto

‖(x1, . . . , xp)‖∞ = max1≤i≤p

‖xi‖

Entonces, cualquiera que sea j, la aplicación proyección πj : E → Ejπj(x1, . . . , xp) = xj es continua (lipschitziana), pues

‖πj(x1, . . . , xp)− πj(y1, . . . , yp)‖ = ‖xj − yj‖≤ ‖(x1 − y1, . . . , xp − yp)‖∞ = ‖(x1, . . . , xp)− (y1, . . . , yp)‖∞.

Proposición 1.16 La función f : A ⊂ E → F es continua en A si y sólo sipara cada conjunto abierto V de F la antimagen f−1(V ) es un abierto de Ai.e. existe algún abierto U de E tal que f−1(V ) = U ∩A.

Demostración. Supongamos f continua en A y sea V un abierto de F . Vea-mos f−1(V ) abierto de A: si x ∈ f−1(V ) se tiene f(x) ∈ V luego existeB(f(x), εx) ⊂ V y por la continuidad de f en x debe existir δx tal quef(B(x, δx) ∩A) ⊂ B(f(x), εx) ⊂ V ⇒ B(x, δx) ∩A ⊂ f−1(V ). Entonces:

f−1(V ) ⊂⋃

x∈f−1(V )B(x, δx) ∩A ⊂ f−1(V ).

Luego tomando el abierto U =⋃

x∈f−1(V )B(x, δx) se tiene que f−1(V ) =

U ∩A.(Probar como ejercicio la implicación en el otro sentido).

Completaremos la serie de definiciones anteriores con la definición delímite. Para ello necesitaremos referirnos previamente a la noción de puntode acumulación:

Definición 1.17 Sea A un subconjunto de un espacio normado E. Un puntoa se dice de acumulación del conjunto A (lo que se expresará como quea ∈ A′) si cada entorno de a tiene algún punto de A distinto de a. Dehecho en espacios normado el punto a será de acumulación de A si y sólo si

12 El Espacio Normado Rn 1.18

cada entorno de A contiene infinitos puntos de A (ejercicio). Observar quea puede ser de acumulación de A sin necesidad de pertenecer a A. Por otraparte también es inmediato probar que si un punto a es interior a A o másgeneralmente si existe una B(a, r) ⊂ A ∪ a entonces a ∈ A′.

Definición 1.18 Sea f : A ⊂ E → F y a un punto de acumulación de A.Diremos que el punto l ∈ F es límite de la función en el punto a, lo quedenotaremos como

lımx→a

f(x) = l,

si para ε > 0, existe δ > 0 tal que si x ∈ A, x 6= a y ‖x − a‖ < δ entonces‖f(x)− l‖ < ε.

Consecuencias directas de la definición son:a) Una función no puede tener dos límites diferentes en el mismo punto.

Como antes con las sucesiones, la demostración de la unicidad del límite sebasa en que puntos distintos admiten entornos disjuntos.

b) Sea f : A ⊂ E → F y a ∈ A. Se tiene:

Si a no es de acumulación de A (en ese caso se dice que a es un puntoaislado de A) entonces f es continua en a.Si a ∈ A′ entonces f es continua en a si y sólo si lımx→a f(x) = f(a).

Si a es aislado de A entonces existe δ tal que el único x de A con lapropiedad ‖x − a‖ < δ es justamente el punto a. Por lo tanto es obvio quef es continua en a.

Si a ∈ A′ ∩A, entonces:(f continua en a) significa:

∀ε > 0, ∃δ ‖x− a‖ < δ, x ∈ A ⇒ ‖f(x)− f(a)‖ < ε

(lımx→a f(x) = f(a)) significa:

∀ε > 0, ∃δ ‖x− a‖ < δ, x ∈ A, x 6= a ⇒ ‖f(x)− f(a)‖ < ε

Obviamente los dos enunciados coinciden pues para x = a, ‖f(a)− f(a)‖ =0 < ε.

c) Si f : A ⊂ E → F y a ∈ A′ (respectivamente a ∈ A), entonceslımx→a f(x) = l (respect. f continua en a) si y sólo si para cada V ∈V (l) (respect. V (f(a)) exista algún U ∈ V (a) tal que f(U∗∩A) ⊂ V (respect.f(U ∩A) ⊂ V ), donde U∗ = U \ a.

La demostración consiste en una sencilla adaptación de la definición ε−δen términos de entornos: supongamos que lımx→a f(x) = l y sea V ∈ V (l).

1.21 El Espacio Normado Rn 13

Entonces existe ε > 0 tal que B(l, ε) ⊂ V y para este ε existe δ tal que six ∈ A, x 6= a y ‖x− a‖ < δ entonces ‖f(x)− l‖ < ε. Dicho de otra forma six ∈ B∗(a, δ)∩A entonces f(x) ∈ B(l, ε) ⊂ V i.e., si consideramos el entornoU = B(a, δ) se tiene que f(U∗ ∩ A) ⊂ V . La implicación en el otro sentidoes análoga (ejercicio).

De la definición de límite por entornos dada en b) se deduce:d) la existencia y el valor del límite de una función en un punto o la

continuidad se mantienen, si se cambian las normas de E y F por otro parde normas equivalentes. En particular, si los espacios E y F son de dimensiónfinita, para estudiar la existencia de límite de una función en un punto o lacontinuidad, podemos utilizar las normas que queramos.

2.1. Reglas de cálculo para límites

1.19 Sean E,F1, . . . , Fp espacios normado f : A ⊂ E → F donde F =F1×F2× · · ·Fp con la norma producto. Sea a ∈ A′ y denotemos por fi, i =1, 2, . . . , p a las funciones coordenadas de f , entonces

lımx→a

f(x) = l = (l1, . . . , lp) ⇔ lımx→a

fi(x) = li.

Demostración. Teniendo en cuenta que

‖f(x)− l‖∞ = ‖(f1(x)− l1, . . . , fp(x)− lp)‖∞ = max1≤i≤p

‖fi(x)− li‖,

es obvio que ‖f(x)− l‖∞ → 0 sii ‖fi(x)− li‖ → 0, ∀i.

1.20 Sea f : A ⊂ E → F tal que en el punto a ∈ A′, lımx→a f(x) = b ysupongamos que g es una función definida en un subconjunto B de F quecontiene a f(A) ∪ b y que es continua en b. Entonces,

lımx→a

g(f(x)) = g( lımx→a

f(x)) = g(b).

Demostración. Trivial.

1.21 Sea f : A ⊂ E → F , a ∈ A′. Si lımx→a f(x) = b y b 6= 0, entoncesexiste un entorno U de a y α > 0 tal que ‖f(x)‖ ≥ α para cada x ∈ U∗ ∩A.En particular, f(x) 6= 0 para cada x ∈ U∗ ∩A.

14 El Espacio Normado Rn 1.23

Demostración. Como consecuencia de lo anterior y de la aplicación “norma”es continua en todo punto se tiene que lımx→a ‖f(x)‖ = ‖ lımx→a f(x)‖ =‖b‖. Por tanto, tomando ε = ‖b‖/2, existirá δ > 0 tal que si ‖x−a‖ < δ, x ∈A, x 6= a entonces∣∣∣‖f(x)‖ − ‖b‖

∣∣∣ ≤ ‖b‖/2 ⇔ ‖b‖/2 ≤ ‖f(x)‖ ≤ 32‖b‖.

Luego tomando U = B(a, δ) se tiene que ‖f(x)‖ ≥ α = ‖b‖/2 para todox ∈ U∗ ∩A.

1.22 Si f : A ⊂ E → F y lımx→a f(x) = l, entonces si B ⊂ A y a ∈B′, lımx→a f|B(x) = l.

Demostración. Trivial.

Es claro que, contrariamente, la existencia de lımx→a f|B(x) no implica ladel lımx→a f(x). Sin embargo en el caso particular en el que B = B(a, r)∩A,entonces

a ∈ B′ ⇔ a ∈ A′ y lımx→a

f(x) = l ⇔ lımx→a

f|B(x) = l

1.23 Para el cálculo de límites son aplicables las siguientes fórmulas:

1) lımx→a

(f + g)(x) = lımx→a

f(x) + lımx→a

g(x); lımx→a

(λf)(x) = λ lımx→a

f(x)

2) Si f, g son funciones escalares, entonces lımx→a

(fg)(x) = lımx→a

f(x) lımx→a

g(x)

3) Si f, g son escalares y lımx→a

g(x) 6= 0, entonces lımx→a

(1/g)(x) = 1lımx→a g(x).

Por tanto lımx→a

(f/g)(x) = lımx→a f(x)lımx→a g(x).

Demostración. Las demostraciones son totalmente análogas a las correspon-dientes para funciones de 1-variable:

1) es inmediata.2) Si lımx→a f(x) = l; lımx→a g(x) = r, entonces:

|(fg)(x)− lr| = |f(x)(g(x)− r) + r(f(x)− l)|≤ |f(x)||g(x)− r|+ |r||f(x)− l|

≤ |f(x)− l||g(x)− r|+ |l||g(x)− r|+ |r||f(x)− l|.

1.26 El Espacio Normado Rn 15

Puesto que cada uno de los tres sumandos anteriores tienden a 0 cuandox→ a, se deduce que lımx→a(fg)(x) = lr.

3) Puesto que lımx→a g(x) = r 6= 0, de 1.21 se deduce que existe α > 0y δ1 > 0 tal que si ‖x − a‖ < δ1, x ∈ A, x 6= a entonces |g(x)| > α. Por lotanto, ∣∣∣ 1

g(x) −1r

∣∣∣ = 1|r||g(x)| |g(x)− r| ≤ 1

|r|α|g(x)− r| → 0.

Los resultados anteriores sobre límites se trasladan de forma automáticaa resultados análogos sobre continuidad:

Corolario 1.24 La función f = (f1, . . . , fp) es continua en un puntoa si y sólo si las funciones coordenadas fi son todas continuas en a.Si f continua en a, g continua en b = f(a), entonces g f es continuaen a.Si f, g continuas en a , entonces f + g, λf, (y si f, g son escalares) fgy f/g(cuando g(a) 6= 0), son continuas en a.

Otras consecuencias

En espacios normados la suma y la multiplicación por escalares sonaplicaciones continuas.Cada función polinómica definida en Rn es continua en todo punto.Si f, g son funciones continuas sobre un subconjunto A de un espacionormado y toman sus valores en R, entonces x ∈ A : f(x) < g(x) esabierto de A y los conjuntos x ∈ A : f(x) ≤ g(x) y x ∈ A : f(x) =g(x) son cerrados de A.

2.2. Límites iterados y límites direccionales

A continuación establecemos algunas condiciones necesarias para la exis-tencia de límite de funciones (escalares, si se quiere) de varias variablesreales.

Definición 1.25 (Límites iterados) Sea f : A ⊂ R2 → R y (x0, y0) ∈ A′.A cada uno de los límites

lımx→x0

( lımy→y0

f(x, y)), lımy→y0

( lımx→x0

f(x, y))

se les denomina límites iterados.

16 El Espacio Normado Rn 1.28

Proposición 1.26 Con las notaciones anteriores, si existe

lım(x,y)→(x0,y0)

f(x, y) = l,

y en algún entorno U de (x0, y0) existe el límite lımy→y0 f|U∗∩A(x, y) entoncestambién existen y es igual a “l” el límite iterado lımx→x0(lımy→y0 f(x, y)).Mismo enunciado para el otro límite iterado.

Demostración. Resulta directamente de aplicar la definición de límite.

Definición 1.27 (Límites direccionales) Dada una recta r que pasapor el punto (x0, y0) Llamaremos límite de la función f en el punto (x0, y0)siguiendo esa recta al lım(x,y)→(x0,y0) f|B(x, y), donde B = r ∩ A (supuestoque (x0, y0) ∈ B′). Por tanto, si r es la recta de pendiente m, y − y0 =m(x− x0), entonces el límite siguiendo esa recta será:

lımx→x0

f(x, y0 +m(x− x0)).

Los límites siguiendo rectas serán los límites direccionales.(Análoga defini-ción para límite siguiendo curvas que pasan por el punto).

Nota. La definición 1.25 se generalizan de manera natural al caso de fun-ciones de 3 o más variables. Para generalizar también la noción de lími-tes direccionales de una función en un punto, deberemos escribir en for-ma paramétrica las ecuaciones de las rectas que pasan por el punto. Así sia = (a1, . . . , an), entonces

x1 = a1 + th1, x2 = a2 + th2, . . . , xn = an + thn

es la ecuación de la recta que tiene como vector director h = (h1, . . . , hn) yque pasa por a. El límite siguiendo esta recta será entonces

lımt→0

f(a1 + th1, . . . , an + thn).

Para n = 2 el límite anterior coincide con el límite direccional en el sentidode la definición 1.27, siguiendo la recta de pendiente m = h2/h1.

Como en el caso de los límites iterados, es evidente que la existencia de límiteimplica la de los límites direccionales y siguiendo curvas. Se deduce, pues,que la existencia de los límites iterados, direccionales y siguiendo curvas soncondiciones necesarias para la existencia del límite. Por lo tanto:

NO existe límite cuando

1.31 El Espacio Normado Rn 17

1. No existe alguno de los límites iterados o existen pero son distintos.

Ejemplo 1.28 Consideremos la función

f(x, y) = x2 + y√x2 + y2 si (x, y) 6= (0, 0); f(0, 0) = 0.

Esta función no es continua en (0, 0) ya que uno de los límites iterados noexiste:

lımy→0

( lımx→0

x2 + y√x2 + y2 ) = lım

y→0

y

|y|= ±1.

Ejemplo 1.29 Este es un ejemplo de una función para la que los límitesiterados existen pero son diferentes (luego el límite no existe)

f(x, y) = (x+ y − 1) ln(x2 + 2y2)(x− 1)2 + y2 , si (x, y) 6= (1, 0).

Se tiene que

lımx→1

( lımy→0

f(x, y)) = lımx→1

2(x− 1) ln x(x− 1)2 = 2

lımy→0

( lımx→1

f(x, y)) = lımy→0

y ln(1 + 2y2)y2 = lım

y→0

4y1 + 2y2 = 0.

2. No existe alguno de los límites direccionales o existen, pero no soniguales.

Ejemplo 1.30 Sea

f(x, y) = xy

x2 + y2 si (x, y) 6= (0, 0).

Los límites direccionales de esta función no son todos iguales. En efecto:

lımx→0

f(x,mx) = lımx→0

mx2

(m2 + 1)x2 = m

m2 + 1

que depende de m. Se deduce pues que el límite no existe.

18 El Espacio Normado Rn 1.33

Ejemplo 1.31 Sea

f(x, y) = x2y

x4 + (y − x)2 si (x, y) 6= (0, 0); f(0, 0) = 0.

Es inmediato comprobar que lımx→0 f(x,mx) = 0 para m 6= 1. En cambiopara m = 1 el límite anterior no existe, es decir la función no tiene límite en(0,0) siguiendo la recta y = x y por lo tanto no admite límite en ese punto(no es continua en (0,0)).

3. No existe el límite siguiendo alguna curva que pasa por el punto o ellímite varía dependiendo de la curva que se tome.

Ejemplo 1.32 Consideremos la función

f(x, y) = xy2

x2 + y4 si (x, y) 6= (0, 0).

Tanto los límite iterados como los límites direccionales en el punto (0,0)existen y valen 0, sin embargo esta función no tiene límite en ese punto, yaque si tomamos las curvas y = m

√x, se tiene:

lımx→0

f(x,m√x) = lım

x→0

m2x2

x2 +m4x2 = m2

m4 + 1 .

Es decir los límites siguiendo esa familia de curvas existen todos pero sondiferentes entre sí, luego el límite no existe.

Ejemplo 1.33 Sea

f(x, y) = x2 ln yx4 + (x2 + ln y)2 , si (x, y) 6= (0, 1); f(0, 1) = 0.

Es inmediato comprobar que también en este caso los límites iterados en(0,1) valen 0. En cuanto a los límites direccionales

lımx→0

x2 ln(1 +mx)x4 + (x+ ln(1 +mx))2 = lım

x→0

ln(1 +mx)x2 + (x+ 1/x ln(1 +mx))2 = ln 1

m2 = 0.

Sin embargo tampoco existe el límite ya que si consideramos la curva y =e−x

2 , que obviamente pasa por (0,1), la función admite límite siguiendo estacurva, pero es diferente de 0.

1.33 El Espacio Normado Rn 19

Ejercicios. 1. Sea f la función definida en A = (x, y) ∈ R2 : x 6= 0; y 6=0; xy 6= 1 por

f(x, y) = x3 − y3

x2y2 − xy.

a) Probar que f es continua es cada punto de A.b) Estudiar la existencia de límite de f en los puntos (a, 0), (0, b), (c, 1/c)

siendo a 6= 0, b 6= 0 y |c| 6= 1.c) Obtener los límites iterados de f en los puntos (1, 1) y (−1,−1)

para estudiar si existe límite de f en esos puntos.d) Comprobar que los límites iterados de de f en (0, 0) no están

definidos; que los límites direccionales en ese punto son todosiguales, pero que la función f no tiene límite en (0, 0).

e) Considerar la función g definida en A por

g(x, y) = (x+ y) sen x3 − y3

x2y2 − xy,

y demostrar que tiene límite en (0, 0) a pesar de que los límitesiterados no están definidos en (0, 0).

2. Considerar las funciones definidas en A = R2 \ (0, 0):

f1(x, y) = (x+ y)2(ey − 1)x2 + y2 ; f2(x, y) = (x+ y)2(ey − 1)

x4 + y2

f3(x, y) = xy(ey − 1)x4 + y2 .

a) Probar que f1 tiene límite en (0, 0).b) Probar que los límites iterados y direccionales de f2 en (0, 0)

existen, pero f2 no tiene límite en (0, 0).c) Probar que la función f3 tiene límite en (0, 0).

3. a) Probar que la función de 1-variable

g(t) = sen tt

si t 6= 0; g(0) = 1,

es continua en todo punto t ∈ R.

20 El Espacio Normado Rn 1.35

b) Utilizar el apartado anterior para probar que la función

f(x, y) = sen xyy

si y 6= 0; f(x, 0) = 1,

es continua en todo punto de R2.

c) Utilizar de nuevo el apartado a) para obtener lım(x,y)→(a,a) f(x, y),a ∈ R, siendo f la función definida en el conjunto A = (x, y) ∈R2 : |x| 6= |y| por

f(x, y) = cosx− cos yx2 − y2

3. Funciones continuas sobre compactos

De nuevo nos referiremos a la topología de un espacio normado paraenunciar, sin demostración, algunos resultados de las funciones continuas,por otra parte ya conocidos para las funciones de una variable. Las demos-traciones de estos resultados se verán en la asignatura de Topología delsegundo semestre de este curso o bien pueden encontrarse en los apuntes deesta misma asignatura del curso 2011/12 (Compacidad).

Definición 1.34 Un conjunto K de un espacio normado se dice compactosi de cada recubrimiento de K por conjuntos abiertos se puede extraer unsubrecubrimiento finito. Abreviadamente si K ⊂

⋃i∈I Ui entonces existe un

subconjunto finito J ⊂ I tal que K ⊂⋃i∈J Ui.

Puesto que la definición de compacto se hace exclusivamente en tér-minos de los abiertos, es claro que que si dos normas sobre el mismoespacio vectorial E son equivalente, un conjunto K ⊂ E es compactorespecto a una de la normas si y sólo si lo es respecto a la otra. En par-ticular en Rn la compacidad de un conjunto no depende de la normaque se tome.

Es cierto, aunque no lo demostraremos, que todo compacto de unespacio normado es un conjunto cerrado y acotado. Ya sabemos queen R el recíproco también se satisface: los conjuntos compactos sonjustamente los que son cerrados y acotados . Esto también es cierto enRn, es decir en los espacios normados de dimensión finita y, según unteorema de F. Riesz (Ver Manual, Teorema 2.9), sólo en ellos.

1B El Espacio Normado Rn 21

1.35 (Funciones continuas sobre compactos). Sean E,F espacios nor-mados y f : A ⊂ E → F una aplicación continua, entonces:

i) La imagen por f de cada compacto K ⊂ A, f(K), es un conjuntocompacto de F y por tanto cerrado y acotado.

ii) f es uniformemente continua sobre cada compacto K ⊂ A.iii) Si F = R entonces f alcanza un valor máximo y un valor mínimo

sobre cada compacto K ⊂ A.

Ejercicios1A Sean p, q números reales positivos tales 1/p + 1/q = 1 (observar que en estascondiciones p y q deben ser mayores que 1).

(a) Demostrar la desigualdad:

xy ≤ 1pxp + 1

qyq, x, y ≥ 0.

Indicación. Escribir xy = e1p ln xp+ 1

q ln yq

y tener en cuenta que la fun-ción ex es convexa.

(b) (Desigualdad de Hölder) Utilizar el apartado anterior para demostrar que

n∑i=1

xiyi ≤

(n∑i=1|xi|p

)1/p( n∑i=1|yi|q

)1/q

.

En otros términos, 〈x, y〉 ≤ ‖x‖p‖y‖q, x = (x1, . . . , xn); y = (y1, . . . , yn).Indicación. Suponer en una primera etapa que ‖x‖p = 1, ‖y‖q = 1 y de-mostrar que entonces 〈x, y〉 ≤ 1.

(c) Demostrar que ‖x‖p = (∑ni=1 |xi|p)

1/p es una norma sobre Rn.

1B Sea p un número real mayor o igual que 1 y denotemos por lp al conjunto desucesiones de números reales (xn) tales que

∑∞n=1 |xn|p < ∞. Definamos también

l∞ como el conjunto de las sucesiones acotadas de números reales.

(a) Probar que lp y l∞ son espacios vectoriales y que la expresiones

‖x‖p =( ∞∑n=1|xn|p)1/p; ‖x‖∞ = sup

n∈N|xn|

definen sendas normas sobre lp y l∞(b) Demostrar que la adherencia en l∞ del conjunto de sucesiones que tienen

todos sus términos nulos, salvo un número finito de ellos, es c0: el espaciovectorial de sucesiones reales que convergen a 0.

22 El Espacio Normado Rn 1C

1C Demostrar que si ‖ · ‖ es una norma sobre Rn tal que

‖(u1, . . . , un)‖ ≤ 1 ⇒ |ui| ≤ 1,(*)

entonces |xi| ≤ ‖x‖, para cada x = (x1, . . . , xn) ∈ Rn. Dar ejemplos de normas queno satisfagan la condición (*) para ningún i.

1D Estudiar si las expresiones siguientes definen una norma sobre R2 :

1. ‖(x, y)‖ =√

4x2 + y2.

2. ‖(x, y)‖ =√|x|+ |y|.

3. ‖(x, y)‖ = |x|+ | 3√x3 + y3|.

4. ‖(x, y)‖ =√

(x− y)2 + y2.

1E Sean (Ei, i = 1, 2, . . . , n) una familia finita de espacios normados y empleemosla notación común ‖ · ‖ para designar a las normas de Ei.

(a) Demostrar que

‖(x1, . . . , xn)‖ =n∑i=1

αi‖xi‖, αi ≥ 0,

‖(x1, . . . , xn)‖ =√‖x1‖2 + . . .+ ‖xn‖2

son normas sobre E = E1 × . . .× En.(b) Utilizar lo anterior para demostrar que

‖(x, y, z)‖ =√

(2|x|+ |y|)2 + z2

es una norma sobre R3.

1F Demostrar que la expresión

‖(x, y, z)‖ =√x2 + (y − x)2 + (z − y)2

define una norma sobre R3. Compararla con la norma euclídea.

1G Sea (E, ‖ · ‖) un espacio normado. Estudiar si la aplicación de E en sí mismo,f(x) = x‖x‖, es continua, uniformemente continua o lipschitziana.

1H Encontrar una norma sobre R2 para la que la esfera unidad sea la elipse deecuación x2 + 4y2 = 4.

1I Sea xn con xn 6= 0 para todo n, una sucesión de Cauchy en un espacionormado.

(a) Probar que la sucesión de números reales ‖xn‖ es convergente. Sea α sulímite.

1K El Espacio Normado Rn 23

(b) Probar que si α > 0 entonces la sucesión xn

‖xn‖ es de Cauchy.(c) Demostrar con un ejemplo que si α = 0, la sucesión xn

‖xn‖ no es necesaria-mente de Cauchy.

1J Sea xn una sucesión convergente a 0 en un espacio normado. Probar quetambién converge a 0 la sucesión:

yn = x1 + x2 + . . .+ xnn

1K Sea E el espacio vectorial de las funciones polinómicas sobre el intervalo [0, 1].Consideremos sobre él las normas:

‖a0 + a1x+ . . .+ anxn‖∞ = max(|a0|, . . . , |an|)

‖a0 + a1x+ . . .+ anxn‖1 = |a0|+ · · ·+ |an|

‖a0 + a1x+ . . .+ anxn‖ = max

x∈[0,1]|a0 + a1x+ . . .+ anx

n|.

Establecer las comparaciones posibles entre ellas, probando, en particular, que laprimera y la tercera no son comparables.

Capítulo 2

La Diferencial de Fréchet

Iniciamos, con este capítulo, el cálculo diferencial para funciones de va-rias variables reales. Aunque el marco de trabajo será, con frecuencia, el delos espacios normados, nuestro interés se centra en la generalización del con-cepto de derivada, y el estudio de sus propiedades, a las funciones de variasvariables reales.

1. Funciones diferenciablesSi f es una función real de una variable real, sabemos que f es derivable

en el punto a si existe

(2.1) f ′(a) = lımh→0

f(a+ h)− f(a)h

.

Es obvio que el concepto anterior de función derivable puede extenderse, sinmodificación alguna, a las funciones de una sola variable, pero que toman va-lores en un espacio normado cualquiera F . En particular si f : A ⊂ R→ Rp,es fácil ver que f ′(a) = (f ′1(a), f ′2(a), . . . , f ′p(a)). Esta fórmula es igualmenteválida si f es una función de 1 variable que toma sus valores en un productofinito de espacios normados. Sin embargo, cuando f es una función variasvariables (o de “variable vectorial"), no podemos definir f ′(a) como en (2.1)pues el “h” por el que habría que dividir no sería, en ese caso, elemento deun cuerpo. Aún sería esto posible para las funciones de variable compleja,pero éstas no son objeto de estudio en este curso. En lo sucesivo, por tanto,el término variable habrá que entenderlo como variable real, y del mismomodo un espacio normado será, siempre, un espacio normado real. No obs-tante, hemos de señalar que no existen diferencias esenciales entre un cálculodiferencial real y un cálculo diferencial complejo.

25

26 La Diferencial de Fréchet 2.0

Antes de proceder a la extensión definitiva del concepto de derivada alas funciones de varias variables, vamos a dedicar un primer una sección laintroducción de dos conceptos básicos, el de derivada parcial y el de deriva-da direccional. Aunque pueda parecer exagerado, se podría afirmar que elCálculo Diferencial en dimensión finita consiste en el cálculo con derivadasparciales.

1.1. Derivadas parciales

Para funciones de una variable disponemos de unas reglas de cálculo dederivadas, las llamadas reglas de derivación. Por ejemplo sabemos que lafunción si f(x) = x2 + x sen x satisface las hipótesis necesarias para poderaplicar estas reglas para calcular su derivada y así obtener que f ′(x) =2x+ sen x+ x cosx. En particular podemos obtener el valor de la derivadaen un punto concreto a sin más que sustituir a en la igualdad anterior, deeste modo f ′(π) = 2π + 0 − π = π. Cuando estas reglas no son aplicablesen algún punto a, aún la función puede admitir derivada en a. Por ejemplosi f(x) =

√x2 + x sen x, x ∈ [−π/2, π/2] y queremos calcular f ′(x), se

puede aplicar la regla de la cadena para hacer este cálculo en todo punto xdistinto de 0. De este modo para x 6= 0 se tiene f ′(x) = 1/2(2x + sen x +x cosx)(2x + sen x + x cosx)−1/2. En cambio no podemos aplicar la reglade la cadena para calcular f ′(0) pues para ello sería necesario que la raízcuadrada (como función de una variable) fuese derivable en 0. Para estudiarla existencia de f ′(0) recurrimos a la definición de derivada en un punto:

f ′(a) = lımx→a

f(x)− f(a)x− a

.

Entonces para la función del ejemplo tendríamos

f ′(0) = lımx→0

√x2 + x sen x

x=√

2 si x→ 0+

−√

2 si x→ 0−

Una situación idéntica se plantea cuando se tiene una función f de va-rias variables, supongamos para concretar de 2-variables x, y, y se quierecalcular la derivada (parcial) de f respecto a una de las variables. Por ejem-plo si f(x, y) = x2 + y sen y la derivada parcial de f respecto de x en unpunto (x, y) no es otra cosa que la derivada de la función de 1-variableque se obtiene al considerar y en la derivación como una constante. Lue-go ∂f

∂x (x, y) = 2x y análogamente ∂f∂y (x, y) = sen y + y cos y. En particular

podemos obtener el valor de la derivadas parciales en un punto concreto

2.1 La Diferencial de Fréchet 27

(a, b) sin más que sustituir (a, b) en las igualdades anteriores. De igual mo-do si f(x, y) =

√x2 + y sen y, y ∈ [−π/2, π/2], se pueden aplicar en cada

(x, y) 6= (0, 0) las reglas de derivación de las funciones de una variable paradeducir que∂f

∂x(x, y) = x(x2 + y sen y)−1/2; ∂f

∂y(x, y) = 1

2(sen y + y cos y)(x2 + y sen y)12 .

Como antes, no podemos aplicar la regla de la cadena para estudiar la exis-tencia de la derivada parcial respecto a x (o respecto a y) en el punto (0, 0),sino que habremos de recurrir a la definición de derivada parcial respectoa x (o respecto a y) en un punto (a, b), que de acuerdo a lo anterior no esmás que derivada en a de la función de la variable x (o y) que se obtiene alsustituir en la definición de f la variable y (o x) por b (o a) i.e.,

∂f

∂x(a, b) = lım

x→af(x, b)− f(a, b)

x− a; ∂f

∂y(a, b) = lım

y→b

f(a, y)− f(a, b)y − b

Más generalmente,

Definición 2.1 Sea f : A ⊂ Rn → F y sea a ∈oA. Llamaremos derivada

parcial j-ésima de f en a a la derivada en aj de la aplicación de 1-variable

Fj : xj → f(a1, .., aj−1, xj , aj+1, .., an)

La denotaremos por (∂f/∂xj)(a) o, también, Djf(a). Por tanto:

∂f

∂xj(a) = F ′j(aj) = lım

xj→aj

f(a1, . . . , aj−1, xj , aj+1, . . . , an)− f(a)xj − aj

.

Teniendo en cuenta que las derivadas parciales no son más que derivadasde funciones de una variable, podemos aplicar las reglas de derivación yaconocidas para estas últimas para deducir las siguientes reglas de cálculocon derivadas parciales:

1) Si f = (f1, f2, . . . , fp),∂f

∂xj(a) =

(∂f1∂xj

(a), ∂f2∂xj

(a), . . . , ∂fp∂xj

(a)).

2) ∂(f + g)∂xj

(a) = ∂f

∂xj(a) + ∂g

∂xj(a); ∂(λf)

∂xj(a) = λ

∂f

∂xj(a).

3) Si f, g son funciones escalares, ∂(fg)∂xj

(a) = f(a) ∂f∂xj

(a) + ∂g

∂xj(a);

y si además g(a) 6= 0, ∂(f/g)∂xj

(a) = g(a)(∂f/∂xj)(a)− f(a)(∂g/∂xj)(a)g(a)2

28 La Diferencial de Fréchet 2.4

Ejemplo (Una función no continua en un punto, que admite en ese puntoderivadas parciales respecto a cualquier índice).

f(x, y) = xy

x2 + y2 si (x, y) 6= (0, 0); f(0, 0) = 0.

Es fácil ver que las dos derivadas parciales de esta función son nulas en(0,0). Por otras parte la función no es continua en (0,0) pues los límitesdireccionales de f en (0,0) existen pero no son todos iguales:

lımx→0

mx2

x2 +m2x2 = m

1 +m2

1.2. Derivadas direccionales

Definición 2.2 Sea f : A ⊂ E → F, a ∈oA y h 6= 0 un vector de E. Se dirá

que f es derivable en el punto a, siguiendo el vector h, si existe

(2.2) Dhf(a) = lımt→0

f(a+ th)− f(a)t

.

Al elemento de F, Dhf(a), se le denominará derivada de f en a, siguiendoel vector h. Cuando f admite derivada siguiendo cualquier vector no nulo,se dirá también que f admite derivadas en todos las direcciones.

Consideremos la recta de ecuación x = a+th, t ∈ R (recta que pasa por ay tiene a h como vector director). Entonces f(a+th) son los valores que tomaf sobre esta recta, y por tanto, por analogía con los límites direccionales,podría pensarse en denominar al límite 2.2, como la derivada de la funciónf en a siguiendo la recta x = a + th. Esto sería correcto, de no ser porquepara cada vector director de esa recta puede resultar un valor distinto paraDhf(a). Concretamente, es fácil ver que

Dλhf(a) = λDhf(a).

2.3 Observemos que las derivadas parciales en un punto no son más que lasderivadas en ese punto siguiendo ciertos vectores particulares, los vectorese1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . .. En efecto,

∂f

∂xj(a) = lım

xj→aj

f(a1, . . . , aj−1, xj , aj+1, . . . , an)− f(a1, . . . , an)xj − aj

= lımxj→aj

f(a+ (xj − aj)ej)− f(a)xj − aj

= lımt→0

f(a+ tej)− f(a)t

= Dejf(a).

2.5 La Diferencial de Fréchet 29

2.4 La existencia de derivadas en todas las direcciones será una condiciónnecesaria para que una función sea derivable en un punto. Pero de nuevoesta condición es muy débil. Como pasaba con las derivadas parciales, esposible que una función sea derivable en un punto en cualquier dirección yno ser continua en ese punto.

Ejemplo (Una función no continua en un punto, que admite en ese puntoderivadas en todas las direcciones).

f(x, y) = x2y

x4 + y2 si (x, y) 6= (0, 0); f(0, 0) = 0.

Si tomamos v = (h, k) y aplicamos la definición para calcular la derivada enel punto (0,0) siguiendo el vector v, resulta

Si k 6= 0, Dvf(0, 0) = lımt→0

f(th, tk)t

= lımt→0

t3h2k

(t4h4 + t2k2)t = h2

k

Si k = 0, Dvf(0, 0) = 0.

Sin embargo, esta función no es continua en (0,0), pues aunque los límitesiterados y direccionales existen todos y valen 0, los límites siguiendo lascurvas y = mx2 son todos diferentes.

1.3. Diferenciabilidad en un punto

Hemos visto que una función de varias variables puede admitir derivadasparciales e incluso direccionales en un punto a sin ser continua en a. Estoindica que si se quiere que las funciones de varias variables que sean deriva-bles en un punto sean continuas en ese punto, no va a bastar que se les exijasólo la existencia de derivadas parciales o direccionales.

Antes de proceder a extender a varias variables la noción de funciónderivable en un punto, conviene establecer un resultado elemental sobreaplicaciones lineales, que habremos de tener en cuenta en lo sucesivo.

Lema 2.5 i) Una aplicación L de Rn en F es lineal si y sólo existen cj ∈F, j = 1, . . . , n tales que L(x1, x2, . . . , xn) = c1x1 + c2x2 + · · · + cnxn. Sedice que L está determinada por la matriz (c1, c2, . . . , cn).

ii) Toda aplicación lineal L de Rn en F es continua, de hecho lipschit-ziana. (Esto no es verdad para L : E → F y E de dimensión infinita):

30 La Diferencial de Fréchet 2.6

Demostración. i) Obviamente cualquier aplicación de ese tipo es lineal. Re-cíprocamente, si L es lineal entonces

L(x1, x2, . . . , xn) = L(∑

xjej) =∑

xjL(ej) = c1x1 + c2x2 + · · ·+ cnxn,

siendo cj = L(ej).ii) También es inmediato comprobar que si L es lineal entonces es lips-

chitziana, pues ‖L(x) − L(y)‖ = ‖∑cj(xj − yj)‖ ≤ (

∑‖cj‖)‖xj − yj‖∞.

Ejercicio. Probar que toda aplicación lineal y continua entre espacios nor-mados es lipschitziana.

Definición 2.6 Sea f : A ⊂ Rn → F, a ∈oA. Se dice que f es diferenciable

o derivable en a (en el sentido de Fréchet), si admite derivadas parcialesrespecto a cualquier índice en a y además se satisface la siguiente condición:

(2.3) lımx→a

f(x)− f(a)−∑nj=1

∂f∂xj

(a)(xj − aj)‖x− a‖

= 0,

(O equivalentemente, si

(D) lımh→0

f(a+ h)− f(a)−∑nj=1

∂f∂xj

(a)hj‖h‖

= 0,

Notas. 1. Observemos en primer lugar que la definición anterior es indepen-diente de la norma. Es decir, que si f es diferenciable en a respecto a lasnormas ‖ ‖ de Rn y F y sustituimos estas normas por las normas equivalentes‖ ‖∗, f es también diferenciable en a respecto a las nuevas normas. sabemosque existen dos constantes mayores que 0, α, β, tales que ‖x‖ ≤ α‖x‖∗ paracada x ∈ Rn y ‖y‖∗ ≤ β‖y‖ para cada y ∈ F . Entonces si

‖f(a+ h)− f(a)−∑nj=1

∂f∂xj

(a)hj‖‖h‖

≤ ε cuando ‖h‖ ≤ δ,

se tiene también que

‖f(a+ h)− f(a)−∑nj=1

∂f∂xj

(a)hj‖∗

‖h‖∗

≤ αβ‖f(a+ h)− f(a)−

∑nj=1

∂f∂xj

(a)hj‖‖h‖

≤ αβε cuando ‖h‖∗ ≤ 1/αδ,

2.8 La Diferencial de Fréchet 31

2. Para funciones de una variable, la definición anterior coincide conla de función derivable en un punto. En efecto, supongamos que f es unafunción de una variable (con valores en un espacio normado F ). Si f esdiferenciable en a entonces por la definición debe existir (∂f/∂x)(a) = f ′(a).Recíprocamente si f es derivable en a, entonces

lımx→a

f(x)− f(a)− f ′(a)(x− a)|x− a|

= 0

⇔ lımx→a

f(x)− f(a)− f ′(a)(x− a)x− a

= 0

⇔ lımx→a

[f(x)− f(a)

x− a− f ′(a)

]= 0 ⇔ lım

x→af(x)− f(a)

x− a= f ′(a).

Ejemplo 2.7 La función

f(x, y) = x3 − y3

x2 + y2 ; f(0, 0) = 0

es continua y admite derivadas parciales respecto a ambas coordenadas en(0,0) pero no es diferenciable en (0,0).

Proposición 2.8 Sea f : A ⊂ Rn → F y a ∈oA. Son equivalentes:

i) f es diferenciable en a.ii) Existe una aplicación lineal J : Rn → F tal que

(2.4) lımh→0

f(a+ h)− f(a)− J(h)‖h‖

= 0.

Demostración. i) inplica ii). De la definición de función diferenciable se de-duce que la condición f diferenciable en a implica que la aplicación lineal Jcuya matriz asociada es la matriz jacobiana ( ∂f∂x1

(a), . . . , ∂f∂xn(a)), satisface

la condición ii).ii) implica i) De hecho de la condición ii) se deduce:

f es derivable en todas las direcciones.La aplicación J es única, J(h) = Dhf(a) =

∑nj=1

∂f∂xj

(a)hj .

f es diferenciable en a

En efecto, supongamos que la aplicación lineal J : Rn → F satisface

lımh→0

f(a+ h)− f(a)− J(h)‖h‖

= 0,

32 La Diferencial de Fréchet 2.10

entonces para cada h 6= 0 (fijado) se tiene:

lımt→0

f(a+ th)− f(a)− J(th)‖th‖

= 0 = lımt→0

f(a+ th)− f(a)− tJ(h)|t|‖h‖

,

que claramente implica que

lımt→0

f(a+ th)− f(a)− tJ(h)t

= 0

y que, por tanto,

J(h) = lımt→0

f(a+ th)− f(a)t

= Dhf(a).

Se ha probado pues que J no puede ser otra aplicación que la definida porJ(h) = Dhf(a), determinada (en dimensión finita) por la matriz

(J(e1), J(e2), . . . , J(en)) = (De1f(a), . . . , Denf(a)) =(∂f

∂x1(a), . . . , ∂f

∂xn(a)),

es decir J(h) = Dhf(a) =∑nj=1

∂f∂xj

(a)hj , que nos dice que la condición ii)no es otra cosa que la condición (D) de diferenciabilidad en a.

Definición 2.9 La función f : E → F se dice diferenciable (o derivable) enel punto a ∈

oA si existe una aplicación lineal y continua J : E → F tal que

(D) lımh→0

f(a+ h)− f(a)− J(h)‖h‖

= 0.

Teniendo en cuenta la proposición anterior si f es diferenciable en el puntoa existe única aplicación lineal J con esta propiedad, la aplicación J(h) =Dhf(a), que en lo sucesivo se denotará por Df(a) y se llamará la di-ferencial de f en a. En dimensión finita, es decir cuando E = Rn, yasabemos que Df(a) está determinada por la matriz jacobiana, es decirDf(a)(h) ≡ Df(a)h =

∑nj=1

∂f∂xj

(a)hj .

Proposición 2.10 Una función diferenciable en un punto a es continuaen ese punto. De hecho, existe alguna bola centrada en B(a, r) y algunaconstanteM ≥ 0 tal que si x ∈ B(a, r), entonces ‖f(x)−f(a)‖ ≤M‖x−a‖.

2.10 La Diferencial de Fréchet 33

Demostración. Por la diferenciabilidad de f en a existe r > 0 tal que si‖x− a‖ ≤ r entonces

‖f(x)− f(a)−Df(a)(x− a)‖‖x− a‖

≤ 1

⇒‖f(x)− f(a)−Df(a)(x− a)‖ ≤ ‖x− a‖.

Sea V = B(a, r) y x ∈ V , entonces teniendo en cuenta que Df(a) es lips-chitziana, se tiene

‖f(x)− f(a)‖ ≤ ‖f(x)− f(a)−Df(a)(x− a)‖+ ‖Df(a)(x− a)‖≤ (1 +K)‖x− a‖.

Ejercicio. Sean las funciones

f1(x, y, z) = xyz

x2 + y4 + z4 ; f1(0, 0, 0) = 0

f2(x, y, z) = xyz

x2 + y2 + z2 ; f2(0, 0, 0) = 0

f3(x, y, z) = xyz2

x2 + y4 + z4 ; f3(0, 0, 0) = 0.

1. Probar que todas las funciones anteriores admiten derivadas en (0, 0, 0)en todas las direcciones.

2. La única función que no es continua en (0, 0, 0) es f1.3. Comprobar que la aplicaciones T2(u) = Duf2(0, 0, 0) no es lineal y por

tanto f2 no es diferenciable en (0, 0, 0).4. Estudiar cuales de las funciones fi satisfacen la igualdadDufi(0, 0, 0) =

∂fi∂x (0, 0, 0)h+ ∂fi

∂y (0, 0, 0)k + ∂fi∂z (0, 0, 0)p, siendo u = (h, k, p).

5. Comprobar que T3(u) = Duf3(0, 0, 0) es lineal, pero f no es dife-renciable en (0, 0, 0) es decir lımu→0

f3(a+u)−f3(a)−Duf3(a)‖u‖ 6= 0, a =

(0, 0, 0); u = (h, k, p).

6. Comprobar que lımu→0f2(a+u)−f2(a)−Duf2(a)

‖u‖ = 0, a = (0, 0, 0); u =(h, k, p), aunque f2 no es diferenciable en (0, 0, 0) (Observar que T2(u) =Duf2(0, 0, 0) no es lineal).

34 La Diferencial de Fréchet 2.12

1.4. Operaciones con funciones diferenciables

Todas las operaciones permitidas para las funciones derivables de 1-variable serán válidas para las funciones diferenciables definidas entre es-pacios normados:

2.11 Si f, g son funciones diferenciables en a entonces f+g es diferenciableen a, ya que la aplicación lineal Df(a) + Dg(a) satisface la condición dediferenciabilidad (D) para f+g. Del mismo modo sucede con λf (ejercicio).

2.12 Sea f : A ⊂ Rn → Rp, diferenciable en a ∈oA. Si B ⊃ f(A) y g : B ⊂

Rp → F es diferenciable en b = f(a) ∈oB entonces g f es diferenciable en

a y se tiene que

(2.5) D(g f)(a) = Dg(f(a)) Df(a) (Regla de la Cadena).

Demostración. De acuerdo a la proposición 2.8 sólo tenemos que probar queg f satisface en a la condición de diferenciabilidad respecto a la aplicaciónlineal y continua J(h) = (Dg(f(a)) Df(a))h, es decir:

lımx→a

(g f)(x)− (g f)(a)− J(x− a)‖x− a‖

= 0.

En efecto, teniendo en cuenta que

(g f)(x)− (g f)(a)− (Dg(f(a) Df(a))(x− a)‖x− a‖

=g(f(x))− g(f(a))−Dg(f(a)

(Df(a)(x− a)

)‖x− a‖

= g(f(x))− g(f(a))−Dg(f(a)(f(x)− f(a))‖x− a‖

+Dg(f(a))

(f(x)− f(a)−Df(a)(x− a)

)‖x− a‖

,

bastará ver que cada uno de los sumandos en la expresión última tiende a 0cuando x tiende a a. Consideremos la función

ϕ(y) = g(y)− g(b)−Dg(b)(y − b)‖y − b‖

si y 6= b; ϕ(b) = 0.

La diferenciabilidad de g en b implica que ϕ es continua en 0. Por otra parte,teniendo en cuenta que en algún entorno U de a existe un M ≥ 0 tal que

2.13 La Diferencial de Fréchet 35

‖f(x)− f(a)‖ ≤M‖x− a‖ se sigue que si x ∈ U∥∥∥∥g(f(x))− g(f(a))−Dg(f(a))(f(x)− f(a))‖x− a‖

∥∥∥∥=∥∥∥∥‖f(x)− f(a)‖‖x− a‖

ϕ(f(x))∥∥∥∥ ≤M‖ϕ(f(x))‖.

Y puesto que lımx→a ϕ(f(x)) = ϕ(lımx→a f(x)) = ϕ(f(a)) = 0, se deduceque el primero de los sumandos tiende a 0 cuando x tienda a a.

Y en cuanto al segundo sumando:

lımx→a

Dg(f(a))(f(x)− f(a)−Df(a)(x− a)

)‖x− a‖

= lımx→a

Dg(f(a))(f(x)− f(a)−Df(a)(x− a)

‖x− a‖

)= Dg(f(a))

(lımx→a

f(x)− f(a)−Df(a)(x− a)‖x− a‖

)= Dg(f(a))(0) = 0.

En particular, la igualdad D(g f)(a) = Dg(f(a)) Df(a) nos dice queque la matriz jacobiana de gf (la matriz de la aplicación lineal D(gf)(a))es el producto de las matrices jacobianas de g en f(a) por la jacobiana de fen a.

(∂(g f)∂x1

(a), . . . , ∂(g f)∂xn

(a))

=

(∂g

∂y1(f(a)), · · · ,

∂g

∂yp(f(a))

∂f1∂x1

(a) · · · ∂f1∂xn

(a)∂f2∂x1

(a) · · · ∂f2∂xn

(a). . . . . . . . . . . . . . . . . . .∂fp∂x1

(a) · · · ∂fp∂xn

(a)

Esta igualdad matricial nos permite escribir entonces lo que podemos llamarla regla de la cadena para derivadas parciales:

∂(g f)∂xj

(a) =p∑s=1

∂g

∂ys(f(a))∂fs

∂xj(a).

Nota. Observar, no obstante, que la demostración dada para 2.12 es válidaaunque los espacios normados no sean de dimensión finita.

36 La Diferencial de Fréchet 2.15

2.13 Una función f = (f1, . . . , fp) es diferenciable en un punto a si y sólosi las funciones coordenadas f1, . . . , fp son diferenciables en a.

Demostración. Es inmediato comprobar que si las funciones fi son diferen-ciables, entonces la aplicación lineal y continua

J(h) = (Df1(a)h,Df2(a)h, . . . ,Dfp(a)h)

satisface la condición de diferenciabilidad en a para la función f = (f1,. . . , fp). Recíprocamente si f es diferenciable en a, entonces cada fi es di-ferenciable en a pues fi = πi f , donde πi es la proyección i-ésima que eslineal y continua y por tanto diferenciable en todo punto, según el lema quedamos más abajo.

2.14 Si f, g son funciones escalares diferenciables en el punto a entonces elproducto fg y el cociente f/g (si g(a) 6= 0) son diferenciables en a.

Demostración. La aplicación fg se obtiene por la composición x → (f(x),g(x))→ f(x)g(x). La segunda función no es más que la aplicación de R2 enR producto de dos números reales, que veremos en el lema de abajo que esdiferenciable en todo punto. La primera es diferenciable en a pues se tratade una función con dos funciones coordenadas f, g, que por hipótesis sondiferenciables en a. Para el cociente Basta ver que si g(a) 6= 0, entonces laaplicación 1/g es diferenciable en a. Escribiendo 1/g como la composiciónde las aplicaciones

x→ g(x)→ 1g(x) ,

eso se sigue de que la aplicación de R en R, t → 1/t, es diferenciable enR \ 0.

Lema 2.15 i) Si T es una aplicación lineal y continua entre los espaciosnormados E y F entonces T es diferenciable en cada punto de x ∈ E yDT (x) = T .

ii) La aplicación producto de números reales es una aplicación de R2 enR diferenciable en todo punto.

Demostración. i) Puesto que

T (x+ h)− T (x)− T (h)‖h‖

= 0,

2.16 La Diferencial de Fréchet 37

Es obvio que se satisface la condición de diferenciabilidad en x con T =DT (x).

ii) Sea p : R2 → R; p(x, y) = xy. Entonces ∂p∂x(a, b) = b y ∂p

∂y (a, b) = a,por lo que

p((a, b) + (h, k))− p(a, b)− ( ∂p∂x(a, b)h+ ∂p∂y (a, b)k)

‖h‖

= (a+ h)(b+ k)− ab− (bh+ ak)‖h‖

= hk√h2 + k2

.

Puesto que lım(h,k)→(0,0)hk√h2+k2 = 0, se tiene que p satisface la condición de

diferenciabilidad en (a, b).

Nota. No consideraremos aquí la diferenciabilidad de la inversa de una fun-ción, ya que el estudio de funciones inversas será el objeto de otro capítuloposterior.

2.16 Los resultados anteriores nos permitirán construir una extensa familiade funciones diferenciables. Empecemos, por ejemplo, con los polinomios:Como se sabe un polinomio de varias variables es una aplicación de la forma

f(x1, x2, . . . , xn) =∑finita

ai1...inxi11 . . . x

inn , ik = 0, 1, . . .

Puesto que la suma y el producto de aplicaciones diferenciables es una apli-cación diferenciable, es evidente que los polinomios son diferenciables ya quelas aplicaciones

(x1, x2, . . . , xn)→ ai1...in

(x1, x2, . . . , xn)→ xik

lo son, como fácilmente puede verificarse.Aplicando 2.14, las funciones racionales (cocientes de dos polinomios)

son diferenciables sobre el conjunto de puntos donde el polinomio del deno-minador no se anula.

Por último, mediante la composición de las funciones anteriores con fun-ciones de una variable y diferenciables, se obtienen nuevas funciones de variasvariables y diferenciables

sen (x2 + y2), log(1 + x2 + y2), 11 + cos2(xyz) , . . .

38 La Diferencial de Fréchet 2.19

1.5. Interpretación geométrica de la diferenciabilidad

Es bien conocido que una función de una variable f es derivable en unpunto a si y sólo si su gráfica admite una recta tangente (no vertical) enel punto (a, f(a)). De igual forma el hecho de que una función (escalar)z = f(x1, . . . , xn), de n-variables, sea diferenciable en un punto a significaen términos geométricos que existe un hiperplano de Rn+1 de ecuación z =f(a1, . . . , an) + J(x1 − a1, . . . , xn − an) (J lineal), tangente a la gráfica def en el punto c = (a, f(a)). Previamente debemos formalizar la noción detangencia, a fin de que la condición de diferenciabilidad: existe J tal que

lımh→0

f(a+ h)− f(a)− J(h)‖h‖

= 0,

pueda interpretarse en el sentido geométrico anterior.

Definición 2.17 Llamaremos curva de Rk (k > 1) a toda aplicación con-tinua γ : I ⊂ R → Rk, donde I es un intervalo de R. Podemos pensar enγ(t) = (x1(t), . . . , xk(t)) como en la posición de un móvil en el instante detiempo t. Al subconjunto de Rk imagen de γ

T (γ) = (x1(t), . . . , xk(t)) : t ∈ I

se le denomina la traza de la curva.(Idéntica definición para curva en un espacio normado).

Si γ es derivable en un punto t0 ∈oI diremos que el vector γ′(t0) =

(x′1(t0), . . . , x′k(t0)) es tangente a la curva en c = γ(t0). Es fácil ver que elvector γ′(t0) es, conforme a la idea intuitiva que se tiene de tangencia, unvector tangente a la traza.

Ejemplo 2.18 Si la función de 1-variable f : I ⊂ R→ R es continua en elintervalo I entonces su gráfica es la traza de una curva de R2.

Obviamente la gráfica de f, Gr(f) = (x, f(x)) : x ∈ I, es la traza dela curva γ : I ⊂ R→ R2, γ(x) = (x, f(x)).

Definición 2.19 Un vector w de Rk se dirá tangente al conjunto M ⊂ Rken el punto c ∈ M , si existe alguna curva γ : I ⊂ R → Rk contenida en Mque pasa por c y tiene a w como vector tangente en c i.e.,

i) γ(t) ∈M para cada t,ii) existe t0 ∈ I tal que γ(t0) = c,iii) γ es derivable en t0 y γ′(t0) = w.

2.20 La Diferencial de Fréchet 39

Geométricamente, un vector tangente a M en c es pues un vector tan-gente a alguna curva trazada sobre M pasando por c (ver ejercicio 2M parauna definición más general de vector tangente.) Al conjunto de vectorestangentes a M en el punto c ∈M se le denotará por Tc(M).

Proposición 2.20 Sea f : A ⊂ R2 → R una aplicación diferenciable en elpunto a = (x0, y0) ∈

oA,M la gráfica de f y c = (a, f(a)) = (x0, y0, f(x0, y0)).

Entonces el conjunto de vectores tangentes a M en c, Tc(M), es el planovectorial director del plano afín Ac(M) que pasa por c y tiene de ecuación

z = f(a) +Df(a)(x− x0, y − y0) = f(a) + ∂f

∂x(a)(x− x0) + ∂f

∂y(a)(y − y0).

Demostración. Es claro que el plano vectorial director de Ac(M) es L =(x, y, z) : z = Df(a)(x, y). Veamos primero que L ⊂ Tc(M). En efecto, seaw = (h, k, p) ∈ L es decir tal que p = Df(a)(h, k) y consideremos la curva

γ(t) = (x0 + th, y0 + tk, f(x0 + th, y0 + tk)).

Obviamente γ es una curva contenida enM que pasa por c = (x0, y0, f(x0, y0)).Geométricamente podemos obtenerla mediante la intersección de M con elplano perpendicular alXY y contiene a la recta x = x0+th; y = y0+tk; z =0. Observemos que γ es derivable en t = 0,

γ′(0) =(h, k, lım

t→0

f(x0 + th, y0 + tk)− f(x0, y0)t

)= (h, k,D(h,k)f(a)) = (h, k,Df(a)(h, k)) ∈ Tc(M).

Veamos ahora que Tc(M) ⊂ L. Sea w = (h, k, p) ∈ Tc(M) y, portanto, sea γ : I ⊂ R → R3 : γ(t) = (x(t), y(t), z(t)) una curva cuyatraza esté contenida en M es decir z(t) = f(x(t), y(t)) y tal que en al-gún punto t0 ∈

oI γ(t0) = (x(t0), y(t0), z(t0)) = c = (x0, y0, f(x0, y0)) y

γ′(t0) = (x′(t0), y′(t0), z′(t0)) = (h, k, p).Se trata pues de ver que de lo anterior se deduce que p = Df(a)(h, k).

En efecto, puesto que z(t) = f(x(t), y(t)), aplicando la regla de la cadena setiene que p = z′(t0) = Df(x(t0), y(t0))(x′(t0), y′(t0)) = Df(x0, y0)(h, k).

Observar que el plano vectorial Tc(M) de la función f no contiene alvector (0, 0, 1). Por eso, la interpretación geométrica que acabamos de dardel hecho de que f sea diferenciable en a suele expresarse diciendo que lagráfica de f admite un plano tangente no vertical en el punto c = (a, f(a)).

40 La Diferencial de Fréchet 2B

La proposición anterior se extiende a más variables y a funciones entreespacios normados con idéntica demostración. El enunciado preciso es elsiguiente:

Proposición 2.21 Si f : A ⊂ E → F es una aplicación diferenciable enel punto a ∈

oA, M ⊂ E × F es la gráfica de f y c = (a, f(a)), entonces el

conjunto de vectores tangentes a M en c, Tc(M), es un subespacio vectorialde E×F isomorfo a E, que no contiene vectores de la forma (0, v) con v 6= 0.Tc(M) es asimismo el espacio vectorial director de la variedad afín de E×Fde ecuación z = f(a) +Df(a)(x− a).

Ejercicios2A Estudiar continuidad y existencia de derivadas parciales para las funciones

1. f(x, y) =

ln(1 + (x− y)2) si x− y > 1x− y + ln 2 si x− y ≤ 1

2. f(x, y) =√x4 + sen 2xy

3. f(x, y) =

x3

x2 + y2 si (x, y) 6= (0, 0)

0 si (x, y) = (0, 0)

4. f(x, y) =

senx−sen yx−y si x 6= y

cosx si x = y

2B Supongamos que f es una función escalar de dos variables, continua en el punto(0,0), y sea g(x, y) = xf(x, y). Probar que g es diferenciable en (0,0).

2C Sean E,F espacios normados, f : A ⊂ E → F y a ∈oA.

(a) Si f es diferenciable en a, probar que

lımh→0

f(a+ h)− f(a)‖h‖

=

0 si Df(a) = 0No existe si Df(a) 6= 0

(b) Probar que si f admite derivadas en a siguiendo cualquier vector y

(∗) lımh→0

‖f(a+ h)− f(a)‖‖h‖

= α 6= 0

entonces ‖Dhf(a)‖ = α‖h‖, para todo h ∈ E.

2F La Diferencial de Fréchet 41

(c) Deducir de (b) que si dimE > dimF y f satisface (∗) entonces f no puedeser diferenciable en a.Indicación. De ser diferenciable en a, existiría algún vector no nulo en elnúcleo de Df(a).

(d) Si f es diferenciable en a, entonces son equivalentes:

i) Existe lımh→0‖f(a+ h)− f(a)‖

‖h‖ii) ‖Df(a)h‖ = ‖Df(a)‖‖h‖ para todo h ∈ E.

(e) Considerar las funciones

f1(x, y) =√x2 + y2 ; f2(x, y) =

√x2 + y2 si x ≥ 0

−√x2 + y2 si x < 0

Probar que ambas funciones satisfacen la condición (∗) en (0,0), cuando seconsidera la norma euclídea en R2. Ninguna de las dos funciones son di-ferenciables en (0,0), pero mientras que la función f1 no admite derivadasdireccionales, la función f2 sí.

2D Probar que la función f(x) = x3/2sen 1/x, f(0) = 0 es derivable en 0, perono es lipschitziana en ningún entorno de 0.

2E Estudiar continuidad, existencia de derivadas parciales, existencia de derivadasdireccionales y diferenciabilidad en el origen de coordenadas, para cada una de lasfunciones siguientes. (Supondremos que todas estas funciones toman el valor 0 enel origen)

1. f(x, y) = x4 + x2y2 + y5

x2 + y4 2. f(x, y) = x3 − y3

x2 + y2

3. f(x, y) = x4 + y4

x2 + y2 4. f(x, y) = sen (x3 + xyz)x2 + y2 + z2

5. f(x, y) = ln(1 + xy)√x2 + y2

6. f(x, y) = ln(1 + xy)3√x2 + y2

7. f(x, y) = (x2 + y3)(x2 + y2)x2 + y4 8. f(x, y) = xy

x2 +√x2 + y2

2F 1. Estudiar la diferenciabilidad de la función f(x, y) = sen |x2 − y2|, en lospuntos (0,0) y (1,1).

2. Estudiar la diferenciabilidad en (0,0) de la función f(x, y) = |xy|α, según losvalores de α ≥ 0.

42 La Diferencial de Fréchet 2F

3. Estudiar continuidad, existencia de derivadas parciales, existencia de deri-vadas direccionales y diferenciabilidad en los puntos (0,0) y (0,1), para lafunción

f(x, y) =√

x4 + sen 2(xy) si x ≥ 0−√x4 + sen 2(xy) si x < 0

2G Demostrar que la función

f(x, y) = x5 − y3√x6 + y4

; f(0, 0) = 0

es diferenciable en (0,0).Indicación: Probar que

0 ≤√x6 + y4 − y2 ≤ |x|3, ∀x, y.

2H En este ejercicio g y ϕ serán en todos los casos una función escalar diferenciableen todo punto (aunque no siempre del mismo número de variables). Supuesto esto, setrata de probar que la función h construida a partir de g es también diferenciable yde calcular sus derivadas parciales en términos de las funciones g y ϕ y sus derivadasparciales:

1. h(x, y, z) = g(x2 − z, sen xyz) 2. h(x, y, z) = g(x+ y − z2)3. h(x) = g(x3, sen x, x− 1) 4. h(x) = g(x2, g(x, sen x))5. h(x, y) = g(x2, g(x, sen y)) 6. h(x, y, z) = xg(xy) + yg(xz) + zg(yz)7. h(x) = xg(x+ g(x)) 8. h(x, y, z) = g(x, y) + g(x, z) + g(y, z)9. h(x, y) = g(x+ ϕ(x, y)) 10. h(x, y) = g(x, yϕ(x, y))

2I Como en el ejercicio anterior, g y ϕ denotarán funciones escalares diferenciablesen todo punto. Sean:

(a) h(x, y, z) = g(xy, ϕ(yz)), con

ϕ(0) = 0 ; ϕ′(0) = 1 ; Dg(0, 0) ≡ (2, 3)

Calcular las derivadas parciales de h en (0, 1, 0).(b) h(x, y) = x · g(x, y, y), con

g(1, 0, 0) = 1 ; Dg(1, 0, 0) ≡ (1, 2,−2).

Calcular las derivadas parciales de h en (1, 0).

2M La Diferencial de Fréchet 43

(c) h(x, y, z) = g(xz, g(y, z)), con

g(0, 1) = 0 ; Dg(0, 0) ≡ (1, 2) ; Dg(0, 1) ≡ (−3, 4).

Calcular las derivadas parciales de h en (0, 0, 1).

2J Probar que la función

h(x, y) =∫ x+y

0e−t

2+xdt

es diferenciable en cada punto y calcular su diferencial.Indicación: Tener en cuenta el teorema fundamental del cálculo integral: Si f esuna función continua en el intervalo [a, b], entonces la función F (x) =

∫ xaf(t)dt es

derivable y su derivada es F ′(x) = f(x).

2K Considerar la función f(x, y) = x2 − 2y.

(a) Obtener la ecuación del plano tangente a la gráfica de f en el punto (0,1,-2).(b) Calcular la derivada de f en (0,1) siguiendo el vector v = (2, 3).(c) Encontrar alguna curva sobre la gráfica de la función f , que pase por el punto

(0,1,-2) y tenga como vector tangente en ese punto a (2, 3, D(2,3)f(0, 1)).

2L Estudiar la existencia de derivadas direccionales en (0,0) para las funciones

f1(x, y) = 3√x3 + y3; f2(x, y) = 3

√x3 + y4

¿Son diferenciables en (0,0)?Indicación: Para estudiar la diferenciabilidad de f2 en (0,0), puede resultar útilsaber que, si r es un número real > 0 y denotamos por g a la función g(u) =3√u+ r− 3

√u, entonces g es no negativa y alcanza un máximo absoluto en el punto

u = −r/2.

2M (Una definición más general de vector tangente) SeaM un subconjuntode un espacio normado G, c ∈ M y v ∈ G. Se dirá que v es tangente a M en c, siexiste una sucesión zn de puntos de M y una sucesión de escalares λn > 0 talque:

zn → c, λn(zn − c)→ v.

Se denotará por Tc(M) al conjunto de vectores tangentes a M en c.

(a) Probar que un vector no nulo v es tangente a M en c si y sólo si existe unasucesión zn ⊂M, zn 6= c tal que

zn → c,zn − c‖zn − c‖

→ v.

44 La Diferencial de Fréchet 2M

(b) Sea γ : (a, b) ⊂ R → G una curva contenida en M que pasa por el puntoc ∈ M . Para concretar, sea c = γ(t0). Probar que si γ es derivable en t0entonces el vector v = γ′(t0) es un vector tangente a M en c.

(c) Sean E,F espacios normados y f : A ⊂ E → F una aplicación continua yderivable siguiendo un vector h en el punto a ∈

oA. Probar que el vector

(h,Dhf(a)) es un vector tangente en el punto c = (a, f(a)) a la gráfica de lafunción f .

(e) Sea f : A ⊂ E → F una función diferenciable en un punto a y M su gráfica:1. Demostrar que el conjunto de los vectores tangentes a M en el puntoc = (a, f(a)) es el subespacio vectorial isomorfo a E,

Tc(M) = (h,Df(a)h) : h ∈ E.

2. Demostrar que el vector v es tangente a M en c = (a, f(a)) si y sólo si ves tangente en c a alguna curva contenida en M que pasa por c.

2.24 La Diferencial de Fréchet 45

2. El teorema del valor medioComenzaremos esta sección recordando dos versiones del teorema del

valor medido para funciones de 1-variable y por tanto ya conocidas:

2.22 Sea f : [a, b] ⊂ R → R una función continua en [a, b] y derivable en(a, b). Entonces:

(i) Existe algún punto c ∈ (a, b) tal que f(b)− f(a) = f ′(c)(b− a).(ii) Si además existe alguna constante M tal que |f ′(x)| ≤ M para todo

x ∈ (a, b), entonces |f(x)− f(y)| ≤M |x− y|, ∀x, y ∈ [a, b] (Fórmulade los incrementos finitos)

En este tema extenderemos a las varias variables la fórmula de los incre-mentos finitos. Esta extensión, a la que nos referiremos como teorema delvalor medio estará presente en mayor o en menor medida, como sucedía para1-variable, en gran parte de los resultados del Calculo Diferencial en variasvariables. En el enunciado del teorema necesitaremos referirnos a la nociónde segmento:

Definición 2.23 En un espacio vectorial E se denomina segmento de ex-tremos a, b, al conjunto

[a, b] = a+ t(b− a) : t ∈ [0, 1] = (1− t)a+ tb : t ∈ [0, 1].

Llamaremos segmento abierto de extremos a y b al conjunto (a, b) = [a, b] \a, b. El conjunto A se dirá convexo si para cada par de puntos de A, elsegmento que los une está totalmente contenido en A.

Proposición 2.24 Toda bola es un conjunto convexo.

Demostración. Sean x, y dos puntos de la bola B(a, r) y sea z = (1−t)x+tyun punto del segmento [x, y]. Entonces

‖z − a‖ = ‖(1− t)x+ ty − ((1− t)a+ ta‖≤ (1− t)‖x− a‖+ t‖y − a‖ < (1− t)r + tr = r.

El primero de los resultados (2.22(i)) se extiende tal cual a funcionesescalares de varias variables. Pero no es cierto, en general, para funcionesvectoriales.

46 La Diferencial de Fréchet 2.27

Teorema 2.25 Sea [a, b] un segmento de Rn y f : A ⊂ Rn → R una funcióncontinua en [a, b] ⊂

oA y derivable en (a, b). Entonces existe algún punto

c ∈ (a, b) tal que f(b)− f(a) = Df(c)(b− a).

Demostración. Consideremos la aplicación λ : [0, 1] ⊂ R → [a, b] ⊂ Rn defi-nida por λ(t) = a + t(b − a) = (a1 + t(b1 − a1), . . . , an + t(bn − an)). Estaaplicación es claramente derivable en [0,1], siendo λ′(t) = b−a. Sea g = f λ,g es una función escalar de una variable que es continua en [0, 1] y derivableen (0, 1), pues f es continua en cada punto λ(t) con t ∈ [0, 1] y derivable enλ(t) con t ∈ (0, 1). Aplicando la regla de la cadena se tiene que

g′(t) =∑ ∂f

∂xj(λ(t))(bj − aj).

Aplicando ahora el teorema de valor medio para funciones escalares de unavariable a la función g en [0, 1], se tiene que existe algún θ ∈ (0, 1)

f(b)−f(a) = g(1)−g(0) = g′(θ) =∑ ∂f

∂xj(λ(θ))(bj−aj) = Df(λ(θ))(b−a).

En cuanto al segundo de los resultados (2.22(ii)) se extiende, sin ningunarestricción, a funciones con valores en un espacio normado F , aunque aquísólo lo demostraremos para F = (Rp, ‖ ‖∞):

Teorema 2.26 Sea [a, b] un segmento de Rn y f : A ⊂ Rn → Rp una funcióncontinua en [a, b] ⊂

oA y derivable en (a, b). Si para para algún M ≥ 0 se

tiene ∣∣∣∣∣ ∂fi∂xj(x)∣∣∣∣∣ ≤M, ∀x ∈ (a, b); i = 1, . . . , p ; j = 1, . . . , n.

Entonces

(2.6) ‖f(b)− f(a)‖∞ ≤M ‖b− a‖1.

Demostración. Es una consecuencia directa del teorema anterior (Teorema2.25) aplicado a cada función coordenada de la función f . En efecto si f =(f1, f2, ..., fp), entonces para cada i = 1, . . . , p, existe algún punto ci ∈ (a, b)tal que fi(b)− fi(a) =

∑ ∂fi∂xj

(ci)(bj − aj), luego

‖f(b)− f(a)‖∞ = max1≤i≤p

|fi(b)− fi(a)| ≤∑

M |bj − aj | = M‖b− a‖1.

2.27 La Diferencial de Fréchet 47

El siguiente teorema no es una extensión a varias variables de alguno yaconocido para 1-variable:

Teorema 2.27 Sea [a, b] un segmento de Rn y f : A ⊂ Rn → Rp una funcióncontinua en [a, b] ⊂

oA. Supongamos que existe algún abierto U tal que [a, b] ⊂

U ⊂ A en el que las derivadas parciales de f existen y están acotadas, esdecir existe M ≥ 0 tal que∣∣∣∣∣ ∂fi∂xj

(x)∣∣∣∣∣ ≤M, ∀x ∈ U ; i = 1, . . . , p ; j = 1, . . . , n.

Entonces ‖f(b)− f(a)‖∞ ≤M ‖b− a‖1.

Demostración. Puede suponerse que f es una función escalar, pues si elteorema fuese cierto para funciones escalares, entonces para una funciónvectorial, f = (f1, f2, ..., fp), se tendría también:

‖f(b)− f(a)‖∞ = max1≤i≤p

|fi(b)− fi(a)| ≤M ‖b− a‖1.

(i) Etapa 1:Supongamos en primer lugar que el segmento [a, b] está contenido en

algún n-rectángulo cerrado R contenido a su vez en U . Por definición, unn-rectángulo (cerrado) es un producto cartesiano de n intervalos (cerrados)de R, es decir un conjunto de la forma

R = [c1, d1]× . . .× [cn, dn].

Por tanto un punto z = (zi) está en R si y sólo si ci ≤ zi ≤ di , para todo i.Entonces

f(a)− f(b) =f(a1, a2, . . . , an)− f(b1, a2, . . . , an)+ f(b1, a2, . . . , an)− f(b1, b2, a3, . . . , an)(2.7)..................................................

+ f(b1, b2, . . . , bn−1, an)− f(b1, . . . , bn).

Evidentemente cada uno de los nuevos puntos que utilizamos en esta des-composición pertenecen a R, y en cada paso los dos puntos que aparecensólo se diferencian en una de las coordenadas. Entonces, la existencia de de-rivadas parciales en cada punto de R, nos permite aplicar en cada uno de lospasos anteriores el teorema de valor medio para funciones de una variable,en efecto vayamos al primer paso y consideremos la función de la variable

48 La Diferencial de Fréchet 2.28

x1, F1 : x1 → f(x1, a2, . . . , an). Obviamente esta función y su derivada estábien definida en [c1, d1] ya que F ′1(x1) = ∂f

∂x1(x1, a2, . . . , an) y las derivadas

parciales existen en cada punto de R ⊂ U . Puesto que a1, b1 ∈ [c1, d1] y|F ′1(x1)| ≤ M si x1 ∈ [c1, d1], aplicando a F1 el teorema del valor medio(2.22)(ii) se tiene que

|f(a1, a2, . . . , an)− f(b1, a2, . . . , an)| = |F1(a1)− F1(b1)| ≤M |a1 − b1|

Procediendo de igual modo con cada línea de (2.7) obtendríamos

|f(b1, . . . , bj−1, aj , . . . , an)− f(b1, . . . , bj , aj+1, . . . , an)|≤∑

M |aj − bj | = M‖a− b‖1.

Etapa 2:Veamos ya que la desigualdad anterior se verifica en el caso general. Para

ello vamos a utilizar el siguiente

Lema 2.28 Si el segmento [a, b] está contenido en el abierto U , entoncesexiste algún λ > 0 tal que para todo x ∈ [a, b], el n-cubo (cuadrado en R2)B∞[x, λ] está contenido en U .

En consecuencia es fácil ver que si p es un número natural tal que1p‖b− a‖∞ ≤ λ, los puntos del segmento [a, b]:

a = c0, c1 = c0 + 1p

(b− a), c2 = c1 + 1p

(b− a), . . . , cp = cp−1 + 1p

(b− a) = b

tienen la propiedad siguiente: Cada dos consecutivos pertenecen a un mis-mo n-cubo cerrado contenido en U . Entonces, conforme a lo probado en laEtapa 1 , se tiene:

‖f(a)− f(b)‖∞ ≤ ‖f(c0)− f(c1)‖∞ + ‖f(c1)− f(c2)‖∞ + · · ·≤M‖c1 − c0‖1 +M‖c2 − c1‖1 + · · ·

= M(1p‖a− b‖1 + 1

p‖a− b‖1 + · · · )

= M‖a− b‖1.

Demostración del Lema. Supongamos que para cada p existe un dp ∈ [a, b]y un yp ∈ B∞[dp, 1

p ] tal que yp ∈ U c. Sea dp = a + tp(b − a) con tp ∈ [0, 1].Puesto que [0, 1] es compacto la sucesión tp tiene una subsucesión tpk

2.30 La Diferencial de Fréchet 49

que converge a un punto s de [0, 1] y por lo tanto dpk converge al punto

d = a+ s(b− a) de [a, b] (comprobarlo como ejercicio). También

‖ypk− d‖∞ ≤ ‖ypk

− dpk‖∞ + ‖dpk

− d‖∞ ≤1pk

+ ‖dpk− d‖∞ → 0,

lo que nos dice que la sucesión ypk de puntos de U c converge a d. Pero esto

es absurdo, pues como d ∈ U y U es abierto cualquier sucesión que converjaa d debe tener sus términos a partir de uno en adelante contenidos en U .

Nota. Los teoremas 2.26 y 2.27 pueden extenderse a funciones con valores enun espacio normado de cualquier dimensión (F, ‖ ‖). En tal caso la hipótesissobre las derivadas parciales habría habría de ser

‖ ∂f∂xj

(x)‖ ≤M,

para cada x bien en (a, b) o en algún abierto conteniendo a [a, b], segúnestemos en las condiciones del Teorema 2.26 o en las del Teorema 2.27. Laconclusión, la misma:

‖f(b)− f(a)‖ ≤M‖b− a‖1.

La demostración de este hecho se deduce claramente del siguiente

Lema 2.29 Sea F un espacio normado y f : [a, b] ⊂ R → F una fun-ción continua en [a, b] y derivable en (a, b). Supongamos que existe al-guna constante M tal que ‖f ′(t)‖ ≤ M para todo t ∈ (a, b), entonces‖f(b)− f(a)‖ ≤M(b− a)

Hay varias demostraciones para este lema. Una de ellas, tomada básicamentedel libro de T.M. Flett [12], puede verse en Manual (Lema 8.10(2) y Teorema8.12). Otra puede verse en el libro de H. Cartan [5]. La demostración quedamos a continuación, quizá la más corta, es la que se basa en el potenteresultado del Análisis Funcional conocido como teorema de Hahn-Banach:

2.30 [Hahn-Banach] Sea (E, ‖ ‖) un espacio normado, L un subespaciovectorial de E y ϕ : L → R una forma lineal continua sobre L tal que|ϕ(u)| ≤ ‖u‖ para cada u ∈ L. Entonces ϕ puede extenderse a una formalineal y continua en todo E y tal que |ϕ(x)| ≤ ‖x‖ para cada x ∈ E.

50 La Diferencial de Fréchet 2.33

Demostración Lema 2.29 Sea h = f(b)− f(a) ∈ F , L =< h > el subespaciovectorial de F generado por h y ϕ : L → R definida por ϕ(th) = t‖h‖. Esobvio que ϕ es lineal y continua sobre L y para cada u ∈ L, |ϕ(u)| = ‖u‖.Sea ϕ : F → R la extensión a F que nos proporciona el teorema de Hahn-Banach y, por tanto, satisfaciendo la desigualdad |ϕ(x)| ≤ ‖x‖ para todox ∈ E. Puesto que toda aplicación lineal y continua es diferenciable en cadapunto, la aplicación g = ϕ f es una función continua en [a, b] y derivableen (a, b) y que toma sus valores en R. Además,

|g′(t)| = |Dϕ(f(t))(f ′(t))| = |ϕ(f ′(t))| ≤ ‖f ′(t)‖ ≤M.

Por tanto, de 2.22(ii) se deduce que

‖f(b)− f(a)‖ = |ϕ(f(b)− f(a))| = |g(b)− g(a)| ≤M(b− a).

2.1. Consecuencias

2.31 Sea U un conjunto abierto convexo de Rn y f : U → Rp una funciónque admite derivadas parciales acotadas en U . Entonces f es lipschitzianaen U.

Demostración. Basta aplicar el apartado (i) del teorema anterior en el seg-mento [x, y] para cada x, y ∈ U .

2.32 Si todas las derivadas parciales de una función f : U ⊂ Rn → Rp sonnulas en el abierto conexo U , entonces f es constante sobre U .

Demostración. Por definición el abierto U se dice conexo si no se puededescomponer como unión de otros dos abiertos no vacíos y disjuntos. Seaa ∈ U y B = x ∈ U : f(x) = f(a). Se trata de probar que B = U . Paraello, veamos en primer lugar que B es abierto, es decir que si x ∈ B entoncesB es entorno de x. Puesto que U es abierto, U es entorno de x y por tantoexiste alguna bola centrada en x, B(x, r(x)) contenida en U . Para que B seaentorno de x bastará ver que esta bola está contenida en B. Puesto que lasderivadas parciales son nulas (acotadas, por tanto, por M = 0) la funciónf debe ser, según 2.25, lipschitziana de constante de Lipschitz M = 0 encada abierto y convexo contenido en U , en particular en la bola B(x, r(x)).Es decir que si y ∈ B(x, r(x)) entonces ‖f(y) − f(x)‖ ≤ 0‖x − y‖, luegof(y) = f(x) y, como f(x) = f(a) ya que x ∈ B, se tiene que y ∈ B.

Con el mismo argumento se prueba que también U \ B es abierto, porlo que U se escribe como unión de los abiertos disjuntos B y U \ B. ComoU es conexo y B 6= ∅(a ∈ B), se tiene que U \B = ∅ o sea que B = U .

2.34 La Diferencial de Fréchet 51

Proposición 2.33 Un conjunto abierto U de Rn es conexo si y sólo si esconexo por arcos i.e., si para cada x, y ∈ U existe una curva r : [α, β]→ Rnde extremos x = r(α); y = r(β) cuya traza está contenida en U .

Demostración. Ver Manual (Proposición 1.10).

2.34 [Condición suficiente de diferenciabilidad] Sea f : A ⊂ Rn →Rp, y a ∈

oA. Si f admite derivadas parciales, respecto a cualquier índice, en

un entorno del punto a y éstas son aplicaciones continuas en a, entonces fes lipschitziana en alguna bola centrada en a y diferenciable en a.

Demostración. Puesto que suponemos que las aplicaciones

∂fi∂xj

: x→ ∂f

∂xj(x)

son continuas en a debe existir alguna B(a, rij) tal que si x ∈ B(a, rij)entonces∣∣ ∂fi∂xj

(x)− ∂fi∂xj

(a)∣∣ ≤ 1 ⇒

∣∣ ∂fi∂xj

(x)∣∣ ≤ 1+

∣∣ ∂fi∂xj

(a)∣∣ ≤M = (1+max

i,j

∣∣∂fi∂xi

(a)∣∣).

Tomando r = mın rij , de 2.31 se deduce entonces que f es lispchitziana enB(a, r).

Para que f sea diferenciable en a hemos de ver que

(2.8) lımx→a

f(x)− f(a)−∑nj=1

∂f∂xj

(a)(xj − aj)‖x− a‖

= 0.

Para ello vamos a aplicar de nuevo 2.31 a la función

g(x) = f(x)− f(a)−n∑j=1

∂f

∂xj(a)(xj − aj).

Es claro que∂gi∂xj

(x) = ∂fi∂xj

(x)− ∂fi∂xj

(a).

Por tanto, aplicando el hecho de que las derivadas parciales de f son con-tinuas en a, se tiene que para todo ε > 0 existe algún δ > 0 tal que six ∈ V = B(a, δ) entonces

∣∣ ∂gi∂xj

(x)∣∣ =

∣∣ ∂fi∂xj

(x)− ∂f

∂xj(a)∣∣ ≤ ε, ∀i, j.

52 La Diferencial de Fréchet 2.37

Se deduce, pues, que la función g cumple en V las hipótesis de 2.31, luegoes lipschitziana en V . En particular, si x ∈ V

‖g(x)− g(a)‖∞ =∥∥f(x)− f(a)−

n∑j=1

∂f

∂xj(a)(xj − aj)

∥∥∞ ≤ ε‖x− a‖1,

que, obviamente, significa que f satisface la condición 2.8.

Nota. Obsérvese que del hecho de que la función g de la demostración an-terior sea lipschitziana en V , se deduce que

lım(x,y)→(a,a)

f(x)− f(y)−∑nj=1

∂f∂xj

(a)(xj − yj)‖x− y‖

= 0.

Una función que satisface la condición anterior se dice que es estrictamentediferenciable en a. Por lo tanto, se ha demostrado que si f es una funcióncuyas derivadas parciales son continuas en a, entonces f es algo más dediferenciable en a, es estrictamente diferenciable en a.

Consecuencia inmediata del teorema anterior es el siguiente

Corolario 2.35 Si todas las derivadas parciales de una función f son con-tinuas en un abierto U de Rn entonces f es locamente lipschitziana y dife-renciable en U .

Definición 2.36 (Función de clase C1) Sea A un subconjunto de Rn.Una función f se dice de clase C1 sobre A, lo cual lo expresaremos conla notación f ∈ C1(A), si f admite derivadas parciales en algún abierto quecontiene a A y éstas son continuas en cada punto de A.

El siguiente corolario es consecuencia directa del teorema anterior:

Corolario 2.37 Si f es una función de clase C1 sobre A entonces f esdiferenciable en cada punto de A.

2Q La Diferencial de Fréchet 53

Ejercicios2N (a) Probar que si ‖ · ‖ es una norma cualquiera sobre Rn, entonces la apli-

cación x → ‖x‖ es una aplicación lipschitziana que no admite derivadasdireccionales en 0.

(b) Sea U = (x, y) ∈ R2 : x2 + y2 < 1 \ 0 × [0, 1], y consideremos la funciónf definida sobre U por

f(x, y) =y2 si x > 0 e y ≥ 00 en otro caso

Probar que U es un abierto conexo (no convexo) sobre el que f es continua,admite derivadas parciales acotadas, pero no es lipschitziana.

2Ñ (a) Probar que si f es una función lipschitziana sobre un abierto U de Rn yadmite derivadas parciales, respecto a cualquier índice, en todo punto de U ,entonces sus derivadas parciales están acotadas en U .

(b) Estudiar si la función f(x, y, z) = sen(x2 − y2 + z2) es lipschitziana o local-mente lipschitziana en R3.

2O (a) Probar que toda aplicación lipschitziana f : A ⊂ E → F, donde E y Fson espacios de Banach, se extiende a una aplicación lipschitziana sobre A.

(b) Sean A, B dos conjuntos no vacíos de un espacio normado, con B ⊂ A, ysupongamos que cada uno de los conjuntos B,A \ B y A es convexo. Pro-bar entonces que una aplicación f es lipschitziana sobre A si y sólo si eslipschitziana sobre B y sobre A \B.

(c) Estudiar si las aplicaciones

f(x, y) = sen |x− y|, g(x, y, z) = sen |x2 + y2 − z2|

son lipschizianas o localmente lipschitzianas.

2P Consideremos la función

f(x, y) =x sen ln(x2 + y2) si (x, y) 6= (0, 0)0 si (x, y) = (0, 0)

Probar que f es una función continua en todo punto, que admite derivadas parcialesacotadas en R2 \ (0, 0) ¿Es lipschitziana?

2Q (a) Sea U un abierto convexo de Rn y supongamos que f, g : U → Rp sondos funciones tales que, en cada punto x ∈ U , ∂fi/∂xj(x) = ∂gi/∂xj(x),cualesquiera que sean los índices i, j. Probar entonces que las funciones f yg se diferencian en una constante.

54 La Diferencial de Fréchet 2Q

(b) Determinar las funciones f : R2 → R que satisfacen las ecuaciones

∂f

∂x(x, y) = 1 ; ∂f

∂y(x, y) = y, ∀(x, y).

2R Sea I un intervalo abierto de R, U un abierto de Rn y f : (t, x) ∈ I×U → f(t, x)una función escalar. Demostrar que si

∂f

∂t(t, x) = 0, ∀(t, x) ∈ I × U

entonces f no depende de t, es decir f(t1, x) = f(t2, x) cualesquiera que seant1, t2, x.

2.38 La Diferencial de Fréchet 55

3. Derivadas parciales de orden superior

Conviene tener presente que, por convenio, una función f derivable (aun-que sea parcialmente) en un punto a debe estar definida en un entorno dea. Recordemos también que la derivada parcial ∂f/∂xj(a), coincide con laderivada en el punto aj de la aplicación:

xj → f(a1, . . . , aj−1, xj , aj+1, . . . , an).

Sea f : A ⊂ Rn → F, a ∈oA. Llamaremos derivada parcial segunda de

f respecto a xi y xj en el punto a, a la derivada respecto xi de la función∂f/∂xj en el punto a. Abreviadamente

∂2f

∂xi∂xj(a) = ∂

∂xi

( ∂f∂xj

)(a).

Se deduce, pues, que la función f es derivable respecto a las variables xi yxj en el punto a, si y sólo si la aplicación

∂f

∂xj: x→ ∂f

∂xj(x)

está definida en algún entorno de a y admite derivada parcial respecto a xien el punto a.

Más generalmente, si j1, j2, . . . , jr son números naturales (independientesentre sí) comprendido entre 1 y n, definiremos inductivamente

∂rf

∂xj1 . . . ∂xjr(a) = ∂

∂xj1

( ∂r−1f

∂xj2 . . . ∂xjr

)(a).

Cuando el resultado final de una derivación parcial sólo dependa del númerode veces que se deriva respecto a cada variable, y no del orden en que serealiza tal proceso (esto no sucederá siempre), cabe utilizar una notaciónabreviada para designar a las derivadas parciales de orden superior. Así, enese caso, utilizaremos la expresión

∂rf

∂xi11 ∂xi22 . . . ∂x

inn

(a),

para denotar al resultado de efectuar r derivaciones parciales: in respecto axn , in−1 respecto a xn−1, etc. y por último i1 derivaciones respecto a x1.Por tanto i1 + i2 + · · ·+ in = r. Algunos de los ik pueden ser iguales a 0, lo

56 La Diferencial de Fréchet 2.40

que expresará que no se realiza derivación alguna respecto a la variable xk(en cuyo caso omitiremos en la expresión anterior el término ∂xikk ).

El teorema más clásico en relación al problema de la permutabilidad delas derivadas es el conocido como teorema de Schwarz o de las derivadasparciales segundas cruzadas.

Teorema 2.38 (Schwarz) Sea f una función escalar de dos variables. Su-pongamos que para cada (x, y) de alguna bola centrada en el punto (a, b),existen

∂f

∂x(x, y), ∂f

∂y(x, y), ∂2f

∂x∂y(x, y),

y que la aplicación ∂2f

∂x∂yes continua en (a, b). Entonces también existe la

otra derivada cruzada en (a, b), y se verifica que

∂2f

∂y∂x(a, b) = ∂2f

∂x∂y(a, b).

Una útil consecuencia del teorema de Schwarz es el siguiente resultadopara funciones de n-variables:

Corolario 2.39 Si todas las derivadas parciales de orden r de la funciónescalar f de n-variables existen en algún entorno de un punto a y son fun-ciones continuas en a, entonces cada derivada parcial de orden r de f en aes independiente del orden en que se efectúen las derivaciones.

(Ver Apuntes 2010: Teoremas de Schwarz).Observemos que la condición del corolario anterior para r = 1 es justa-

mente la que denominábamos çondición suficiente de diferenciabilidad"(2.34).En la proposición siguiente vemos qué consecuencias se derivan ahora de estacondición sobre las derivadas de orden r.

Proposición 2.40 Sea f : A ⊂ Rn → Rp, y a ∈oA. Si todas las derivadas

parciales de orden r de la función f existen en algún entorno del punto a yéstas son aplicaciones continuas en a, entonces:

1. Cada derivada de orden r−1 de f , ∂r−1f , es una función lipschitzianaen algún entorno de a (luego continua en cada punto de ese entorno)y diferenciable en a.

2.42 La Diferencial de Fréchet 57

2. f y cada derivada parcial de orden s < r− 1 es diferenciable en algúnentorno de a.

Demostración. Consideremos una derivada de orden r−1, ∂r−1f . Llamemos,por ejemplo, ϕ a esta aplicación. Entonces la función ϕ satisface la condiciónsuficiente de diferenciabilidad, ya que ∂ϕ

∂xjno es otra cosa que una derivada

parcial de orden r de f (que por hipótesis es continua en a):

∂ϕ

∂xj= ∂

∂xj(∂r−1f) ≡ ∂rf.

Por tanto, según (2.34) ϕ(= ∂r−1f) es lipschitziana en alguna bolaB(a, δ) y diferenciable en a.

Con el mismo argumento, aplicado ahora a cada ∂r−1f , que es continuaen cada punto x ∈ B(a, δ), se tiene que cada ∂r−2f es diferenciable enx. Y así sucesivamente, cada ∂r−3f, . . . , ∂f∂xj

y, finalmente, también f , sondiferenciables en cada x ∈ B(a, δ).

Definición 2.41 (Función de clase Cr) Sea A un subconjunto de Rn.Una función f se dice de clase Cr (r ∈ N \ 0) sobre A, lo cual lo ex-presaremos con la notación f ∈ Cr(A), si f admite derivadas parciales deorden r en algún abierto que contiene a A y éstas son continuas en cadapunto de A.

De acuerdo con el resultado tipo teorema de Schwarz del corolario ante-rior y la Proposición 2.40 es obvio que

Corolario 2.42 Si f es una función de clase Cr sobre un conjunto A, en-tonces en el cálculo de la las derivadas parciales de orden r de la función fen cada punto de A o en el las derivadas de orden s < r en cada punto x dealgún abierto que contiene a A, no importa el orden en que se efectúen lasderivaciones.

58 La Diferencial de Fréchet 2S

Ejercicios2S Comprobar si en las funciones siguientes se da la igualdad entre las derivadasparciales cruzadas en (0, 0). Estudiar en cada caso si se satisfacen las condicionesdel teorema de Schwartz.

1. f(x, y) = xyx2 − y2

x2 + y2 ; f(0, 0) = 0.

2. f(x, y) = x2y2 cos 1/x ; f(0, y) = 0.

3. f(x, y) = x2y2 sen 1xy2 ; f(x, 0) = f(0, y) = 0.

2T Consideremos los operadores diferenciales

∇ f = ( ∂f∂x1

, . . . ,∂f

∂xn) ; ∆f = ∂2f

∂x21

+ · · ·+ ∂2f

∂x2n

H f = x1∂f

∂x1+ · · ·+ xn

∂f

∂xn; div(F1, . . . , Fn) = ∂F1

∂x1+ · · ·+ ∂Fn

∂xn

rot(F1, F2, F3) = ∇× F =(∂F3

∂y− ∂F2

∂z,∂F1

∂z− ∂F3

∂x,∂F2

∂x− ∂F1

∂y

)A los operadores anteriores se les conoce, en el orden en que han sido definido, comooperador: Gradiente, Laplaciano, Hamiltoniano, Divergencia y Rotacional.

Supuesto que se pueden permutar las derivaciones, demostrar que

1. ∆ f = div∇f 2. div(rotF ) = 0.3. H ∆−∆ H = −2 ∆ 4. ∆ f = 0 ⇒ ∆ ∆((x2

1 + · · ·+ x2n)f) = 0.

Capítulo 3

Teoremas de Taylor

Una vez más nos disponemos a extender a las funciones de varias varia-bles resultados ya conocidos para funciones de una variable, los teoremasde aproximación de Taylor. Por buena lógica deberíamos empezar con laextensión a las varias variables del concepto de función r-veces diferenciableen un punto. Sin embargo, para evitar complicaciones formales (y de pasoganar tiempo) no haremos esta extensión. Sólo nos referiremos al polinomiode Taylor de orden r de una función f en un punto a, cuando f sea de claseCr en el punto a, es decir cuando f admite derivadas parciales de orden ren algún entorno de a y éstas son continuas en a.

Esto es pedirle a f algo más que ser r-veces diferenciable en el punto a.Ya lo sabíamos para r = 1, esa condición implica que f es diferenciable ena y lipschitziana en algún entorno de a. En consecuencia, de la Proposición2.40 y el Corolario 2.39, se deduce que para r > 1, si una función es de claseCr en a entonces:

1. Cada derivada de orden r−1 de f , ∂r−1f , es una función lipschitzianaen algún entorno de a (luego continua en cada punto de ese entornoi.e. de clase Cr−1 en ese entorno) y diferenciable en a.

2. f y cada derivada parcial de orden s < r− 1 es diferenciable en algúnentorno de a.

3. En el cálculo de las derivadas parciales de orden r de f en a y de lasderivadas parciales de orden ≤ r − 1 de f en cada x de algún entornode a, se pueden permutar las derivaciones.

Ejercicio. Probar por inducción:

59

60 Teoremas de Taylor 3.2

1. Si f, g : A ⊂ Rn → R son de clase Cr en un punto a ∈oA, entonces su

producto f.g también es de clase Cr en a.2. Si f : A ⊂ Rn → Rp y g : B ⊂ Rp → R son funciones de clase Cr en

algún entorno los puntos a ∈oA y f(a) ∈

oB, entonces g f es de clase

Cr en algún entorno de a.

Definición 3.1 Sea f : A ⊂ Rn → F una función que admite derivadasparciales de orden r en algún entorno de un punto a ∈

oA. Llamaremos

Polinomio de Taylor de la función f en el punto a al polinomio cuyo términoindependiente es f(a) y los términos de grado 1 ≤ k ≤ r son los siguientes:

1k!

∑1≤i1,...,ik≤n

∂kf(a)∂xi1∂xi2 . . . ∂xik

xi1xi2 . . . xik

Es habitual emplear la notación

Dkf(a)xk =∑

1≤i1,...,ik≤n

∂kf(a)∂xi1∂xi2 . . . ∂xik

xi1xi2 . . . xik

y referirse a Dkf(a) como la diferencial de orden k de f en a. De hecho, laigualdad anterior, caso de ser f k-veces diferenciable, establece la forma decalcular el valor que toma la aplicación Dkf(a) sobre el vector (x, x, . . . , x).Puesto que en este curso no cabe hablar de diferenciales de orden superior,la igualdad anterior nos permite dar una expresión del polinomio de Taylordel mismo tipo que para las funciones de una variable:

Prf(a)x = f(a) +Df(a)x+ 12!D

2f(a)x2 + · · ·+ 12!D

rf(a)xr.

Proposición 3.2 Si la aplicación f es de clase Cr en a, entonces

1k!D

kf(a)xk =∑

k1+...+kn=k

1k1!k2! . . . kn!

∂kf(a)∂xk1

1 ∂xk22 . . . ∂xkn

n

xk11 x

k22 . . . xkn

n

Demostración. Consideremos uno de los sumandos de Dkf(a)xk:

∂kf(a)∂xi1∂xi2 . . . ∂xik

xi1xi2 . . . xik .

3.3 Teoremas de Taylor 61

Nos preguntamos si puede haber otros sumandos iguales a éste. Es obvioque, todos los sumandos en que intervengan las mismas coordenadas y elmismo número de veces, son iguales, pues sólo diferenciarán en el orden enque se efectúan las derivaciones y esto, de acuerdo a la hipótesis con quetrabajamos, no importa. Si k1, k2, k3, . . . , kn es el número de derivacionesrespecto x1, x2, x3, . . . , xn (donde algunos de los naturales ki puede ser iguala 0, ya que k = k1 + k2 + · · · + kn), es claro entonces que el número desumandos iguales al fijado es exactamente igual al de las permutaciones dek elementos en los que se repiten k1, k2, . . . , kn, es decir igual a k!

k1!···kn! , y elvalor común de ellos:

∂kf(a)∂xk1

1 ∂xk22 . . . ∂xkn

n

xk11 x

k22 . . . xkn

n ,

Observar que cuando algún ki es 0 (para concretar por ejemplo si k1 = 0)se tiene que

∂kf(a)∂x0

1∂xk22 . . . ∂xkn

n

x01xk22 . . . xkn

n = ∂kf(a)∂xk2

2 . . . ∂xknn

xk22 . . . xkn

n .

Por tanto,

1k!D

kf(a)xk = 1k!

∑k1+...+kn=k

k!k1!k2! . . . kn!

∂kf(a)∂xk1

1 ∂xk22 . . . ∂xkn

n

xk11 x

k22 . . . xkn

n

=∑

k1+k2+...+kn=k

1k1!k2! . . . kn!

∂kf(a)∂xk1

1 ∂xk22 . . . ∂xkn

n

xk11 x

k22 . . . xkn

n .

1. Teoremas de TaylorExtenderemos a continuación a las varias variables el teorema (global)

de Taylor con resto de Lagrange y el conocido como teorema local de Taylor.Como ya dijimos las hipótesis que usaremos serán algo más fuerte que lasque realmente se necesitan.

Recordando:

Teorema 3.3 i)(Global) Si f : [a, b] ⊂ R→ R es una función (r + 1)-vecesderivable en el intervalo [a, b], entonces existe algún punto ξ ∈ (a, b) tal que

f(b)− Prf(a)(b− a) = 1(r + 1)!f

(r+1)(ξ)(b− a)r+1.

62 Teoremas de Taylor 3.4

ii) Si f : [a− δ, a+ δ] ⊂ R→ R es r-veces derivable en a entonces

lımh→0

f(a+ h)− Prf(a)hhr

= 0.

Veremos en primer lugar la extensión a varias variables del teorema global.

1.1. Teorema global de Taylor

Teorema 3.4 Sea f : A ⊂ Rn → R, una función de clase Cr+1 en el seg-mento [a, a+ h] ⊂

oA, entonces existe un punto ξ ∈ (a, a+ h) tal que

f(a+ h)− Prf(a)h = 1(r + 1)!D

r+1f(ξ)hr+1

Demostración. Puesto que f ∈ Cr+1[a, a + h], sabemos que f y cada ∂sfcon s ≤ r es diferenciable en cada punto del segmento [a, a + h]. Vamos aver que la función de 1-variable g(t) = f(a+ th) es (r+1)-veces derivable en[0, 1] y, por tanto, le podemos aplicar el teorema global de Taylor en [0, 1].En efecto, g es la composición de las aplicaciones t → a + th → f(a + th),ambas diferenciables luego

g′(t) =∑j

∂f

∂xj(a+ th)hj .

De acuerdo con esto, también podremos derivar g′ ya que las derivadasparciales ∂f

∂xjtambién son derivables en cada punto a+ th. Luego,

g′′(t) =∑j

(∑i

∂2f(a+ th)∂xi∂xj

hi)hj =∑i,j

∂2f(a+ th)∂xi∂xj

hihj .

Procediendo de esta forma, es claro que podemos derivar g hasta el ordenr + 1 obteniendo,

g(r+1)(t) =∑

1≤i1,...,ir+1≤n

∂r+1f(a+ th)∂xi1∂xi2 . . . ∂xir+1

hi1hi2 . . . hir+1 .

Aplicando entonces el teorema global de Taylor a g en [0, 1], y teniendoen cuenta que g(1) = f(a + h); g(0) = f(a) se tiene ya el resultado quebuscábamos.

3.5 Teoremas de Taylor 63

Nota. El teorema global de Taylor anterior (sólo válido en esta forma parafunciones escalares), es para el caso r = 1 el teorema del valor medio parafunciones escalares: Si f : A ⊂ Rn → R es una función continua en elsegmento [a, b] ⊂ A y derivable en (a, b), entonces existe un punto ξ ∈ (a, b)tal que

f(b)− f(a) = Df(ξ)(b− a) =∑ ∂f

∂xj(ξ)(bj − aj).

1.2. Teorema local de Taylor

En la extensión del teorema local de Taylor a varias variables usaremosel siguiente lema:

Lema 3.5 Si f es una función de clase Cr en el punto a entonces∂

∂xj

(Prf(a)(x− a)

)(x) = Pr−1

(∂f

∂xj

)(a)(x− a)

Demostración. Sea ϕk la parte homogénea de grado k del polinomio deTaylor, es decir

ϕk(x) =∑i1+i2+...+in=k

1i1!i2! . . . in!

∂kf(a)∂xi11 ∂x

i22 . . . ∂x

inn

(x1 − a1)i1(x2 − a2)i2 . . . (xn − an)in .

Entonces∂ϕk∂xj

(x) =

∂xj

( ∑i1+i2+...+in=k

ij≥1

1i1!i2! . . . in!

∂kf(a)∂xi11 ∂x

i22 . . . ∂x

inn

(x1 − a1)i1(x2 − a2)i2 . . . (xn − an)in)

=∑

i1+i2+...+in=kij≥1

iji1!i2! . . . in!

∂kf(a)∂xi11 ∂x

i22 . . . ∂x

inn

(x1 − a1)i1 . . . (xj − aj)ij−1 . . . (xn − an)in

=∑

i1+...+(ij−1)+...+in=k−1

ij≥1

1i1! . . . (ij − 1)! . . . in!

∂kf(a)∂xi11 ∂x

i22 . . . ∂x

inn

(x1 − a1)i1 ..(xj − aj)ij−1..(xn − an)in

=∑

i1+i2+...+in=k−1

1i1!i2! . . . in!

∂k−1(∂f/∂xj)(a)∂xi11 ∂x

i22 . . . ∂x

inn

(x1 − a1)i1 . . . (xj − aj)ij . . . (xn − an)in .

64 Teoremas de Taylor 3.6

(observar que la validez de la última de las igualdades anteriores se basa enque se pueden permutar las derivaciones). Es evidente que de lo anterior sesigue ya lo que queríamos, es decir que

∂xj

(Prf(a)(x− a)

)(x) = Pr−1

(∂f

∂xj

)(a)(x− a).

Teorema 3.6 (Local de Taylor) Si la aplicación f : A ⊂ Rn → Rp es declase Cr en un punto a ∈

oA, entonces

lımx→a

f(x)− Prf(a)(x− a)‖x− a‖r

= 0.

Demostración. Obviamente se puede suponer que f es una función escalar,es decir p = 1. Razonaremos por inducción sobre r. Para r = 1 la hipótesisimplica que f es diferenciable en a, luego

lımx→a

f(x)− (f(a) +Df(a)(x− a)‖x− a‖

= 0.

Como P1f(a)(x− a) = f(a) +Df(a)(x− a), de lo anterior se deduce que elteorema es cierto para r = 1.

Supongamos pues, que para r > 1, f es de clase Cr en a (por tanto f esdiferenciable en algún entorno de a) y tomemos como hipótesis de inducciónque el teorema es cierto para r − 1. En particular, estamos suponiendo queel teorema es cierto para las funciones ∂f

∂xj, ya que cada ∂r−1( ∂f∂xj

) es unaderivada parcial de orden r y por tanto continua en a. Aplicando el lemaanterior, se deduce que:

0 = lımx→a

∂f∂xj

(x)− Pr−1(∂f/∂xj)(a)(x− a)‖x− a‖r−1

1

= lımx→a

∂∂xj

(f(x)− Prf(a)(x− a))‖x− a‖r−1

1.

Si g(x) = f(x) − Prf(a)(x − a) que, igual que f , es diferenciable an algúnentorno de a, lo anterior nos dice que para cada ε > 0 existe B(a, δ) tal quesi x ∈ B(a, δ) entonces g diferenciable en x y∣∣∣∣ ∂g∂xj (x)

∣∣∣∣ ≤ ε‖x− a‖r−11 , ∀j.

3.7 Teoremas de Taylor 65

Fijado x con ‖x − a‖1 < δ se puede aplicar el teorema del valor medio(Teorema 2.26) a la función g en el segmento [a, x]. En efecto si z ∈ [a, x]entonces | ∂g∂xj

(z)| ≤ ε‖z−a‖r−11 ≤ ε‖x−a‖r−1

1 . Es decir g tiene sus derivadasparciales acotadas en [a, x] y además es diferenciable en [a, x], luego

|f(x)− Prf(a)(x− a)| = |g(x)− g(a)| ≤ ε‖x− a‖r−11 ‖x− a‖1 = ε‖x− a‖r1,

es decirlımx→a

f(x)− Prf(a)(x− a)‖x− a‖r

= 0.

A Prf(a)(x−a), es decir al polinomio de Taylor de orden r en a expresado enpotencias de (xi−ai) se le suele denominar “el desarrollo de Taylor de ordende f en a”. La conclusión del teorema anterior suele expresarse diciendo queel desarrollo de Taylor de f en a aproxima a f hasta el orden r, o tambiénque f y su desarrollo de Taylor son tangentes de orden r o tienen un puntode tangencia de orden r en a.

1.3. Unicidad del polinomio de Taylor

Lema 3.7 (Unicidad) Sea f : A ⊂ Rn → F y a ∈oA, entonces para cada

número natural r ≥ 1 existe a lo sumo un polinomio Q de grado ≤ r tal que

lımh→0

f(a+ h)−Q(h)‖h‖r

= 0.

Demostración. Supongamos que existen dos polinomios de grado ≤ r tales

lımx→0

f(h)−Q1(h)‖h‖r

= 0

lımh→0

f(h)−Q2(h)‖h‖r

= 0

y probemos que ambos polinomios coinciden.Si llamamos S(h) = Q1(h)−Q2(h), nuestra hipótesis implica que

(∗) lımh→0

S(h)‖h‖r

= 0.

Se trata de ver, por tanto, que el único polinomio de grado ≤ r que tiene lapropiedad anterior es el idénticamente nulo, o sea que S(h) = 0 para todoh ∈ Rn.

66 Teoremas de Taylor 3.8

Escribamos S = S0 + S1 + · · ·+ Sr, donde Sk es la parte homogénea delpolinomio S formada por los términos de grado k, es decir

Sk(h1, . . . , hn) =∑

i1+i2+...+in=kci1i2..inh

i11 h

i22 . . . h

inn .

Fijemos h = (h1, . . . , hn) 6= (0, . . . , 0) y veamos que S(h) = 0. De la expre-sión dada anteriormente para Sk, se deduce que si t ∈ R entonces

Sk(th) = Sk(th1, . . . , thn) = tkSk(h1, . . . , hn) = tkSk(h).

De la condición (∗) se sigue entonces que

0 = lımt→0+

S(th)tr‖h‖r

= lımt→0+

S0 + tS1(h) + · · ·+ trSr(h)tr‖h‖r

= S00 ⇒ S0 = 0.

En consecuencia

0 = lımt→0+

tS1(h) + · · ·+ trSr(h)tr‖h‖r

= lımt→0+

S1(h) + · · ·+ tr−1Sr(h)tr−1‖h‖r

= S1(h)0 ⇒ S1(h) = 0.

De este modo se deduce pues S0 = 0; S1(h) = 0; . . . Sr−1(h) = 0 y que

0 = lımt→0+

tSr(h)t‖h‖r

= Sr(h)‖h‖r

que obviamente implica que también Sr(h) = 0.

Como consecuencia del teorema local de Taylor y el lema de unicidad seobtiene el siguiente corolario:

Corolario 3.8 Sea f : A ⊂ Rn → Rp una función de clase Cr en un puntoa ∈

oA y supongamos que Q es un polinomio tal que

lımh→0

f(a+ h)−Q(h)‖h‖r

= 0.

Entonces Prf(a)(x) = [Q(x)]≤r, donde [Q(x)]≤r es el polinomio formadocon los términos de grado ≤ r del polinomio Q.

3.9 Teoremas de Taylor 67

Demostración. Si R(h) = Q(h)− [Q(h)]≤r, entonces es obvio que todos lostérminos de R son de grado > r. Puesto que podemos elegir la norma quequeramos, podemos suponer que para cada h = (h1, . . . , hn) ∈ Rn se tieneque |hi| ≤ ‖h‖. Entonces si denotamos por M al máximo de las normas delos coeficientes de R y por s al número de términos de R, es claro que enalgún entorno de 0, ‖R(h)‖ ≤ sM‖h‖r+1. Luego∥∥∥∥R(h)

‖h‖r

∥∥∥∥ ≤ sM‖h‖ → 0 cuando h→ 0.

Se deduce pues que

lımh→0

f(a+ h)− [Q(h)]≤r‖h‖r

= lımh→0

(f(a+ h)−Q(h)) +R(h)‖h‖r

= 0.

Puesto que único polinomio de grado ≤ r que aproxima a f hasta el ordenr en un entorno de a es Prf(a)x, de lo anterior se deduce que Prf(a)x =[Q(x)]≤r.

Ejemplo 3.9 (Una función que se aproxima hasta el orden r en unentorno de a por un polinomio y no es de clase Cr en a)

Sea la funciónf(x) = x3 sen 1

x; f(0) = 0.

El polinomio 0 aproxima hasta el orden 2 a la función f en un entorno de0, pues

lımx→0

f(x)x2 = lım

x→0x sen 1

x= 0.

En cambio, f no es de clase C2 en 0, ya que ni siquiera es 2-veces derivableen 0.

Por contra para r = 1 se tiene:

Ejercicio. Probar que una función f continua en un punto a es diferenciableen a si y sólo si existe un polinomio de grado ≤ 1 tal que

lımx→a

f(x)−Q(x− a)‖x− a‖

= 0.

.

68 Teoremas de Taylor 3.11

2. ANEXO: El álgebra de los desarrollos de Taylor

Sea f : A ⊂ Rn → F una función continua en a ∈oA y Q un polinomio.

Emplearemos la notación f r∼ Q en a para expresar que

lımx→a

f(x)−Q(x− a)‖x− a‖r

= 0.

3.10 Sean f, g : A ⊂ Rn → F continuas en a ∈oA, tales que f r∼ Q y g r∼ P

en a, entonces:

1. λf + µgr∼ λQ+ µP en a, ∀λ, µ ∈ R.

2. (Para F = R), fg r∼ QP en a.

Demostración. 1. La demostración se deduce trivialmente de la definición.2. Escribiendo f(x)g(x)−Q(x− a)P (x− a) = (f(x)−Q(x− a))g(x) +

(g(x)− P (x− a))Q(x− a), de la hipótesis se deduce que

lımx→a

f(x)g(x)−Q(x− a)P (x− a)‖x− a‖r

= 0 · g(a) + 0 · f(a) = 0,

3.11 Sean f : A ⊂ Rn → Rp y g : B ⊂ Rp → R funciones continuas ena ∈

oA y f(a) ∈

oB, respectivamente. Si Q y P son polinomios tales que f r∼ Q

en a y g r∼ P en f(a), entonces g f r∼ P (Q− f(a)) en a.

Demostración. Sea ε > 0. Como f es diferenciable en a, existe δ1 > 0 yα > 0 tal que ‖f(x)− f(a)‖ ≤ α‖x− a‖. Por hipótesis existe η > 0 tal quesi ‖y − f(a)‖ < η entonces

‖g(y)− P (y − f(a))‖ ≤ ε

αr‖y − f(a)‖r.

Entonces tomando ‖x−a‖ ≤ δ2 = mın(δ1,ηα) (lo que implica ‖f(x)−f(a)‖ ≤

α‖x− a‖ ≤ η), se tiene que

‖g(f(x))−P (f(x)−f(a))‖ ≤ ε

αr‖f(x)−f(a)‖r ≤ ε

αrαr‖x−a‖r = ε‖x−a‖r.

Se deduce pues que cuando ‖x− a‖ < δ2,

‖g(f(x))− P (Q(x− a)− f(a))‖ ≤ ‖g(f(x))− P (f(x))− f(a))‖+‖P (f(x)− f(a))− P (Q(x− a)− f(a))‖

≤ ε‖x− a‖r + ‖P (f(x)− f(a))− P (Q(x− a)− f(a))‖.

3.12 Teoremas de Taylor 69

Por último, sea β > 0 mayor que ‖f(x)− f(a)‖ y ‖Q(x− a)− f(a)‖ cuando‖x−a‖ ≤ δ2 (observemos que cuando ‖x−a‖ ≤ δ2, entonces ‖f(x)−f(a)‖ ≤αδ2 y ‖Q(x − a) − f(a)‖ está acotado, pues Q es continua en el compactoB[0, δ2]). Puesto que P es de clase C1, sus derivadas parciales están acotadasen B[0, β], luego P es lipschitziana en B(0, β), y por tanto existe M > 0tal si ‖x − a‖ ≤ δ2 entonces ‖P (f(x) − f(a)) − P (Q(x − a) − f(a))‖ ≤M‖f(x) − Q(x − a)‖. Como f r∼ Q podemos encontrar δ3 > 0 tal que si‖x− a‖ < δ3 entonces ‖f(x)−Q(x− a)‖ ≤ ε/M‖x− a‖r, y en consecuencia

‖P (f(x)− f(a))− P (Q(x− a)− f(a))‖ ≤ ε‖x− a‖r.

Teorema 3.12 (i) Sean f, g : A ⊂ Rn → Rp de clase Cr en un punto a ∈oA.

Entonces

1. λf + µg es de clase Cr en a y

Pr(λf + µg)(a)(x− a) = λPrf(a)(x− a) + µPrg(a)(x− a)

2. (Para p=1), la función f.g es de clase Cr en a y

Pr(fg)(a)(x− a) = [Prf(a)(x− a) · Prg(a)(x− a)]≤r

(ii) Si f : A ⊂ Rn → Rp y g : B ⊂ Rp → R son funciones de clase Cr enlos puntos a ∈

oA y f(a) ∈

oB, entonces g f es de clase Cr en a y se tiene

que

Pr(g f)(a)(x− a) = [Prg(f(a))(Prf(a)(x− a)− f(a))]r

Demostración. Que la suma, producto y composición son funciones de claseCr era el objetivo del ejercicio propuesto al principio del capítulo. Por otraparte ya sabemos que si una función ϕ es de clase Cr en un punto c, entoncesPrϕ(c) es el único polinomio de grado ≤ r con la propiedad ϕ r∼ Prϕ en c(ver Corolario 3.8). En (i) el polinomio de grado ≤ r λPrf(a)(x − a) +µPrg(a)(x− a) tiene esta propiedad, luego según lo anterior este polinomiodebe ser el desarrollo de Taylor de orden r de λf + µg. En cuanto a fgtambién sabemos que fg r∼ Prf · Prg en a lo que implica, según el corolario3.8, que fg r∼ [Prf ·Prg]r. De nuevo, se tiene que el polinomio de grado ≤ r,[Prf · Prg]r debe ser precisamente Pr(fg)(a).

La demostración para la composición (apartado (ii)) es idéntica a la delproducto (ejercicio).

70 Teoremas de Taylor 3.12

Ejercicio. (a) Sea g(t) = (1− t)−1. Probar que Prg(0)t = 1 + t+ · · ·+ tr.

(b) Seah(x, y) = 1

cosx− sen y .

Utilizar el teorema 3.12(ii) y el apartado anterior para calcular el desa-rrollo de Taylor de orden 4 de h en el punto (0, π).

Sugerencia: Si se escribe

h(x, y) = 11− (1− (cosx− sen y))

y llamamos f(x, y) = 1− (cosx− sen y) entonces h = g f .

Ejercicios3A Obtener el coeficiente del término en x4yz2 del desarrollo de Taylor en el origende una función de las variables x, y, z.

3B Si en el desarrollo de Taylor en el origen de una función de las variables x, y, zel único término de grado 7 es 3x4yz2, ¿cuáles son las derivadas parciales de orden7 de esta función en (0, 0, 0)?

3C Supuesta conocida la función f y sus derivadas, obtener el polinomio de Taylorde orden 2 de la función g(x, y, z) = f(xy, xz) en un entorno del punto (0, 0, 0).

3D Obtener el polinomio de Taylor de orden 3 de la funciones

f(x, y) = cosxcos y ; g(x, y) = cosxy

en un entorno de (0,0)

3E Sea f(x, y) = 3x2y2 +x4 + y4 + sen3 xy. Demostrar que el polinomio de Taylorde orden 5 para la función f en (0,0) es igual a 3x2y2 + x4 + y4.

3F Supongamos que f es una función de clase C6, tal que

lım(x,y,z)→(0,0,0)

f(x, y, z)− (2x− yz2 + x2yz + z3x2)(x2 + y2 + z2)3 = 0.

(a) Obtener P6f(0, 0, 0)(x, y, z), P5f(0, 0, 0)(x, y, z) y P3f(0, 0, 0)(x, y, z)(b) Calcular las derivadas parciales de f en (0, 0, 0) hasta el orden 6.

3K Teoremas de Taylor 71

3G Demostrar, sin tener que hacer el cálculo, que todas las derivadas parciales deorden ≤ 8 de la función f(x, y) = sen(x9 + y9) son nulas en (0,0). Probar asimismoque igual sucede con las de orden ≤ 5 para la función g(x, y, z) = cosxyz.

3H Estudiar la existencia de los límites siguientes haciendo el desarrollo de Taylorque convenga y aplicando después el teorema de Taylor que proceda.

1. lım(x,y)→(0,0)

xy − sen x sen yx2 + y2 2. lım

(x,y)→(0,0)

xy − sen x sen y(x2 + y2)3/2

3. lım(x,y)→(0,0)

xy − sen x sen y√x6 + y6

4. lım(x,y)→(0,0)

sen x+ cos y − cosx− x+ y2

x2 + y2

5. lım(x,y)→(0,0)

2xy − 1 +√

cos 2(x+ y)x2 + y2 6. lım

(x,y)→(0,0)

sen2 x+ sen2 y

x2 + y2

7. lım(x,y)→(0,0)

xey − yex − x+ y

x2 + y2 8. lım(x,y)→(0,0)

xey − yex − x+ y + x3

x2 + y2

9. lım(x,y)→(0,0)

xey − yex

x2 + y2 10. lım(x,y)→(0,0)

xey − yex − x+ y

x2 + y2

3I En cada uno de los ejemplos estudiar la existencia del límite en (0,0).

1. h(x, y) = (x− y)3

(x− y)2 + x4 . 2. h(x, y) = x5 + y3x− x2y2 + y4x

x4 + y4 − x2y2 + y6

3. h(x, y) = x5 + y3x2 − x3y2 + y4x

x4 + y4 − x2y2 + y6 4. h(x, y) = x5 + y3x2 − x3y2 + y4x

x4 + x2y2 + y6

5. h(x, y) = x4 + y2x2 + y4x+ y6

x4 + x2y2 + y6 6. h(x, y) = x5 + y4x+ y7

x4 + x2y2 + y6

7. h(x, y) = x4 + y2x2 + (x+ y)6

x4 + x2y2 + y6 8. h(x, y) = x sen y − y sen xsen2 x+ sen2 y

9. h(x, y) = x sen y − y sen x(sen2 x+ sen2 y)2 10. h(x, y) = xy − sen x sen y

x4 + y4

3J Sea P un polinomio homogéneo de n variables y grado k ≥ 1 y f : R→ R unafunción derivable hasta el orden que necesitemos. Consideremos la función g = fP .(a) Probar que para cada 0 ≤ j < k se verifica que

Pkr+jg(0)x = Prf(0)(P (x))

(b) Aplicar (a) para calcular el polinomio de Taylor de orden 7 en (0,0) de lafunción f(x, y) = cos(x2 − xy).

3K (a) Sea f : R → R una función n-veces diferenciable en 0. Probar que si1 ≤ k < n, la función

g(t) = f(t)− Pnf(0)ttn−k

; g(0) = 0

72 Teoremas de Taylor 3K

es k-veces diferenciable en 0.Indicación: Razonar por inducción sobre k.

(b) Deducir de (a) que si f es n-veces diferenciable en 0 (n ≥ 2), entonces lafunción

h(t) = f(t)− f(0)t

; h(0) = f ′(0)

es (n− 1)-veces diferenciable en 0, siendo

Pn−1g(0)t = f ′(0) + 1/2!f ′′(0)t+ . . .+ 1/n!f (n)(0)tn−1

(c) Utilizar lo anterior para demostrar que las funciones

g1(x, y) =

sen x− sen y

x− ysi x 6= y

cosx si x = y

g2(x, y) =

1−√

1 + xy

xysi xy 6= 0

0 si xy = 0

son de clase C∞ (g2 en algún entorno de (0,0)). Obtener el polinomio deTaylor de orden 4 en (0,0) de ambas funciones.

Capítulo 4

Funciones Implícitas

El teorema de las funciones implícitas constituye, junto con el de la fun-ción inversa, la herramienta teórica básica para el estudio de las variedadesdiferenciables (curvas, superficies,...). Nosotros lo obtendremos como coro-lario del teorema de Banach de la aplicación contractiva.

1. Teorema de punto fijo

Lema 4.1 Sea B[b, r] una bola cerrada de Rp y k una aplicación de la bolaB[b, r] en sí misma. Si k es una aplicación contractiva i.e., lipschitziana conconstante de Lipschitz 0 < c < 1, entonces existe un único punto v ∈ B[b, r]tal k(v) = v (un punto fijo).

Demostración. (Existencia) Supongamos k(b) 6= b y consideremos la suce-sión

b, k(b), k(k(b)), . . .

Observemos que para que k tenga un punto fijo basta que esta sucesión seade Cauchy. En efecto, en ese caso la sucesión sería convergente a un puntov de la bola B[b, r] pues cada término de la sucesión está en B[b, r] y losconjuntos cerrados contienen a los límites de sus sucesiones convergentes.Pero al ser k continua, la imagen por k de esta sucesión convergería a k(v)i.e.,

b, k(b), k(k(b)), . . .→ v ⇒ k(b), k(k(b)), . . .→ k(v).

Pero es obvio que esta última sucesión (la sucesión imagen) es una subsuce-sión de la anterior y por tanto también ha de converger a v. Por la unicidaddel límite resultaría entonces que k(v) = v.

73

74 Funciones Implícitas 4.1

Denotemos por v1 = b, v2 = k(b), . . . , vj+1 = k(vj), . . . y veamos que lasucesión vj es de Cauchy: Si q > m entonces

‖vq − vm‖ ≤ ‖vq − vq+1‖+ ‖vq+1 − vq+2‖+ · · ·+ ‖vm−1 − vm‖= ‖k(vq−1)− k(vq)‖+ ‖k(vq − k(vq+1)‖+ · · ·+ ‖k(vm−2)− k(vm−1)‖

≤ c(‖vq−1 − vq‖+ ‖vq − vq+1‖+ · · ·+ ‖vm−2 − vm−1‖)−−−−−−−−−−−−−−−−−−−−−−−−

≤ cq(1 + c+ · · ·+ cm−q−1)‖b− k(b)‖

≤ cq 11− c‖b− k(b)‖ → 0 cuando q →∞.

(Unicidad.) Si v1 y v2 fueran puntos fijos de k, entonces

‖v1 − v2‖ = ‖k(v1)− k(v2)‖ ≤ c‖v1 − v2‖ ⇒ v1 = v2.

2. El problema de las funciones implícitas

Antes de enunciar el teorema de existencia de Funciones Implícitas, hare-mos algunas consideraciones sobre el tipo de problemas que vamos a tratar:

Si X,Y son espacios normados y M un subconjunto no vacío de X × Y ,un punto (a, b) ∈ M se dice que es punto regular de M si existe algúnentorno W de (a, b) tal que el trozo de M contenido en W es exactamentebien

la gráfica de una función de x, es decir satisface la condición

(x, y1) ∈M ∩W, (x, y2) ∈M ∩W ⇒ y1 = y2.

equivalentemente existe A ⊂ X y una función h : A ⊂ X → Y tal queM ∩W = (x, h(x)) : x ∈ A,

o bien,

la gráfica de una función de y, es decir satisface la condición

(x1, y) ∈M ∩W, (x2, y) ∈M ∩W ⇒ x1 = x2.

equivalentemente existe B ⊂ Y y una función g : B ⊂ Y → X tal queM ∩W = (y, g(y)) : y ∈ B.

4.1 Funciones Implícitas 75

Ejercicio. Sean X,Y espacios normados, M ⊂ X×Y y (a, b) ∈M . Probarque las condiciones siguientes son equivalentes:

1. Existe algún entornoW de (a, b) talM∩W es la gráfica de una funcióny = h(x) definida en algún entorno U de a y continua en a.

2. Existen B(a, s), B(b, r) tales que M ∩ (B(a, s) × B(b, r)) es la gráficade un función y = h(x) definida en B(a, s) y continua en a.

3. Existen B(a, s), B(b, r) tales que para cada x ∈ B(a, s) existe un únicopunto y = h(x) ∈ B(b, r) tal que (x, h(x)) ∈M y h continua en a.

4. Existe B(a, s) y una única función h : B(a, s) → Y continua en a yh(a) = b tal que (x, h(x)) ∈M .

El teorema de las funciones implícitas constituye la principal herramientapara detectar en los casos interesantes si un punto es regular. El punto departida en este este teorema será el subconjunto M de los puntos (x, y) ∈Rn × Rp que satisfacen alguna ecuación del tipo f(x, y) = 0, donde f : A ⊂Rn×Rp → Rp. Por tanto M es el lugar geométrico de los puntos de Rn×Rpque satisfacen el sistema de p ecuaciones:

f1(x1, . . . , xn, y1, . . . , yp) = 0f2(x1, . . . , xn, y1, . . . , yp) = 0−−−−−−−−−−−−−−−−−−fp(x1, . . . , xn, y1, . . . , yp) = 0

El objetivo del teorema no es pues resolver la ecuación f(x, y) = 0, que puedeser un problema bien difícil e incluso insoluble de forma exacta, sino el deestablecer condiciones (suficientes) sobre f para, dado un punto (a, b) ∈M ,exista algún entornoW de (a, b) tal queM ∩W sea la gráfica de una funciónde x y, por lo tanto, que (a, b) sea regular.

Observemos en primer lugar que muchas curvas y superficies conocidasse expresan como un lugar geométrico de este tipo: la circunferencia decentro (0,0) y radio r es el lugar geométrico de los puntos del plano que sonsolución de la ecuación x2 + y2 = r2, análogamente el conjunto de puntosde R3 que satisfacen la ecuación x2 + y2 − z2 = r2 es una superficie esféricay los que satisfacen el sistema x2 + y2 − z2 = r2; x + y + z = 0 es unacurva, concretamente una circunferencia. Pero también una ecuación deltipo f(x, y) = 0 puede originar lugares geométricos más complejos.

76 Funciones Implícitas 4.3

Ejercicio. Dibujar los conjuntos M1 y M2 de puntos de R2 que son, res-pectivamente, solución de la ecuación sen(x2 + y2) = 0 y de la ecuaciónsen xy = 0.

Sólo nos limitaremos a obtener herramientas para saber si al despejary vamos a tener una sola posibilidad de hacerlo, es decir si sólo vamos aencontrar una función y = h(x) tal que f(x, h(x)) = 0 o varias posibilidades,es decir varias funciones y = hi(x) tales que f(x, hi(x)) = 0.

Ejemplo 4.2 SeaM el conjunto de puntos de R2 que satisfacen la ecuación(y−1)(x−y2) = 0. Vamos a analizar M en un entorno de cada uno de estostres puntos de M : (4,−2), (1, 1), (0, 0). Consideremos el punto (4,−2) y elentorno de este punto (3, 5)× (−3,−1). Es obvio que la intersección de esteentorno y M es justamente la gráfica de una función de x, la función hdefinida en (3, 5) (entorno del punto 4) por h(x) = −

√x. Luego el punto

(4,−2) es un punto regular de M . Sin embargo el punto (1, 1) no es regular,pues la intersección de M con un entorno del punto (1,1) no es la gráfica deuna única función de x, en cualquier entorno de (1,1) la ecuación permitedespejar y de más de una forma pues para cada x los puntos (x, 1) y (x,+

√x)

son puntos solución. TampocoM es la gráfica de una función de x en ningúnentorno del punto (0, 0), sin embargo es claro que en este caso M sí que esla gráfica de una función de una función de y definida en un entorno de 0.Luego (0, 0) es un punto regular.

2.1. Existencia de funciones implícitas

Teorema 4.3 Sea f : A ⊂ Rn × Rp −→ Rp y (a, b) un punto deoA tal que

f(a, b) = 0. Supongamos que

(i) f es continua en (a, b).(ii) Las derivadas parciales ∂fi/∂yj existen en algún entorno del punto

(a, b) y son continuas en (a, b).

(iii) det(∂fi∂yj

(a, b))6= 0.

En estas condiciones, existen dos bolas abiertas U = B(a, s) y V = B(b, r)tales que si M es el lugar geométrico de los puntos que son solución de laecuación f(x, y) = 0, entoncesM∩(U×V ) es la gráfica de una única funciónh definida en U i.e., para cada x ∈ U existe un único punto y = h(x) ∈ Vverificando la ecuación f(x, y) = 0. Además la función h es continua en a.

4.3 Funciones Implícitas 77

Demostración. 1 [?] Para concretar utilizaremos la norma ‖ ‖∞ es decir, alo largo de la demostración, ‖ ‖ ≡ ‖ ‖∞. Es un ejercicio fácil comprobar quela conclusión es independiente de la norma. Vamos a ponernos en situaciónde aplicar el lema 4.1. Definamos para ello

k(x, y) = y −D2f(a, b)−1(f(x, y)),

donde con D2f(a, b) denotamos a la aplicación lineal de Rp en Rp cuyamatriz asociada es la matriz de las derivadas parciales de f = (f1, f2, . . . , fp)respecto a las coordenadas yj en el punto (a, b), o sea

D2f(a, b) ≡(∂fi∂yj

(a, b))i,j

Observemos que k está bien definida, ya que la hipótesis (iii) garantiza laexistencia de la inversa de la aplicación lineal D2f(a, b). Además es inme-diato comprobar que

f(x, y) = 0 ⇐⇒ k(x, y) = y.

Luego, en particular, k(a, b) = b.Nos va a interesar escribir

k(x, y) = D2f(a, b)−1(D2f(a, b)(y)− f(x, y))

Lo que significa que si llamamos

g(x, y) = D2f(a, b)(y)− f(x, y) =∑ ∂f

∂yj(a, b)yj − f(x, y),

entonces k = D2f(a, b)−1 g. Es claro que, de la continuidad de f en (a, b) ydel hecho de que (en dimensión finita) toda aplicación lineal es lipschitziana(ver demostración de Proposición 2.8 ), se deduce que k también es continuaen (a, b). Por otra parte, si se tiene en cuenta que

∂g

∂yj(x, y) = ∂f

∂yj(a, b)− ∂f

∂yj(x, y),

de la continuidad en el punto (a, b) de ∂fi∂yj

se deduce que dado ε > 0 exister > 0 tal que si ‖x− a‖ ≤ r y ‖y − b‖ ≤ r entonces ‖(∂gi)/∂yj)(x, y)‖ ≤ ε.

1La demostración está sugerida por el método de Newton de obtención numérica deraíces en una ecuación

78 Funciones Implícitas 4.3

Resulta pues que para cada x fijo con ‖x − a‖ ≤ r, la aplicación gx : y →g(x, y) tiene sus derivadas parciales acotadas en la bola B[b, r]. Aplicando elteorema del valor medio a gx, se tiene entonces que si ‖x− a‖ ≤ r entoncespara todos u, v en B[b, r]

‖g(x, u)− g(x, v)‖ ≤ ε‖u− v‖1 ≤ pε‖u− v‖∞.

Si β es una constante de Lipschitz para la aplicación lineal D2f(a, b)−1, delo anterior se deriva que para cada x tal que ‖x− a‖ ≤ r, se tiene

‖k(x, u)− k(x, v)‖ ≤ β‖g(x, u)− g(x, v)‖ ≤ pβε‖u− v‖∞.

Tomando ε tal que c = pβε < 1, la desigualdad anterior nos dice que paracada x ∈ B[a, r] la aplicación kx es contractiva en B[b, r]. Para poder aplicarel teorema del punto fijo a kx sólo necesitaríamos que kx aplique la B[b, r] ensí misma. Esto será posible, pero habrá que tomar x en una bola centradaen a y radio (quizás) más pequeño que r. En efecto, de la continuidad de ken (a, b) se deriva que existe un número real 0 < s < r tal que

‖x− a‖ ≤ s =⇒ ‖k(x, b)− k(a, b)‖ < (estricto)r(1− c).

Entonces, si ‖x− a‖ ≤ s e y ∈ B[b, r]

‖k(x, y)− b‖ = ‖k(x, y)− k(a, b)‖ ≤ ‖k(x, y)− k(x, b)‖+ ‖k(x, b)− k(a, b)‖< c‖y − b‖+ r(1− c) ≤ r.

Obsérvese que lo anterior prueba que kx aplica la bola cerrada B[b, r] en labola abierta B(b, r).

En consecuencia, del teorema del punto fijo se deduce que para cada x ∈B(a, s) la aplicación kx : B[b, r]→ B[b, r] tiene un único punto fijo y = h(x),es decir para cada x ∈ B(a, s) existe un único punto y = h(x) ∈ B(b, r) talque k(x, y) = y ⇔ f(x, y) = 0.

Sólo queda probar la continuidad de la aplicación h en a: Utilizando denuevo la continuidad de k en (a, b), dado ε > 0 existe δ > 0 tal que si‖x− a‖ < δ entonces,

‖h(x)− h(a)‖ = ‖k(x, h(x))− k(a, h(a))‖≤ ‖k(x, h(x))− k(x, h(a))‖+ ‖k(x, h(a))− k(a, h(a))‖

≤ c‖h(x)− h(a)‖+ ε(1− c)⇓

(1− c)‖h(x)− h(a)‖ ≤ ε(1− c)⇔ ‖h(x)− h(a)‖ ≤ ε

4.3 Funciones Implícitas 79

Demostración para n = 1, p = 1.

De acuerdo con las hipótesis, suponemos pues que ∂f∂y es una aplicación

continua en (a, b) y que ∂f∂y (a, b) 6= 0. La demostración está sugerida por el

método de Newton de obtención numérica de raíces en una ecuación. Vamosa ponernos en situación de aplicar el Teorema de Punto Fijo. Definamospara ello

k(x, y) = y − 1∂f/∂y(a, b)f(x, y).

Es inmediato comprobar que

f(x, y) = 0 ⇐⇒ k(x, y) = y.

Luego, en particular, k(a, b) = b. Por tanto lo que se tiene que probar esque existen entornos U y V de a y b respectivamente tales que para cadax ∈ U existe un único y = h(x) ∈ V tal que k(x, h(x)) = h(x). O lo que eslo mismo que si x ∈ U la aplicación de la variable y, kx(y) = k(x, y), tieneun único punto fijo y = h(x) en V .

Pues vamos a ello, intentando aplicar a kx el teorema del punto fijo:

1. ¿kx es contractiva? Según el teorema del valor medio así será si|k′x(y)| ≤ c, con 0 < c < 1.

k′x(y) = ∂k

∂y(x, y) = 1− 1

∂f/∂y(a, b)∂f

∂y(x, y).

En particular ∂k∂y (a, b) = 0 y la continuidad en (a, b) de ∂f

∂y implica tambiénla continuidad en (a, b) de ∂k

∂y . Por tanto, tomando 0 < c < 1 existe r > 0tal que cuando |x− a| ≤ r, |y − b| ≤ r se tiene que

|k′x(y)| =∣∣∂k∂y

(x, y)− ∂k

∂y(a, b)

∣∣ ≤ c,Luego si x ∈ [a − r, a + r], la aplicación kx es lipschitziana de constante c(contractiva) en el intervalo cerrado [b− r, b+ r], i.e.

|kx(y1)− kx(y2)| = |k(x, y1)− k(x, y2)| ≤ c|y1 − y2|, ∀y1, y2 ∈ [b− r, b+ r].

2. Para poder aplicar el teorema del punto fijo a kx sólo necesitaríamosque kx aplique el intervalo [b − r, b + r] en sí mismo. Esto será posible,pero habrá que tomar x en un intervalo centrado en a y radio (quizás) más

80 Funciones Implícitas 4.4

pequeño que r. En efecto, de la continuidad de k en (a, b) se deriva que existeun número real 0 < s < r tal que

|x− a| ≤ s =⇒ |k(x, b)− k(a, b)| < r(1− c).

Entonces, si |x− a| ≤ s e |y − b| ≤ r

|kx(y)− b| = |k(x, y)− k(a, b)| ≤ |k(x, y)− k(x, b)|+ |k(x, b)− k(a, b)|< c|y − b|+ r(1− c) ≤ r.

Obsérvese que lo anterior prueba que kx aplica el intervalo cerrada [b−r, b+r]en en intervalo abierto (b− r, b+ r).

En consecuencia, del teorema del punto fijo se deduce que para cadax ∈ (a − s, a + s) la aplicación kx : [b − r, b + r] → [b − r, b + r] tiene unúnico punto fijo y = h(x), es decir para cada x ∈ (a− s, a+ s)(= U) existeun único punto y = h(x) ∈ (b− r, b+ r)(= V ) tal que k(x, h(x)) = h(x) ⇔f(x, h(x)) = 0.

Sólo queda probar la continuidad de la aplicación h en a: Utilizando denuevo la continuidad de k en (a, b), dado ε > 0 existe δ > 0 tal que si|x− a| < δ entonces,

|h(x)− h(a)| = |k(x, h(x))− k(a, h(a))|≤ |k(x, h(x))− k(x, h(a))|+ |k(x, h(a))− k(a, h(a))|

≤ c|h(x)− h(a)|+ ε(1− c)⇓

(1− c)|h(x)− h(a)| ≤ ε(1− c)⇔ |h(x)− h(a)| ≤ ε

La conclusión del teorema anterior suele expresarse también de algunade las formas equivalentes siguientes:

En B(a, s)×B(b, r) la ecuación f(x, y) = 0 permite despejar a y comouna (única) función y = h(x) definida en B(a, s) y continua en a.En B(a, s)×B(b, r) la ecuación f(x, y) = 0 define implícitamente unaúnica función y = h(x) continua en a.

2.2. Funciones implícitas: derivación

El teorema de existencia de funciones implícitas y sobre todo su corolario,muestra cómo las condiciones de continuidad de la aplicación f las heredaíntegramente la función h definida implícitamente a partir de la ecuaciónf(x, y) = 0. Vamos a ver ahora que igual sucede con la diferenciabilidad.

4.4 Funciones Implícitas 81

Lema 4.4 (Lema fundamental) Sea f : A ⊂ Rn × Rp → Rp y (a, b) unpunto de

oA tal que f(a, b) = 0. Supongamos que h es una función continua

en a tal que h(a) = b y que verifica f(x, h(x)) = 0 para cada x de algunabola centrada en a. Entonces, si

(i) f es diferenciable en (a, b), y

(ii) det(∂fi∂yj

(a, b))6= 0,

la aplicación h es también diferenciable en a y su diferencial en a se calculamediante la fórmula:

Dh(a) = −D2f(a, b)−1 D1f(a, b).

Demostración. Vamos a probar en primer lugar que, supuesta h diferenciableen a, su diferencial en a es la de la fórmula.

Por hipótesis existe una bola U = B(a, s) tal que f(x, h(x)) = 0 paracada x ∈ U , es decir

fi(x1, . . . , xn, h1(x1, . . . , xn), . . . , hp(x1, . . . , xn)) = 0, i = 1, 2, . . . , p

con otras palabras, para cada i, la composición de las aplicaciones

(x1, . . . , xn) ϕ−→ (x1, . . . , xn, h1(x1, . . . , xn), . . . , hp(x1, . . . , xn)) fi−→ 0

es la aplicación idénticamente nula sobre U . Aplicando entonces la regla dela cadena, se tiene que

0 = ∂(fi ϕ)∂xj

(a, b) = ∂fi∂xj

(a, b) +p∑

k=1

∂fi∂yk

(a, b)∂hk∂xj

(a),

que matricialmente se puede expresar mediante la igualdad:

D1f(a, b) +D2f(a, b) Dh(a) = 0 ⇔ D2f(a, b)−1 D1f(a, b) +Dh(a) = 0.

Probemos que h es diferenciable en a:

Hemos de ver que

lımu→0

h(a+ u)− h(a) + (D2f(a, b)−1 D1f(a, b))u‖u‖

= 0.

82 Funciones Implícitas 4.5

Como hipótesis tenemos que f es diferenciable en el punto (a, b), luego

lım(u,v)→(0,0)

f(a+ u, b+ v)− f(a, b)−D1f(a, b)u−D2f(a, b)v‖u‖+ ‖v‖ = 0.

Consideremos en la expresión anterior v = h(a + u) − h(a). Teniendo encuenta que h es continua en a, es decir (h(a+u)−h(a))→ 0 cuando u→ 0)y que f(x, h(x)) = 0, se deduce que

lımu→0

D2f(a, b)(h(a+ u)− h(a)) +D1f(a, b)u‖u‖+ ‖h(a+ u)− h(a)‖ = 0,

o equivalentemente (componiendo con D2f(a, b)−1) que

lımu→0

h(a+ u)− h(a) + (D2f(a, b)−1 D1f(a, b))u‖u‖+ ‖v‖ = 0.

Observamos entonces que la diferencia entre las expresiones que dan ladiferenciabilidad de f en (a, b) y la diferenciabilidad de h en a está única-mente en el denominador de las mismas. Si escribimos

h(a+ u)− h(a) + (D2f(a, b)−1 D1f(a, b))u‖u‖

=

h(a+ u)− h(a) + (D2f(a, b)−1 D1f(a, b))u‖u‖+ ‖v‖ · ‖u‖+ ‖v‖

‖u‖,

donde v = h(a+u)−h(a), bastará probar para terminar que cuando u→ 0,la expresión

‖u‖+ ‖v‖‖u‖

está acotada. Para ello tendremos en cuenta que D2f(a, b)−1 D1f(a, b) eslipschitziana, por ser lineal.

‖v‖ = ‖h(a+ u)− h(a)‖ ≤‖h(a+ u)− h(a) + (D2f(a, b)−1 D1f(a, b))u‖+ ‖(D2f(a, b)−1 D1f(a, b))u‖≤ε(‖u‖+ ‖v‖) + β‖‖u‖,

donde ε es arbitrario y las desigualdades se verifican para u suficientementepequeño, es decir siempre que ‖u‖ < δ (que depende de ε).

Se deduce que(1− ε)‖v‖ ≤ (ε+ β)‖u‖.

Por lo que tomando por ejemplo ε = 1/2, se tiene ya que‖u‖+ ‖v‖‖u‖

= 1 + ‖v‖‖u‖≤ 1 + 2β.

4.5 Funciones Implícitas 83

Teorema 4.5 (De las funciones implícitas) Si en el teorema de exis-tencia de funciones implícitas (Teorema 4.3) se sustituye la hipótesis “fcontinua en (a, b)"por una de las siguientes:

f es continua en algún entorno de (a, b)f es diferenciable en (a, b),f es de clase Cr en algún entorno de (a, b),

entonces, si h es la aplicación definida implícitamente por la ecuaciónf(x, y) = 0, se tiene que:

h es continua en algún entorno de ah es diferenciable en a,h es de clase Cr en algún entorno de a.

Demostración. Supongamos f continua en algún entorno de (a, b). Es obvioque en la demostración del teorema de existencia podemos tomar las bolasabiertas U y V de radios s y r suficientemente pequeños para que f (y portanto k) sea continua en cada punto de U × V . La demostración de queentonces h es continua en cada punto de U es idéntica a la que la se dio paraprobar la continuidad en a.

La diferenciabilidad de h en a cuando f es diferenciable en (a, b) esconsecuencia directa del lema de derivación (Lema 4.4).

Supongamos f de clase Cr en un abierto W que contenga al punto(a, b). Podemos suponer también que en todo punto (x, y) ∈ W se tie-ne que det(D2f(x, y)) 6= 0. En efecto, escribamos la aplicación (x, y) →det(D2f(x, y)) como composición de las funciones del diagrama

(x, y)→(∂fi∂yj

(x, y))i,j

→ det(∂fi∂yj

(x, y))i,j

.

Puesto que, por hipótesis, las derivadas parciales de f respecto a las coor-denadas y son continuas en (a, b) y la aplicación determinante es tam-bién continua, la función composición es continua en (a, b). De la hipótesisdet(D2f(a, b)) 6= 0 resulta entonces que para todo (x, y) en algún entornode (a, b), det(D2f(x, y)) 6= 0.

Tomando ahora las bolas U y V del teorema de existencia de funcionesimplícitas satisfaciendo que U ×V ⊂W , la función h está en las condicionesdel lema 4.4 en cada punto x ∈ U , pues h es continua en x según veíamos

84 Funciones Implícitas 4.5

antes, f diferenciable en (x, h(x)) y det (D2f(x, h(x)) 6= 0. Se deduce puesque h es diferenciable en cada x de U , siendo

Dh(x) = −D2f(x, h(x))−1 D1f(x, h(x)).

De lo anterior se deduce que en cada x de U

∂hi∂xj

(x) = −1detD2f(x, h(x))

∑Aik(x, h(x))∂fk

∂xj(x, h(x)),

donde las funciones Aik(x, h(x)) son los elementos de la fila i de la matrizadjunta de D2f(x, h(x)) y por lo tanto son sumas de productos de derivadasparciales de primer orden de la función f . Lo mismo cabe decir para lafunción det D2f(x, h(x)), de la que además sabemos que es distinta de ceroen U . De todo ello se deduce fácilmente que las aplicaciones ∂hi/∂xj sonaplicaciones continuas. Razonando por inducción y teniendo en cuenta elejercicio siguiente se obtendría finalmente que h es de clase Cr (hacerlo!).

Ejercicios4A Dar ejemplos de funciones de clase C∞, f , para las que el conjunto

M = (x, y) : f(x, y) = 0

sea respectivamente ∅, finito e infinito numerable.

4B Probar que el conjuntoM = (x, y) ∈ R2 : y2 +sen2 1/x = 0 es, en un entornode (0, 0), la gráfica de una función h, pero esta función h no está definida en ningúnentorno de 0.

4C Consideremos las funciones f1(x, y) = −1+cos(x−y); f2(x, y) = (x2+y2)(x2+(y − 1)2 − 2); f3(x, y) = (x2 + y2)(xy − 1) y sea Mi = (x, y) : fi(x, y) = 0 (i =1, 2, 3).

(a) Probar que en (0, 0) las funciones fi no satisfacen alguna de las hipótesis delteorema de existencia de funciones implícitas.

(b) Probar que existen intervalos abiertos U, V centrados en 0 tales que M1 ∩(U × V ) es la gráfica de una función de x definida en U y continua en 0.

(c) Probar que existen intervalos abiertos U, V centrados en 0 tales que M2 ∩(U × V ) es la gráfica de una función de x definida en U , pero no continuaen 0.

4E Funciones Implícitas 85

(d) Probar que no existen dos intervalos abiertos U, V centrados en 0 tales queM3 ∩ (U × V ) sea la gráfica de una función de x definida en U .

4D Estudiar si el sistema

x2 − y2 + 2t = 2z2 − t2 − xy = −1

permite despejar dos de las variables como función de las otras dos en algún entornodel punto (x0, y0, z0, t0) = (

√6, 0,√

3,−2) y en algún entorno del punto (0, 0, 0, 1).

4E Sean x, y, z, t cuatro variables ligadas entre sí por las ecuaciones

x3 + y3 + z3 + t3 = 0x2 + y2 + z2 + t2 = 1

86 Funciones Implícitas 4E

Comprobar que la expresión ∂x/∂y puede tener más de un significado, y calculartodos sus posibles valores para (x0, y0, z0, t0) = (−

√3/8,−

√1/8,

√3/8,

√1/8).

¿Qué ocurre para (x0, y0, z0, t0) = (1/2,−1/2, 1/2,−1/2)?

4F Considerar las funciones

f1(x, y) = y − x2 3√y; f2(x, y) = y − x 3

√y3 + x.

Probar que las dos son diferenciables en (0, 0), sus derivadas respecto a y en (0,0)son distintas de 0, pero no son continuas en (0,0). Comprobar que f1(x, h(x)) = 0para más de una función h diferenciable en 0. En cambio sólo existe una función hverificando f2(x, h(x)) = 0.

Capítulo 5

Subvariedades Diferenciablesde Rk

Vamos a completar lo visto en los capítulos anteriores sobre el teoremade las Funciones Implícitas y Funciones Inversas con un tema de iniciaciónal estudio de las Variedades Diferenciables.

1. Variedades

Definición 5.1 (Definición explícita) Sea M un subconjunto no vacíode Rk. Se dirá que M es una variedad diferenciable de dimensión 1 ≤ n < ky clase Cr si para cada c ∈M existe algún entornoW de c tal queM ∩W esla gráfica de alguna función h definida en algún abierto U de Rn y de claseCr sobre U .

La primera observación que es necesario hacer es que la función h, debido alcarácter local de la misma, puede cambiar de un punto a otro, y asimismo lasn coordenadas de las que depende. Por tanto si M es variedad, de acuerdocon la definición, para el punto c ∈M existe unW ∈ V (c) y una distribuciónde las k coordenadas de los puntos z deW en dos bloques x, y de n y p = k−ncoordenadas, de forma que M ∩W = (x, h(x)) : x ∈ U, con U abierto deRn y h : U ⊂ Rn → Rp de clase Cr. (Obviamente, el bloque de coordenadas xno es necesariamente el de las n primeras coordenadas de los puntos z ∈ Rk,aunque, por comodidad, escribamos z = (x, y)).

La segunda observación es que W puede tomarse abierto. En efecto, sicon las notaciones anteriores M ∩W es la gráfica de la función h ∈ Cr(U),entonces la función x→ (x, h(x)) es continua sobre el abierto U y por tanto

87

88 Subvariedades Diferenciables de Rk 5.2

el conjunto V = x ∈ U : (x, h(x)) ∈oW es un abierto. Se tiene pues que

M∩oW es la gráfica de la restricción de h a V ¿Pueden ser distintos M ∩W

y M∩oW?

Teorema 5.2 (Definición implícita) El conjunto no vacío M ⊂ Rk esuna variedad diferenciable de dimensión 1 ≤ n < k y clase Cr si y sólo sipara cada c ∈ M existe un entorno abierto W de c y una función f : W ⊂Rk → Rk−n de clase Cr tal que

1. Rango(Df(c)) = k − n.2. M ∩W = z ∈W : f(z) = 0.

Demostración. Supongamos que M es un variedad diferenciable de dimen-sión n y sea c un punto de M . Sea W entorno abierto de c tal que M ∩W =(x, h(x)) : x ∈ U para alguna función h de las n-variables x y de clase Cren U . Podemos escribir entonces que

M ∩W = (x, y) ∈ U × Rp : y − h(x) = 0,

lo cual es obvio que implica:

M ∩W = M ∩W ∩ (U × Rp) = (x, y) ∈ U × Rp : y − h(x) = 0= (x, y) ∈ U × Rp : y − h(x) = 0 ∩W

= (x, y) ∈ (U × Rp) ∩W : y − h(x) = 0.

Si f es la función definida en U × Rp como f(x, y) = y − h(x) y W1 =W ∩ (U × Rp), entonces lo anterior nos permite escribir que

M ∩W1 = (x, y) ∈W1 : f(x, y) = 0.

ClaramenteW1 es un entorno abierto de c y f ∈ Cr(W1). Además, la matrizjacobiana de Df(c) es la siguiente

∂f1∂x1

(c) · · · ∂f1∂xn

(c) 1 0 · · · 0

∂f2∂x1

(c) · · · ∂f2∂xn

(c) 0 1 · · · 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .∂fp∂x1

(c) · · · ∂fp∂xn

(c) 0 0 · · · 1

,

5.3 Subvariedades Diferenciables de Rk 89

que tiene un menor de orden p = k − n no nulo, luego rg(Df(c)) = p.Recíprocamente, si M satisface la condición del teorema en c ∈ M ,

denotemos por y = (y1, . . . , yp) a uno de los grupos de coordenadas talque el menor de Df(c) correspondiente a las derivaciones respecto a yj esdiferente de 0, y por x = (x1, . . . , xn) al grupo formado con el resto de lascoordenadas. Sin pérdida de generalidad, podemos suponer que el bloque xes el de las n primeras coordenadas. Según esto, los puntos de M que estánen el entorno W son los que verifican la ecuación f(x, y) = 0. Además, de lahipótesis se deduce que f satisface las condiciones del teorema de existenciade Funciones Implícitas en c = (a, b). Luego, existen entornos abiertos U yV de a y b, respectivamente, con U × V ⊂ W y una función h de clase Crde U en V , cuya gráfica es M ∩ (U × V ).

2. Variedad tangenteEn el capítulo 2 se definió el concepto de vector tangente en un punto c

de un conjunto M ⊂ Rk. Geométricamente, un vector tangente a M en c noera más que un vector tangente a alguna curva trazada sobreM pasando porc (ver ejercicio 2M para una definición más general de vector tangente). Sevio entonces que, en el caso particular de queM sea la gráfica de una funciónh de n variables reales y diferenciable en un punto a, el conjunto Tc(M) devectores tangentes a M en el punto c = (a, h(a)) es un espacio vectorial dedimensión n, cuya expresión es Tc(M) = (u,Dh(a)u) : u ∈ Rn.

Proposición 5.3 Si M es una variedad diferenciable de Rk de dimensión1 ≤ n < k y clase Cr y c ∈M , entonces el conjunto Tc(M) es un subespaciovectorial de Rk de dimensión n

Demostración. Puesto que, localmente, M es la gráfica de una función den variables y clase Cr, basta tener en cuenta lo comentado en el párrafoanterior.

A Tc(M) se le llamará el espacio vectorial tangente a la variedad M en cy al trasladado a c de este subespacio, i.e., c+ Tc(M) se le llamará pues lavariedad tangente a M en c. Un punto z de Rk pertenecerá a la variedadtangente a M en c si (z − c) ∈ Tc(M).

Vamos a caracterizar ahora el espacio vectorial tangente a un variedaden un punto a partir de la definición implícita. Suponemos, pues, que M esuna variedad de Rk determinada, en un entorno W del punto c ∈M , comoel lugar geométrico de los puntos de W que satisfacen la ecuación

90 Subvariedades Diferenciables de Rk 5.4

f(z1, z2, . . . , zk) = 0, donde f = (f1, f2, . . . , fp) es una función de clase Cr talque rg(Df(c)) 6= 0. (Abreviadamente, nos referiremos a lo anterior diciendoqueM está determinada en un entorno de c por la función f = (f1, . . . , fp)).Se tiene entonces

Proposición 5.4 SiM es la variedad determinada en un entorno del puntoc ∈M por la función f = (f1, . . . , fp), entonces

Tc(M) = kerDf(c) = ∩ kerDfi(c).

Demostración. Sea v ∈ Tc(M). Entonces v es el vector velocidad en c dealguna curva γ contenida en M y que pasa por c. Es decir γ(t) ∈ M ypara algún t0, γ(t0) = c y γ′(t0) = v. Puesto que M está determinadaen un entorno de c por f y γ esta contenida en M , se deduce que, pa-ra t suficientemente próximo a t0, f(γ(t)) = 0. Luego derivando en t0,se obtiene que Df(γ(t0))γ′(t0) = 0, o sea Df(c)v = 0, que nos dice quev ∈ kerDf(c) =

⋂pi=1 kerDfi(c). Para demostrar que Tc(M) ⊃ kerDf(c)

basta tener en cuenta que ambos subespacios tienen la misma dimensión.En efecto, como por hipótesis, el rango de la aplicación lineal Df(c) es iguala p, su núcleo debe ser un subespacio de dimensión igual a n = k − p.

Nota. Para otras definiciones equivalentes de una variedad diferenciable verManual (Anexo: distintas presentaciones de una variedad).

Ejercicios5A Estudiar si el conjuntoM de los puntos que satisfacen las ecuaciones siguientesson variedades diferenciables y en tal caso de qué dimensión.

1. x2 + y2 + z2 + xy + yz − xz = 0 2. x2 + y2 + z2 + xy + yz − xz = 1

5B Sea M el conjunto de puntos de R3 que satisfacen el sistemax2 + y2 − z = 1x− y + z2 = 1

(a) Probar que M es una variedad diferenciable.(b) Hallar la ecuación de la recta tangente a M en (1, 0, 0).

5C Subvariedades Diferenciables de Rk 91

5C Sea M = (x, y, z) 6= (0, 0, 0) : x3 + y3 + z3 = 2(x+ y + z)2.

(a) Probar que M es una variedad diferenciable.(b) Determinar los posibles puntos de M en los que el plano x + y = 0 sea

tangente a M.

(c) Determinar la recta tangente a la curva intersección deM con el plano x+y =0 en el punto (1,−1, 2).

Capítulo 6

Funciones Inversas

En este capítulo estudiaremos condiciones para la derivación de la inversade una función de varias variables y, en particular, extenderemos a estasfunciones la fórmula (g−1)′(g(a)) = 1/g′(a).

Sin embargo, el principal resultado de este capítulo es el teorema co-nocido como Teorema de la Función Inversa. Lo obtendremos a partir delteorema de las funciones implícitas y, junto a éste, constituirá otra impor-tante herramienta de la Geometría Diferencial. Formalmente este teoremaconsiste en una condición suficiente para que una función de varias varia-bles, g, admita localmente una función inversa con las mismas propiedadesde diferenciabilidad que g.

1. Derivada de funciones inversas

En lo que sigue la frase “la función g : A ⊂ X → Y admite inversa”expresará cualquiera de los enunciados (evidentemente) equivalentes:

cada elemento y ∈ g(A) tiene una única anti-imagen en A;para cada elemento y ∈ g(A), A ∩ g−1(y) es un conjunto con un sóloelemento;para cada elemento y ∈ g(A), existe un único x ∈ A tal que g(x) = y;g es inyectiva en A.g−1 : g(A)→ X es aplicación.

Nuestro punto de partida en esta sección será una función g : A ⊂Rn → Rn inyectiva y diferenciable en un punto a ∈

oA. Es bien conocido

93

94 Funciones Inversas 6.2

que, en general, su inversa no es diferenciable. Por ejemplo, la función de 1-variable g(x) = x3 es una biyección de R en R diferenciable en 0 cuya inversag−1(y) = 3

√y no es diferenciable en 0 = g(0). El motivo de esto es que para

funciones de 1-variable una condición necesaria para la derivabilidad de g−1

en g(a) es que g′(a) 6= 0. Esta condición se mantiene para funciones de variasvariables:

Proposición 6.1 Sea g : A ⊂ Rn → Rn inyectiva y diferenciable en unpunto a ∈

oA. Si g−1 es diferenciable en g(a) entonces

Dg−1(g(a)) = Dg(a)−1,

y por tanto

detDg(a) = det(∂gi∂xj

(a))6= 0.

Demostración. Puesto que g−1 g = idRn(la identidad), aplicando la reglade la cadena resulta que

Dg−1(g(a)) Dg(a) = idRn ,

de lo que se deduce que Dg(a) es una aplicación lineal inversible, siendoDg−1(g(a)) = (Dg(a))−1, y por tanto detDg(a) 6= 0.

Ejercicio. Comprobar que la aplicación g : (x, y) → (u, v) cuyas funcionescoordenadas son u(x, y) = x3 + xy2; v(x, y) = y es una biyección de R2 enR2 cuya inversa no es diferenciable en g(0, 0) = 0.

La función g−1 del ejercicio anterior sí será diferenciable en (u, v) =g(x, y) para cada (x, y) en el que detDg(x, y) 6= 0. El motivo de esto esque esta condición del determinante es también suficiente, como veremos,cuando g es de clase C1, como es el caso del ejemplo.

Ejercicio. Siendo g la función del ejercicio anterior y g−1 : (u, v)→ (x, y),observar que no resulta fácil obtener explícitamente g−1, es decir x e y comofunciones de (u, v). Obtener, sin necesidad de conocer g−1, Dg−1(−3, 2) esdecir

∂x

∂u(−3, 2); ∂x

∂v(−3, 2); ∂x

∂u(−3, 2); ∂y

∂v(−3, 2).

Damos a continuación el principal resultado de esta sección. En él seestablecen las condiciones justas para que la inversa de una función biyectiva

6.2 Funciones Inversas 95

y diferenciable sea también diferenciable. Si no se ha incluido en el capítulodedicado a las reglas de derivación, es porque todo el estudio sobre funcionesinversas está estrechamente ligado al de las funciones implícitas.

Teorema 6.2 Sea g : A ⊂ Rn → Rn una aplicación inyectiva y diferenciableen un punto a ∈

oA. Entonces la aplicación g−1 es diferenciable en el punto

b = g(a) si y sólo si

(a) b ∈o

g(A) y g−1 es continua en b.

(b) det(∂gi∂xj

(a))6= 0.

Demostración. Si g−1 es diferenciable en b = g(a) entonces, como hemosconvenido siempre, el punto b debe ser interior al conjunto donde está defi-nida la función g−1, es decir a g(A). Por otra parte g−1 debe ser continua enb, pues toda función diferenciable en un punto es continua en ese punto. Porúltimo ya vimos antes que la condición detDg(a) 6= 0 era necesaria para ladiferenciabilidad de g−1.

Que las condiciones anteriores también son suficientes resulta del lema4.4, aplicado a las funciones f(x, y) = g(x)−y; h = g−1, cambiando en él lospapeles de las coordenadas y y las coordenadas x (verificar como ejerciciotodos los detalles).

En la práctica los problemas que el teorema anterior plantea son dos:1. Cómo reconocer si g es inyectiva (al menos en algún entorno del pun-

to a).2. Supuesta g inyectiva, cómo saber si g−1 está definida en algún entorno

de g(a) y es continua en g(a). Tengamos presente que no siempre es fácilobtener explícitamente g−1.

Por fortuna disponemos de herramientas de fácil aplicación (condicionessuficientes) para resolver ambos problemas. Concretamente, en el segundode ellos, bastará que g, además de ser inyectiva, sea continua en algún en-torno de a para garantizar que g−1 sea continua en g(a). De hecho con estahipótesis adicional g−1 resultaría continua en algún entorno de g(a). Estoes consecuencia de un importante teorema de topología, que no tiene cabi-da aquí. Lo que sí veremos a continuación es otro importante teorema, queestablece condiciones suficientes fácilmente verificables en la práctica, quegarantizan a la vez el carácter inyectivo de g en algún entorno de a y lacontinuidad de g−1 en algún entorno de g(a).

96 Funciones Inversas 6.3

2. Inversión localTeorema 6.3 (Lema fundamental) Sea g : A ⊂ Rn → Rn, a ∈

oA y

supongamos que

(a) g admite derivadas parciales en algún entorno del punto a, continuasen a.

(b) det(∂gi∂xj

(a))6= 0.

Entonces existen U y V , entornos abiertos de a y b = g(a) respectivamente,tales que la restricción de g a U es una biyección de U sobre V , cuya inversaes diferenciable en b.

Demostración. Observemos en primer lugar que de (a) se deriva que g es unaaplicación diferenciable en a y continua en algún entorno de a (ver Teorema2.34). Teniendo en cuenta esto, es fácil ver que la función f(x, y) = g(x) −y satisface la condiciones para poder aplicar el teorema de las FuncionesImplícitas en el punto (a, b) respecto de las coordenadas x, es decir siendox el bloque de coordenadas a despejar. Concretamente, f(a, b) = 0, f esuna función derivable en (a, b) y continua en algún entorno de (a, b), admitederivadas parciales continuas en (a, b) y

det(∂fi/∂xj)(a, b) = ∂gi∂xj

(a) 6= 0.

Existen, por tanto, dos entornos U1 y V , de a y b respectivamente (si sequiere, bolas abiertas), tales que

∀y ∈ V, ∃(único)x = h(y) ∈ U1 tal que y = g(x),

y la aplicación h hereda las propiedades de f , luego es continua en V ydiferenciable en b. De acuerdo con esto, resulta pues que cada punto y de Vtiene una única antimagen x en U1. Esto significa que si denotamos

U = los puntos de U1 que son antimágenes por g de los puntos de V = g−1(V ) ∩ U1,

entonces U es abierto (para probarlo tened en cuenta que g puede suponersecontinua sobre U1 y aplicar la Proposición 1.16) y la restricción g|U es unabiyección entre U y V , cuya inversa (que no es otra que la aplicación h escontinua en V y diferenciable en b.

6.4 Funciones Inversas 97

Nota. Observemos que si la hipótesis (a) del lema anterior la cambiamos porla más fuerte, “g de clase Cr en algún entorno de a”, entonces la función fhereda esa misma propiedad y en consecuencia la función (g|U )−1 definidaimplícitamente por la ecuación f(x, y) = 0 resultará entonces de clase Cr enel entorno de g(a), g(U).

Como consecuencia directa del lema de inversión local se tiene:

Teorema 6.4 (Teorema de la función inversa) Sea U un abierto de Rny g : U ⊂ Rn → Rn una aplicación de clase Cr sobre U . Se tiene entonces,

1. Las condiciones siguientes son equivalentes:

a) Para cada x ∈ U

detDg(x) = det(∂gi∂xj

(x))6= 0.

b) Para cada x de U existe algún entorno abierto Ux ⊂ U tal que g|Ux

es inyectiva, g(Ux) abierto y g−1|Ux

de clase Cr (abreviadamente unatal g se dice que es un “difeomorfismo local” de clase Cr sobreU).

2. En particular, cuando además g sea inyectiva en U , la equivalenciaanterior establece que la aplicación g−1 es de clase Cr (en cuyo casose dice que g es un “difeomorfismo” entre los abiertos U y g(U)) si ysólo si detDg(x) 6= 0.

Demostración. 1. a) implica b) Sólo hay que aplicar el lema de inversión yla nota posterior en cada x ∈ U . b) implica a) Como ya sabemos (Teorema6.2), una condición necesaria para que la inversa g|Ux

sea diferenciable eng(x) es que detDg(x) 6= 0.

2. Puesto que g es inyectiva en U , la equivalencia anterior nos dice quedetDg(x) 6= 0 para cada x ∈ U si y sólo si g−1 es de clase Cr en el entornoabierto de g(x), g(Ux) ⊂ g(U), luego g(U) abierto y las derivadas parcialesde orden r de g−1 son continuas en cada x ∈ U .

Ejercicios6A (T. aplicación inyectiva) Sea g : U ⊂ Rn → Rp una aplicación de clase C1

sobre el abierto U y supongamos que para todo punto x ∈ U , Dg(x) es inyectiva.Probar entonces que g es una aplicación localmente inyectiva.

98 Funciones Inversas 6B

6B (T. aplicación suprayectiva) Sea g : U ⊂ Rn → Rp una aplicación de cla-se C1 sobre el abierto U y supongamos que para todo punto x ∈ U , Dg(x) essuprayectiva. Probar entonces que g es una aplicación abierta.

6C Probar que no puede existir una aplicación de clase C1 e inyectiva de un abiertode R2 en R.

6D Sea g : R → R2 una aplicación de clase C1. Probar que si x ∈ R existe algúnentorno de x cuya imagen por g no es entorno de g(x).

6E Sea g la transformación de coordenadas dada por las ecuaciones

u = x2 − y; v = xy

y consideremos el abierto U = (x, y) : detDg(x, y) 6= 0.

(a) Estudiar si g es un difeomorfismo local o global sobre U .(b) ¿Es g localmente inyectiva sobre R2?(c) Probar que la transformación anterior define un cambio de coordenadas (di-

feomorfismo global) sobre el abierto V = (x, y) : x2 − y < 0 y utilizase enla ecuación funcional

∂y

[f(x, y) + x

∂f

∂x(x, y)

]= xy.

6F Estudiar si la aplicación

g(x, y, z) = (x2 − y − z, 2x+ y + z, x+ y − z)

es un difeomorfismo del abierto V = (x, y, z) : x > −1 sobre g(V ).

6G Sea g : (a, b) ⊂ R → R una aplicación derivable en (a, b) con g′(x) 6= 0 paratodo x ∈ (a, b). Probar que g admite función inversa diferenciable en cada puntodel abierto g(a, b).

6H Si f es una función de 2 variables y clase C2, transformar la expresión

x2 ∂2f

∂x2 + y2 ∂2f

∂y2 + x∂f

∂x+ y

∂f

∂y

mediante el cambio x = eu; y = ev.

6I (a) Transformar la ecuación diferencial y′ = f(x, y) mediante el cambio devariables x = x(u, v); y = y(u, v).

(b) Utilizar coordenadas polares para plantear y resolver el siguiente problema:Obtener el perfil que debe tener unas tijeras para que corten en ángulo recto.

Capítulo 7

Extremos de funciones devarias variables

En este capítulo vamos a considerar la teoría clásica de extremos parafunciones diferenciables de varias variables, cuyos dos tópicos habituales sonlos Extremos Relativos y los Extremos Condicionados.

1. Extremos relativos

Una aplicación clásica del Teorema Local de Taylor es el estudio de losextremos relativos de una función escalar. Aunque la analogía con el caso deuna variable es total, hay algunas diferencias que surgen de manera naturalpor el paso a una dimensión superior.

Trabajaremos con funciones escalares, definidas sobre un conjunto A ⊂Rk. Se dirá que la función f : A ⊂ Rk → R presenta un mínimo (máximo)absoluto en el punto a ∈ A si f(x) ≥ f(a) (f(x) ≤ f(a)) para todo x ∈ A.Y se dirá que f presenta extremo relativo en a, si existe un entorno V de acontenido en A, tal que la diferencia f(x)− f(a) no cambia de signo cuandox ∈ V :

Máximo Si f(x)− f(a) ≤ 0.

Mínimo Si f(x)− f(a) ≥ 0.

Luego sólo cuando a ∈oA, es decir cuando f esté definida en alguna bola

centrada en a, podremos considerar la cuestión de si f presenta un extremorelativo en a.

99

100 Extremos de funciones de varias variables 7.2

1.1. Condiciones necesarias de extremo

Recordemos que si queremos que una función derivable de 1-variablepresente un máximo o un mínimo relativo en un punto a, la recta tangente asu gráfica en el punto (a, f(a)), y = f(a)+f ′(a)(x−a) debe ser paralela al ejeX, es decir f ′(a) = 0. Aunque sabemos que esta condición no es suficiente,pues a puede ser un punto de inflexión. Del mismo modo si f es de 2-variableses intuitivamente claro que una condición necesaria para que f presente unextremo relativo en el punto a = (x0, y0) es que (supuesta f diferenciableen a) el plano tangente a su gráfica en en el punto (x0, y0, f(x0, y0)), z =f(x0, y0) +Df(a)(x− x0, y − y0) sea paralelo al plano XY , es decir

Df(a) ≡ (∂f∂x

(a), ∂f∂y

(a)) = (0, 0).

Más generalmente cuando f es una función diferenciable se obtiene la si-guiente condición necesaria de extremo, totalmente análoga a la de funcionesde una variable.

Proposición 7.1 Si f es diferenciable en a y presenta un extremo relativoen ese punto, entonces Df(a) = 0 y por tanto

∂f

∂xi(a) = 0, i = 1, 2, . . . , k.

Demostración. Supongamos, para concretar, que f presenta un mínimo ena. Sea entonces h un vector cualquiera. Entonces:

Df(a)h = Dhf(a) = lımt→0

f(a+ th)− f(a)t

=

lımt→0+f(a+th)−f(a)

t ≥ 0lımt→0−

f(a+th)−f(a)t ≤ 0

.

7.2 Por tanto, el proceso para encontrar los posibles puntos de extremorelativo para una función diferenciable comienza con el planteamiento delsistema

Df(x) = 0 ⇔ ∂f

∂xi(x1, · · · , xn) = 0, i = 1, 2, · · · , n.

Los puntos solución de este sistema de n ecuaciones con n incógnitas sedenominan puntos críticos . Después de la proposición 7.1, una condición

7.3 Extremos de funciones de varias variables 101

necesaria para que la función f presente un extremo relativo en un punto xes que x sea un punto crítico. Pero esto no es, en general suficiente. ¿Cómocontinuar? Recordemos que cuando f es de una variable, para saber si estafunción presenta o no un extremo en un punto crítico a, se obtenían lasderivadas sucesivas f ′′(a), f ′′′(a).... Si todas ellas son nulas, no disponemosde ningún criterio general para saber si f presenta un extremo en a. Enotro caso, del teorema de Taylor se deduce que una condición necesaria ysuficiente para que f presente un extremo relativo en a es que la primeraderivada que no se anule en a sea de orden par. Pero esto no se extiendetal cual a las varias variables. Dicha condición, aunque necesaria, noserá suficiente para garantizar la existencia de extremo.

El parecido y la diferencia entre una y varias variables quedan patentesen la proposición que enunciaremos a continuación:

Consideremos pues una función f : A ⊂ Rk −→ R cuyas derivadasparciales sucesivas no son todas nulas en el punto a ∈

oA y supongamos que

la primera de estas derivadas que no se anulan en a es la de orden r. Parapoder aplicar el teorema de Taylor, supondremos también que f es de claseCr en a. En este caso, puesto que todas las derivadas parciales de ordenmenor estrictamente que r se anulan en a, es claro que

Prf(a)h = f(a) + 1r!D

rf(a)hr

= f(a) +∑

r1+...+rk=r

1r1! . . . rn!

∂rf(a)∂xr1

1 ∂xr22 . . . ∂xrk

k

hr11 h

r22 . . . hrk

k .

En lo sucesivo, siempre que no haya lugar a confusión, denotaremos por Qpa la suma de los términos de grado p del polinomio de Taylor de f en a. Esdecir:

Prf(a) = Q0 +Q1 + . . .+Qr; Qp(h) = 1p!D

pf(a)hp.

Proposición 7.3 En estas condiciones, es decir si la primera de las deriva-das parciales sucesivas de f que no se anulan en a es la de orden r y f es declase Cr en a, entonces:

1) Una condición necesaria para que f presente un mínimo en a es que rsea un número par y Qr(h) ≥ 0 para todo h ∈ Rk ( ≤ 0 para todo hpara máximo).

2) Una condición suficiente para que f presente un mínimo en a es que rsea par y Qr(h) > 0 para todo h ∈ Rk, h 6= 0 ( < 0 para todo h 6= 0para máximo).

102 Extremos de funciones de varias variables 7.3

Demostración. Para probar 1), supongamos para concretar que f presentaun mínimo relativo en a. De acuerdo con las hipótesis y teniendo en cuentaque para cada polinomio homogéneo de grado r se satisface la igualdadQ(th) = trQ(h), es fácil ver que el teorema local de Taylor nos dice que si hes un vector de Rk entonces:

(7.1) lımt→0

f(a+ th)− f(a)tr

= 1r!D

rf(a)hr = Qr(h).

Como estamos suponiendo que f presenta un mínimo en a, f(a+ th)−f(a) es ≥ 0 para t suficientemente pequeño. Por tanto r debe ser par, puessi r fuese impar el límite en (7.1) debería ser igual a 0 , ya que este límitepor la derecha sería ≥ 0 mientras que por la izquierda sería ≤ 0. Comoel valor de este límite es 1

r!Drf(a)hr, entonces de ser r impar se tendría

que Drf(a)hr = 0 para todo h, en contra de nuestra suposición de que lasderivadas parciales de orden r no son todas nulas. Luego la igualdad (7.1)prueba que r es par y que Qr(h) ≥ 0 para todo h.

2) Supongamos ahora que (el polinomio homogéneo de grado r) Qr(h) =1/(r!)Drf(a)hr es estrictamente mayor que 0 para todo h 6= 0 de Rk, y seaλ el valor mínimo que alcanza este polinomio sobre la esfera u : ‖u‖ = 1(que es un compacto). De acuerdo a nuestra hipótesis es claro que λ > 0.Teniendo en cuenta que, al ser Qr un polinomio homogéneo de grado r,

Qr(h)‖h‖r

= Qr

(h

‖h‖

),

del teorema local de Taylor, se deduce que

0 = lımh→0

f(a+ h)− f(a)− 1r!D

rf(a)hr

‖h‖r= lım

h→0

f(a+ h)− f(a)−Qr(h)‖h‖r

.

Y, por lo tanto, para ε = λ/2 existe un δ > 0 tal que si 0 < ‖h‖ < δ,entonces

−λ2 ≤f(a+ h)− f(a)−Qr(h)

‖h‖r

= f(a+ h)− f(a)‖h‖r

−Qr( h

‖h‖)r

≤ f(a+ h)− f(a)‖h‖r

− λ.

Lo que implica quef(a+ h)− f(a)

‖h‖r≥ λ

2

7.5 Extremos de funciones de varias variables 103

si 0 < ‖h‖ < δ y, por lo tanto que f(a+ h)− f(a) > 0. Así pues f presentaun mínimo (estricto) en a.

7.4 En resumen, el procedimiento general para la obtención de los puntosde extremos relativos es el siguiente:

1. Obtención de los Puntos Críticos∂f

∂xi(x1, · · · , xn) = 0, i = 1, 2, · · · , n

Supongamos que a es un punto crítico y la primera derivada de lafunción f que no se anula en a es la de orden r, entonces:

2. r impar La función f no tiene extremos en a

3. r par y Qr(h) > 0 para todo h 6= 0. La función presenta un Mínimoen a.

4. r par y Qr(h) < 0 para todo h 6= 0. La función presenta un Máximoen a.

5. r par pero Qr(h) no tienen signo constante. La función no tiene ex-tremos en a.

6. r par, Qr(h) tiene signo constante, pero existe algún h 6= 0 tal queQr(h) = 0. Caso Dudoso.

Aplicamos a continuación el estudio anterior a algunos ejemplos:

Ejemplo 7.5 Seaf(x, y) = 6x2y − 2y3 − 3x4.

1. Puntos críticos:∂f

∂x(x, y) = 12xy − 12x3 = 0

∂f

∂y(x, y) = 6x2 − 6y2 = 0.

Es claro que los únicos puntos que satisfacen el sistema anterior (los puntoscríticos), son: (0, 0), (1, 1), (−1, 1)

Consideremos en primer lugar el (0,0):Puesto que f es un polinomio de grado 4, sabemos que P4f(x0, y0)(x, y) =

f(x+x0, y+y0). En particular P4f(0, 0)(x, y) = f(x, y) = 6x2y−2y3−3x4.

104 Extremos de funciones de varias variables 7.5

Se tiene pues que todas las derivadas parciales de 1o y 2o orden de f en (0,0)son nulas, luego

2. r = 3 (impar) y por tanto f no presenta un extremo en (0, 0).

Estudiamos ahora f en el punto crítico (1,1):

P4f(1, 1)(x, y) = f(x+ 1, y + 1) = 6(x+ 1)2(y + 1)− 2(y + 1)3 − 3(x+ 1)4

= 1− 12x2 − 6y2 + 12xy + 6x2y − 12x3 − 2y3 − 3x4.

Por lo tanto las derivadas parciales de primer orden de f en (1,1) son nulasmientras que las de orden 2 no, luego

2. r = 2 (par) y por tanto no podemos descartar aún la posibilidad deque f presente un extremo en este punto.

3. Q2(x, y) = −12x2 − 6y2 + 12xy, y es fácil ver que podemos escribirQ2(x, y) = −6[x2 +(x−y)2], de lo que se deduce que Q2(x, y) < 0 para todo(x, y) 6= (0, 0) y que , por lo tanto, f presenta un máximo relativo estrictoen (1, 1).

Por último analizamos qué sucede en (-1,1):

P4f(−1, 1)(x, y) = f(x− 1, y + 1) = 6(x− 1)2(y + 1)− 2(y + 1)3 − 3(x− 1)4

= 1− 12x2 − 6y2 − 12xy + 6x2y + 12x3 − 2y3 − 3x4.

Por lo tanto las derivadas parciales de primer orden de f en (-1,1) son nulasmientras que las de orden 2 no, luego de nuevo

2. r = 2 (par).3. Q2(x, y) = −12x2−6y2−12xy = −6[x2 +(x+y)2]. Por tanto también

ahora Q2(x, y) < 0 para todo (x, y) 6= (0, 0) y por lo tanto f presenta unmáximo relativo estricto en (−1, 1).

En los casos en que la primera derivada que no se anule en un punto seala segunda, es decir cuando r = 2, existen ciertos atajos para estudiar laexistencia de extremo en ese punto, que vemos a continuación:

1.2. Caso particular

Según lo visto antes, en el caso particular de que la primera de las deriva-da parciales sucesivas de la función f que no se anule en el punto a sea la deorden 2, la existencia de extremo de f en a está estrechamente relacionadacon el signo de Q2(h) (el polinomio formado por los términos de grado 2 delpolinomio de Taylor en a). Para estudiar el posible signo de este polinomio(en este caso y sólo en este caso) podemos utilizar un resultado que se deriva

7.5 Extremos de funciones de varias variables 105

de la teoría de las formas cuadráticas (ver Gantmacher, F.R., “Théoriedes Matrices” Tome 1, Dunod, Paris, 1966.):

Denotemos por Hf (a) a la matriz de las derivadas parciales segundas def en a ( que se denomina Hessiano de f en a).

Hf (a) =

∂2f∂x2

1(a) ∂2f

∂x1∂x2(a) · · · ∂2f

∂x1∂xn(a)

∂2f∂x2∂x1

(a) ∂2f∂x2

2(a) · · · ∂2f

∂x2∂xk(a)

· · · · · · · · · · · ·

∂2f∂xk∂x1

(a) ∂2f∂xk∂x2

(a) · · · ∂2f∂x2

k(a)

Se tiene entonces :

(i) Q2(h) ≥ 0, ∀h si y sólo si todos los menores principales de Hf (a) sonno negativos (condición necesaria de mínimo).

(ii) Q2(h) ≤ 0, ∀h si y sólo si los menores principales de orden par deHf (a) son no negativos y los menores principales de orden impar nopositivos (condición necesaria de máximo).

(iii) Q2(h) > 0, ∀h 6= 0 si y sólo si los menores principales de Hf (a)formado por las i primeras filas y las i primeras columnas i = 1, 2, . . . , k

∆i =

∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣

∂2f∂x2

1(a) ∂2f

∂x1∂x2(a) · · · ∂2f

∂x1∂xi(a)

∂2f∂x2∂x1

(a) ∂2f∂x2

2(a) · · · ∂2f

∂x2∂xi(a)

· · · · · · · · · · · ·

∂2f∂xi∂x1

(a) ∂2f∂xi∂x2

(a) · · · ∂2f∂x2

i(a)

∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣,

son mayores (estrictamente) que 0 (condición suficiente de mínimo).

(iv) Q2(h) < 0, ∀h 6= 0 si y sólo si ∆1 < 0, ∆2 > 0, . . . , (−1)i∆i > 0, . . . ,(condición suficiente de máximo).

106 Extremos de funciones de varias variables 7.6

Aplicando este criterio al ejemplo anterior en el punto (-1,1), para el queQ2(x, y) = −12x2 − 6y2 − 12xy, se tendría que

Hf (−1, 1) =(−24 −12−12 −12

)Por lo que ∆1 = −24 < 0, ∆2 = 144 > 0. Según el criterio anterior, estosignifica que Q2(x, y) < 0 para todo (x, y) 6= (0, 0) y por lo tanto que fpresenta un máximo en (−1, 1).

Ejemplo 7.6 Seaf(x, y, z) = cosxz

1− xyzdefinida en el abierto U = (x, y, z) ∈ R3 : xyz < 1.

1. Puntos críticos.Es fácil ver (ejercicio) que los únicos puntos críticos de f en U son los

puntos (c, 0, 0), (0, c, 0), (0, 0, c) para cualquier c ∈ R. A continuación vamosa analizar si f presenta extremo en los puntos (0, 0, 0), (1, 0, 0), (0, 1, 0).

2. En general, parece razonable tratar de aplicar, si fuera posible, el atajoanterior. Para lo cual, dado un punto crítico, el Hessiano de f en ese puntodebería ser distinto de la matriz idénticamente nula. En caso contrario, esdecir si las primeras derivadas no nulas son las de orden r y r > 2, deberemosrecurrir (de acuerdo al estudio general) a analizar Qr, el polinomio formadopor los términos de grado r del polinomio de Taylor en el punto. En esteejemplo, r = 2 en el punto (1,0,0) y en el (0,1,0), pero es mayor que 2 enel punto (0,0,0), como puede comprobarse haciendo el cálculo directo de lasderivadas parciales segundas (que resulta un poco pesado) en esos puntos.Podemos evitar este cálculo directo de derivadas obteniendo los polinomiosde Taylor y deducirlas de los coeficientes de estos polinomios. Consideremospues, en primer lugar, el punto crítico (0, 0, 0). Teniendo en cuenta que losdesarrollos de Taylor de las funciones de 1-variable cos t, 1

1−t en 0 son:

cos t ≡ 1− 12 t

2 + · · · ; 11− t ≡ 1 + t+ t2 + · · · ,

es fácil ver (ejercicio) que los sucesivos polinomios de Taylor de f en (0,0,0)se obtienen así:

Pf(0, 0, 0)(x, y, z) ≡ (1− 12x

2z2 + · · · )(1 + xyz + · · · ) ≡ 1 + xyz + · · ·

Lo que nos indica que la primera derivadas no nula de f en (0,0,0) es∂f

∂x∂y∂z(0, 0, 0) = 1,

7.8 Extremos de funciones de varias variables 107

es decir que r = 3 (impar) y por tanto f no presenta extremos en (0, 0, 0).

Análogamente los sucesivos polinomios de Taylor de f en (1,0,0) y (0,1,1)se obtienen así:

Pf(1, 0, 0)(x, y, z) ≡ (1− 12(x+ 1)2z2 + · · · )(1 + (x+ 1)yz + · · · )

≡ 1− 12z

2 + yz + · · ·

Pf(0, 1, 0)(x, y, z) ≡ (1− 12x

2z2 + · · · )(1 + x(y + 1)z + · · · )

≡ 1 + xz + · · · .

Se deduce pues que

Hf (1, 0, 0) =

0 0 00 0 10 1 −1

; Hf (0, 1, 0) =

0 0 10 0 01 0 0

,lo que de acuerdo al criterio del hessiano nos dice que f no presenta tampocoextremos en ninguno de estos puntos, ya que en ambos hessianos existe unmenor principal de orden 2 que es menor que cero.

2. Extremos condicionadosVamos a desarrollar en esta sección una técnica clásica, basada en el uso

de Multiplicadores, para la obtención de condiciones de extremo sobre unavariedad . Dichas condiciones no diferirán formalmente de las ya vimos paraextremos relativos.

Definición 7.7 Sea ϕ : A ⊂ Rk → R una función escalar, c ∈oA y M una

variedad diferenciable que contiene a c. Se dirá que ϕ presenta un extremosobre M (o condicionado) en el punto c, si existe un entorno W de c tal queϕ(z)− ϕ(c) no cambia de signo cuando z ∈W ∩M .

Máximo Si ϕ(z)− ϕ(a) ≤ 0.

Mínimo Si ϕ(z)− ϕ(a) ≥ 0.

Proposición 7.8 En la situación anterior y supuesta ϕ diferenciable enc, una condición necesaria para que ϕ presente un extremo en c sobre lavariedad M es que Dϕ(c)w = 0, para todo w ∈ Tc(M). Se dice en ese casoque c es un punto crítico de ϕ sobre la variedad M .

108 Extremos de funciones de varias variables 7.10

Demostración. Sea w ∈ Tc(M) y γ una curva contenida en M que pase porc y tenga a w por vector tangente en c. Es decir, γ(t0) = c, y γ′(t0) = wen algún punto t0. Entonces la función de la variable t, ϕ γ, presenta unextremo relativo en el punto t0, luego (ϕ γ)′(t0) = 0. Aplicando la regla dela cadena se tiene pues

0 = (ϕ γ)′(t0) = Dϕ(γ(t0))γ′(t0) = Dϕ(c)w.

Corolario 7.9 (Multiplicadores de Lagrange) Sean M y ϕ como en laproposición anterior y supongamos que M está determinada, en un entornodel punto c ∈ M , por las funciones f1, f2, . . . , fp. Entonces, una condiciónnecesaria para que la aplicación ϕ presente un extremo sobre la variedad Men el punto c, es que existan p números reales λ1, . . . , λp tales que c sea unpunto crítico de la función F = ϕ+ λ1f1 + . . .+ λpfp.

Demostración. Por la proposición anterior, si ϕ presenta un extremo con-dicionado en c entonces Dϕ(c)w = 0 para todo w ∈ Tc(M) = ∩ kerDfi(c).Luego

kerDϕ(c) ⊃ ∩ kerDfi(c),

y esto implica ya lo que queríamos, en virtud del lema algebraico siguiente

Lema 7.10 Si g1, g2, . . . , gp son formas lineales independientes de Rk y ges otra forma lineal tal que ker g ⊃ ∩pi=1 ker gi, entonces existen p númerosreales λ1, . . . , λp tales que

g +∑

λigi = 0.

Demostración. Completemos la familia de formas lineales g1, g2, . . . , gp hastaobtener una base B = g1, . . . , gp, gp+1, . . . , gk. Entonces

g =k∑i=1

µigi.

Sea e1, . . . , ek la base dual de B, es decir gi(ej) = δij . Es evidente entoncesque si i ≤ p < j,

ej ∈p⋂i=1

ker gi ⊂ ker g,

7B Extremos de funciones de varias variables 109

luego

0 = g(ej) =k∑i=1

µigi(ej) = µjgj(ej) = µj ,

lo que implica que g =∑pi=1 µigi.

Tomando λi = −µi resulta lo que queríamos.

Nota. Los ejercicios 7E,7F,7H, 7I y 7J constituyen ejemplos prácticos deaplicación del resultado anterior sobre multiplicadores de Lagrange. En elejercicio 7E se da una indicación que quizás pueda servir como modelo enlos demás ejercicios. En todos ellos se parte de un función diferenciable ϕ,que se sabe que alcanza un máximo o mínimo absoluto sobre una variedadM , y se trata de obtener este valor máximo o mínimo y algún punto c ∈Men donde se alcance. Es inmediato comprobar que tales puntos c deben serpuntos de extremo (condicionado) sobre M y por lo tanto puntos críticos deϕ sobre M .

Ejercicios7A Estudiar la existencia de extremos relativos para las funciones

1. f(x, y) = x4 + y4 − 2(x− y)2 2. f(x, y) = x3 + y2 − xy2

3. f(x, y) = x3 + y3 − 3x2y2 + 1 4. f(x, y, z) = x4 + y4 − 3x2y2xz

5. f(x, y, z) = 2x4 + 2y4 + z4 − 4x2y2z 6. f(x, y) = 2x4 + 3y4 − 4x2y3

7. f(x, y) = x2y + x2 + 2xy + xy2 + y2 8. f(x, y) = x4 + y4 − xy3 + 19. f(x, y) = x4 + y4 − xy4 + 1 10. f(x, y) = y2 − 3x2y + 2x4

11. f(x, y) = x3 + 3x2y − xy2 + 1 12. f(x, y) = x2y2 + xy4

7B Demostrar que los siguientes enunciados son equivalentes

(a) x2 + y2 + z2 ≥ α(xy + xz + yz), para todos x, y, z.(b) La función f(x, y, z) = x2 + y2 + z2 − α(xy + xz + yz), presenta un mínimo

relativo en el punto (0, 0, 0).(c) α ∈ [−2, 1].

110 Extremos de funciones de varias variables 7C

7C Estudiar la existencia de extremos relativos para las funciones

f(x, y) = sen |xy|, 0 < x ≤ π/2, 0 < y ≤ π/2.

f(x, y) = eax+y2+ b sen(x2 + by2)− y2.

f(x1, . . . , xn) = x1x2 · · ·xn + an+1(

1x1

+ . . .+ 1xn

), (a > 0) , x ∈ Ω = (0,∞)n

f(x1, . . . , xn) = (∑

aixi)e−(x21+...+x2

n)

7D Demostrar que entre los polígonos convexos de n lados inscritos en una cir-cunferencia, el polígono regular es el de mayor perímetro y también el de mayorárea.

7E Hallar la distancia

(a) entre la recta x+ y = 1 y la hipérbola xy = 2.indicación: Considerar M = (x, y, z, t) ∈ R4 : x + y = 1; zt = 2 y ϕ laaplicación ϕ(x, y, z, t) = (x− z)2 + (y − t)2. M es una variedad diferenciablede R4 y el cuadrado de la distancia entre las dos curvas, el mínimo absolutode ϕ sobre M .

(b) entre las curvas

x

1 = y

2 = z

4 ;x2 − xy + y2 − z2 = 1x2 + y2 = 1

7F Hallar la distancia al origen de la curva intersección de las superficies

xyz = a; y = bx, a > 0, b > 0.

7G Sea M el conjunto de puntos de R3 que satisfacen el sistemax2 + y2 − z = 1x− y + z2 = 1

(a) Probar que M es una variedad diferenciable.(b) Hallar la ecuación de la recta tangente a M en (1, 0, 0).(c) Estudiar si (1, 0, 0) es un punto crítico de la función g(x, y, z) = xyz−x−y+z

sobre M .

7H (a) Obtener el paralelepípedo recto de menor área entre los que tienen igualvolumen.

7J Extremos de funciones de varias variables 111

(b) Obtener el paralelepípedo de mayor volumen entre los que tienen igual área.

7I Sea K = (x, y, z) ∈ R3 : z = x2 +y2 ; z = x+1. Probar que K es un compactoy hallar el máximo y el mínimo absoluto de la función ϕ(x, y, z) = y2−2x+z sobreK.

7J Calcular el máximo y el mínimo absoluto de la función ϕ(x, y, z) = x + y − zsobre el compacto K = (x, y, z) : x2 + y2 ≤ 1, x2 + y2 + z2 ≤ 4.

bibliografía

186

Bibliografía

[1] Apostol, T., “Análisis Matemático”, Reverté, Barcelona, 1979.

[2] Avez, A., “Calcul Différentiel”, Masson, Paris, 1983.

[3] Benedetto, J.J., “Real Variable and Integration ”, B.G. Teubner, Stutt-gart, 1976.

[4] Berstein, S., Quelques remarques sur l’interpolation, Math. Ann., 79(1918), 1 – 12.

[5] Cartan, H., “Cálculo Diferencial”, Ediciones Omega, Barcelona, 1972.

[6] Cheney, E.W., “Introduction to Approximation Theory”, McGraw-Hill,New York, 1966.

[7] Choquet, “Topología”, Toray-Masson, Barcelona, 1971.

[8] Cohen, P.J., A minimal model for set theory, BAMS, 69 (1963), 537 – 540.

[9] Cohn, D.L., “Measure Theory”, Birkhäuser, Boston, 1980.

[10] Dieudonné, J., “Fundamentos de Análisis Moderno”, Reverté, Barcelona,1966.

[11] Fleming, W.H., “Funciones de Varias Variables”, C.E.C.S.A., 1976.

[12] Flett, T.M., “Differential Analysis”, Cambridge University Press, 1980.

[13] Gantmacher, F.R., “Théorie des Matrices”, Tome 1 Dunod, Paris, 1966.

[14] Garnir, H.G., “Teoría de Funciones I”, Marcombo, Barcelona, 1966.

[15] Garnir, H.G., “Functions de Variables Reelles”, tome II, Gauthier-Villars,París, 1965.

[16] Hewitt, E., Stromberg, K., “Real and Abbstract Analysis”, Springer-Verlag, New York, 1965.

187

bibliografía

[17] Hewitt, E., Ross, K.A., Extensions of Haar measure and of harmonicanalysis for locally compact abelian groups, Math. Annalen , 160 (1965),171 – 194.

[18] Isaacson, E. and Keller, H.B., “Analysis of Numerical Methods”,Dover, New Yory, 1994.

[19] Kakutani, S., Oxtoby, J.C., , Ann. of Math., (2) 52 (1950), 580 – 590.

[20] Kolmogorov, A.N., Fomin, S.V., “Elementos de la Teoría de Funcionesy del Análisis Funcional ”, Mir, Moscú, 1975.

[21] Moore, G.H., “Zermelo’s Axiom of Choice ”, Springer-Verlag, New York,1982.

[22] Nachbin, L., “Topology on Spaces of Holomorphic Mappings”, Springer,Berlin, 1969.

[23] Natanson, I.P., “Theory of Functions of a Real Variable ”, Ungar, NewYork, 1967.

[24] Von Newman, J., “Functional Operators Vol.I: Measures and Integrals”,Princeton Univ. Press, , 1950.

[25] Rudin, W., “Análisis Real y Complejo”, McGraw Hill, Madrid, 1973.

[26] Schwartz, L., “Cours d’Analyse”, Hermann, Paris, 1967.

[27] Solovay, R.M., Amodel of set-theory in which every set of reals is Lebesguemedible, Ann. of Math., 92 (1970), 1 – 56.

[28] Williamsom, J.H., “Integración Lebesgue”, Tecnos, Madrid, 1973.

[29] Yosida, K., “Funtional Analysis”, Sspringer, Berlin, 1974.

[30] Zaanen, A.C., “Integration”, North-Holland, Amsterdam, 1967.

188