Carrillo Julio - calculo en Varias Variables

60
Julio C. Carrillo E. Profesor Escuela de Matem´aticas Universidad Industrial de Santander Monday, November 5, 2007 at 8:44 am (FA07.01,02)

description

Carrillo Julio - calculo en Varias Variables UIS

Transcript of Carrillo Julio - calculo en Varias Variables

Page 1: Carrillo Julio - calculo en Varias Variables

Julio C. Carrillo E.Profesor Escuela de Matematicas

Universidad Industrial de Santander

Monday, November 5, 2007 at 8:44 am(FA07.01,02)

Page 2: Carrillo Julio - calculo en Varias Variables

Para uso exclusivo en el salon de clase.

2007 c© Julio C. Carrillo E.

Universidad

Industrial de

Santander

Escuela de Matematicas

Universidad Industrial de Santander

2008

Page 3: Carrillo Julio - calculo en Varias Variables

Agradecimientos a todos aquellos estudiantes que con sus

preguntas ayudan a mejor los contenidos de este mate-

rial.

Definitivamente, hasta los que ensenamos tambien

aprendemos, si prestamos un poco de atencion en clase.

El Autor

Page 4: Carrillo Julio - calculo en Varias Variables

Indice general

1. Preliminares 11

1.1. El espacio euclidiano n–dimensional . . . . . . . . . . . . . . 11

1.2. Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3. Longitud o norma . . . . . . . . . . . . . . . . . . . . . . . . 12

1.4. Angulo entre dos vectores . . . . . . . . . . . . . . . . . . . . 13

1.5. Angulos directores y cosenos directores . . . . . . . . . . . . . 13

1.6. Proyecciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.7. Trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.7.1. Con desplazamiento a lo largo de una lınea recta . . . 15

1.7.2. Con desplazamiento a lo largo de una trayectoria nolineal . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.8. El producto cruz de vectores . . . . . . . . . . . . . . . . . . 16

1.9. Triple producto escalar de vectores . . . . . . . . . . . . . . . 17

1.10. Lıneas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.11. Planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2. Funciones vectoriales 20

2.1. Definicion, dominio, imagen, grafica . . . . . . . . . . . . . . 20

2.2. Operaciones algebraicas con funciones vectoriales . . . . . . . 21

2.3. Lımite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.4. Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.5. Derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.6. Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.7. Movimiento curvilıneo . . . . . . . . . . . . . . . . . . . . . . 26

2.7.1. Vector tangente, Vector tangente unitario, vector nor-mal y plano osculador . . . . . . . . . . . . . . . . . . 26

2.7.2. Velocidad, rapidez y aceleracion . . . . . . . . . . . . 30

2.7.3. Longitud de arco . . . . . . . . . . . . . . . . . . . . . 31

2.7.4. Curvatura de una curva . . . . . . . . . . . . . . . . . 34

2.7.5. Fuerzas definidas mediante funciones vectoriales . . . 36

2.7.6. Fuerzas definidas mediante campos vectoriales . . . . 39

3. Funciones de varias variables 42

3.1. Las funciones de varias variables . . . . . . . . . . . . . . . . 42

3.1.1. Algebra de funciones de varias variables . . . . . . . . 47

3.2. Lımite y continuidad de campos escalares . . . . . . . . . . . 48

Page 5: Carrillo Julio - calculo en Varias Variables

3.2.1. Lımite de un campo escalar . . . . . . . . . . . . . . . 50

3.2.2. Continuidad de un campo escalar . . . . . . . . . . . . 53

3.3. Derivada de un campo escalar . . . . . . . . . . . . . . . . . . 56

3.4. Gradientes y derivadas direccionales . . . . . . . . . . . . . . 78

3.5. Extremos de funciones de varias variables . . . . . . . . . . . 82

3.5.1. Extremos sin restricciones . . . . . . . . . . . . . . . . 82

3.5.2. Extremos con restricciones . . . . . . . . . . . . . . . 87

4. Integracion multiple 97

4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

4.2. Integrales dobles . . . . . . . . . . . . . . . . . . . . . . . . . 98

4.2.1. Integrales doble sobre dominios rectangulares . . . . . 98

4.2.2. Integrales iteradas . . . . . . . . . . . . . . . . . . . . 101

4.2.3. Integrales dobles sobre regiones mas generales . . . . . 107

4.2.4. Integrales dobles en coordenadas polares . . . . . . . . 115

4.2.5. Aplicaciones de las integrales dobles . . . . . . . . . . 123

4.3. Integrales triples . . . . . . . . . . . . . . . . . . . . . . . . . 138

4.3.1. Aplicaciones de las integrales triples . . . . . . . . . . 142

4.4. Integrales triples en coordenadas cilındricas y esfericas . . . . 145

4.4.1. Coordenadas cilındricas . . . . . . . . . . . . . . . . . 145

4.4.2. Coordenadas esfericas . . . . . . . . . . . . . . . . . . 148

4.5. Cambio de variables . . . . . . . . . . . . . . . . . . . . . . . 150

4.5.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . 150

4.5.2. Transformaciones . . . . . . . . . . . . . . . . . . . . . 151

5. Funciones de Rn en R

m 159

5.1. Lımite y continuidad . . . . . . . . . . . . . . . . . . . . . . . 161

5.2. Diferenciabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 163

6. Calculo vectorial 168

6.1. Campos vectoriales . . . . . . . . . . . . . . . . . . . . . . . . 168

6.1.1. Definicion de campo vectorial, y su primera clasificacion168

6.1.2. Lıneas de flujo y flujos de campos vectoriales . . . . . 171

6.1.3. Segunda clasificacion de los campos vectoriales . . . . 174

6.2. Calculo diferencial vectorial . . . . . . . . . . . . . . . . . . . 178

6.3. Calculo integral vectorial . . . . . . . . . . . . . . . . . . . . 178

6.3.1. Integral de lınea . . . . . . . . . . . . . . . . . . . . . 178

6.3.2. Integral de superficie . . . . . . . . . . . . . . . . . . . 196

6.3.3. Consecuencias e implicaciones del Teorema de Greeny Teorema de Stokes sobre campos vectoriales diver-gentes, rotacionales y conservativos . . . . . . . . . . . 208

6.4. Aplicaciones en la fısica . . . . . . . . . . . . . . . . . . . . . 216

6.4.1. Dinamica . . . . . . . . . . . . . . . . . . . . . . . . . 216

iv Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 6: Carrillo Julio - calculo en Varias Variables

6.4.2. Dinamica de fluidos . . . . . . . . . . . . . . . . . . . 216

6.4.3. Electromagnetismo . . . . . . . . . . . . . . . . . . . . 216

6.4.4. Conduccion de calor . . . . . . . . . . . . . . . . . . . 216

6.4.5. Termodinamica . . . . . . . . . . . . . . . . . . . . . . 216

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables v

Page 7: Carrillo Julio - calculo en Varias Variables

3 Funciones de varias variables

3.1. Las funciones de varias variables

Los campos escalares, o funciones de varias variables, son funciones queFunciones de n variables,dominio, imagen y grafica tienen aplicacion en la representacion de magnitudes escalares asociados con

vectores o puntos del espacio n-dimensional. Por ejemplo, la temperatura encada punto de una lamina plana de grosor despreciable, o bien la densidaden cada punto de un cilindro.

Definicion 3.1. Sea D un subconjunto no vacıo de Rn. Una funcion f que asigna a cada punto x =

(x1, . . . , xn) de D un numero real f(x) = f(x1, . . . , xn) se llama una funcion de n variables con dominio Dy valores reales. La razon de llamarse a f una funcion de n variables es simplemente por las n coordenadasque tiene el punto x = (x1, . . . , xn) y la imagen f(x) = f(x1, . . . , xn) depende de esas n coordenadas. Lascoordenadas x1, . . . , xn seran las variables independientes de f y xn+1 = f(x) = f(x1, . . . , xn) la variableindependiente. Entonces, x = (x1, . . . , xn) sera la preimagen y xn+1 = f(x) = f(x1, . . . , xn) la imagen.

Por ejemplo,

f(x, y) =xy

x − y+ ln(x2 + y2)

f(x, y) = x2 + y2

son funciones en dos variables, las independientes son x, y y la variabledependiente es z = f(x, y). De igual modo,

f(x, y, z) = x2 + y2 − z2

es una funcion en tres variables dependientes x, y, z y la variable dependientees w = f(x, y, z). Un ejemplo mas general es la funcion polinomica en cincovariables

f(x1, x2, x3, x4, x5) = x1 − 2x22 + x3x

34x

25

en la cual las cinco variables independientes son x1, x2, x3, x4, x5 y la variabledependiente es x6 = f(x1, x2, x3, x4, x5). Funciones de dos, tres, cuatro omas variables ocurren en la Fısica. Por ejemplo,

p =RT

Vley de un gas ideal

L =πr4θn

2torque de un alambre

E =m

2

N∑

i=n

(u2i + v2

i + w2i ) energıa de un gas ideal en terminos de las

componentes de la velocidad de N moleculas

Observacion 3.1. Las funciones de n variables tambien se suelen deno-tar de la forma f : D ⊆ R

n → R. Desde el punto de vista fısico, lasfunciones de varias variables son llamadas campos escalares estacionarios

Page 8: Carrillo Julio - calculo en Varias Variables

(independientes del tiempo), o simplemente campos escalares. Los camposescalares no estacionarios (dependientes del tiempo), son funciones de laforma f : D× I ⊆ R

n ×R → R tales que f(x, t) existe, para algun x ∈ Rn y

t ∈ R. El Calculo de campo escalares no estacionarios se reduce al estudio decampos escalares estacionarios considerando ya sea t como una constante,o bien considerando como un campo escalar estacionario con dominio enR

n+1 = Rn ×R. En lo sucesivo se considerara este ultimo enfoque, y cuan-

do se tenga un campo escalar no estacionario en particular, se procedera ahacer las aclaraciones del respecto. Aun mas, la notacion en si misma esclara y permite identificar cuando un campo escalar es estacionario o no.En un campo escalar estacionario f(x) o no estacionario f(x, t), el vectorx representa la variable espacial para campo escalar, y en un campo escalarno estacionario f(x, t), el escalar t representa tiempo para el campo escalar.

Definicion 3.2. Sea f : D ⊆ Rn → R una funcion en n variables. El subconjunto D de R

n es llamado eldominio de f y el subconjunto R de todas los valores f(x), con x ∈ D, es la imagen de f . La grafica de fes el subconjunto de R

n+1 que consta de todos los puntos (x, f(x)) con x ∈ D. Simbolicamente,

Df = D ⊆ Rn, If = {f(x) ∈ R | x ∈ D}), Gf = {(x, f(x)) ∈ R

n+1 | x ∈ D}.

Tambien, la imagen y grafica de f se pueden representar en terminos delas n variables independientes x1, . . . , xn y la variable dependiente xn+1 =f((x1, . . . , xn)):

If = {f(x1, . . . , xn) | (x1, . . . , xn) ∈ D}Gf = {(x1, . . . , xn, f(x1, . . . , xn)) ∈ R

n+1 | (x1, . . . , xn) ∈ D}.

Tambien se puede considerar

Gf = {(x1, . . . , xn, xn+1) ∈ Rn+1 | xn+1 = f(x1, . . . , xn)

para algun (x1, . . . , xn) ∈ D}

Una funcion escalar es una funcion en una variable. Para hacer hacer consis-tentes las definiciones de la grafica de funciones de una y varias variables sedebe considerar en general la grafica f como un subconjunto de R

n+1. Tam-bien por esta razon las funciones de varias variables se designan medianteletras minusculas del alfabeto tales como f , g, etc.

Desde el punto de vista geometrico se consideran unicamente graficas defunciones de n variables cuando n = 1, 2. Si n = 1, la grafica de f representauna curva en el plano xy, y una superficie en el espacio tridimensional xyzcuando n = 3.

Cuando el dominio Df de una funcion f de Rn en R no esta definido ex-

plıcitamente, entonces se define como el conjunto

Df = {x ∈ R | f(x) existe}

Ademas,

If = {f(x) | x ∈ Df}Gf = {(x, f(x)) ∈ R

n+1 | x ∈ Df}

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 43

Page 9: Carrillo Julio - calculo en Varias Variables

seran la imagen y la grafica de f . Por ejemplo, la funcion f(x) = x − 3 esen una variable. Su dominio e imagen consisten del conjunto de los numerosreales, y la grafica de todos los puntos (x, x − 3) ∈ R

2, con x ∈ R, quegeometricamente representa una lınea recta en el plano xy.

A cada punto en el plano xy la funcion f(x, y) = x2+y2 le asigna un numeroreal no negativo. Por lo tanto, el dominio de f consiste de R

2, el plano xy.La imagen consiste de todos los reales no negativos, la parte no negativa deleje z, y la grafica de f de todos los punto (x, y, x2 + y2) donde (x, y) ∈ R

2,o bien, x, y ∈ R. Geometricamente, la grafica de f representa una superficieen el espacio tridimensional xyz llamada paraboloide.

x y

z

La funcion

f(x, y) =1

x2 − y2,

esta definida cuando

x2 − y2 > 0 ≡ y2 < x2 ≡ |y| < |x| ≡ −|x| < y < |x|.

Geometricamente el dominio de f esta representado en la siguiente figura yconsiste de todos los puntos del plano xy que permanecen entre las graficasde y = ±|x|. La imagen es el conjunto de todos los reales positivos, y la

grafica el conjunto de todos los puntos (x, y, z) con z = 1/√

x2 − y2. Es-ta grafica no es facil de realizar y el uso de software grafico apropiado esrecomendado, GnuPlot por ejemplo.

1

2

3

−1

−2

−3

1 2 3−1−2−3

x

y

44 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 10: Carrillo Julio - calculo en Varias Variables

El dominio de la funcion

f(x, y) =√

x2 − y,

consiste de todos los puntos del plano xy tales que y ≤ x2.

1

2

3

−1

−2

−3

1 2 3−1−2−3

x

y

La imagen consiste de todos los reales no negativos y la grafica de todos los

puntos (x, y, z) =(

x, y,√

x2 − y)

. La representacion de la grafica requiere

de software.

El dominio de la funcion

f(x, y) = 10(

x3 + xy4 − x

5

)

e−(x2+y2) + e−((−x−1,225)2+y2)

consiste todos los puntos del plano xy y la imagen de los numeros reales.Formalmente la grafica de f se puede definir del modo hasta ahora hechoy esta en el espacio tridimensional xyz. La siguiente figura representa estagrafica en el dominio [−4, 4]× [−4, 4].

x y

z

La grafica de una funcion en dos variables tambien se puede realizar medi-Conjuntos de nivelante sus curvas de nivel.

Definicion 3.3. Sea f : D ⊆ Rn → R una funcion en n variables. Para cada c en la imagen de f el

conjunto de nivel Lc(f) de f consiste de todos los puntos x en el dominio D de f tales que f(x) = c.Para funciones de dos variables los conjuntos de nivel se llaman curvas de nivel, o curvas de contorno, ypara funciones en tres variables se llaman superficies de nivel.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 45

Page 11: Carrillo Julio - calculo en Varias Variables

Desde el punto de vista geometrico tiene solo sentido hablar de curvas ysuperficies de nivel. En particular, para funciones de dos variables las curvasde nivel se pueden interpretar de la siguiente manera. Sea z = c y z =f(x, y). Entonces la curva de nivel Lc(f) de f se puede interpretar comouna curva en el espacio bidimensional, o bien como la interseccion del planoπc de ecuacion z = c, el cual es paralelo y localizado a distancia |z| del planoxy, y la grafica de f ; es decir, Lc(f) = πc ∩Gf . De esta manera, la curva denivel tendra una elevacion sobre el plano xy de |c| unidades. En topografıa,las curvas de nivel corresponden a el mapa de elevacion de un terreno. Dehecho, en topografıa no se tiene una funcion que de las elevaciones, pero sepueden al menos graficar mediante tecnicas topograficas.Ejemplo 3.1. Identifique las curvas de nivel de la funcion

f(x, y) =√

x2 + y2

y realice la grafica algunas de ellas.Solucion. La curva de nivel Lc(f) esta dada mediante la ecuacion f(x, y) =

c, o bien√

x2 + y2 = c, la cual tienen sentido cuando c ≥ 0. Como estaecuacion se puede reescribir de la forma x2 + y2 = c2, entonces se concluyeque cada curva de nivel Lc(f) es una circunferencia en el plano xy con centroen el origen y radio c cuando c es positivo, y el origen (0, 0) del plano xycuando c = 0. La graficas en la figura siguiente representan curvas de nivelLc(f) para c = 0, 1, 2, 3, 4.

Para obtener interpretacion de las curvas de nivel Lc(f) de f como la inter-seccion de su grafica con los planos de ecuacion z = c, donde c es no negativo,primero se debe graficar a f . Note que al escribir z = f(x, y) se obtiene la

ecuacion z =√

x2 + y2, que al reescribirla de la forma z2 = x2 = y2, z ≥ 0,se concluye que representa la ecuacion de la parte superior de un cono. Lainterseccion de este cono con el plano de ecuacion z = c, c ≥ 0 sera unpunto (cuando c = 0) o circunferencias (cuando c > 0) de radio c a la alturac del plano xy. La siguiente figura incluye ambos, las curvas de nivel en elplano xy y como la interseccion de la grafica de f con los planos z = c. Lasiguiente figura incluye ambas graficas, respectivamente.

1

2

3

4

−1

−2

−3

−4

1 2 3 4−1−2−3−4

x

y

bc = 0

c = 1

c = 2

c = 3

c = 4

c = 0c = 1

c = 1

c = 2

c = 2

c = 3

c = 3

c = 4

c = 4

xy

z

-4

-2

0

2

4

-4

-2

0

2

40

1

2

3

4

5

46 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 12: Carrillo Julio - calculo en Varias Variables

3.1.1. Algebra de funciones de varias variables

Al ser numeros reales las imagenes de las funciones de varias variables,las operaciones algebraicas que se realicen con ellas se encuentran deter-minadas por las operaciones algebraicas de los numeros reales. Adicional-mente se pueden componer esas funciones con las funciones escalares (o deuna variable) y las funciones vectoriales que ya conocemos. A fin de evitarmalentendidos con la definicion de composicion de funciones, se incluye lasiguiente definicion formal de la composicion de funciones.

Sean A, B, C, D conjuntos no vacıos tales que B, C son de la misma “natu-Definicion decomposicion de funciones raleza”, y f : A → B y g : C → D dos funciones. Si la interseccion If ∩ Dg

es no vacıa, entonces la composicion de las funciones f y g, es la funciondenotada por g ◦ f , la cual tiene sentido y esta definida por

(g ◦ f)(x) = g(f(x))

para todo x en el dominio de f tal que f(x) esta en la imagen de g.

A B C D

x f(x) ∈ Dg g(f(x))

If ∩ Dg 6= ∅

f g

g◦f

Cuando esto sucede se dice que la funcion composicion g ◦ f tiene sentido.

Definicion 3.4 (Algebra de funciones de varias variables). Sean f, g : D ⊆ Rn → R funciones de varias

variables, h : D′ ⊆ R → R una funcion real y R : I ⊆ R → Rn una funcion vectorial. Para todo x en D se

definen las siguientes funciones:

1. (f + g)(x) = f(x) + g(x)

2. (cf)(x) = cf(x) para toda constante c

3. (fg)(x) = f(x)g(x)

4.

(

f

g

)

(x) =f(x)

g(x)si g(x) 6= 0.

5. Si la funcion composicion h ◦ f tiene sentido, entonces se define la funcion de varias variables

(h ◦ f)(x) = h(f(x)).

6. Si la funcion composicion f ◦ R tiene sentido, entonces se define la funcion real

(f ◦ R)(t) = f(R(t)).

Ejemplo 3.2. Si

f(x, y) =xy

x + y, h(t) = 2t + 1, R(t) = (t, t2),

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 47

Page 13: Carrillo Julio - calculo en Varias Variables

entonces

(h ◦ f)(x, y) = h(f(x, y)) = h

(

xy

x + y

)

=2xy

x + y+ 1

(f ◦ R)(t) = f(R(t)) = f(t, t2) =t3

t + t2=

t2

1 + tcon t 6= 0.

Por lo tanto, h ◦ f es una funcion de dos variables y f ◦ R es una fun-cion de una variable. El dominio de h ◦ f consiste de todos los puntos delplano xy tales que x + y 6= 0, y el dominio de f ◦ R de todos los numerosreales t diferentes de 0 y −1. Observe ademas que f se puede representarcomo el cociente de dos funciones de dos variables, digamos f1(x, y) = xy yf2(x, y) = x + y

3.2. Lımite y continuidad de campos escalares

Persona que trabaje en el campo de la fısica–matematica y sus

aplicaciones y no entienda de que trata el concepto de lımite,

tendra una nocion muy limitada de lo que realmente significa

este campo en el area de las ciencias naturales.

La nocion de lımite esta ıntimamente ligada al problema de la aproximaciony continuidad en problemas del tipo causa–efecto. Matematicamente, unproblema del tipo causa–efecto se representa mediante una funcion f defini-da de un conjunto D ⊆ A en un conjunto B. Las causas estan representadaspor los elementos de A y los efectos por elementos de B. Entonces la funcionf : D ⊆ A → B, tal que f(a) = b esta en B, para algun a en D, representala relacion funcional entre las causas y los efectos, y ademas enfatiza queel efecto b es consecuencia o lo produce la causa a, b = f(a), y ademas esunica. El conjunto A representa el espacio de las causas, los elementos deD las causas predecibles y los elementos de A \D las causas no predecibles.Similarmente, B representa el espacio de las efectos, la imagen If el espaciode las efectos predecibles, y B \ If el de los efectos no predecibles.

A B

D

a′

a′′

If

b′ = f(a′)

b′′

f

a′′ y b′′ representan posibles causas y efectos no predecibles, respectivamente.A la causa predecible a′ le corresponde un efecto predecible b′ = f(a′).

48 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 14: Carrillo Julio - calculo en Varias Variables

En la practica, y por lo general, se obtienen (en el laboratorio, por ejemplo)y con mediana certeza los “valores ideales” del efecto b y la causa a que loproduce. Los valores reales son unicamente estimaciones de ellos y ademasa puede ser eventualmente una causa no predecible. Entonces, el problemade establecer que tan buena es una estimacion de estos valores consiste delo siguiente:

1. Fase de aproximacion: Dada un efecto aproximado, establecer lacausa aproximada que lo produce. Se debe cumplir que el efecto aproxi-mado y debe estar cercano del valor b (i.e., y ≈ b) y ser consecuencia deuna causa x (i.e., y = f(x)), siempre que la causa x este muy cercana delvalor a, aun si no es exactamente a (i..e, x ≈ b y x 6= a). Simbolicamente,

f(x) → b cuando x → a, x 6= a,

2. Fase de cuantificacion del error: En donde hay aproximaciones,hay errores. En los conjuntos A y B se deben disponer de algun medio(instrumento) para cuantificar el error en las aproximaciones entre lascausas y los efectos. El error debe entenderse como la medida de la dis-tancia entre el valor estimado y el valor real, sean en causas o efectos.Cuantificar el error sera el proceso de medir la distancia entre los valoresreales y estimados. Si los conjuntos A y B son subconjuntos de R, estoserrores de aproximacion son obtenidos mediante el valor absoluto, y portanto

dB(f(x), b) := |f(x) − b|, dA(x, a) := |x − a|.

representaran el error en la aproximacion o distancia entre los valoresreales y estimados en los efectos y las causas, respectivamente.

En general, se supone que en los conjuntos A y B es posible definir unaforma de medir distancia de una forma similar a la anterior. Por lo tanto,si sucede que en las causas f(x) ≈ b cuando en los efectos x ≈ b, aun six 6= b, entonces debe tenerse que el error en la aproximacion del efecto,dB(f(x), b), debe ser muy pequeno cuando el error en la aproximaciondel efecto, dA(f(x), a), es muy pequeno, aun si x 6= a. Observe que x 6= asi y solo si dA(x, a) > 0. Simbolicamente,

dB(f(x), b) → 0 cuando dA(x, a) → 0 aun si dA(x, a) > 0.

3. Fase de estimacion de la magnitud del error: Las magnitudes en elerror deben ser de cierto orden. Este es un requerimiento que es estandarcuando se realizan estudios experimentales de problemas causa–efecto.En este tipo de problemas es conocido o dado el orden ǫ del error en laaproximacion de los efectos (en el mundo real esto es precisamente lo quese puede ver o determinar) y se busca entonces establecer o encontrar elorden δ del error en la aproximacion en las causas, pero de tal modo queel error en la aproximacion de los efectos sea del orden ǫ previamentedado cuando el error en la aproximacion en las causas sea del orden δencontrado, aun si el error en las causas no es cero,

Decir que “el error en la aproximacion es de cierto orden” significa que“el error en la aproximacion es menor que el orden de aproximacion”.Por lo tanto, en el caso en discusion debemos tener lo siguiente.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 49

Page 15: Carrillo Julio - calculo en Varias Variables

Dado el orden ǫ > 0 del error en la aproximacion del efectob, se busca establecer un orden δ > 0 del error en la aproxi-macion de la causa a, de tal modo que dB(f(x), b) < ǫ cuandodA(x, a) < δ, aun si dA(x, a) > 0. Simbolicamente,

Dado un ǫ > 0, se busca un δ > 0 tal que dB(f(x), b) < ǫcuando 0 < dA(x, a) < δ.

La notacion matematica de lımite resume estos tres procesos:

lımx→a

f(x) = b.

El problema causa–efecto definido mediante f es un continuo o es continuocuando

lımx→a

f(x) = f(a).

3.2.1. Lımite de un campo escalar

Definicion 3.5 (Lımite de una funcion de varias variables). Sea f : D ⊆ Rn → R una funcion de varias

variables y a un punto que no necesariamente pertenece al dominio de f . Se dice que lımx→a f(x) = L sidado un ǫ > 0 existe un δ > 0 tal que |f(x) − L| < ǫ siempre que 0 < ‖x− a‖ < δ.

Observe que

‖x − a‖ =√

(x1 − a1)2 + · · · + (xn − an)2

representa la distancia entre los puntos x = (x1, . . . , xn) y a = (a1, . . . , an)de R

n y

|f(x) − L|

la distancia entre los numeros reales f(x) y L. En el siguiente sentido debeentenderse el concepto de existencia del lımite L de f en a:

Cuando el punto x esta suficientemente cercano de a, pero x 6= a,entonces el valor de f(x) estara muy cercano de L. La norma‖x− a‖ y el valor absoluto |f(x)−L| son una medida del erroren esas aproximaciones. Cuantificado el orden ǫ del error en laaproximacion de f(x) a L, se busca entonces cuantificar el ordenδ del error en la aproximacion de x a a. Por eso se suele tambiendenotar el lımite de la forma “f(x) → a cuando x → a”, y selee “f(x) tiende a a cuando x tiende a a”.

Geometricamente, los puntos x se encuentran localizados en el interior deuna esfera n–dimensional de centro en a y radio δ, sin el punto a, y losvalores f(x) en el intervalo abierto (L − ǫ, L + ǫ).

Proposicion 3.1 (Unicidad del lımite). Sea f : D ⊆ Rn → R una funcion de varias variables y a un punto

que no necesariamente pertenece al dominio de f . Si el lımite lımx→a f(x) existe entonces el lımite es unico;es decir, si lımx→a f(x) = L1 y lımx→a f(x) = L2 entonces L1 = L2.

El contrarrecıproco de este resultado es una herramienta valiosa para probarque un cierto lımite no existe:

50 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 16: Carrillo Julio - calculo en Varias Variables

Si el lımite lımx→a f(x) no es unico, entonces lımx→a f(x) noexiste.

A diferencia del calculo de funciones de una variables, en donde existenunicamente dos direcciones para aproximar el punto al cual se toma el lımite,para las funciones de varias variables existen multiplies direcciones, y ademastrayectorias, para que el punto x aproxime el punto lımite a. Si el lımiteexiste, entonces el lımite es independiente de la trayectoria que pase por elpunto. Si el lımite no existe, es suficiente demostrar que a lo largo de dostrayectorias C1 y C2 que pasen por el punto a, la funcion f(x) tiene doslimites distintos.Ejemplo 3.3. Sea

f(x, y) =xy

x2 + y2.

El dominio de f consiste de todos los puntos del plano xy con excepcion delorigen. Consideremos la ecuacion y = mx de una recta de pendiente m quepasa por el origen. Entonces

f(x, y) =mx2

x2 + m2x2=

m

1 + m2→ m

1 + m2cuando x → 0, y = mx,

o

lımx→0

y=mx

f(x, y) = lımx→0

mx2

x2 + m2x2=

m

1 + m2.

Por lo tanto el lımite de f en el origen del plano no existe: diferentes valoresde m producen curvas diferentes a lo largo de las cuales f tiene limites difer-entes. Para cualquier otro punto del plano xy el lımite de f existe (probarlo).Ejemplo 3.4. La funcion

f(x, y) =x2 − y2

x2 + y2

tambien esta definida para todo punto del plano xy con excepcion del origen.De nuevo, observe que

lımx→0y=0

f(x, y) = lımx→0

x2 − 0

x2 + 0= 1,

lımx=0y→0

f(x, y) = lımy→0

0 − y2

0 + y2= −1,

en donde x = 0 es una recta horizontal que pasa por el origen y y = 0 esuna recta vertical que tambien pasa por el origen. Por lo tanto, f no tienelımite en el origen del plano xy.Ejemplo 3.5. Tambien la funcion

f(x, y) =x4 − y4

x2 + y2

esta definida para todo punto del plano xy con excepcion del origen. Noobstante, como el lımite

lım(x,y)→(0,0)

x4 − y4

x2 + y2= lım

(x,y)→(0,0)

(x2 − y2)(x2 + y2)

x2 + y2

= lım(x,y)→(0,0)

(x2 − y2) = 0 − 0 = 0

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 51

Page 17: Carrillo Julio - calculo en Varias Variables

e independiente de la trayectoria que pase por el origen del plano xy, en-tonces f tiene lımite cero en el origen.

Ejemplo 3.6. Determine si el lımite de la funcion f(x, y) =3x2y

x2 + y2existe

en (0, 0).

Solucion. Como

lımx→0

y=mx

f(x, y) = lımx→0

3x2(mx)

x2 + (mx)2=

3mx

1 + m2= 0

y

lımx=0y→0

f(x, y) = lımy→0

0

y2= 0,

e igual sucede tomando el lımite a lo largo de las parabolas y = ax2 y x = ay2

con a 6= 0, se puede intuir que el lımite vale 0. Desafortunadamente esto noprueba que el lımite sea 0, pues el resultado depende de la trayectoria quepasa por el origen. Para demostrar que el lımite es cero se aplica la definicionde lımite. Sea ǫ > 0 dado. Se debe encontrar un δ > 0 tal que

3x2y

x2 + y2− 0

< ǫ siempre que 0 < ‖(x, y) − (0, 0)‖ < δ

o equivalentemente,

3x2|y|x2 + y2

< ǫ siempre que 0 <√

x2 + y2 < δ

Pero

x2 < x2 + y2, y2 < x2 + y2.

Por lo tanto,

3x2|y|x2 + y2

< 3|y| = 3√

y2 < 3√

x2 + y2 < 3δ.

Como se requiere que

3x2|y|x2 + y2

< ǫ,

es suficiente elegir 3δ = ǫ. Entonces δ = ǫ/3 y al hacer 0 <√

x2 + y2 < ǫ/3se obtiene

3x2y

x2 + y2− 0

≤ 3√

x2 + y2 < 3( ǫ

3

)

= ǫ

Por consiguiente,

lım(x,y)→(0,0)

3x2y

x2 + y2= 0.

52 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 18: Carrillo Julio - calculo en Varias Variables

Proposicion 3.2 (Propiedades del lımite). Sean f, g : D ⊆ Rn → R funciones de n variables que poseen

lımite en un punto a que no necesariamente pertenece a D. Entonces las funciones f +g, cf (c un constantecualquiera), fg, f/g tambien poseen lımite en a y ademas

(a) lımx→a

(f(x) + g(x)) = lımx→a

f(x) + lımx→a

g(x)

(b) lımx→a

(cf(x)) = c lımx→a

f(x)

(c) lımx→a

f(x)g(x) = lımx→a

f(x) lımx→a

g(x)

(d) lımx→a

f(x)

g(x)=

lımx→a

f(x)

lımx→a

g(x)si lım

x→ag(x) 6= 0.

(e) Sea h : D′ ⊆ R → R una funcion real tal que la funcion compuesta h ◦ f esta definida. Si los lımiteslımx→a

f(x)(≡ L) y lımt→L

h(t) existen, entonces el lımite de h ◦ f existe en a y ademas

lımx→a

h(f(x)) = h(

lımx→a

f(x))

.

(f) Sea R : D′ ⊆ R → Rn una funcion vectorial tal que la funcion compuesta f ◦ R esta definida. Si los

lımites lımt→t0

R(t)(≡ L) y lımx→L

f(x) existen, entonces el lımite de f ◦ R existe en t0 y ademas

lımt→t0

f(R(t)) = f

(

lımt→t0

R(t)

)

.

3.2.2. Continuidad de un campo escalar

Definicion 3.6 (Continuidad puntual). Se dice que una funcion de varias variables f : D ⊆ Rn → R es

continua en a si y solo si

lımx→a

f(x) = f(a),

o lo que es lo mismo,

lımh→0

f(a + h) = f(a).

En caso contrario, f se dice es discontinua en a.

Esta definicion significa que f(a) y lımite de f en a existen, y el valor de fy el lımite de f son iguales en a. De otro lado, la condicion de existencia def(a) es equivalente a la condicion que el punto a pertenezca al dominio def .

Ejemplo 3.7. La funcion f(x, y) =x2 − y2

x2 + y2no tiene lımite en el origen del

plano. Entonces f es discontinua en (0, 0). Tambien se puede argumentarque f no esta definida en el origen del plano.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 53

Page 19: Carrillo Julio - calculo en Varias Variables

Ejemplo 3.8. La funcion

f(x, y) =

x4 − y4

x2 + y2si (x, y) 6= (0, 0)

1 si (x, y) = (0, 0)

tiene lımite cero en el origen del plano y f(0, 0) = 1. Entonces f es discon-tinua en el origen.

Proposicion 3.3 (Propiedades de la continuidad puntual). Sean f, g : D ⊆ Rn → R funciones de n

variables que son continuas en el punto a. Entonces las funciones f + g, cf (c un constante cualquiera), fg,f/g tambien continuas en a y ademas

(a) lımx→a

(f(x) + g(x)) = f(a) + g(a)

(b) lımx→a

(cf(x)) = cf(a)

(c) lımx→a

f(x)g(x) = f(a) g(a)

(d) lımx→a

f(x)

g(x)=

f(a)

g(a)si g(a) 6= 0.

(e) Sea h : D′ ⊆ R → R una funcion de una variable tal que la funcion compuesta h ◦ f esta definida. Si fes continua en a y h es continua en f(a), entonces la funcion de varias variables h ◦ f es continua ena y ademas

lımx→a

h(f(x)) = h(f(a)).

(f) Sea R : D′ ⊆ R → Rn una funcion vectorial tal que la funcion compuesta f ◦ R esta definida. Si R es

continua en t0 y f es continua en R(t0), entonces la funcion escalar f ◦ R es continua en t0 y ademas

lımt→t0

f(R(t)) = f(R(t0)).

Ejemplo 3.9. Determine los puntos en donde la funcion racional

f(x, y) =2xy

x2 + y2

es continua.

Demostracion. Las funciones polinomicas g(x, y) = 2xy y h(x, y) = x2 +y2 son continuas en todo punto (a, b) ∈ R

2. De la propiedad del cociente defunciones tenemos que la funcion f(x, y) es continua en todo punto (a, b) ∈R

2, excepto en el origen. Por lo tanto, la funcion f(x, y) es continua en todopunto (x, y) de R

2 con excepcion del origen.

Definicion 3.7 (Continuidad global). Una funcion de varias variables f es continua en el conjunto D′ sif es continua en cada punto de D′.

Las propiedades de continuidad de funciones de varias variables en un con-junto de su dominio se obtienen de una manera natural de las propiedadesde continuidad puntual.

54 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 20: Carrillo Julio - calculo en Varias Variables

Los monomios x, y y c, con c un escalar cualquiera, se puede demostrarfacilmente son funciones continuas en R

2:

lım(x,y)→(a,b)

x = a

lım(x,y)→(a,b)

y = b

lım(x,y)→(a,b)

c = c

para cualquier punto (a, b) en R2. Por lo tanto, de las propiedades del pro-

ducto de funciones continuas el monomio cxnym, para algun numero enterono negativo m, es tambien continuo en R

2:

lım(x,y)→(a,b)

cxmym = cambm

para cualquier punto (a, b) en R2. De la propiedad de la suma de funciones

continuas el polinomio p(x, y) en dos variables sera tambien una funcioncontinua en R

2:

lım(x,y)→(a,b)

p(x, y) = p(a, b)

para todo punto (a, b) en R2.

Ejemplo 3.10. Evaluar

lım(x,y)→(1,−2)

(x2y3 − x3y2 + 3x + 2y).

Solucion. Como los polinomio son funciones continuas en R2, entonces

lım(x,y)→(1,−2)

(x2y3 − x3y2 + 3x + 2y) = −8 − 4 + 3 − 4 = −13.

Una funcion racional f en dos variables es el cociente de dos polinomios, ysera una funcion continua en R

2 con excepcion de aquellos puntos (x, y) endonde el denominador de f se anula. Por ejemplo, la funcion racional

f(x, y) =2xy + 1

x2 + y2

esta definida en todo R2 con excepcion del origen. Por tanto, f es continua

en R2 con excepcion del origen.

Ejemplo 3.11. Determine la continuidad de la funcion

f(x, y) = ln(x2 + y2 − 1).Solucion. La funcion logaritmo natural es continua para todo numero realpositivo, y la funcion g(x, y) = x2 + y2 − 1 es continua para todo valor dex y y. De la propiedad de composicion de funciones continuas se concluyeque la funcion f es continua para todos los puntos (x, y) en R

2 tales quex2 + y2 > 1.

Ejemplo 3.12. Determine la continuidad de la funcion

f(x, y) =

1 − x2 − y2

x2 − y2.

Solucion. De la propiedad de composicion de funciones continuas se tieneque el numerador de f es continuo para todo punto (x, y) en R

2 tal quex2 + y2 < 1. El denominador de f es continuo para todo punto (x, y) enR

2, y es cero cuando y = ±|x|. De la propiedad del cociente de funcionescontinuas se obtiene que f es continua para todo punto (x, y) en R

2 tal quex2 + y2 < 1 y y 6= ±|x|.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 55

Page 21: Carrillo Julio - calculo en Varias Variables

3.3. Derivada de un campo escalar

La derivada de una funcion escalar f(x) se puede considerar como el lımitedel cociente diferencias de Newton de la funcion a lo largo del eje x:

f ′(x) = lımh→0

f(x + h) − f(x)

h,

si el lımite de la derecha existe.

La derivada de una funcion en n variables su puede considerar de igualmanera, solo que existiran n posibles alternativas (o ejes coordenados) cadauna de las cuales se llaman las derivadas parciales de la funcion con respectoa la direccion considerada. Por esto, las derivadas parciales dan informacionde la razon de cambio de una funcion en varias variables en cada una delas direcciones de los ejes coordenadas. Mas exactamente, estas derivadas sedefinen de la siguiente forma.

Definicion 3.8 (Derivadas parciales). Sea f : D ⊆ Rn → R una funcion de n variables. Las derivadas

parciales fx1, . . . , fxn

de f con respecto a las variables x1, . . . , xn en el punto a = (a1, . . . , an) en la direcciondel j–esimo eje coordenado se define en forma vectorial como

fxj(a) = lım

t→0

f(a + tej) − f(a)

t

o en forma cartesiana como

fxj(a1, . . . , an) = lım

t→0

f(a1, . . . , aj + t, . . . , an) − f(a1, . . . , an)

t,

para j = 1, . . . , n, si cada uno de estos limites existe. Otras notaciones de las derivada parcial de f conrespecto a la variable xj son las siguientes:

fxj(a) = fj(a) =

∂f

∂xj(a) = ∂jf(a) = Dxj

f(a) = Djf(a).

Cuando n = 2, se denota z = f(x, y) y las derivadas parciales de f tambien se denotan como

fx =∂f

∂x=

∂z

∂x= zx, fy =

∂f

∂y=

∂z

∂x= zy.

Cuando n = 3, se considera w = f(x, y, z) y las derivadas parciales de f tambien se denotan como

fx =∂f

∂x=

∂w

∂x= wx, fy =

∂f

∂y=

∂w

∂y= wy, fz =

∂f

∂z=

∂w

∂z= wz .

Una explicacion de las derivadas parciales es la siguiente. De acuerdo con ladefinicion anterior, fxj

(a) se obtiene restringiendo la funcion f a la recta quepasa por el punto a y es paralela al j–esimo eje coordenado. Esta ecuaciontiene la ecuacion vectorial X = a+ tej para t un numero real y ej el vectordirector del j–esimo eje coordenado. Por lo tanto, fxj

(a) da la razon decambio de f en a en la j–esima direccion coordenada.Ejemplo 3.13. Calcule las derivadas parciales de f(x, y) = y2 sen x ena = (π/2, 1).

Solucion. f es una funcion de dos variables que esta definida para todo

56 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 22: Carrillo Julio - calculo en Varias Variables

(x, y) en R2. Ası que se deben calcular derivadas parciales de f en a, a saber:

fx(π/2, 1) y fy(π/2, 1).

Para calcular la derivada parcial de f con respecto a x se tienen dos opciones.Primera opcion: Se utiliza la definicion de lımite para calcular fx(x, y).Esto da,

fx(x, y) = lımt→0

f((x, y) + ti) − f(x, y)

t= lım

t→0

f(x + t, y) − f(x, y)

t

= lımt→0

y2 sen(x + t) − y2 sen x

t= y2 lım

t→0

sen(x + t) − sen x

t

= y2 d(sen x)

dx= y2 cosx,

lo cual es equivalente a considerar a y como una constante y diferenciar conrespecto a x. A continuacion se sustituye (x, y) = (π/2, 1), lo cual da

fx(π/2, 1) = 1 · cos(π/2) = 0

Segunda opcion: Se hace y = 1 en la formula de f para obtener

g(x) = f(x, 1) = sen x.

Esta es una funcion en una variable que se puede diferenciar para obtener

g′(x) = cosx.

A continuacion se sustituye x = π/2 y se obtiene

fx(π/2, 1) = g′(π/2) = cos(π/2) = 0,

como se esperaba.

De nuevo se presentan ambas opciones para calcular la derivada parcial def con respecto a y en (π/2, 1).Primera opcion: De la definicion,

fy(x, y) = lımt→0

f((x, y) + tj) − f(x, y)

t= lım

t→0

f(x, y + t) − f(x, y)

t

= lımt→0

(y + t)2 senx − y2 sen x

t· sen x = lım

t→0

(y + t)2 − y2

t

=d(y2)

dy· senx = 2y sen x,

lo cual es equivalente a a considerar a x como una constante y diferenciarcon respecto a y. A continuacion se sustituye (x, y) = (π/2, 1), lo cual da

fy(π/2, 1) = 2 sen(π/2) = 2

Segunda opcion: Se hace x = π/2 en la formula de f para obtener

h(x) = f(π/2, y) = y2 sen(π/2) = y2.

Esta es una funcion en una variable que se puede diferenciar para obtener

h′(x) = 2y.

A continuacion se sustituye y = 1 y se obtiene

fy(π/2, 1) = h′(1) = 2.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 57

Page 23: Carrillo Julio - calculo en Varias Variables

Ejemplo 3.14. Calcule las primeras derivadas parciales de la funcion f(x, y) =x2y en cualquier punto (x, y) de su dominio.

Solucion. El dominio de f es todo R2. De la definicion, la derivada parcial

de f con respecto a x esta dada como

fx(x, y) = lımt→0

f((x, y) + ti) − f(x, y)

t= lım

t→0

f(x + t, y) − f(x, y)

t

= lımt→0

(x + t)2y − x2y

t= lım

t→0

(x + t)2 − x2

t· y =

d(x2)

dx· y = 2xy

en donde i = e1 = (1, 0), lo cual es equivalente a considerar a y como unaconstante y derivar con respecto a x. Igualmente,

fy(x, y) = lımt→0

f((x, y) + tj) − f(x, y)

t= lım

t→0

f(x, y + t) − f(x, y)

t

= lımt→0

x2(y + t) − x2y

t= x2 lım

t→0

(y + t) − y

t= x2 d(y)

dy= x2,

lo cual tambien se obtiene considerando a x constante y derivando con re-specto a y.

Al calcularse la derivada parcial de f con respecto a la variable xj como ellımite de la variacion de los cocientes de diferencias de Newton a lo largo dela direccion del eje coordenado xj , ej , se mantienen fijas las restantes direc-ciones. Por esto, en lugar de calcular la derivada parcial de f con respectoa la variable xj mediante la definicion, la derivada parcial fxj

se puede cal-cular de forma directa manteniendo las otras variables fijas y derivando conrespecto a la variable xj . Simbolicamente,

∂f

∂xj(x1, . . . , xn) =

df

dxj(x1, . . . , xn), j = 1, . . . , n.

Las reglas ordinarias de la derivacion aplican.Ejemplo 3.15. Encuentre las derivadas parciales de la funcion f(x, y, z) =x3y − x sen(yz) y su dominio comun.

Solucion. Considerando a y y z constantes y derivando con respecto a xse obtiene

fx(x, y, z) = 3x2y − sen(yz).

Para encontrar fy se consideran x y z constantes y se deriva con respecto ay:

fy(x, y, z) = x3 − xz cos(yz).

Finalmente, considerando a x y y como constante y derivando con respectoa z se obtiene

fz(x, y, z) = −xy cos(yz).

De las funciones relacionadas con las derivadas parciales de f se concluyeque el dominio comun de ellas es todo R

3.

Ejemplo 3.16. Encuentre las derivadas parciales de la funcion f(x, y, z) =

xyze−x2−y2−z2

.

58 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 24: Carrillo Julio - calculo en Varias Variables

Solucion. Al igual que en el caso de las funciones de dos variables, cadavez que se va a derivar con respecto a una de las variable se consideran lasotras dos como constantes y se deriva aplicando las reglas ordinarias de laderivada. En este caso,

fx(x, y, z) = yze−x2−y2−z2 − 2x2yze−x2−y2−z2

fy(x, y, z) = xze−x2−y2−z2 − 2xy2ze−x2−y2−z2

fz(x, y, z) = xye−x2−y2−z2 − 2xyz2e−x2−y2−z2

Considere la grafica de funcion de dos variables z = f(x, y). El plano x = x0Interpretacion de lasderivadas parciales interseca la grafica de f en la curva plana de la figura y el valor fy(x0, y0)

es la pendiente de la recta tangente a esta curva en el punto P .

b P (x0, y0, z0)

(x0, y0, 0)x y

z

Tambien, el plano y = y0 interseca la grafica de f en la curva plana de lafigura y el valor fx(x0, y0) es la pendiente de la recta tangente a esta curvaen el punto P .

bP (x0, y0, z0)

(x0, y0, 0)x y

z

Ejemplo 3.17. Considere el paraboloide de ecuacion f(x, y) = 9− x2 − y2.(a) El paraboloide y el plano y = 1 se intersecan en una curva C1. Encontrarlas ecuaciones parametricas de la recta tangente en (1, 1, 7). (b) Igualmente,el paraboloide y el plano x = 1 se intersecan en curva C2. Encontrar lasecuaciones parametricas de la recta tangente en (1, 1, 7). (c) Encuentre laecuacion del plano tangente al paraboloide en el punto (1, 1, 7).

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 59

Page 25: Carrillo Julio - calculo en Varias Variables

Solucion. (a) Como fx(x, y) = −2x entonces fx(1, 1) = −2 es la pen-diente de la recta tangente a la curva en (1, 1, 7). Veamos como estarecta tiene a d1 = (1, 0,−2) como su vector director. Para encontrareste, parametrizamos la curva C1 de la siguiente forma. Como y = 1 yz = f(x, y) = 8 − y2, entonces la funcion vectorial F (t) = (t, 1, 8 − t2)es una parametrizacion de C1. Entonces, F ′(t) = (1, 0,−2t). Cuandot = 1 tenemos F (1) = (1, 1, 7) y entonces la recta tangente en (1, 1, 7)tiene a d1 = F ′(1) = (0, 1,−2) como su vector director. Por lo tanto,

x = 1 + t, y = t, z = 7 − 2t

representan las ecuaciones parametricas de la recta tangente a la graficade f en (1, 1,−7).

(b) En este caso, fy(x, y) = −2y y fy(1, 1) = −2 es la pendiente de la rectatangente a C2 en (1, 1,−7). Como el vector director de esta recta esd2 = (0, 1,−2), entonces

x = 1, y = 1 + t, z = 7 − 2t

representan las ecuaciones parametricas de la recta tangente en (1, 1,−7).

(c) El vector normal al plano tangente a la grafica de f en (1, 1,−7) estadado por

n = d1 × d2 =

i j k

0 1 −21 0 −2

= (−2,−2,−1).

y entonces

−2(x − 1) − 2(y − 1) − (z + 7) = 0

representa la ecuacion del plano tangente a la grafica de f en el punto(1, 1,−7).

Por un procedimiento analogo se puede demostrar que si las primeras derivadasparciales de un campo escalar f existen y son continuas en un punto (x0, y0)de R

2, entonces

z = f(x0, y0) + ∇f((x0, y0) · (x − x0, y − y0)

= f(x0, y0) + fx(x0, y0)(x − x0) + fy(y − y0)

Debemos esperar que al igual que funciones de una variable, que si el punto(x, y) esta en una vecindad de (x0, y0) entonces los valores de la funcionf(x, y) se puedan aproximar mediante los valores de la ecuacion del planotangente en (x, y); i.e.,

f(x, y) ≈ f(x0, y0) + ∇f((x0, y0) · (x − x0, y − y0)

si (x, y) esta en una vecindad de (x0, y0).

Por ejemplo, si f(x, y) = 9 − x2 − y2, (x0, y0) = (1, 1) y (x, y) = (1,5; 1,2)entonces

f(1,5; 1,2) = 5,31 ≈ f(1, 1) − 2(1,5 − 1) − 2(1,2 − 1) = 7 − 1 − 0,4 = 5,6.

El orden de esta aproximacion puede ser mejorado considerando las segundasderivadas parciales de f .

60 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 26: Carrillo Julio - calculo en Varias Variables

Ejemplo 3.18. De acuerdo con la ley de un gas ideal para un gas confina-do, si P atmosferas es la presion, V litros es el volumen y T grados es latemperatura absoluta en la escala de Kelvin, se tienen la formula

PV = kT (3.1)

donde k es una constante de proporcionalidad. Suponga que el volumen deun gas de cierto recipiente es de 12 litros y que la temperatura es de 290◦Ky k = 0,6. (a) Calcule la tasa de variacion de T si V permanece fijo en 12litros. (b) Utilice el resultado del inciso (a) para aproximar la variacion dela presion si la temperatura se incrementa a 295◦K. (c) Calcule la tasa devariacion instantanea de V por unidad de variacion de P si T permanecefija en 290◦K. (d) suponga que la temperatura se mantiene constante. Utiliceel resultado del inciso (c) para calcular la variacion aproximada del volumennecesario para producir la misma variacion en la presion que se obtuvo enel inciso (b).

Solucion. Al hacer V = 12, T = 290 y k = 0,6 en la formula del gas idealse obtiene P = 14,5.

(a) Resolviendo (3.1) para P cuando k = 0,6 se obtiene

P =0,6T

V

La tasa de variacion instantanea de P por unidad de variacion de T , siV se mantiene constante, es

∂P

∂T=

0,6

V

Cuando T = 290 y V = 12, esta tasa de variacion esta aumentado a

razon de∂P

∂T= 0,05 atmosferas por cada grado en la escala de Kelvin.

(b) Del resultado del inciso (a), cuando T se incrementa en 5 unidades(de 290 a 295) y V permanece fijo, un incremento aproximado de Pes 5(0,005) = 0,25 atmosferas. Por lo tanto, si la temperatura se incre-menta de 290◦K a 295◦K, entonces el incremento de la presion es deaproximadamente 0,25 atmosferas.

(c) Al resolver (3.1) para V cuando k = 0,6, se obtiene

V =0,6T

P

La tasa de variacion instantanea de V por unidad de variacion de P ,si T se mantiene constante, es

∂V

∂P= −0,6T

P 2

Cuando T = 290 y P = 14,5, la tasa de variacion instantanea de V porunidad de variacion de P , si T permanece fija en 290, es

∂V

∂P= −0,6(290)

14,52= −0,83;

es decir, esta tasa de variacion disminuyendo a razon de 0,83 litros porcada atmosfera.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 61

Page 27: Carrillo Julio - calculo en Varias Variables

(d) Si P se incrementa en 0,25 y T permanece fija, entonces del resultadodel inciso (c) la variacion de V debe ser aproximadamente

(0,25)(−0,83) = −0,21.

Por lo tanto, el volumen debe disminuir aproximadamente en 0,21 litrospara que la presion aumente de 14,5 a 14,75 atmosferas.

Por ser las derivadas parciales de una funcion de varias variables otra funcionDerivadas parciales desegundo orden de varias variables, se puede nuevamente intentar calcular sus derivadas

parciales.

Definicion 3.9. Sea f : D ⊆ Rn → R una funcion de n variables. Las segunda derivada parcial fxixj

de fcon respecto a las variables x1, . . . , xn en el punto x = (x1, . . . , xn) se define en forma vectorial como

fxjxk(x) = lım

h→0

fxj(x + hek) − fxj

(x)

h

para j, k = 1, . . . , n, si el lımite existe. Las segundas derivadas parciales de f se suelen llamar derivadasparciales de segundo orden, y tambien se denotan de la siguiente forma:

fxjxk(x) =

(

fxj(x))

xk= fjk(x) =

∂xk

(

∂f

∂xj(x)

)

=∂2f

∂xk∂xj(x)

Las segundas derivadas parciales fxjxkse llaman mixtas cuando j es diferente de k.

Una funcion z = f(x, y) en dos variables tiene cuatro segundas derivadasparciales, de las cuales dos son derivadas parciales mixtas:

fxx =∂

∂x

(

∂f

∂x

)

=∂2f

∂x2, fxy =

∂y

(

∂f

∂x

)

=∂2f

∂y∂x

fyx =∂

∂x

(

∂f

∂y

)

=∂2f

∂x∂y, fyy =

∂y

(

∂f

∂y

)

=∂2f

∂y2

Operativamente hablando, es facil pensar como calcular las derivadas par-Derivadas parciales deorden superior ciales de orden m de una funcion de n variables. Desde el punto de vista

matematico la notacion se complica un poco, pero no es sustancialmente im-portante en la comprension de lo que entenderemos como todas las derivadasparciales de orden m de f .

Definicion 3.10. Las derivadas parciales de orden m de una funcion en n variables f se pueden denotarpor

∂mf

∂xj11 ∂xj2

2 · · · ∂xjmn

en donde los escalares j1, . . . , jm son numeros enteros no negativos tales que j1 + j2 + · · · + jm = m. Esdecir,

∂mf

∂xj11 ∂xj2

2 · · · ∂xjmn

=∂j1+j2+···+jmf

∂xj11 ∂xj2

2 · · · ∂xjmn

=∂j1

∂xj11

(

∂j2

∂xj22

(

· · ·(

∂jmf

∂xjmm

))

)

62 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 28: Carrillo Julio - calculo en Varias Variables

Por ejemplo, si f es una funcion en cuatro variables x, y, z, w entonces unaderivada parcial de sexto orden de f es

∂6f

∂x2∂y∂w3=

∂2

∂x2

(

∂y

(

∂3f

∂w3

))

:= f3012 := fw3yx2

Las derivadas parciales de orden m de f se pueden clasificar en dos cate-Derivadas parcialesmixtas de orden superior gorıas.

Definicion 3.11. Las derivadas parciales de exactamente orden m de f con respecto a la variable xk seran

∂mf

∂xmk

=∂

∂xk

(

∂xk

(

· · ·(

∂f

∂xk

)))

(m veces) para k = 1, . . . , n.

Cualquier otra derivada de orden m de f que no sea con respecto unicamente a una de las variables x1, . . . , xn

sera una derivada parciales mixta de orden m de f .

Ejemplo 3.19. Encuentre las terceras derivadas parciales de la funcionf(x, y) = xey − 3 cos(x − y).

Solucion.

fx(x, y) = ey + sen(x − y) fy(x, y) = xey − sen(x − y)

fxx(x, y) = cos(x − y) fxy(x, y) = ey − cos(x − y)

fyx(x, y) = ey − cos(x − y) fyy(x, y) = xey + cos(x − y)

fxxx(x, y) = − sen(x − y) fxxy(x, y) = sen(x − y)

fxyx(x, y) = sen(x − y) fxyy(x, y) = ey − sen(x − y)

fyxx(x, y) = sen(x − y) fyxy(x, y) = ey − sen(x − y)

fyyx(x, y) = ey − sen(x − y) fyyy(x, y) = xey + sen(x − y)

En el ejemplo anterior, las derivadas parciales mixtas de segundo y tercer or-den son iguales: fxy = fyx, fxxy = fxyx = fyxx, fxyy = fyxy = fyyx. LeonardEuler establecio y demostro por primera vez en 1734, en relacion con susestudios de hidrodinamica, las condiciones que garantizaban esta igualdad.En general, este resultado se cumple bajo las siguientes condiciones.

Proposicion 3.4 (Teorema de Clairaut o de Schwarz). Sea f : D ⊆ Rn → R una funcion en n varias

variables. Si f tiene derivadas parciales continuas de orden m en un punto x dado en D, entonces todas lasderivadas parciales mixtas hasta de orden m de f en x son iguales.

Si por ejemplo, f es una funcion en cuatro variables que tiene derivadasparciales de quinto orden continuas en un punto de su dominio, entonceslas derivadas mixtas de f de segundo, tercer, cuarto y quinto orden seraniguales en ese mismo punto. El siguiente ejemplo considera una funcion dedos variables que tiene terceras derivadas parciales continuas.Ejemplo 3.20. Verifique el Teorema de Clairaut para f(x, y) = xe−x2−y2

con derivadas parciales de f de tercer orden.

Solucion. Primero se necesitan las primeras derivadas parciales:

fx(x, y) = e−x2−y2 − 2x2e−x2−y2

fy(x, y) = −2xye−x2−y2

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 63

Page 29: Carrillo Julio - calculo en Varias Variables

Ahora se calculan las segundas derivadas parciales:

fxx(x, y) = −6xe−x2−y2

+ 4x3e−x2−y2

fxy(x, y) = 4x2ye−x2−y2

fyy(x, y) = 4xy2e−x2−y2

fyx(x, y) = 4x2ye−x2−y2

Finalmente, se calculan las terceras derivadas parciales:

fxxx(x, y) = −6e−x2−y2

+ 24x2e−x2−y2 − 8x4e−x2−y2

fxxy(x, y) = 12xye−x2−y2 − 8x3e−x2−y2

fxyx(x, y) = 8xye−x2−y2 − 8x3ye−x2−y2

fxyy(x, y) = −8x2y2e−x2−y2

fyyx(x, y) = 4y2e−x2−y2 − 8x2y2e−x2−y2

fyyy(x, y) = 8xye−x2−y2 − 8xy3e−x2−y2

fyxx(x, y) = 8xye−x2−y2 − 8x3ye−x2−y2

fyxy(x, y) = 4x2e−x2−y2 − 8x2y2e−x2−y2

Como las terceras derivadas parciales de f son continuas en cualquier puntode R

2, entonces las derivadas parciales mixtas de segundo y de tercer ordende f en cualquier punto de R

2 seran iguales. En efecto, de los resultadoanteriores se observa que fxy = fyx en el caso de las segundas derivadasparciales mixtas, y que fxxy = fxyx = fyxx y fxyy = fyxy = fyyx en el casode las terceras derivadas parciales mixtas.

La condicion de la continuidad de las derivadas parciales de orden m de fes crucial. Por ejemplo, la funcion

f(x, y) =

xy(x2 − y2)

x2 + y2si (x, y) 6= (0, 0)

0 si (x, y) = (0, 0)

tiene segundas parciales parciales en (0, 0) y no obstante fxy(0, 0) 6= fyx(0, 0).

Intuitivamente, la derivada parcial de una funcion de dos variables no existeProblema de la noexistencia de las

derivadas parcialescuando la grafica de la funcion tiene dobleces, esquinas, huecos, hoyos opicos. Por ejemplo, la funcion f(x, y) = −x2|y| no tiene derivada parcialcon respecto a y en todo punto de la forma (x, 0), en donde x es un numeroreal cualquiera diferente de cero. Se observa de la figura que grafica de ftiene un doblez a lo largo del eje x debido a la funcion |y|. De acuerdo a ladefinicion de la derivada parcial de f ,

x y

z

fy(x, 0) = lımh→0

f(x, 0 + h) − f(x, 0)

h= lım

h→0

−x2|h|h

=

{

x2 si h → 0−

−x2 si h → 0+

Como el lımite no es unico para todo x diferente de cero, entonces fx(x, 0)no existe para todos esos valores de x; no obstante, fy(0, 0) = 0. Tambiense puede demostrar que la derivada parcial fx(0, 0) existe y es cero.Ejemplo 3.21. Sea f(x, y) = −x2|y|. (a) Determine si existen un plano quepasa por el punto (0, 0, 0) de la grafica de f . En caso afirmativo, encuentrela ecuacion del plano. (b) ¿Es el plano tangente a la grafica de f en (0, 0, 0)?¿Se puede garantiza que el plano tangente a la grafica de f en (0, 0, 0) existe?(c) ¿Que relacion se puede establecer entre la existencia de las derivadasparciales en un punto y la existencia de un plano tangente a la grafica de fen ese mismo punto?

64 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 30: Carrillo Julio - calculo en Varias Variables

Solucion. (a) Ambas derivadas parciales fx(0, 0) y fy(0, 0) existen y soncero. Por lo tanto, los vectores directores a las rectas tangentes cuandox = 0 y y = 0 son d1 = (0, 1, 0) = j y d2 = (1, 0, 0) = i, respectivamente.La existencia de esto dos vectores no colineales determina la existencia delplano que pasa por el punto (0, 0, 0) de la grafica de f . El vector normal alplano es η = j × i = −k y la ecuacion del plano que pasa por (0, 0, 0) esz = 0.

(b) El plano que pasa por el punto (0, 0, 0) existe, pero desafortunadamenteno es tangente a la grafica en ese punto. Este hecho se puede observardirectamente de la grafica de f . Formalmente, por ejemplo los dos puntos(0, 0, 0) y (0, 2, 0) son distintos y pertenecen tanto a la grafica de f como alplano z = 0. Esto nos garantiza que existe un plano que pasa por el punto(0, 0, 0) de la grafica de f pero no es tangente a la grafica de f en (0, 0, 0).En consecuencia, no existe un plano tangente a la grafica de f en (0, 0, 0).

(c) Este ejemplo permite concluir que en general la existencia de las derivadasparciales de una funcion en varias variables no garantiza la existencia delplano tangente a la grafica de la funcion. Cosa bien distinta sucede en lasfunciones de una variable en donde la existencia de la derivada de la fun-cion implica la existencia de la recta tangente a la grafica de la funcion. Enconclusion, la existencia de las derivadas parciales de una funcion en masde una variable no garantiza la existencia del plano tangente a la grafica dela funcion.

Intuitivamente una funcion en dos variables se puede considerar “suave” siFunciones suaves devarias variables su grafica no tiene dobleces, esquinas, huecos, hoyos o picos. El problema es

como convertir esta nocion intuitiva de suavidad en una nocion matematicaque aplique a cualquier funcion en varias variables. Al igual que en funcionesde una variable, la clave esta en la existencia de las derivadas parciales.

Definicion 3.12. Una funcion de varias variables f : D ⊆ Rn → R se dice “suave” de orden k en D si

las derivadas parciales de orden k de f existen y son continuas para todo x en D. Se asume que f tienesuavidad de orden cero si f es continua, y que f es suave si f tiene suavidad de cualquier orden.

Ejemplo 3.22. La funcion f(x, y) = x|x|y4 tiene suavidad de orden ceroy de primer orden, pero no tiene suavidad de segundo orden ni de ningunorden mayor que dos. Claramente f es continua, y las primeras derivadasparciales de f existen y son continuas:

fx(x, y) = 2|x|y, fy(x, y) = 4x|x|y3.

No obstante, la segunda derivada parcial fxx de f no existe a largo de todopunto (0, y) en el eje y, con y 6= 0:

fxx(0, y) = lımh→0

fx(0 + h, y) − f(0, y)

h= lım

h→0

2|0 + h|y − 2|0|yh

= lımh→0

|h|h

(2y) =

{

−2y si h → 0−

2y si h → 0+

Por lo tanto f tiene suavidad de primer orden.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 65

Page 31: Carrillo Julio - calculo en Varias Variables

Aparentemente la diferenciabilidad de una funcion f en varias variables es,Diferenciabilidaden cierto modo, una medida de que tan suave es la funcion. ¿Y por que tantoruido con la diferenciabilidad? Bien, se me ocurre explicarlo de otra maneraque no sea la del mecanismo que decide que tan suave es no una funcion envarias variable, y ella es una razon practica. Aunque pueda parecer una ideasin sentido, la diferenciabilidad de f es de gran utilidad en el campo de lasaplicaciones; en particular, desde el punto de vista computacional. Supongaque f es una funcion de varias variables que involucra funciones trascen-dentes. En la practica los valores de f(x) para un x dado, no se podranobtener de forma exacta; de hecho, ni las calculadoras y computadoras masavanzadas de hoy dıa lo pueden hacer. Lo que se hace es recurrir a estimaruna aproximacion de f(x) mediante el valor p(x) de un polinomio linealp en n variables. ¿Porque un polinomio lineal? Porque ellos son los poli-nomios de menor grado en n variables que involucran las cuatro operacionesaritmeticas elementales con las cuales los seres humanos y las computadorassabemos operar: suma, resta, multiplicacion y division en sus variables.

Tratemos de entender lo que vamos a hacer. Empecemos por el caso massencillo. En las funciones de una variable el valor de f(x) es aproximado porel valor de un polinomio lineal p(x) que representa la ecuacion de la rectatangente a la grafica de f en el punto (x0, f(x0)), en donde x0 un valor muycercano a x. Si pretendemos seguir este camino para el caso de las funcionesf en varias variables y tratamos de encontrar la ecuacion del plano tangentemediante las derivadas parciales como se hizo en el Ejemplo 3.17, nos vamosa encontrar con una seria dificultad.

En el Ejemplo 3.21 se muestra el caso de una funcion que tiene derivadasparciales en un punto, pero no tiene un plano tangente a la grafica de lafuncion en ese punto. En ese caso la funcion f no es suave, tiene un dobleza lo largo del eje x. Debemos intuir entonces que parte de la medida quetan suave es una funcion f de varias variables esta ligada a la existencia desus derivadas parciales. Lo que no esta claro es como esto eventualmenteimplique que se puedan aproximar localmente los valores de f(x) por losvalores p(x) de un polinomio lineal p en n variables que pasa por el punto(a, f(a)).

No nos desanimemos y continuemos. Si la idea previa de encontrar la ecuacionde un plano tangente a la grafica de una funcion en mas de una variablecon las derivadas parciales no funciona, busquemos otra manera de hacer-lo, y ademas tratemos de disenar algun instrumento (matematico) que nosindique cuando nos vamos a enfrentar a ese dificultad.

De ser f suave alrededor de un punto (a, f(a)), esperamos (lo mismo quesucede con funciones de una variable) que los valores f(x) de la funcionen puntos x muy cercanos a a, se puedan aproximar localmente por losvalores p(x) de un polinomio lineal p en n variables que pasa por el punto(a, f(a)). Obviamente existira un error en esta aproximacion y debera serposible estimarlo de la forma

|f(x) − p(x)|,

para todo x cercano a a; cercanıa que dependera de que tan distante seencuentre x de a y la cual se mide por ‖x − a‖.Como el error en la aproximacion de p(x) a f(x) depende que tan cercanoeste x de a, se requiere entonces que error en la aproximacion |f(x)− p(x)|

66 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 32: Carrillo Julio - calculo en Varias Variables

relativo a la distancia entre x y a tienda a cero siempre que x este muycercano de a; i.e.,

|f(x) − p(x)|‖x − a‖ → 0 siempre que x → a,

o en otras palabras

lımx→a

|f(x) − p(x)|‖x − a‖ = 0.

Si definimos el error (no absoluto) E(x, a) como

E(x, a) :=f(x) − p(x)

‖x − a‖ ,

entonces tendremos que

f(x) = p(x) + E(x, a) ‖x − a‖

donde

lımx→a

|E(x, a)| = 0.

Evidentemente, esto nos indica que el valor f(x) es aproximado por el valorde p(x) y que el error E(x, a) ‖x − a‖ en esa aproximacion es muy pequeno,casi cero, en cercanıas de a.

Nos queda aun por establecer como obtener el polinomio lineal p. Del Calculode funciones en una variable sabemos que las valores de f(x) se puedenaproximar por los valores de la recta tangente (un polinomio lineal en unavariable) a la grafica de f en un punto (x0, f(x0)), donde el valor x estasuficientemente cercano al valor x0. Recordemos que la pendiente de la rectatangente en el punto (x0, f(x0)) esta dada por

f ′(x0) = lımx→x0

f(x) − f(x0)

x − x0,

si el lımite existe. Supongamos que el lımite existe. El lımite anterior significaque existe un numero m = f ′(x0) tal que

lımx→x0

|f(x) − f(x0) − m(x − x0)||x − x0|

= 0.

De nuevo, al definir el error E(x, x0) de la forma

E(x, x0) :=f(x) − f(x0) − m(x − x0)

|x − x0|

tendremos que f es derivable en x0 si existe un numero m = f ′(x0) tal que

f(x) = f(x0) = m(x − x0) + E(x, x0)|x − x0|

donde

lımx→x0

|E(x, x0)| = 0.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 67

Page 33: Carrillo Julio - calculo en Varias Variables

Es claro entonces como generalizar esta idea al problema de la aproximacionDiferenciabilidad,aproximacion lineal y

plano tangentede los valores de una funcion en n variables mediante un polinomio linealen n variables. Antes se requiere introducir una notacion adicional.

Los elementos del conjunto R1×n de las matrices de orden 1 × n se llaman

vectores filas de orden n, y los elementos del conjunto Rn×1 de las matrices

de orden n× 1 se llaman vectores columnas de orden n. Los vectores de Rn

se identifican como vectores columnas de orden n. Es claro de la definicionque la transpuesta de un vector fila de orden n es un vector columna deorden n, y viceversa. Por ejemplo, en R

3 tenemos que

(4, 2, 3)T =

423

T

=[

4 2 3]

el cual es un vector fila de orden 3.

Muchos problemas en la fısica e ingenierıa requieren del uso de metodosvectoriales o matriciales relacionados con funciones de varias variables, elllamado analisis vectorial, los cuales requieren de la notacion de tipo vec-torial. Tambien la necesidad de este tipo de notacion se requiere de unanotacion eficiente para la derivada y la regla de la cadena de campos es-calares. A fin de resolver este problema de notacion, primero que todo seconsideran los vectores de R

n como vectores columnas de orden n. Segundo,se redefine el producto escalar de vectores de R

n en terminos de vectoresfilas o columnas, es decir, matrices. Si x y y estan en R

n entonces se definesu producto escalar entre ellos como

x · y = xT y = x1y1 + · · · + xnyn,

donde x e y se consideran como vectores filas de orden n, siendo xT latranspuesta de x, un vector fila de orden n.

Finalmente, la anterior notacion tiene por objeto lo siguiente. Como laderivada de una funcion escalar definida de R en R es un escalar, una ma-triz de orden 1 × 1, y la derivada de una funcion vectorial definida de R enR

n es un vector de Rn, una matriz columna de orden n, entonces podemos

suponer que la derivada de toda funcion definida de Rn en R es una matriz

de orden 1 × n, es decir, un vector fila de orden n. En general debemostener que si f : D ⊆ R

n → Rm es una funcion, su derivada Df(x) debe ser

una matriz de orden m × n. En terminos de esta notacion se puede definirla diferenciabilidad de una funcion de n variables, o campo escalar, de lasiguiente manera.

Definicion 3.13 (Diferenciabilidad de un campo escalar). Se dice que una funcion f en n variables esdiferenciable en a si existe un vector fila Df(a) de orden n, llamado la derivada f en a, tal que

f(x) = f(a) + Df(a)(x − a) + E(x, a) ‖x − a‖

donde

lımx→a

|E(x, a)| = 0.

68 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 34: Carrillo Julio - calculo en Varias Variables

Considerando la definicion de producto interior anterior tenemos que el pro-ducto de matrices Df(a)(x − a) se puede escribir como el producto devectores de R

n,

Df(a)(x − a) ≡ Df(a)T · (x − a)

Definicion 3.14 (Gradiente de un campo escalar). Si f es una funcion f en n variables que es diferencia-

ble en a, se define el gradiente de f en a, ∇f(a), como el vector Df(a)T de Rn. Es decir, ∇f(a) = Df(a)T .

Es claro de esta definicion que ∇f(a)T = Df(a), un vector fila de orden n.Igualmente, si se adopta la notacion cartesiana usual, entonces la derivaday el gradiente de un campo escalar seran el mismo vector. En lo sucesivosolo se adoptara la notacion vectorial.

Si f es diferenciable en a, entonces el polinomio lineal en n variables

p(x) = f(a) + Df(a)(x − a)

sera la ecuacion del plano tangente a f que pasa por el punto (a, f(a)).Ası, la diferenciabilidad de f en a es equivalente a la existencia de un planotangente a la grafica de f en el punto (a, f(a)) y mediante el cual los valoresde p(x) aproximan el valor de f(x) en el sentido indicado anteriormente.De acuerdo con esta notacion, el polinomio del plano tangente a la graficade f en (a, f(a)) tendra la forma

p(x) = f(a) + Df(a)(x − a)

= f(a) + ∇f(a)T (x − a) = f(a) + ∇f(a) · (x − a),

en donde x − a se considera como un vector columna de orden n.Observacion 3.2. Al reescribir la ecuacion del polinomio p(x) en la formavectorial

(−∇f(a), 1) · (x − a, p(x) − f(x)) = 0

se concluye que el vector (−Df(a), 1) es ortogonal a la grafica de f enel punto (a, f(a)). No obstante este resultado, son necesario algunos otrosresultados para establecer que esta conjetura es cierta (cf. Proposiciones 3.17y 3.18).

Ahora, el problema de aproximar los valores de f(x) mediante los valores delpolinomio p(x) se reduce a poder encontrar el gradiente (o la derivada) def . Vamos por partes. Al igual que en el caso de funciones en una variable,primero se debe establece la unicidad de la derivada y que derivabilidadimplica continuidad.

Proposicion 3.5 (Unicidad de la derivada). Si el gradiente de la funcion f : D ⊆ Rn → R en n variables

existe en un punto a, entonces el gradiente es unico.

Este resultado garantiza que existe un unico plano tangente a la grafica def en el punto (a, f(a)) y en consecuencia, que existe un unico polinomio

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 69

Page 35: Carrillo Julio - calculo en Varias Variables

p(x) que satisface el punto (a, p(x)) y permite aproximar el valor de f(x)para x en cercanıas de a.

Proposicion 3.6 (Continuidad y diferenciabilidad). Si la funcion f : D ⊆ Rn → R en n variables es

diferenciable en un punto a en D, entonces f es continua en a.

Demostracion. Si f es diferenciable en a,

f(x) = f(a) + ∇f(a) · (x − a) + E(x, a) ‖x − a‖

en donde

lımx→a

|E(x, a)| = 0.

Por lo tanto,

0 ≤ |f(x) − f(a)| ≤ |∇f(a) · (x − a)| + |E(x, a)| ‖x − a‖= ‖∇f(a)‖ ‖x − a‖ | cos θ| + |E(x, a)| ‖x − a‖≤ ‖∇f(a)‖ ‖x − a‖ + |E(x, a)| ‖x − a‖

en donde los terminos del lado derecho de la ultima desigualdad tienden acero cuando x → a, y entonces

lımx→a

f(x) = f(a).

Por lo tanto, f es continua en a.

Hasta ahora seguimos sin disponer de una herramienta para encontrar elDiferenciabilidad yexistencia de las

derivadas parcialesgradiente de una funcion de varias variables, y de por si la definicion no esutil para lograrlo. Sin embargo, y como se vera a continuacion, la diferencia-bilidad de la funcion implica la existencia de sus derivadas parciales y unaforma de calcular el gradiente de la funcion.

Proposicion 3.7. Si la funcion de n variables f : D ⊆ Rn → R es diferenciable en x, entonces las primeras

derivadas parciales de f existen en x y ademas el gradiente es el vector de esas derivadas parciales en x:

∇f(x) =

(

∂f

∂x1(x), . . . ,

∂f

∂xn(x)

)

Demostracion. Si f es diferenciable en a, entonces

lımx→a

|f(x) − f(a) −∇f(a) · (x − a)|‖x − a‖ = 0

Sea x = a + hej . Entonces

lımx→a

|f(a + hej) − f(a) − h(∇f(a))j ||h| = 0

o tambien,

lımx→a

f(a + hej) − f(a)

h− (∇f(a))j

= 0.

70 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 36: Carrillo Julio - calculo en Varias Variables

Esto implica que

lımx→a

f(a + hej) − f(a)

h= (∇f(a))j

y por tanto, la j–esima derivada parcial

∂f

∂xj(a) = (∇f(a))j ,

es la j–esima componente del gradiente.

No obstante lo anterior, poder obtener el gradiente de f depende que fsea diferenciable, cosa que aun no sabemos como establecer ni condicionesque las garantizan. Afortunadamente el siguiente criterio nos resuelve elproblema.

Proposicion 3.8. Si la funcion f : D ⊆ Rn → R en varias variables tiene primeras derivadas parciales en

todo punto cercano a a y si ademas esas derivadas parciales son continuas en x, entonces f es diferenciableen a.

El siguiente diagrama resume los resultados anteriores.

Definicion dediferenciabilidad

Primeras derivadasparciales continuas

DiferenciabilidadExistencia de las

derivadas parciales

Continuidad Gradiente

Obviamente este diagrama nos dice tambien que la existencia del gradienteno implica que la funcion sea continua. ¿Existe un ejemplo?Ejemplo 3.23. Mostrar que la funcion

f(x, y) =x2 − y2

x2 + y2

es diferenciable en todos en plano xy excepto en el origen.Solucion. Las derivadas parciales de f son

∂f

∂x(x, y) =

2x(x2 + y2) − 2x(x2 − y2)

(x2 + y2)2=

4xy2

(x2 + y2)2,

∂f

∂y(x, y) =

−2y(x2 + y2) − 2y(x2 − y2)

(x2 + y2)2=

−4x2y

(x2 + y2)2,

las cuales son continuas excepto cuando (x, y) = (0, 0). La Proposicion 3.6y su contrarrecıproco garantizan que f es diferenciable en todos los puntosdel plano xy con excepcion del origen. Ademas la Proposicion 3.7 garantizaque el gradiente de f existe y esta definido por

∇f(x, y) =4xy

(x2 + y2)2(y,−x)

todos los puntos del plano xy con excepcion del origen.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 71

Page 37: Carrillo Julio - calculo en Varias Variables

Ejemplo 3.24. Encuentre la ecuacion del plano tangente a la grafica de lafuncion f(x, y) = x2 + y2 en el punto (1, 1, 2).

Solucion. Observe que ∇f(x, y) = (2x, 2y). Por lo tanto, la ecuacion delplano tangente a la grafica de la funcion f en el punto (1, 1, 2) resulta ser

z − 2 = 2(x − 1) + 2(y − 1)

o bien

2x + 2y − z = 2

A la derivada de funciones de varias variables se le debe exigir que cumplalas mismas propiedades de la derivada usual, es decir, si f, g son funcionesen varias variables y diferenciables y c es un escalar, entonces las funcionesf + g y cf deben ser diferenciables y

D(f + g) = Df + Dg

D(cf) = cD(f)

Es decir, D debe ser una transformacion lineal, y Df(x) es un vector(W.H. Young, 1908; M. Frechet, 1911). A continuacion se establece que laspropiedades algebraicas del gradiente se comportan como las reglas usualde las derivadas.

Proposicion 3.9 (Reglas del gradiente). Supongamos de los gradiente de las funciones f y g existen.Entonces

1. ∇(f(x) + g(x)) = ∇f(x) + ∇g(x)

2. ∇(cf(x)) = c∇f(x)

3. ∇(f(x)g(x)) = f(x)∇f(x) + g(x)∇f(x)

4. ∇(

f(x)

g(x)

)

=g(x)∇f(x) − f(x)∇g(x)

g2(x)

Demostracion.

∇(fg) =

(

∂(fg)

∂x1, . . . ,

∂(fg)

∂xn

)

=

(

f∂g

∂x1+ g

∂f

∂x1, . . . , f

∂g

∂xn+ g

∂f

∂xn

)

= f

(

∂g

∂x1, . . . ,

∂g

∂xn

)

+ g

(

∂f

∂x1, . . . ,

∂f

∂xn

)

= f∇g + g∇f

Las otras demostraciones son similares.

Ejemplo 3.25. Encuentre la derivada de f si f(x, y) = (x2−y2)/(x2 +y2).

Solucion. De las reglas de la derivada, y la Proposicion 3.7 el gradiente oderivada de f existe y esta definido por

∇f(x, y) =

(

2x(x2 + y2) − 2x(x2 − y2)

(x2 + y2)2,−2y(x2 + y2) − 2y(x2 − y2)

(x2 + y2)2

)

=

(

4xy2

(x2 + y2)2,

−4x2y

(x2 + y2)2

)

=4xy

(x2 + y2)2(y,−x),

para todo punto del plano con excepcion del origen.

72 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 38: Carrillo Julio - calculo en Varias Variables

Como hemos visto, si f es diferenciable en a y x esta cercano de a, en-Diferencialestonces los valores de f(x) pueden ser aproximados mediante los valores delpolinomio lineal p(x) = f(a) + ∇f(a) · (x − a). Adicionalmente, tambienpodemos considerar en aproximar los valores de f(x) mediante los valoresde f(a), supuesto que el valor de f(a) es facil de obtener. El incremento delerror (no absoluto) en esta aproximacion sera f(x) − f(a). Como f es unafuncion de n variables y diferenciable en a entonces

f(x) − f(a) = ∇f(a) · (x − a) + E(x, a) ‖x − a‖

en donde

lımx→a

E(x, a) = 0.

Sea ∆f(x) = f(x − f(a) el incremento de f , y ∆x = x − a el incrementoen x. Entonces

∆f(x) = ∇f(a) · ∆x + E(x, a) ‖∆x‖

en donde

lım∆x→0

E(x, a) = 0.

Tenemos ası que ∇f(a) · ∆x sera una buena aproximacion del incremento∆f(x). Esto sugiere la siguiente definicion.

Definicion 3.15. Sea f una funcion diferenciable, y sea dx = (dx1, . . . , dxn) el vector diferencial de x (elvector de los diferenciales dx1, . . . , dxn de x1, . . . , xn). La diferencial (total) de f , denotada como df(x), sedefine en forma vectorial como

df(x) = ∇f(x) · dx

o en forma cartesiana como

df(x1, . . . , xn) =∂f

∂x1(x1, . . . , xn)dx1 + · · · + ∂f

∂xn(x1, . . . , xn)dxn

Ejemplo 3.26. Un envase metalico cerrado tiene la forma de cilındricocircular recto de 6 pulg. de altura interior, de 2 pulg. de radio interior yde 0.1 pulg. de grosor. Si el costo del metal es de 40 centavos por pulgadacubica, aproxime mediante diferenciales el costo total del metal empleado enla elaboracion del envase.Solucion. Si V es el volumen en pulgadas cubicas de un cilindro circularrecto que tiene un radio de r pulgadas y una altura de h pulgadas, entoncesV = V (r, h) y

V = πr2h

El volumen exacto del metal empleado en el envase metalico es la diferenciaentre los volumenes de dos cilindros circulares rectos de dimensiones r1 = 2,h1 = 6 y r2 = 2,1 y h2 = 6,2, pulgadas, respectivamente. El incremento∆V proporciona el volumen exacto del metal empleado en el envase, pero

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 73

Page 39: Carrillo Julio - calculo en Varias Variables

como unicamente se desea un valor aproximado, se calcula el diferencial dV .Considerando

dV =∂V

∂rdr +

∂V

∂hdh = 2πrh dr + πr2 dh

con r = r1 = 2, h = h1 = 6, dr = ∆r = 0,1 y dh = ∆h = 0,2 se obtiene

dV = 2π(2)(6)(0,1) + π(2)2(0,2) = 3,2π.

De este modo, ∆V ≈ 3,2π pulgadas cubicas sera la cantidad aproximadade material empleado en el envase. Puesto que el costo del metal es de 40centavos por pulgada cubica, el costo aproximado del metal empleado en elenvase es (40)(3,2π) = 128π ≈ 402 centavos, es decir, $4,02.

La Regla de la cadena establece condiciones para la existencia de la derivadaRegla de la cadenade la composicion de funciones, y una forma de calcularla. Las funciones devarias variables se pueden componer, hasta el momento, con una funcion deuna variable o una funcion de una variable:

D ⊆ Rn If ⊆ I ⊆ R R

x f(x) h(f(x))

f h

h◦f

o de una funcion vectorial con una funcion de varias variables

I ⊆ R IR ⊆ D ⊆ Rn

R

t R(t) f(R(t))

R f

f◦R

En el primer caso la composicion es una funcion en varias variables y en elsegundo una funcion escalar o de una variable.

Proposicion 3.10. Sean f : I ⊆ Rn → R una funcion de n variables y h : I ⊆ R → R una funcion escalar

tales que la interseccion If ∩Dh es no vacıa. Si f es diferenciable de x y h es diferenciable de f(x) entoncesv = h ◦ f es diferenciable de x y ademas

∇v(x) = h′(f(x))∇f(x)

En notacion cartesiana, esta version de la regla de la cadena se puede formu-

x1

... u v

xn

∂u

∂x1

dv

du

∂u

∂xn

lar como sigue. Si v es una funcion diferenciable de u, definida por v = h(u),donde u = f(x1, . . . , xn) es diferenciable de x1, . . . , xn, entonces la funcionv es diferenciable de x1, . . . , xn, y ademas

∂v

∂x1=

dv

du

∂u

∂x1, . . . ,

∂v

∂xn=

dv

du

∂u

∂xn

La regla de la cadena es facil de recordar utilizando el diagrama de arboladjunto con ramas que parten de las componentes de la variable x, luego ala variable u y finalmente a la variable v.

74 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 40: Carrillo Julio - calculo en Varias Variables

Ejemplo 3.27. Si h es una funcion de una variable y diferenciable. De-

muestre que la funcion z = h(

x2

2 − y3

3

)

satisface la ecuacion en derivadasparciales

y2 ∂z

∂x+ x

∂z

∂y= 0

Solucion. Sea u = x2

2 − y3

3 . Se desea probar que la funcion z = f(u)

x

u z

y

∂u

∂xdz

du

∂u

∂y

satisface la ecuacion dada. De la regla de la cadena, utilizando el diagramade la figura, se obtiene

∂z

∂x=

dz

du

∂u

∂x= xf ′(u)

∂z

∂y=

dz

du

∂u

∂y= −y2xf ′(u)

Por lo tanto,

y2 ∂z

∂x+ x

∂z

∂y= y2(xf ′(u)) + x(−y2f ′(u)) = 0.

Proposicion 3.11. Sean R : I ⊆ R → Rn una funcion vectorial y f : D ⊆ R

n → R una funcion de nvariables tales que la interseccion IR ∩Df es no vacıa. Si R′(t) existe y f es diferenciable de R(t) entoncesu = f ◦ R es diferenciable de t y ademas

u′(t) = ∇f(R(t)) · R′(t)

La forma cartesiana de esta version de la regla de la cadena es como sigue. Si

x1

t... u

xn

dx1

dt

dxn

dt

∂u

∂x1

∂u

∂xn

u es una funcion diferenciable de x1, . . . , xn, definida por u = f(x1, . . . , xn),donde x1, . . . , xn son diferenciables de t, entonces la funcion u es diferencia-ble de t, y ademas

du

dt=

∂u

∂x1

dx1

dt+ · · · + ∂u

∂xn

dxn

dt

Esta formula se obtiene del diagrama de arbol anexo con ramas que partende la variable t, luego a las variables x1, . . . , xn, y finalmente a la variableu.Ejemplo 3.28. Determine du/dt si u = yex + xey, x = cos t, y = sen t.Solucion. De la regla de la cadena, empleando el diagrama de arbol de la

x

t u

y

dx

dt

dy

dt

∂u

∂x

∂u

∂y

figura anexa, se tiene

du

dt=

∂u

∂x

dx

dt+

∂u

∂y

dy

dt

= (yex + ey)(− sen t) + (ex + xey) cos t

= (cos t − sen2 t)ecos t + (cos2 t − sen t)esen t

Ejemplo 3.29. Utilice la ley del gas ideal (Ejemplo 3.18) con k = 0,8para obtener la tasa a la que la temperatura varia en el instante en que elvolumen del gas es de 15 litros y el gas esta bajo presion de 12 atmosferas,si el volumen se incrementa a la tasa de 0,1 litros por minuto y la presiondisminuye a la tasa de 0,2 atmosferas por minuto.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 75

Page 41: Carrillo Julio - calculo en Varias Variables

Solucion. Sean t minutos el tiempo que ha transcurrido desde que el volu-

P

t T

V

dP

dt

dV

dt

∂T

∂P

∂T

∂V

men del gas comenzo a incrementarse. Sean T grados Kelvin la temperatura,P atmosferas la presion y V litros el volumen a los t minutos. De la ley delgas ideal,

T = 10,8PV = 1,25PV.

En el instante dado, P = 12, V = 15,dP

dt= −0,2, y

dV

dt= 0,1. Al aplicar

la regla de la cadena,

dT

dt=

∂T

∂P

dP

dt+

∂T

∂V

dV

dt

= 1,25VdP

dt+ 1,25P

dV

dt= 1,25(15)(−0,2) + 1,25(12)(0,1)

= −2,25

Por lo tanto, la temperatura disminuye a la tasa de 2,25 grados Kelvin porminuto, el instante indicado.

Aunque aun no se tiene la definicion de un campo vectorial, ni de su derivaba,la siguiente version de la regla de la cadena tambien es valida.

Proposicion 3.12. Sean F : D ⊆ Rn → R

n una campo vectorial y f : D′ ⊆ Rn → R una funcion de n

variables tales que la interseccion IF∩Df es no vacıa. Si F es diferenciable de x y f es diferenciable de F(x)entonces u = f ◦ F es diferenciable de x y ademas

∇u(x) = ∇f(F(t))DF(x)

La forma cartesiana de esta version la regla de la cadena es la siguiente. Si

y1

... x1

yn

...

...... u

y1

...

... xn

yn

∂x1

∂y1

∂x1

∂yn

∂xn

∂y1

∂xn

∂yn

∂u

∂x1

∂u

∂xn

u es una funcion diferenciable de x1, . . . , xn, definida por u = f(x1, . . . , xn),donde x1, . . . , xn son diferenciables de y1, . . . , yn, entonces la funcion u esdiferenciable de y1, . . . , yn, y ademas

du

dy1=

∂u

∂x1

∂x1

∂y1+ · · · + ∂u

∂xn

∂xn

∂y1

du

dy2=

∂u

∂x1

∂x1

∂y2+ · · · + ∂u

∂xn

∂xn

∂y2

...

du

dyn=

∂u

∂x1

∂x1

∂yn+ · · · + ∂u

∂xn

∂xn

∂yn

Esta formula se obtiene del diagrama de arbol anexo con ramas que partende la variable y1, . . . , yn, luego a las variables x1, . . . , xn, y finalmente a lavariable u.Ejemplo 3.30. Sean u = x2 + yz, x = r sen t, y = r cos t y z = r sen2 t.Calcular ∂u/∂r y ∂u/∂t aplicando la regla de la cadena.

76 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 42: Carrillo Julio - calculo en Varias Variables

Solucion. De la regla de la cadena, empleando el diagrama de arbol anexo,

r

x

t

u

r

y

t

∂x

∂r

∂x

∂t

∂y

∂r

∂y

∂t

∂u

∂x

∂u

∂y

se tiene

∂u

∂r=

∂u

∂x

∂x

∂r+

∂u

∂y

∂y

∂r

= 2x sen t + z cos tt + y sen2 t

= 2r sen2 t + r sen2 t cos t + r sen2 t cos t

= 2r sen2 t(1 + cos t)

y

∂u

∂t=

∂u

∂x

∂x

∂t+

∂u

∂y

∂y

∂t

= 2xr cos t − zr sen t + 2yr sen t cos t

= 2r2 sen t cos t − r2 sen3 t + 2r2 sen t cos2 t

= r2 sen t(2 cos t + 2 cos2 t − sen2 t)

La regla de la cadena se puede aplicar para obtener un resultado que pro-Derivacion parcialimplıcita porciona una formula para calcular la derivada de una funcion definida im-

plıcitamente.

Proposicion 3.13. Sea f(x) una funcion de una variable que es diferenciable tal que y = f(x) y f estadefinida implıcitamente por la ecuacion F (x, y) = 0. Si F es diferenciable y Fy(x, y) 6= 0 entonces

dy

dx= −Fx(x, y)

Fy(x, y)

Demostracion. Sea z = F (x, y) donde y = f(x). De la regla de la cadena,

dw

dx= Fx(x, y)

dx

dx+ Fy(x, y)

dy

dx

Debido a que w = F (x, f(x)) es diferenciable para todo x en el dominio def y por hipotesis F (x, f(x)) = 0, entonces dw/dx = 0. Ademas dx/dx = 1.Por lo tanto,

0 = Fx(x, y) + Fy(x, y)dy

dx

Puesto que Fy(x, y) 6= 0, al resolver esta ecuacion para dy/dx se obtiene elresultado.

Ejemplo 3.31. Calcule dy/dx si x cos y + y cosx + 1 = 0.Solucion. Sea F (x, y) = x cos y + y cosx + 1. Entonces

Fx(x, y) = cos y − y sen x, Fy(x, y) = −x sen y + cosx

Del la Proposicion 3.13,

dy

dx= −Fx(x, y)

Fy(x, y)= − cos y − y sen x

−x sen y + cosx=

y senx − cos y

cosx − x sen y

para todo (x, y) tal que cosx 6= x sen y.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 77

Page 43: Carrillo Julio - calculo en Varias Variables

Para ecuaciones en tres variables x, y, z que se suponen definen implıcita-mente a z en funcion de x y y se obtiene el siguiente resultado, un analogode la proposicion anterior.

Proposicion 3.14. Sea f(x, y) una funcion de dos variables que es diferenciable tal que z = f(x, y) y festa definida implıcitamente por la ecuacion F (x, y, z) = 0. Si F es diferenciable y Fz(x, y, z) 6= 0 entonces

∂z

∂x= −Fx(x, y, z)

Fz(x, y, z),

∂z

∂y= −Fy(x, y, z)

Fz(x, y, z).

Ejemplo 3.32. Calcule ∂z/∂x y ∂z/∂y si

4z3 + 3xz2 − xyz − 2xy2 + 7 = 0.

Solucion. Sea F (x, yz) = 4z3 + 3xz2 − xyz − 2xy2 + 7. Entonces

Fx = 3z2 − yz − 2y2, Fy = −xz − 4xy, Fz = 12z2 + 6xz − xy.

De la Proposicion 3.14,

∂z

∂x= − 3z2 − yz − 2y

12z2 + 6xz − xy,

∂z

∂y= − −xz − 4xy

12z2 + 6xz − xy

si 12z2 + 6xz − xy 6= 0.

3.4. Gradientes y derivadas direccionales

Las derivadas direccionales son especialmente importantes para establecerun sentido fısico y geometrico de la derivada o gradiente de una funcion fen n varias variables, y en especial para demostrar que el polinomio linealen n variables, p(x) = f(a) + ∇f(a) · (x − a) representa efectivamente laecuacion del plano tangente a la grafica de f en el punto de coordenadas(a, f(a)); asunto que aun esta por demostrar.Definicion 3.16 (Derivada direccional). Sea f : D ⊆ R

n → R una funcionde n variables. Se define la derivada de f en a en la direccion del vector u

como

∂f

∂u(a) = lım

h→0

f(a + hu) − f(a)

h,

si el lımite existe. Si u es un vector unitario, Duf(a) se llama la derivadadireccional de f en a en la direccion del vector u.

Para un campo escalar f definido de R2 en R, la derivada direccional de f en

un punto (x0, y0) se puede interpretar geometricamente como la componenteen z del vector tangente en el punto (x0, y0, f(x0, y0)) a la curva C que esla interseccion de la grafica de f y el plano que pasa por la recta (x, y) =(x0, y0) + tu, t ∈ R, y es perpendicular al plano xy.Ejemplo 3.33. Calcule la derivada direccional de la funcion f(x, y) = 12−x2 − 4y2 si u es el vector unitario de direccion π/6.

78 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 44: Carrillo Julio - calculo en Varias Variables

Solucion. Como u = cos π6 i + sen π

6 j =√

32 i + 1

2j entonces

∂f

∂u(x, y) = lım

h→0

f(x + h√

32 , y + h 1

2 )) − f(x, y)

h

= lımh→0

−√

3hx − 74h2 − 4hy

h

= lımh→0

(−√

3x − 74h − 4y)

= −√

3x − 4y

Proposicion 3.15 (Diferenciabilidad y derivada direccional). Si f es difer-enciable en a entonces

∂f

∂u(x0) = ∇f(x0) · u.

Demostracion. Si f es diferenciable en a las derivadas parciales de f ena existen y ademas

f(x) = f(a) + ∇f(a) · (x − a) + E(x, a) ‖x − a‖

en donde E(x, a) → 0 cuando t → 0. Supongamos que x es un punto enla recta x = a + hu para algun escalar h. Observe que x → a si y solo sih → 0. Por lo tanto,

f(a + hu) − f(a)

h= ∇f(a) · u ± E(a + hu, a)

en donde E(a+hu, a) → 0 cuando h → 0. Como el lımite del lado izquierdode esta ecuacion existe, entonces se concluye que ∂f(a)/∂u existe. Tomandolımite cuando h tiende a cero en ambos lados de la ecuacion anterior seobtiene el resultado.

Proposicion 3.16 (Primer sentido geometrico del gradiente). Sea f unafuncion de n variables y diferenciable en a, donde ∇f(a) es un vector nonulo.

(a) El valor maximo de ∂f(a)/∂u es ‖∇f(a)‖, el cual se obtiene cuandola direccion de u es la de ∇f(a). Por esta razon, ∇f(a) apunta en ladireccion a lo largo de la cual f crece mas rapido.

(b) El valor mınimo de ∂f(a)/∂u es −‖∇f(a)‖, el cual se obtiene cuandola direccion de u es la direccion opuesta de ∇f(a). Por esta razon,−∇f(a) apunta en la direccion a lo largo de la cual f decrece masrapido.

Demostracion. Si u es un vector unitario entonces

∂f

∂u(a) = ∇f(a) · u = ‖∇f(a)‖ ‖u‖ cos θ = ‖∇f(a)‖ cos θ,

donde θ representa el angulo entre u y ∇f(a). Este angulo es maximocuando θ = 0; esto es, cuando u y ∇f(a) son paralelos. Si θ = π el angulo esmınimo, y u y ∇f(a) tienen direcciones opuestas y ∂f(a)/∂u = −‖∇f(a)‖.Se considera en la hipotesis que ∇f(a) 6= 0, porque si ∇f(a) = 0 entonces∂f(a)/∂u = 0 para cualquier u.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 79

Page 45: Carrillo Julio - calculo en Varias Variables

Es decir, si nos queremos mover en la direccion en la cual f crece mas rapi-do, debemos hacerlo en la direccion de ∇f(a). Analogamente, si deseamosmovernos en la direccion en la cual f decrece mas rapido, debemos hacerloen la direccion de −∇f(a).Ejemplo 3.34. Dada la funcion f(x, y) = 2x2 − y2 + 3x − y, calcular elvalor maximo de ∂f/∂u en el punto (1,−2).Solucion. Como fx(x, y) = 4x + 3 y fy(x, y) = −2y − 1, entonces

∇f(1,−2) = ((4x + 3)i − (2y + 1)j)∣

(1,−2)= 7i + 3j

Por lo tanto, el valor maximo de ∂f/∂u en (1,−2) es

‖∇f(1,−2)‖ =√

72 + 32 =√

49 + 9 =√

58

Ejemplo 3.35. Sea V (x, y, z) volts el potencial electrico todo punto (x, y, z) 6=(0, 0, 0) del espacio tridimensional, dado por

V (x, y, z) =1

x2 + y2 + z2.

(a) Calcule la tasa de variacion de V en el punto (2, 2,−1) en la direcciondel vector 2i − 3j + 6k. (b) Determine la direccion de la mınima tasa devariacion de V en (2, 2,−1).

Solucion. (a) El vector unitario u en la direccion de 2i − 3j + 6k es

u = 27i − 3

7j + 67k

Como

∇V (x, y, z) = Vx(x, y, z)i + Vy(x, y, z)j + Vz(x, y, z)k

= − 1

(x2 + y2 + z2)3/2(xi + yj + zk)

entonces

∂V

∂u(2, 2,−1) = ∇V (2, 2,−1) · u

= −( 227i + 2

27j − 227k) · (2

7i − 37j + 6

7k)

=8

189= 0,042.

Por lo tanto, en (2, 2,−1) el potencial crece aproximadamente a unatasa de 0,042 volts por unidad de variacion en la distancia medida enla direccion de u.

(b) El vector unitario en la direccion de ∇V (2, 2,−1) es

− ∇V (2, 2,−1)

‖∇V (2, 2,−1)‖ = −227i + 2

27j − 227k

327

=2

3i +

2

3j − 1

3k.

Los cosenos directores de este vector son 2/3, 2/3 y −1/3, los cualesproporcionan la direccion de la mınima tasa de variacion de V en(2, 2,−1).

La siguiente proposicion establece una relacion directa entre el gradiente yel conjunto de nivel de un campo escalar.

80 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 46: Carrillo Julio - calculo en Varias Variables

Proposicion 3.17 (Segundo sentido geometrico del gradiente). Sea g :R

n → R una funcion con primeras derivadas parciales continuas y a unpunto en el conjunto de nivel Lc(g) definida por g(x) = c, para algunaconstante c. Entonces ∇g(a) es normal a Lc(g) en el siguiente sentido:para todo vector v tangente a una trayectoria C en Lc(g) que pasa por a secumple que ∇g(a) · v = 0.

Demostracion. Si C es una trayectoria en Lc(g) que pasa por a y estadefinida por R(t), entonces existe un escalar t0 tal que R(t0) = a y ademasg(R(t0)) = c. Como v es tangente a C en a entonces v y R′(t0) son colineales.Sin perdida de generalidad supongamos que v = R′(t0). Ası que derivandoen ambos lados de la ecuacion g(R(t0)) = c con respecto a t y aplicando laregla de la cadena tenemos que

0 =d

dtg(R(t0)) =

d

dtg(R(t))

t=t0

= ∇g(R(t)) · R′(t)

t=t0

= ∇g(R(t0)) · R′(t0) = ∇g(a) · v

Definicion 3.17 (Plano tangente). Sea S el conjunto de nivel n–dimensionalformada por los puntos x en R

n tales que g(x) = c, para c una constantedada. El plano tangente a S en un punto a de S se define por la ecuacionvectorial

∇g(a) · (x − a) = 0

si ∇g(a) es diferente del vector nulo.

La diferencial con el uso adquirio el nombre de gradiente o campo gradiente,El campo gradientedebido a que este vector genera un campo vectorial que es tangente en cadapunto a las curvas de nivel de g. El gradiente asociado con cada punto x

en el dominio de g es el vector ∇g(x). El conjunto de todos esos vectoresen R

n se llama el campo gradiente de gf . Geometricamente, el gradiente serepresenta una flecha de origen en x y extremo x + ∇g(x).Proposicion 3.18 (Tercer sentido geometrico del gradiente). Sea f unafuncion en n variables que es diferenciable en a. Entonces la ecuacion delplano tangente a la grafica de f en el punto de coordenadas (a, f(a)) estadada por el polinomio lineal en n variables,

p(x) = f(a) + ∇f(a) · (x − a).

Demostracion. Consideremos el caso n = 2 y sea z = f(x, y). Sea gla funcion en tres variables definida de la forma g(x, y, z) = f(x, y) − z.Observe que la grafica Gf de f coincide con la curva de nivel Lk(g) de gcuando k = 0; es decir, Gf = L0(g). Entonces tendremos que el vector∇g(x0, y0, z0) = (fx(x0, y0), fy(x0, y0),−1) = (∇f(x0, y0),−1) es normal ala grafica de f en el punto (x0, y0, z0) = (x0, y0, f(x0, y0)). En consecuencia,este vector y este punto determinan un plano tangente a la grafica de f ental punto, y su ecuacion esta dada de la forma,

(∇f(x0, y0),−1) · (x − x0, y − y0, z − f(x0, y0)) = 0;

o lo que es lo mismo,

z = f(x0, y0) + ∇f(x0, y0) · (x − x0, y − y0).

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 81

Page 47: Carrillo Julio - calculo en Varias Variables

3.5. Extremos de funciones de varias variables

Sea f : D ⊆ Rn → R una funcion y M un subconjunto de R

n tal que lainterseccion D ∩ M es no vacıa; usualmente se considera M es un subcon-junto del dominio D de f . Un problema de optimizacion no lineal tiene laestructura estandar dada por

mın{f(x) | x ∈ M}

o

max{f(x) | x ∈ M},

donde M es un subconjunto de Rn, el cual puede representar o no una

trayectoria en Rn.

Por ejemplo, M puede ser la bola n–dimensional

B(O, r) = {x ∈ Rn | ‖x‖ ≤ r}

con centro en el origen de Rn y radio positivo r; o el conjunto de nivel

Lk(g) = {x ∈ Rn | g(x) = k},

donde k es una constante apropiada. Cuando M = B(O, r), el problema sesuele llamar de optimizacion global, y cuando M = Lk(g) un problema deoptimizacion con restricciones. Ambos tipos de problemas de optimizacionseran discutidos en esta seccion.

3.5.1. Extremos sin restricciones

Un problema de optimizacion o extremos sin restricciones (o global) con-siste en el problema de encontrar los extremos locales o extremos absolutosde una cierta funcion f de varias variables, donde f se considera definidaen todo su dominio. En esta seccion se estudian resultados que garantizancondiciones que permiten establecer cuales son los extremos locales de f ,si ellos existen. Como veremos, el criterio de la primera derivada para fun-ciones de una variable no se puede extender al caso de funciones de variasvariables. La extension del criterio de la segunda derivada es posible y sudemostracion require del teorema de Taylor para funciones variables. Lascondiciones que permiten cuales son los extremos locales de f requieren dealgunos resultados de Algebra Lineal. Finalmente, es oportuno aclarar quedesafortunadamente no se pueden establecer criterios que permitan encon-trar los extremos absolutos de un problema de optimizacion sin restricciones.

Para a en Rn y ǫ > 0, B(a, ǫ) denota la vecindad (abierta) de a de radio ǫ

definida como

B(a, ǫ) = {x ∈ Rn | ‖x − a‖ < ǫ}

Maximos y mınimos locales y puntos de silla

Primero que todo consideremos un subconjunto M de Rn que no sea una

trayectoria.Definicion 3.18. Sea f : D ⊆ R

n → R una funcion de varias variables yM un subconjunto de R

n tal que M ⊆ D. Se dice que f tiene un mınimo

local o relativo en un punto a de M si existe una vecindad abierta U de

82 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 48: Carrillo Julio - calculo en Varias Variables

a en M tal que f(x) ≥ f(a) para todo x en U . El numero f(a) se llamael mınimo relativo de f en M . Se dice que f tiene un mınimo global

o absoluto en un punto a de M si f(a) ≥ f(x) para todo x en M , y elnumero f(a) se llama el maximo global o absoluto de f en M . Si lasdos anteriores desigualdades se cumplen en el sentido estricto, se dice quef tiene un mınimo local estricto en M y un mınimo global estricto

en M , respectivamente.

El maximo local o relativo y el maximo global o absoluto se definen de formasimilar.Definicion 3.19 (Extremos locales). Un extremo local (absoluto) es unnumero que es un mınimo local (absoluto) o un maximo (global). Por conven-cion, un extremo sera un extremo absoluto y un maximo o un mınimo

seran un maximo absoluto o un mınimo absoluto.

Las siguientes definiciones y resultados son necesarios para obtener el criteriode la segunda derivada para funciones de varias variables.

Teorema de Taylor de segundo orden

Si f es diferenciable en a y tiene un punto crıtico en a entonces

f(x) − f(a) = E1(x, a) ‖x − a‖donde E1(x, a) → 0 cuando x → a. Por lo tanto, se necesita mas informa-cion de f en a en terminos de E1(x, a) ‖x − a‖ para determinar el signoalgebraico de f(x)− f(a). El Teorema de Taylor de segundo orden permiteresolver esta dificultad.Definicion 3.20 (La matriz hessiana y el hessiano). Sea f : D ⊆ R

n → R

una funcion de varias variables con segundas derivadas parciales ∂2f/∂xi∂xj

continuas en x. La matriz hessiana de f es la matriz de las segundasderivadas parciales de f ,

[

∂2f

∂xi∂xj(x)

]

=

∂2f∂x2

1

(x) ∂2f∂x1∂x2

(x) · · · ∂2f∂x1∂xn

(x)∂2f

∂x2∂x1

(x) ∂2f∂x2

2

(x) · · · ∂2f∂x2∂xn

(x)

......

. . ....

∂2f∂xn∂x1

(x) ∂2f∂xn∂x2

(x) · · · ∂2f∂x2

n(x)

y se denota como D2f(x). Observemos que la matriz hessiana es una matrizcuadrada de orden n y simetrica. El determinante de la matriz hessiana def se llama el hessiano de f . Ademas,

D2f(x) =

[

∇(

∂f

∂x1(x)

)

∇(

∂f

∂x2(x)

)

· · · ∇(

∂f

∂xn(x)

)]

El termino “hessiana” fue acunado por James Joseph Sylvester en honordel matematico aleman Ludwig Otto Hesse, quien habıa usado el termino“determinantes funcionales”.Proposicion 3.19 (Formula de Taylor de segundo orden). Sea f : D ⊆R

n → R una funcion de varias variables con segundas derivadas parciales∂2f/∂xi∂xj continuas en una vecindad V de a. Entonces para cada x en Vse tiene

f(x) = f(a) + Df(a)(x − a) +1

2!(x − a)T D2f(a)(x − a) + E2(x, a) ‖x − a‖2

en donde E2(x, a) → 0 cuando x → a.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 83

Page 49: Carrillo Julio - calculo en Varias Variables

Demostracion. Sea y = a+td, con t ∈ R, la ecuacion de la recta que pasapor el punto a en la direccion del vector d = x − a. Definamos la funcionescalar φ(t) = f(a + td). Observe que φ tiene segundas derivadas continuasen una vecindad de t = 0 tal que φ(0) = f(a) y φ(1) = f(x). Por el Teoremade Taylor para funciones de una variable,

φ(1) = φ(0) + φ′(0) +1

2!φ′′(c), donde 0 < c < 1.

De la regla de la cadena,

φ′(0) =d

dtf(a + td)

t=0

= Df(a)d = ∇f(a) · d

y

φ′′(c) =d

dt(Df(a + td) d)

t=c

=

(

d

dtDf(a + td)

t=c

)

d

= (D2f(a + cd)d)d ≡ dT D2f(a + cd)d,

en notacion vectorial. Ahora definamos E2(d + a, a) por la ecuacion

E2(d + a, a) ‖d‖2=

1

2!dT [D2f(a + cd) − D2f(a)]d,

si d 6= O, y E2(a, O) = 0 si d = O. Entonces,

f(x) = f(a) + Df(a)d +1

2!d

T D2f(a)d + E2(a + d, a) ‖d‖2.

Como∣

∣d

T [D2f(a + cd) − D2f(a)]d∣

≤n∑

i=1

n∑

j=1

∂2f

∂xi∂xj(a + cd) − ∂2f

∂xi∂xj(a)

‖d‖2,

se tiene que

|E2(d + a, a)| ≤ 1

2!

n∑

i=1

n∑

j=1

∂2f

∂xi∂xj(a + cd) − ∂2f

∂xi∂xj(a)

para d no nulo. Como las segundas derivadas parciales son continuas en a,entonces

lımd→0

∂2f

∂xi∂xj(a + cd) =

∂2f

∂xi∂xj(a),

ası que E2(d+a, a) → 0 cuando d → 0. Observe que x → a cuando d → O.Esto termina la demostracion.

Condiciones para la existencia de extremos locales

Para dar condiciones necesarias y suficientes para la existencia de extremoslocales se consideran resultados de Algebra Lineal avanzada. Estos resulta-dos conciernen a los topicos de matrices simetricas, formas bilineales, matri-ces definido positivas y definido negativas, valores y vectores propios. Este

84 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 50: Carrillo Julio - calculo en Varias Variables

enfoque fue apropiadamente establecido por James Joseph Sylvester, espe-cialmente, y aunque solo se considera parte de su teorıa, se recomienda lalectura de libros avanzados en estos topicos cuando se requiera realizar apli-caciones matematicas que involucren el problema de determinar los extremosrelativos de funciones en mas de dos variables.Proposicion 3.20 (Condiciones necesarias de primer orden). Si f tieneprimeras derivadas parciales continuas en M y f tiene un mınimo local ena entonces Df(a) = O.

Demostracion. Supongamos que Df(a) 6= O. Entonces existe un vectorno nulo ξ en R

n tal que Dξf(a) = Df(a) · ξ = α < 0 (Por ejemplo ξ =−Df(a)T = −∇f(a)).

Considerando la variacion de f a lo largo de la linea recta que pasa por a

en la direccion del vector ξ, se tiene la funcion escalar

φ(t) = f(a + tξ)

Por la regla de la cadena, φ′(t) = Df(a + tξ)ξ. Como φ(0) = f(a) y φ esdiferenciable en t = 0, del teorema de Taylor en funciones de una variabletenemos que si t 6= 0

φ(t) = φ(0) + φ′(0)t + E1(t, 0)|t| = φ(0) + t

(

φ′(0) +E1(t, 0)|t|

t

)

Como E1(t, 0)|t|/t → 0 cuando t → 0 y φ′(0) = Df(a)ξ = α < 0 entoncesexiste un t0 tal que φ′(0)+E1(t, 0)|t|/t ≤ α/2 para todo t ∈ (0, t0). Entonces

φ(t) ≤ φ(0) +1

2αt

para todo t ∈ (0, t0). Como α < 0 esto implica que

φ(t) < φ(0),

o lo que es igual

f(a + tξ) < f(a)

para todo t ∈ (0, t0). Sin embargo esto contradice que a sea un mınimo localde f .

Aunque el recıproco de este resultado no es cierto en general, el nos indicaque si una funcion f en varias variables es diferenciable, entonces f puedetener un extremo local en todos aquellos puntos de su dominio en donde sugradiente se anula. Esta observacion motiva la siguiente definicion.Definicion 3.21. Sea f : D ⊆ R

n → R una funcion de varias variablesdiferenciable en a. Si ∇f(a) = O entonces el punto a se llama un puntocrıtico, o estacionario, de f . Un punto crıtico de f es un punto de silla sitoda vecindad U de a contiene puntos x y x′ distintos tales que f(x) > f(a)y f(x′) < f(a).

La Proposicion 3.20 establece una condicion necesaria para que f tenga unpunto critico en a, pero no es una condicion suficiente para que f tenga unmınimo local en a. Condiciones suficientes son dadas en la Proposicion 3.23,pero antes se hace necesario considerar algunos preliminares para obtenereste resultado.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 85

Page 51: Carrillo Julio - calculo en Varias Variables

Definicion 3.22. Sea A una matriz simetrica de orden n × n.

(a) A es definido positiva (negativa) si xT Ax > 0 (< 0) para todo vectorno nulo x de R

n.

(b) A es semidefinido positiva (negativa) si xT Ax ≥ 0 (≤ 0) para todovector x de R

n.

(c) A es indefinida si no es semidefinido positiva ni definido positiva.

Sea A = [aij ] una matriz de orden n × n. Entonces A tiene n submatricesdiagonales Ak de orden k × k, para k = 1, . . . , n, definidas por

Ak =

a11 a12 · · · a1k

a21 a22 · · · a2k

......

. . ....

ak1 ak2 · · · akk

;

o por simplicidad, Ak = [aij ]k×k. Los numeros reales det Ak = |Ak| sellaman los subdeterminantes diagonales de A.Proposicion 3.21 (Lema de Sylvester). Sea A una matriz simetrica deorden n × n.

(a) A es definido positiva si y solo si |Ak| > 0 para k = 1, . . . , n.

(b) A es definido negativa si y solo si |A1| < 0, |A2| > 0, |A3| < 0, . . .

(c) A es indefinida si y solo si |Ak| < 0 para algun k par.Proposicion 3.22 (Condicion necesaria de segundo orden). Sea f : D ⊆R

n → R una funcion de varias variables con terceras derivadas parcialescontinuas y a un mınimo (maximo) local de f . Entonces Df(a) = O yD2f(a) es semidefinido positiva (negativa).

Demostracion. La demostracion se sigue del Teorema de Taylor para fun-ciones de varias variables y el criterio de Sylvester.

La siguiente proposicion establece condiciones suficiente para la existenciade la extremos locales.Proposicion 3.23 (Criterio de la segunda derivada). Sea f : D ⊆ R

n → R

una funcion de varias variables con terceras derivadas parciales continuas ya un punto crıtico de f .

(a) Si D2f(a) es semidefinido positiva entonces f(a) es un mınimo localfuerte de f .

(b) Si D2f(a) es semidefinido negativa entonces f(a) es un mınimo localfuerte de f .

(c) Si D2f(a) es indefinida entonces f(a) no es un extremo local de f .

Demostracion. Del Teorema de Taylor y la hipotesis que ∇f(a) = O

tenemos

f(x) = f(a) +1

2(x − a)T D2f(a)(x − a) + E2(x, a) ‖x − a‖2

en donde E2(x, a) → 0 cuando x → a. Si la matriz simetrica D2f(a) esdefinido positiva, entonces existe una constante positiva λ1 (que puede sertomada como el menor valor propio de D2f(a)) tal que

(x − a)T D2f(a)(x − a) ≥ λ1 ‖x − a‖2

86 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 52: Carrillo Julio - calculo en Varias Variables

para todo vector x de Rn (cf. Gilbert Strang, Linear Algebra). Por lo tanto,

f(x) − f(a) ≥ 1

2λ1 ‖x − a‖2 + E2(x, a) ‖x − a‖2

en donde E2(x, a) → 0 cuando x → a. Como la expresion del lado derechoes positiva cuando x → a, se sigue que f(x) > f(a) en alguna vecindad dea; i.e., f(a) es un mınimo local fuerte de f .

Ademas es facil de demostrar que si a es un punto estacionario de f , entonces

1. f(a) no es ni maximo local ni mınimo local si D2f(a) tiene valorespropios positivos y negativos.

2. f(a) puede ser o no un maximo local si D2f(a) es semidefinido positiva.

El siguiente resultado es un caso particular de la anterior proposicion.Corolario 3.1. Sea f(x, y) una funcion con terceras derivadas parcialescontinuas en un conjunto abierto D en R

2. Sea ademas (x0, y0) un puntocrıtico de f . Entonces,

(a) Si fxx(x0, y0) > 0 y fxx(x0, y0)fyy(x0, y0)− f2xy(x0, y0) > 0 entonces f

tiene un mınimo local en (x0, y0).

(b) Si fxx(x0, y0) < 0 y fxx(x0, y0)fyy(x0, y0)− f2xy(x0, y0) > 0 entonces f

tiene un maximo local en (x0, y0).

(c) Si fxx(x0, y0)fyy(x0, y0)−f2xy(x0, y0) < 0 entonces f tiene un punto de

silla en (x0, y0).

(d) Si fxx(x0, y0)fyy(x0, y0) − f2xy(x0, y0) = 0 el criterio no decide nada.

Ejemplo 3.36. Encuentre y clasifique los puntos crıticos de la funcionf(x, y, z) = x4 + y4 + z4 − 2xyz + 1.

De nuevo se aclara que el criterio de la segunda derivada garantiza condi-ciones que permiten clasificar los puntos crıticos de una funcion en variasvariables como extremos locales. Desafortunadamente, el criterio no existecriterio alguno que permita obtener los extremos absolutos de la funcion.

3.5.2. Extremos con restricciones

Un problema de optimizacion o extremos con restricciones consiste en elproblema de encontrar los extremos locales o absolutos de una cierta funcionf de varias variables en un subconjunto M de su dominio.Definicion 3.23. Sea f : D ⊆ R

n → R una funcion, y M un subconjuntode D. Un extremo (local) de f sujeto a la restriccion M es un extremo (local)de la restriccion de f a M .

Se consideran los casos de extremos con restricciones cuando M es un con-junto cerrado y acotado, y cuando M es el conjunto de nivel de una funciong en varias variables dada.

Extremos absolutos de funciones definidas en conjuntos cerrados y acotados

En esta seccion se optimiza una funcion, es decir se identifican los extremos(absolutos) de una funcion en varias variables definida en un conjunto cer-rado y acotado de R

n.Definicion 3.24. Sea M un conjunto en R

n.

(a) M es cerrado si este incluye su frontera. M es un conjunto abierto sieste no incluye ningun punto de su frontera. La frontera de M se sueledenotar como ∂M .

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 87

Page 53: Carrillo Julio - calculo en Varias Variables

(b) M es un conjunto acotado si existe una bola n–dimensional que con-tiene a M . En otras palabras, M es acotado si M es finito.

Por ejemplo, el intervalo abierto (−5, 4) es un conjunto abierto en R y elintervalo cerrado [−5, 4] es un conjunto cerrado en R. La frontera de ambosconjuntos, la frontera la conforman los extremos de los intervalos, es decir,los numeros reales −5 y 4. En el primer caso, el conjunto abierto no incluyelos extremos del intervalo, los cuales determinan su frontera, y ambos sonconjuntos acotados.

De otro lado, el rectangulo

(−1, 2)× (1, 4) = {(x, y)| − 1 < x < 2, 1 < y < 4}

es un conjunto abierto y acotado en R2 y el rectangulo

[−1, 2]× [1, 4] = {(x, y)| − 1 ≤ x ≤ 2, 1 ≤ y ≤ 4}

es un conjunto cerrado y acotado en R2. En este caso, el conjunto abierto no

incluye los lados del rectangulo por lo cual se puede hablar de un rectanguloabierto y acotado. La frontera de ambos conjuntos esta conformada por loslados del rectangulo. Observe que al agregar al rectangulo abierto su fronterase obtiene el rectangulo cerrado.

(a) (b)−1 2

1

4

x

y

−1 2

1

4

x

y

Figura 3.1: (a) Conjunto abierto y acotado, y (b) conjunto cerrado y acotadoen R

2.

El primer cuadrante del plano xy que no incluye la parte positiva de los ejescoordenados es un conjunto abierto pero no acotado de R

2.

Tambien, un cırculo en el plano xy es un conjunto abierto, su frontera es lacircunferencia, y el cırculo cerrado incluye el cırculo y su circunferencia.

En general, sea a un punto dado en Rn y r un numero real positivo dado. En-

tonces la bola n–dimensional B(a, r) = {x ∈ Rn| ‖x − a‖ < r} es un conjun-

to abierto en Rn, su frontera es el conjunto ∂B(a, r) = {x ∈ R

n| ‖x − a‖ =r}, y la bola n–dimensional cerrada B(a, r) = {x ∈ R

n| ‖x − a‖ ≤ r} es unconjunto cerrado en R

n.

El siguiente criterio establece condiciones mediante la cual se garantiza laexistencia de los extremos (absolutos) de una funcion en varias variablesrestringida a un conjunto cerrado y acotado de su dominio.Proposicion 3.24 (Teorema de Weierstrass o del valor extremo). Sea Mun subconjunto no vacıo, cerrado y acotado de R

n. Si f : M ⊆ Rn → R es

una funcion continua, entonces existen puntos a y a′ en M tal que f(a) ≤f(x) ≤ f(a′) para todo x en M .

88 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 54: Carrillo Julio - calculo en Varias Variables

(a) (b) (c)

Figura 3.2: (a) Conjunto abierto, (b) la frontera, (c) conjunto cerrado yacotado en R

2.

La prueba estandar se obtiene notando que si f es continua entonces laimagen de un conjunto cerrado y acotado es tambien un conjunto cerradoy acotado. Como M es cerrado y acotado, se sigue que f(M) debe sertambien cerrado y acotado. Por tanto, f alcanza su mınimo absoluto y sumaximo absoluto en algunos puntos a y a′ en M , respectivamente. Estoprecisamente garantiza que f(a) ≤ f(x) ≤ f(a′) para todo x en M . Noteque este teorema no dice en donde ocurren los extremos absolutos de f .Dice unicamente que ellos existen. Note tambien que al ser M un conjuntocerrado y acotado, puede ser considerado como un conjunto formado por suinterior y su frontera. Por tanto, los extremos de f en M pueden ocurriren el interior de M o en la frontera de M . Esto sugiere el siguiente procesopara encontrar estos extremos absolutos:

(a) Se buscan los puntos crıticos de f en el interior de M y se determinael valor de la funcion en esos puntos. En otras palabras, se buscan losextremos locales de f en el interior de M .

(b) Se buscan todos los extremos locales de f sobre la frontera de M . Estousualmente involucra tecnicas de Calculo diferencial de funciones enuna variable.

(c) El Teorema de Weierstrass garantiza que el mayor y el menor valor delos valores encontrados en los dos procesos anteriores seran el maximoy el mınimo (absolutos) de f en el conjunto M .

Observese que el anterior proceso requiere de encontrar los extremos localesde f sobre el interior de la frontera de M , pero no clasificarlos. Es decir,no es necesario aplicar el criterio de la segunda derivada. Segundo, es buenocomentar que a menudo la frontera de M esta conformado por una curva oun numero finito de curvas, cada una de las cuales esta representada por unafuncion continua definida en un intervalo cerrado y acotado. De acuerdo conel teorema del valor extremo de funciones de una variable, esto solo requiereque para cada una de estas funciones se encuentren sus puntos crıticos enel intervalo abierto en el cual esten definidas y los valor de de la funcion enlos dos extremos del respectivo intervalo. El mayor y menor de estos valoresseran los extremos absolutos de f sobre la frontera de M . Esto hace quela mayor parte de trabajo sea realizado en esta parte del proceso anterior,pero que se pueda reducir un tanto el proceso de encontrar estos extremos,como se vera en el siguiente ejemplo.Ejemplo 3.37. Encuentre, si existen, el maximo y mınimo de la funcionf(x, y) = x2 − y2 − 2xy + 1 en el conjunto [−1, 2]× [−1, 2].

Solucion. Sea M = [−1, 2] × [−1, 2]. El dominio M de f es un cuadradoel cual es un conjunto cerrado y acotado. Para propositos de referencia seconsidera a continuacion su grafica.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 89

Page 55: Carrillo Julio - calculo en Varias Variables

x

y

y = 2

y = −1

x = 2x = −1

El hecho que f sea una funcion polinomica garantiza que f es continua enM . Ası que el teorema de Weierstrass garantiza que f alcanza sus extremos(absolutos) en M . Se resuelve el problema de encontrar los extremos de fen M en dos pasos.a. Encontrando los extremos locales en el interior de M . Para en-contrar los puntos crıticos de f en el interior de M , se hacen las primerasderivadas parciales de f cero y se resuelve el sistema resultante simultanea-mente:

(fx = 0) 2x − 2y = 0

(fy = 0) −2y − 2x = 0

el cual es un sistema facil de resolver. Mediante el metodo de eliminacion seencuentra que x = y = 0. Ası que (0, 0) es el punto crıtico de f que esta enel interior de M . El extremo local de f en el interior de M es f(0, 0) = 1.

b. Encontrando los extremos locales sobre la frontera de M . En estecaso la frontera de M esta conformada por cuatro lados, que estan definidospor cuatro curvas continuas definidas sobre intervalos cerrados y acotados,cuya interseccion dos a dos dan los cuatro extremos del cuadrado M . Eneste caso, solo se deben encontrar los extremos locales (sin clasificarlos) decada una de las funciones que definen estas curvas, como ya se menciono,los cuales definen los respectivos extremos de f sobre la frontera de M .

En el lado izquierdo del cuadrado: A lo largo de este lado tenemos que

x = −1, −1 ≤ y ≤ 2, z = f(−1, y) = −y2 + 2y + 2

Ahora, encontrar los extremos locales de f a lo largo del lado derecho esequivalente a encontrar los extremos locales de la funcion z = −y2 + 2y + 2cuando −1 ≤ y ≤ 2. Del teorema del valor extremos en una variable, se debeencontrar los puntos crıticos esta funcion cuando −1 ≤ y ≤ 2 y entoncesevaluarla en los puntos crıticos y en los extremos del intervalo en y.

Como zy = −2y + 2 = 0 cuando y = 1 ∈ (−1, 2) entonces f tiene unpunto crıtico en el lado izquierdo del cuadrado y de coordenadas (−1, 1).En este punto el extremo local de f es z = f(−1, 1) = −12 + 2 + 2 = 3.En los extremos del lado izquierdo se obtienen los valores z = f(−1,−1) =−(−1)2 + 2(−1) + 2 = −1 y z = f(−1, 2) = −22 + 2(2) + 2 = 4.

En el lado derecho del cuadrado: En este caso,

x = 2, −1 ≤ y ≤ 2, z = f(2, y) = −y2 − 4y + 5

Como zy = −2y − 4 = 0 cuando z = −2 /∈ (−1, 2) entonces f no tienepuntos crıticos en el lado derecho del cuadrado. En los extremos del lado

90 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 56: Carrillo Julio - calculo en Varias Variables

derecho se obtienen los valores z = f(2,−1) = −(−1)2 − 4(−1) + 5 = 8 yz = f(2, 2) = −22 − 4(2) + 5 = −7.

En el lado inferior del cuadrado: Tenemos,

y = −1, −1 ≤ x ≤ 2, z = f(x,−1) = x2 + 2x

Como zx = 2x + 2 = 0 cuando z = −1 /∈ (−1, 2) entonces f no tienepuntos crıticos en el lado inferior del cuadrado. En los extremos del ladoinferior se obtienen los valores z = f(−1,−1) = (−1)2 + 2(−1) = −1 yz = f(2,−1) = 22 + 2(2) = 8.

En el lado superior del cuadrado: En este caso,

y = 2, −1 ≤ x ≤ 2, z = f(x, 2) = x2 − 4x − 3

Como zx = 2x − 4 = 0 cuando z = 2 /∈ (−1, 2) entonces f no tiene puntoscrıticos en el lado superior del cuadrado. En los extremos del lado superiorse obtienen los valores z = f(−1, 2) = (−1)2−4(−1)−3 = 2 y z = f(2, 2) =22 − 4(−2)− 3 = −7.

c. Encontrando los extremos (absolutos) en M . Ahora se reunen losextremos locales de f en el interior y la frontera, junto con los valores de fen las esquinas del cuadrado que determina a M , pero evitando repeticionesde valores como se puede notar. Tenemos ası la siguiente tabla.

x y f(x, y)0 0 1

−1 1 3−1 −1 −1−1 2 4

2 −1 82 2 −7

Entonces el mınimo (absoluto) de f es z = −7, el ocurre en la esquina delcuadrado de coordenadas (2, 2), se obtiene como el menor de los valoresf(x, y) anteriores. El maximo (absoluto) de f es z = 8, el cual ocurre en laesquina del cuadrado de coordenadas (2,−1), se obtiene tambien como elmayor de esos valores. La Figura 3.3 muestra los extremos absolutos de fen M .

Ejemplo 3.38. Encuentre, si existen, el maximo y mınimo de la funcionf(x, y) = 2x2 − y2 + 6y sobre el disco de radio 4, x2 + y2 ≤ 16.

Solucion. Note que el interior del disco esta dado por la desigualdad y laigualdad da su frontera o circunferencia. Obviamente, −4 ≤ x, y ≤ 4.

a. Encontrando los extremos locales en el interior del disco. Paraencontrar los puntos crıticos en el interior del disco, se resuelve el siguientesistema simultaneamente,

(fx = 0) 4x = 0

(fy = 0) −2y + 6 = 0

De la primera ecuacion se obtiene x = 0 y de la segunda y = 3. Ası que elpunto critico para esta funcion es (0, 3). Como 02 + 32 = 9 < 16, entonces(0, 3) esta en el interior del disco. El extremo local de f en el interior deldisco es f(0, 3) = 2(0)2 − 32 + 6(3) = 12.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 91

Page 57: Carrillo Julio - calculo en Varias Variables

xy

z

Maximo 8en (2,−1)

Mınimo −7en (2, 2)

-10

12

-10

12

-6

-4

-2

0

2

4

6

8

Figura 3.3: Maximo y mınimo de la funcion f(x, y) = x2 − y2 − 2xy + 1 enel cuadrado [−1, 2]× [−1, 2].

b. Encontrando los extremos locales en la frontera del disco. En lafrontera del disco, x2 + y2 = 16. Resolviendo para x2 y reemplazando en laexpresion de f se puede conseguir una funcion de y. En efecto,

x2 = 16 − y2

−4 ≤ y ≤ 4

g(y) = f(x, y) = 2(16 − y2) − y2 + 6y = −3y2 + 6y + 32

donde g(y) correspondera a la representacion de f sobre la frontera del disco,es decir como una funcion de y donde y esta en el intervalo [−4, 4]. Por elteorema del valor extremos de funciones de una variable, g tiene extremosabsolutos en este intervalo. Para encontrarlos se procede de la forma usualpara funciones de una variable, pero no se encuentran los extremos absolutospara economizar tiempo.

Como g′(y) = −6y + 6 = 0 cuando y = 1 ∈ (−4, 4) entonces f tiene unpunto critico sobre la circunferencia de radio 4. Las coordenadas en x deeste punto se obtienen de la ecuacion x2 = 16 − 1 = 15 como x = ±

√15.

El extremo local de f es g(1) = f(±√

15, 1) = −3(1)2 + 6(1) + 32 = 35.El valor de esta funcion en los extremos del intervalo en y son g(−4) =−3(−4)2+6(−4)+32 = −40 y g(4) = −3(4)2+6(4)+32 = 8. La coordenadaen x correspondiente a estos puntos se obtienen reemplazando el valor de y

92 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 58: Carrillo Julio - calculo en Varias Variables

en la ecuacion de la circunferencia. Cuando y = −4, x2 = (−4)2 − 16 = 0cuando x = 0. Similarmente, cuando y = 4, x2 = 42 − 16 = 0 cuandox = 0. Los correspondientes valores de f son entonces f(0,−4) = −40 yf(0, 4) = 8.

c. Encontrando los extremos en el disco. Al reunir la informacionanterior se obiene la siguiente tabla.

x y f(x, y)0 3 12

±√

15 1 350 −4 −400 4 8

Del menor y mayor de los valores en z se concluye lo siguiente. El maximode f es 35 y ocurre en dos lugares distintos del disco, mientras que el mınimoes −40 y ocurre unicamente en el punto (0,−4) de la frontera del disco. Lasiguiente figura muestra los extremos absolutos de f en el disco de radio 4.

x y

z

-4-2024

-4-2

02

4

-40

-20

0

20

40

Este ejemplo demuestra que uno de los extremos absolutos pueden ocurriren mas de un lugar. Algunas veces esto puede o no pasar. Notese tambienque tales extremos pueden ocurrir en el interior o en la frontera del conjuntoM .

Extremos absolutos de funciones a lo largo de conjuntos de nivel, multiplicadores de Lagrange

Ahora se busca resolver el problema de encontrar los extremos de una fun-cion de varias variables f(x) cuando x tiene la restriccion de pertenecer a unconjunto de nivel M en el dominio de f . Simbolicamente, se busca resolverel problema

mın{f(x) | x ∈ M} ≡ mınx∈M

f(x)

o

max{f(x) | x ∈ M} ≡ maxx∈M

f(x)

donde M ⊆ Df usualmente dado de la forma

M = {x ∈ Rn | g(x) = k}

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 93

Page 59: Carrillo Julio - calculo en Varias Variables

para alguna constante apropiada k. Observe que M = Lk(g) y por tantola ecuacion g(x) = k, llamada de igualdad, es la restriccion que define aM . Por lo tanto, se busca optimizar la funcion f para todo vector x en elconjunto de nivel de g, Lk(g) con k un numero dado de la imagen de g.

En general, tambien se puede considerar

M = {x ∈ Rn | gi(x) = ki, i = 1, . . . , m}

para constantes apropiadas ki, y m < n. Es claro que el conjunto n–dimensional M esta definido por las restricciones gi(x) = ki para i =1, . . . , m.Proposicion 3.25 (Teorema de multiplicadores de Lagrange). Sean f, g :D ⊆ R

n → R dos funciones suaves dadas. Sean M el conjunto de nivel deg con valor k y a un punto en D tal que g(a) = k. Si ∇g(a) 6= O y f tieneun extremo en a entonces existe un numero real λ tal que

∇f(a) = λ∇g(a).

Demostracion. Sea R(t) una trayectoria en M que pasa por a. EntoncesR(t0) = a para algun t = t0. Ademas se tendra que ∇g(a) es tangente a Men el punto a, en el sentido que

∇g(a) · R′(t0) = 0.

De otro lado si f restringida a M tiene un maximo en a, entonces la funcionen una variable f(R(t)) tiene un maximo en t = t0. Del calculo de funcionesde una variable se tiene que

d

dtf(R(t0)) = 0.

De la regla de la cadena,

d

dtf(R(t)) = ∇f(R(t)) · R′(t).

Por lo tanto, en t = t0 se tiene que

∇f(a) · R′(t0) = 0;

es decir, ∇f(a) tambien es perpendicular a M en a. Como el espacio tan-gente a M en a es una recta, entonces los vectores gradientes ∇f(a) y∇g(a) son paralelos. Como ∇g(a) 6= O, entonces ∇f(a) es multiplo escalarde ∇g(a).

Proposicion 3.26 (Criterio de la segunda derivada para extremos restringi-dos). Sean f, g : D ⊆ R

n → R dos funciones suaves dadas (con segundasderivadas parciales continuas al menos). Sean M el conjunto de nivel de gcon valor k y a un punto en D tal que g(a) = k. Supongamos que ∇g(a) 6= O

y

∇f(a) = λ0∇g(a)

para algun escalar λ0. Se define la funcion auxiliar h = f − λg en n + 1variables (λ, x) = (λ, x1, . . . , xn), y el punto x0 = (λ0, a) = (λ0, a1, . . . , an)

94 Julio C. Carrillo E. Para uso exclusivo en el salon de clase – UIS

Page 60: Carrillo Julio - calculo en Varias Variables

en su dominio. Sea |D2h(x0)| el hessiano de h, el cual esta dado como sigue:

0 −gx1−gx2

· · · −gxn

−gx1hx1x1

hx1x2· · · hx1xn

−gx2hx1x2

hx2x2· · · hx2xn

......

.... . .

...−gxn

hx1xnhxnx2

· · · hxnxn

Sean D2h(x0)k las submatrices diagonales de D2h(x0) de orden k ≥ 3.Entonces,

(a) Si los subdeterminantes |D2h(x0)k| son positivos para todo orden k ≥ 3entonces f restringida a M tiene un mınimo local en a.

(b) Si los subdeterminantes alternan los signos de la forma |D2h(x0)3| > 0,|D2h(x0)4| < 0, |D2h(x0)5| > 0, . . . entonces f restringida a M tieneun maximo local en a.

(c) Sea n = 2. Si |D2h(x0)| = 0 entonces el criterio no decide y f re-stringida a M puede tener un maximo local o un mınimo local en a oni una u otra cosa.

Sea n > 2. Si para k ≥ 3 alguno de los subdeterminantes |D2h(x0)k|es diferente de cero y no siguen los patrones anteriores entonces frestringida a M no tiene un mınimo local ni un maximo local en a;tendra un punto de silla en a.

Para uso exclusivo en el salon de clase – UIS Calculo en Varias Variables 95