“De que impressão é derivada aquela suposta ideia?”
Ensaio Sobre o Entendimento Humano, David Hume
Desde a Grécia antiga matemáticos tentavam resolver problemas onde a ideia de limite estava presente, mas não tinha sido organizada e formalizada. O método da exaustão, de Eudoxo, visava encontrar a área de um círculo, por exemplo, através de um polígono com cada vez mais lados. O problema da Quadratura do Círculo talvez tenha sido o primeiro a lidar com diferenças tão pequenas quanto se queira, no entanto, há uma grande discussão sobre finito e infinito na matemática grega. O salto intelectual de identificar o que acontece quando avaliamos o limite de uma função só apareceu com Newton e Leibniz no século 17.
Usando a Física como base para o problema, inicialmente Newton queria saber como podemos calcular a taxa instantânea de velocidade, ou seja, dada uma função $f(x)$ qualquer, que representa a variação de um corpo no espaço, de forma que $x=x(t)$, como a função está variando para um determinado $t$?
Newton descobriu que poderia usar retas secantes em um ponto $P=(x=a, f(a))$, que em nosso caso é uma reta que passa pelo ponto $P$ e é paralela ao gráfico neste ponto. Com isso, encontramos um novo ponto $Q=(x=b, f(b))$, que a linha também cruza e teremos a inclinação dessa reta:
$$ m_{PQ}=\frac{f(b)-f(a)}{b-a} $$Essa aproximação da inclinação pode ser muito ruim, dependendo da distância entre $P$ e $Q$. Porém, o que acontece quando movemos o ponto $Q$ até $P$? Imaginamos que $b\rightarrow a$ (dizemos: $b$ tende a $a$), ou seja, o valor de $b$ vai se aproximando cada vez mais de $a$, mas o denominador nunca pode ser zero pois a divisão seria indefinida. A reta vai se parecer cada vez mais com uma tangente, como queríamos, e sua equação será:
$$ f(b)=y=f(a)+m(b-a) $$Esse valor pode ser aproximado tanto quanto se queira, mas uma análise mais profunda revela uma ferramenta poderosa, que é o conceito de limite.
No problema da variação da posição de um objeto, ao analisarmos a velocidade média, não temos como saber como ela variou instantaneamente, ou seja, quando $t=t_1$, por exemplo. O que fizemos foi aplicar uma sequência de operações em dados coletados de tempos em tempos para obter um valor consolidado que não pode ser desagregado para identificar os momentos de maior variação. Porém, se utilizarmos a relação obtida anteriormente, podemos avaliar que:
$$ V.M. = \frac{\text{mudança na posição}}{\text{tempo decorrido}}=\\ = \frac{f(t)-f(a)}{t-a} $$que é a mesma equação que tínhamos. Para obter a velocidade instantânea, calculamos o que acontece que essa relação quando $t$ se aproxima de $a$.
O próximo passo é compreender que a diferença entre $b$ e $a$ que queríamos obter, pode ser escrita de outra forma. Como $b$ é variável, podemos chamá-la de $x$ e definimos que $x=a+h$, ou seja, estamos incrementando ou decrementando o valor de $x$ para chegarmos em $a$. Isso acontece porque $x$ pode estar em qualquer dos dois lados de $a$ (imaginando os números em uma reta, por exemplo). Disso, obtemos:
$$ \frac{f(x)-f(a)}{x-a}=\frac{f(a+h)-f(a)}{a+h-a}= \frac{f(a+h)-f(a)}{h} $$Que podemos reescrever, trocando $a$ por $x$:
$$ \frac{f(x+h)-f(x)}{h} $$Suponha que criemos uma tabela de valores quando vamos tomando o valor de $h$ cada vez menor. O que obtemos de resultado? Lembre-se que $h$ representa a diferença para aproximarmos $x$ de $a$. Esse processo é conhecido como tomar o limite da função e escrevemos como:
$$ \lim_{x \rightarrow a} f(x) $$Por exemplo, $\lim_{x\rightarrow 1} 2-2x^2=0$, onde neste caso podemos substituir $x$ por 1 porque não problemas de divisão por zero ou infinito.
O limite pode ou não existir. Por exemplo, se fizermos $\lim_{x\rightarrow 1^+}$ e $\lim_{x\rightarrow 1^-}$, ou seja, quando $x$ se aproxima de 1 pelo lado esquerdo (valores menores do que 1) e pelo lado direito (valores maiores do que 1) e obtemos um $L$ diferente em cada, o limite não existe. Por isso é obrigatório investigar sempre a vizinhança do ponto de interesse.
Dadas duas funções $f$, $g$ e uma constante qualquer $c$ temos as seguintes propriedades dos limites:
O teorema do sanduíche ou confronto (squeeze theorem) é útil quando temos três funções $f,h,g$, cujos valores para um determinado $x$ estão no intervalo $[a,b]$ temos:
$$ f(x)\leq h(x) \leq g(x) \\ \text{ ou } a \leq c \leq b $$De forma que, se $\lim_{x\rightarrow c}f(x)=\lim_{x\rightarrow c}g(x)=L$, então $\lim_{x\rightarrow c}h(x)=L$
Uma função $f(x)$ é dita contínua no ponto $x=a$ se
$$ \lim_{x\rightarrow a}f(x)=f(a) $$E $f(x)$ é dita contínua no intervalo $I=[a,b]$ caso seja contínua em cada ponto de $I$.
O teorema do valor intermediário nos diz que se uma função $f(x)$ é contínua no intervalo $I=[a,b]$ e há um número $M$ entre $f(a)$ e $f(b)$, então podemos encontrar um número $c$ tal que:
$$ a < c < b \\ f(c)=M $$Uma sequência é uma lista de números que estão dispostos em uma determinada ordem. A lista pode ter uma quantidade finita ou infinita de números. Se denotarmos o primeiro número como $a_1$ e defirmos uma regra para calcular o i-ésimo termo, escrito como $a_i$, podemos escrever uma sequência de n termos como
$$ \{ a_1, a_2, a_3, ..., a_i, a_{i+1}, a_{i+2}, ..., a_n \} \\ \text{ com } i < n $$Se a sequência possui infinitos termos, podemos escrevê-la como $\{ a_n \}_{n=1}^{\infty}$. É usual também escrever a sequência como uma função, por exemplo, $f(n)=(n+1)^{(n/2)}$.
Podemos usar a ideia de limite para sequências, da mesma forma que fizemos antes:
$$ \lim_{n\rightarrow \infty}a_n = L \\ \lim_{n\rightarrow \infty}a_n = \pm\infty \\ $$Propriedades de limites de sequências. Dadas duas sequências convergentes $\{ a_n \}$, $\{ b_n \}$ e $c$ uma constante:
Usando o conceito de limites de funções que vimos na seção anterior, podemos agora definir o que é uma derivada. Dada uma função $f(x)$, sua derivada, escrita como $f'(x)$ ou $dy/dx$, é dada por:
$$ f'(x)=\lim_{h\rightarrow 0} \frac{f(x+h)-f(x)}{h} $$ou seja, obtemos uma nova função $f'(x)$ quando calculamos a derivada de $f(x)$.
Uma função $f(x)$ é dita diferenciável em um ponto $x=a$ se $f'(x)$ existe. O mesmo ocorre para um intervalo, $f(x)$ é diferenciável em $I=[a,b]$ se $f'(x)$ existe em qualquer ponto de $I$.
Se $f(x)$ é diferenciável em $x=a$ então $f(x)$ é contínua em $x=a$.
Nossa avaliação inicial do problema de limites tinha como objetivo encontrar a taxa de variação de uma função qualquer. É importante dizer que para saber se $f(x)$ cresce ou decresce em determinado ponto, precisamos olhar a derivada, isto é, avaliamos o sinal de $f'(x)$ quando $x=a$. Podemos interpretar então a derivada como a inclinação da reta tangente no ponto avaliado.
Algumas propriedades de derivadas:
Algumas fórmulas importantes:
Quando temos duas funções $f(x)$ e $g(x)$ e temos uma multiplicação ou divisão entre elas, não podemos simplesmente assumir que as derivadas são como
$$ (f(x)\cdot g(x))'=f'(x)\cdot g'(x) \text{ ou } \\ (f(x)/g(x))'=f'(x)/g'(x) $$Isso vai levar a resultados incorretos. Para estes casos utilizados a regra do produto e a regra do quociente:
$$ (f(x)\cdot g(x))' = f'(x)\cdot g(x) + f(x)\cdot g'(x) \\ (f(x)/g(x))'= \frac{f'(x)\cdot g(x)-f(x)\cdot g'(x)}{[g(x)]^2} $$Quando temos uma composição de funções, utilizamos a regra da cadeia para calcular a derivada. Dadas $f(x)$ e $g(x)$, ambas diferenciáveis, se $F(x)=(f\circ g)(x)=f(g(x))$, então:
$$ F'(x)=f'(g(x))g'(x) $$Quando temos formas indeterminadas, como $0/0$, $\infty/\infty$, $1^{\infty}$, $0\cdot \pm \infty$, $0^0$, $\infty^0$ e $\infty - \infty$, podemos avaliar o limite com a chamada regra de L'Hospital. Um exemplo simples e muito útil é
$$ \lim_{x\rightarrow 0} \frac{sin(x)}{x} $$onde temos, se substituirmos $x=0$, a forma indeterminada $0/0$. Atacamos esse problema derivando numerador e denominador, ou seja:
No caso do exemplo de $sin(x)/x$, aplicando a regra, temos
$$ \lim_{x\rightarrow 0} \frac{sin(x)}{x}=\lim_{x\rightarrow 0} \frac{cos(x)}{1}=cos(0)=1 $$Quando analisamos uma curva $f(x)$ podemos classificar alguns pontos importantes para análise de seu comportamento, seja em um intervalo $I=[a,b]$ ou globalmente $]-\infty, \infty[$. Chamamos de pontos críticos aqueles cuja derivada não existe ou é 0, ou seja, quando $x=c$, $f'(c)=0$ ou $f'(c)=\nexists$. Para isso, $f(c)$ deve existir.
Podemos usar uma analogia para entender os máximos e mínimos de uma função. Imagine que você está em uma montanha russa, subindo. Ao chegar ao fim da subida, vamos passar por um pico, o carrinho vai ficar alinhado na horizontal, com relação ao chão, e depois começa a descer novamente. Isso pode ocorrer várias vezes, com picos maiores que os outros. Se guardamos a informação da altura, podemos decidir qual foi o maior pico que passamos. O maior pico é chamado de máximo global, enquanto os outros são máximos locais. O mesmo vale para os mínimos. Em formulação matemática, escrevemos:
Quando dizemos "no intervalo aberto em volta de um ponto", dizemos que existe um intervalo $I=[a,b]$ onde $c \in I$ é o maior ou menor valor que a função assume em $I$.
Podemos usar diferentes estratégias para encontrar os pontos críticos, máximos e mínimos. Uma delas é o método gráfico, onde desenhamos a curva da função e avaliamos os pontos. Porém, isso pode ser muito trabalhoso. Utilizar a derivada $f'(x)$ é muito mais prático. Se uma função $f(x)$ é contínua em um intervalo $I=[a,b]$, o teorema do valor extremo nos diz que existem dois números, $c,d$, tais que, $a\leq c$ e $d\leq b$, de forma que, $f(c)$ é um máximo absoluto e $f(d)$ é um mínimo absoluto da função. Esse teorema nos informa sobre a existência dos pontos de máximo e mínimo, mas não o local onde ocorrem. Se $f(x)$ é um ponto extremo quando $x=c$ e $f'(c)$ existe, então, $x=c$ é um ponto crítico. Teremos que $f'(c)=0$. Esse é o chamado teorema de Fermat.
Uma vez que encontramos os pontos candidatos, precisamos de algum método para classificá-los em máximos e mínimos, locais e globais. O primeiro passo é definir o intervalo que vamos trabalhar e avaliar se a função $f(x)$ é contínua nele. Encontramos os pontos críticos fazendo $f'(x)=0$ e depois calculamos a função $f(x)$ nesses pontos. Os valores desse cálculo vão determinar os máximos e mínimos.
Entretanto, há ainda outro método importante para utilizarmos. A primeira derivada também nos informa, como vimos anteriormente, se a função está crescendo ou decrescendo, ou seja, podemos utilizá-la para dizer se um determinado ponto $x=c$ é um pico ou vale. Em outras palavras:
A derivada muda de sinal em pontos críticos. Disso escrevemos:
Também podemos utilizar a segunda derivada para analisar a concavidade da função, isto é, como a reta tangente em um ponto do intervalo $I$ está abaixo ou acima da curva da função. Dizemos que $f(x)$ tem concavidade para cima se no intervalo $I$ todas as retas tangentes à curva em $I$ estão abaixo do gráfico e, dizemos que tem concavidade para baixo, se as retas tangentes estão acima do gráfico em $I$. Um ponto de inflexão, $x=c$ ocorre quando há mudança de concavidade. Essa explicação está relacionada com a segunda derivada da seguinte forma:
Pontos de inflexão vão ocorrer quando a segunda derivada mudar de sinal, ou seja, vamos encontrá-los calculando $f''(x)=0$. Avaliando a segunda derivada na vizinhança de $x=c$, onde $f'(c)=0$, temos:
Suponha que temos uma função $f(x)$ cujas $n+1$ derivadas existem e são contínuas em um intervalo na vizinhança do ponto $x=0$. O polinômio de Taylor nos permite aproximar essa função por um polinômio de grau $n$, $P_n(x)$. Montamos esse polinômio por partes. Por exemplo, $P_0(x)=f(0)$, o que nos dá o valor de $f(0)$ corretamente. Agora incrementamos com a primeira derivada:
$$ P_1(x)=f(0)+f'(0)x $$ E prosseguimos assim até a n-ésima derivada: $$ P_n(x)=f(0)+f'(0)x+\frac{f''(0)}{2!}x^2+...+\frac{f^{n}(0)}{n!}x^n $$Que é o polinômio de Taylor de ordem $n$ centrado em 0 (ou série de Maclaurin).
De forma genérica, podemos escrever o polinômio com centro em outro valor (diferente de zero), da seguinte forma:
$$ \sum_{k=0}^n \frac{f^{(k)}(a)}{k!}(x-a)^k $$Que aproximar a função $f(x)$ próximo do valor de $a$.
O teorema de Taylor nos diz que a função $f(x)$ pode ser escrita como:
$$ f(x)=P_n(x)+R_{n+1}(x) $$onde $R_{n+1}(x)$ é um termo de erro que é escrito como
$$ R_{n+1}(x)=\frac{f^{(n+1)}(c)}{(n+1)!}(x-a)^{n+1} $$Para algum $c$ entre $a$ e $x$.
Seja $f(x)$ uma função com $n$ derivadas existentes e contínuas em um intervalo que queremos avaliar uma solução, por exemplo, $f(x)=a$. Suponha que nosso chute para $a$ seja $x_0$, mas que aproximação ainda não é boa o suficiente. Utilizando a fórmula da reta tangente, podemos calcular um novo ponto, onde essa reta cruza o eixo $x$, ou seja, o ponto $P=(x_1,0)$
$$ y=f(x_0)+f'(x_0)(x-x_0) \\ 0=f(x_0)+f'(x_0)(x_1-x_0) \\ x_1=x_0-\frac{f(x_0)}{f'(x_0)} $$Se fizermos essa conta novamente, para o próximo ponto $x_2$, vamos encontrar uma relação de recorrência que pode ser escrita da seguinte forma:
$$ x_{n+1}=x_n-\frac{f(x_n)}{f'(x_n)} $$Sendo que $f'(x_n)\ne 0$. Este é o método de Newton. Se utilizarmos $a=0$, podemos encontrar os pontos críticos e daí achar os máximos e mínimos de $f(x)$.
Quando tínhamos uma função $f(x)$, um polinômio por exemplo, sua derivada $f'(x)$ podia ser obtida por regras simples de manipulação do expoente e o coficiente que acompanham a variável $x$. Será que poderíamos fazer o processo inverso, ou seja, obter $f(x)$ com base em $f'(x)$? Claro, basta lembrar da regra utilizada e invertê-la. Por exemplo, se $f'(x)=2x$, sabemos que o dois era expoente de $x$, pela regra, $x^n \rightarrow n\cdot x^{n-1}$. Logo, a função que buscamos é $F(x)=x^2$. Repare que escrevemos o $F$ maiúsculo para diferenciar o processo, da derivada para a função. Essa nova função é chamada de anti-derivada.
Esse processo que fizemos pode ser escrito de uma maneira apropriada, onde utilizamos o nome "integral indefinida" e usamos um símbolo para indicar o que devemos fazer:
$$ \int f(x) dx = F(x)+c, \text{ onde c é constante.} $$onde queremos encontrar a anti-derivada (ou calcular a integral ou integrar) da função $f(x)$. Queremos obter a função $F(x)$ que quando derivada gera $f(x)$.
Propriedades básicas da integração:
No primeiro caso que vimos, $f(x)=2x$, teríamos
$$ \int f(x) dx = \int 2x dx= 2\int x dx = 2 [\frac{x^2}{2}] = x^2 $$O dois apareceu no denominador para poder cancelar o dois do numerador, que é a regra de integração de polinômio $x^n \rightarrow \frac{x^{n+1}}{n+1} + c, \text{ com } n\ne -1$. O $c$ é uma constante que sempre aparece porque a derivada de uma constante é 0, então temos infinitas possibilidade da função $F(x)$.
Existem diversas regras de integração para os diferentes tipos de função. Veja a referência [3]
Quando um ou ambos os limites de integração são infinitos, temos uma integral imprópria. Nesses casos, renomeamos o limite infinito com outra variável, calculamos a integração e depois aplicamos o limite quando essa variável tender ao infinito. Por exemplo, calcule $\int_1^\infty \frac{1}{x^2}dx$
$$ A_t=\int_1^t \frac{1}{x^2}dx=-\frac{1}{x}|_1^t=1-1/t \\ A=\lim_{t\rightarrow \infty} (1-1/t)=1 \\ \int_1^\infty \frac{1}{x^2}dx = 1 $$Uma integral imprópria é dita convergente se o limite existe e divergente caso contrário.
Em alguns casos, quando temos composição de funções no integrando, podemos utilizar a regra da substituição para calcular a integral de $f(g(x))$. Por exemplo,
$$ \int 18x^2\sqrt[4]{6x^3+5}dx $$Se analisarmos os termos dentro da raiz quarta, podemos notar que a derivada de $6x^3+5$ é $18x^2$, exatamente o termo multiplicando a raiz. Vamos chamar $u=6x^3+5$ e, derivando, temos $du=18x^2dx \rightarrow dx=du/18x^2$:
$$ \int \frac{18x^2\sqrt[4]{u}}{18x^2}du=\int \sqrt[4]{u}du = \\ = \frac{4}{5}u^{5/4}+c=\frac{4}{5}(6x^3+5)^{5/4}+c $$o que transformou o problema em algo muito mais fácil de resolver. A regra de substituição é definida então por:
$$ \int f(g(x))g'(x)dx = \int f(u)du, \text{ onde } u=g(x) $$Quando temos duas funções $u(x)$ e $v(x)$ sendo multiplicadas no integrando, podemos aplicar a regra de integração por partes para tentar resolver o problema. Para isso, precisamos identificar que $v(x)$ é a derivada de alguma outra função (o mesmo também valeria se usassemos $u(x)$), ou seja, vamos chamá-la de $v'(x)$. Teríamos o seguinte:
$$ \int u(x)v'(x) dx = u(x)v(x)-\int u'(x)v(x) dx $$A integração por substituição trigonométrica é muito útil quando conseguimos identificar certos padrões no integrando. Utilizando a relação $sin^2\theta + cos^2\theta=1$, podemos resolver a seguinte integral:
$$ \int \frac{dx}{\sqrt{a^2-x^2}} dx $$Fazendo $x=asin(\theta)$ e $dx=acos(\theta)d\theta$, encontramos que $\theta=arcsin(\frac{x}{a}):$
$$ \int \frac{acos(\theta)}{\sqrt{a^2-a^2sin^2\theta}}d\theta = \\ = \int \frac{acos\theta}{\sqrt{a^2(1-sin^2\theta)}}d\theta \\ = \int \frac{acos\theta}{\sqrt{a^2cos^2\theta}}d\theta = \\ = \int d\theta = \theta+C= \\ arcsin(x/a)+C $$O mesmo padrão pode ser observando quando usamos $1+tan^2\theta=sec^2\theta$ e o integrando contém um termo do tipo $\frac{1}{a^2+x^2}$. Caso o integrando tenha $1/(x^2-a^2)$ podemos utilizar a relação $sec^2\theta-1=tan^2\theta$. O mesmo pode ser feito com a relação $cosh^2(x)-sinh^2(x)=1$ e também $sinh^{-1}(x)=ln(x+\sqrt{x^2+1})$ no caso de notarmos $1/(\sqrt{a^2+x^2})$.
Já vimos algumas situações onde podemos substituir o integrando por outra expressão que facilite o processo de integração. Porém, há mais casos possíveis que não se encaixam nessa estratégia. Quando temos uma função do tipo $f(x)=\frac{P(x)}{Q(x)}$ onde não conseguimos uma expressão para escrever o numerador ou denominador como derivada do outro, podemos utilizar a regra de frações parciais para tentar resolver o problema. Ela consiste em reescrever a fração entre $P(x)$ e $Q(x)$ de forma que obtemos um integrando mais fácil do que se tinha anteriormente.
Para isso, $P(x)$ deve ter um grau polinomial menor do que $Q(x)$, de forma que podemos fatorar $Q(x)$ para obter somas de frações. O caso mais geral é dado abaixo:
$$ \frac{1}{(ax^2+bx+c)^k}=\frac{A_1x+B_1}{ax^2+bx+c}+\frac{A_2x+B_2}{(ax^2+bx+c)^2} + ... + \frac{A_kx+B_k}{(ax^2+bx+c)^k} $$O primeiro passo é decompor o polinômio do denominador. Por exemplo, se queremos integrar $\frac{3x+11}{x^2-x-6}$, podemos escrever o denominador como $x^2-x-6=(x-3)(x+2)$. Disso, escrevemos a fração parcial:
$$ \frac{3x+11}{x^2-x-6}=\frac{A}{x-3}+\frac{B}{x+2} $$Agora podemos deixar os denominadores iguais dos dois lados para obter a seguinte equação:
$$ 3x+11=A(x+2)+B(x-3) $$Resolvendo esse sistema, usando os valores que zeram os coeficientes das constantes ($x=-2$ e $x=3$), obtemos que $B=-1$ e $A=4$, de forma que a integral será:
$$ \int \frac{3x+11}{x^2-x-6} dx = \int \frac{4}{x-3}dx - \int \frac{1}{x+2} dx $$No caso em que $P(x)$ tem grau polinomal maior ou igual à $Q(x)$, devemos utilizar a divisão de polinômios para obter uma nova expressão para integrar.
Quando temos uma integral definida que não pode ser calculada de forma analítica, utilizamos métodos de aproximação para obter seu valor. Por exemplo, sabemos que a integral $\int_0^2 e^{x^2} dx$ não pode ser resolvida, mas estimada.
A regra do ponto médio é um tipo de aproximação que subdivide o intervalo de integração de partes iguais, ou seja, dado $[a,b]$, cada intervalo será $\Delta x=\frac{b-a}{n}$, onde para cada subintervalo tomamos o ponto médio. Definido o valor de $n$, a integral ficará
$$ \int_a^b f(x)dx \sim \Delta xf(x_1^*)+\Delta xf(x_2^*)+...+\Delta xf(x_n^*)=\\ \Delta x[f(x_1^*)+f(x_2^*)+...+f(x_n^*)] $$A regra do Trapézio também é utilizada para aproximar a área embaixo de uma curva. Da mesma forma que prosseguimos anteriormente, tomamos um valor de $n$ para subdividir o intervalo de integração, ou seja, $\Delta x=\frac{b-a}{n}$, onde cada subintervalo agora é redefinido como $[x_{i-1}, x_i]$. Calculamos cada área com a seguinte fórmula:
$$ A_i = \frac{\Delta x}{2}(f(x_{i-1})+f(x_i)) $$Procedendo assim para cada subintervalo, obtendo:
$$ \int_a^b f(x)dx \sim \frac{\Delta x}{2} [f(x_0)+2f(x_1)+2f(x_2)+...+2f(x_{n-1})+f(x_n)] $$Quando temos um $n$ par e cada intervalo no mesmo formato anterior, ou seja, $\Delta x=\frac{b-a}{n}$, aproximamos a curva que limita a área com uma função quadrática. Cada aproximação vai cobrir dois subintervalos, daí o motivo de ter um $n$ par. A área aproximada será calculada da seguinte forma:
$$ A_i=\frac{\Delta x}{3}(f(x_{i-1})+4f(x_i)+f(x_{i+1})) $$A integral pode ser escrita então como
$$ \int_a^b f(x)dx\sim \frac{\Delta x}{3}[f(x_0)+4f(x_1)+2f(x_2)+...+2f(x_{n-2})+4f(x_{n-1})+f(x_n)] $$Sempre que aproximamos uma integral temos que tentar estimar o erro, quando é possível comparar com a solução exata. Definindo $E_M, E_T$ e $E_S$ como os erros do método do ponto médio, trapézio e Simpsons, respectivamente, calculamos:
$$ |E_M|\leq \frac{K(b-a)^3}{24n^2} \\ |E_T|\leq \frac{K(b-a)^3}{12n^2} \\ |E_S|\leq \frac{K(b-a)^5}{180n^4} \\ $$Nos dois primeiros casos, assume-se uma cota $|f''(x)|\leq K$ no intervalo. Para a regra de Simpson, usa-se uma cota para a quarta derivada, isto é, $|f^{(4)}(x)|\leq M$, para $a\leq x\leq b$.
Quando passamos de funções de uma variável para funções de várias variáveis, deixamos de estudar curvas no plano e passamos a estudar superfícies, volumes e, de modo mais geral, objetos definidos em espaços de dimensão maior. Uma função como $f(x,y)$ associa a cada par ordenado $(x,y)$ um número real; geometricamente, esse valor pode ser visto como a altura de uma superfície sobre o plano $xy$.
A noção de limite continua central. Dizemos que $\lim_{(x,y)\rightarrow (a,b)} f(x,y)=L$ quando os valores de $f(x,y)$ podem ser tornados arbitrariamente próximos de $L$ à medida que o ponto $(x,y)$ se aproxima de $(a,b)$ por qualquer caminho no domínio. Essa exigência é mais forte do que no caso de uma variável, porque agora há infinitas direções possíveis de aproximação.
Uma função de várias variáveis é contínua em $(a,b)$ quando o limite existe e coincide com o valor da própria função naquele ponto, isto é, quando
$$ \lim_{(x,y)\rightarrow (a,b)} f(x,y)=f(a,b). $$Já a diferenciabilidade envolve a existência de uma boa aproximação linear da função em uma vizinhança do ponto. Intuitivamente, em vez de aproximarmos o gráfico por uma reta tangente, aproximamos a superfície por um plano tangente. Quando essa aproximação existe, a função é diferenciável no ponto e, em particular, é contínua nele.
Para funções de várias variáveis, cada variável pode variar independentemente das demais. Por isso, definimos as derivadas parciais, que medem a taxa de variação da função quando alteramos uma variável e mantemos as outras fixas. Para $f(x,y)$, temos:
$$ \frac{\partial f}{\partial x}(x,y) \qquad \text{e} \qquad \frac{\partial f}{\partial y}(x,y). $$O gradiente de $f$ é o vetor formado por todas as derivadas parciais de primeira ordem:
$$ \nabla f(x,y)=\left(\frac{\partial f}{\partial x}(x,y), \frac{\partial f}{\partial y}(x,y)\right). $$Geometricamente, o gradiente aponta na direção de crescimento mais rápido da função, e seu módulo indica a intensidade local dessa variação. Além disso, ele é ortogonal às curvas de nível $f(x,y)=c$, pois nessas curvas o valor da função permanece constante.
Em aplicações, o gradiente aparece em otimização, física, aprendizado de máquina e geometria diferencial, pois resume em um único vetor a informação local mais importante sobre como a função varia nas diferentes direções.
Em funções de várias variáveis, máximos e mínimos locais são definidos de forma análoga ao caso de uma variável. Dizemos que $f(x,y)$ tem um máximo local em $(a,b)$ se, em uma vizinhança desse ponto, o valor $f(a,b)$ é maior ou igual aos demais valores da função. A definição de mínimo local é análoga.
Os candidatos a pontos de extremo são chamados pontos críticos. Para funções diferenciáveis, eles costumam ser encontrados resolvendo o sistema
$$ \frac{\partial f}{\partial x}(a,b)=0, \qquad \frac{\partial f}{\partial y}(a,b)=0. $$Depois de localizar os pontos críticos, precisamos classificá-los. Um critério comum usa as derivadas parciais de segunda ordem. Para $f(x,y)$, definimos
$$ D=f_{xx}(a,b)f_{yy}(a,b)-[f_{xy}(a,b)]^2. $$O ponto de sela merece destaque: nele a função não é nem máximo nem mínimo, embora as derivadas parciais se anulem. Esse tipo de comportamento é comum em superfícies que sobem em uma direção e descem em outra.
Nem sempre queremos maximizar ou minimizar uma função em todo o domínio. Muitas vezes o problema vem acompanhado de uma restrição, como $g(x,y)=c$. Nesses casos, procuramos extremos condicionados, isto é, valores máximos ou mínimos de $f(x,y)$ sujeitos à condição imposta.
O método dos multiplicadores de Lagrange fornece uma forma elegante de tratar esse problema. A ideia é que, em um ponto extremo sujeito à restrição, o gradiente de $f$ deve ser paralelo ao gradiente de $g$. Assim, procuramos soluções do sistema
$$ \nabla f(x,y)=\lambda \nabla g(x,y), \qquad g(x,y)=c, $$onde $\lambda$ é o multiplicador de Lagrange.
Depois de resolver o sistema, avaliamos a função objetivo nos pontos candidatos para identificar máximos e mínimos. O método se generaliza para mais variáveis e mais restrições, sendo muito importante em otimização, economia, física e engenharia.
Transformações são funções que levam pontos de um espaço em pontos de outro espaço. Em cálculo multivariável, frequentemente estudamos aplicações do tipo $T(u,v)=(x(u,v),y(u,v))$, que mudam a forma como descrevemos uma região do plano ou do espaço.
Essas transformações podem representar rotações, translações, escalas, cisalhamentos ou mudanças mais gerais de coordenadas. Elas são úteis porque certos problemas se tornam muito mais simples quando descritos em um sistema apropriado. Por exemplo, regiões circulares costumam ser mais bem tratadas em coordenadas polares do que em coordenadas cartesianas.
Ao trabalhar com transformações, é importante analisar se elas são invertíveis localmente, como deformam comprimentos, áreas e volumes, e de que modo alteram a expressão das funções e integrais envolvidas.
A matriz jacobiana reúne as derivadas parciais de uma transformação vetorial. Se $T(u,v)=(x(u,v),y(u,v))$, sua matriz jacobiana é dada por
$$ J_T(u,v)= \begin{pmatrix} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{pmatrix}. $$O determinante dessa matriz, chamado jacobiano, mede a variação local de área produzida pela transformação. Em duas dimensões, $|\det(J_T)|$ indica o fator pelo qual pequenos elementos de área são ampliados, comprimidos ou invertidos.
Esse objeto é fundamental em mudanças de variáveis em integrais múltiplas, no estudo local de transformações e em resultados como o teorema da função inversa.
O teorema da função inversa estabelece condições sob as quais uma transformação diferenciável possui inversa localmente diferenciável. Intuitivamente, ele nos diz quando uma aplicação não "amassa" o espaço em torno de um ponto e, portanto, pode ser revertida em uma vizinhança desse ponto.
No caso de uma transformação $T:\mathbb{R}^n\rightarrow\mathbb{R}^n$, uma condição central é que a matriz jacobiana no ponto considerado seja inversível, ou seja, tenha determinante diferente de zero. Quando isso acontece, existe uma vizinhança na qual $T$ admite inversa, e essa inversa também é diferenciável.
Esse resultado é importante porque justifica diversas mudanças de coordenadas e ajuda a entender quando relações entre variáveis podem ser resolvidas localmente em sentido reverso.
Nem toda relação entre duas variáveis aparece explicitamente na forma $y=f(x)$. Em muitos casos, temos uma equação envolvendo $x$ e $y$ ao mesmo tempo, e ainda assim podemos calcular $dy/dx$ tratando $y$ como função implícita de $x$. Esse procedimento é chamado diferenciação implícita.
Suponha, por exemplo, a equação
$$ x^3+y^3=8. $$Derivando ambos os lados com respeito a $x$, obtemos:
$$ \frac{d}{dx}(x^3+y^3)=\frac{d}{dx}(8)\\ 3x^2+3y^2\frac{dy}{dx}=0\\ \frac{dy}{dx}=-\frac{x^2}{y^2}. $$Um segundo exemplo é dado por
$$ x^2+2xy+y^2=5. $$Derivando termo a termo e aplicando a regra do produto em $2xy$, temos:
$$ \frac{d}{dx}(x^2+2xy+y^2)=\frac{d}{dx}(5)\\ 2x+2\left(x\frac{dy}{dx}+y\right)+2y\frac{dy}{dx}=0\\ 2x+2y+2x\frac{dy}{dx}+2y\frac{dy}{dx}=0\\ (2x+2y)\frac{dy}{dx}=-(2x+2y)\\ \frac{dy}{dx}=-1, $$desde que $x+y\neq 0$. A diferenciação implícita é muito útil em curvas definidas por equações, superfícies de nível e problemas geométricos em geral.
A integração de funções de várias variáveis generaliza a ideia de área acumulada para áreas, volumes, massas e outras grandezas distribuídas em regiões do plano ou do espaço. Para uma função $f(x,y)$ definida em uma região $R$, a integral dupla
$$ \iint_R f(x,y)\,dA $$pode representar, por exemplo, o volume sob a superfície $z=f(x,y)$ sobre a região $R$, desde que a função seja não negativa.
Na prática, integrais duplas e triplas costumam ser calculadas como integrais iteradas, isto é, integrando uma variável por vez. Esse procedimento é formalizado pelo teorema de Fubini, que permite escrever, em condições adequadas,
$$ \iint_R f(x,y)\,dA= \int_a^b\int_{g_1(x)}^{g_2(x)} f(x,y)\,dy\,dx $$ou em ordem inversa, dependendo da descrição da região.
Além de cálculo de volume, essas integrais aparecem em centro de massa, probabilidade, campos escalares e problemas físicos envolvendo densidade distribuída.
Muitas integrais múltiplas tornam-se mais simples quando trocamos o sistema de coordenadas. Em duas dimensões, um caso clássico é a passagem de coordenadas cartesianas $(x,y)$ para coordenadas polares $(r,\theta)$, dadas por
$$ x=r\cos\theta, \qquad y=r\sin\theta. $$Nessa mudança, o elemento de área não permanece simplesmente $dr\,d\theta$. A deformação geométrica introduzida pela transformação é capturada pelo jacobiano, e obtemos
$$ dA = r\,dr\,d\theta. $$De forma geral, ao mudar variáveis em uma integral múltipla, devemos transformar tanto a região de integração quanto o elemento diferencial, multiplicando pelo valor absoluto do determinante jacobiano. Em três dimensões, aparecem também coordenadas cilíndricas e esféricas, especialmente úteis em problemas com simetria radial.
Integrais de linha permitem integrar uma função ao longo de uma curva, e não sobre um intervalo reto ou sobre uma região bidimensional. Se a curva $C$ é parametrizada por $\mathbf{r}(t)$, com $a\leq t\leq b$, então uma integral de linha escalar pode ser escrita como
$$ \int_C f\,ds. $$Esse tipo de integral aparece, por exemplo, quando queremos calcular a massa de um fio cuja densidade varia ao longo do comprimento. Já no caso de campos vetoriais, a integral de linha
$$ \int_C \mathbf{F}\cdot d\mathbf{r} $$está associada a grandezas como trabalho realizado por uma força ao longo de uma trajetória. Nessas situações, a orientação da curva passa a ser relevante.
Integrais de linha conectam cálculo, geometria e física, e servem como base para resultados mais avançados, como os teoremas de Green, Stokes e da divergência.
Referências: