高等数学(二)导数与微分1

三、导数与微分

3.1 导数的定义

定义:设函数\(f(x)\)\(x_0\)的某邻域内有定义,如果极限 \[ \lim\limits_{\Delta x\to0}\frac{\Delta y}{\Delta x}=\lim\limits_{\Delta x\to0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x} \] 存在,则称\(f(x)\)在点\(x_0\)处可导,并称此极限值为\(f(x)\)在点\(x_0\)处的导数。

我们对导数太熟悉了,以至于忘记了导数最原本的定义。只需要函数在一个点的邻域有定义,并且应变量的增量\(\Delta y\)和自变量的增量\(\Delta x\)的比值的极限存在,那么这点就可导,与函数是否在邻域连续什么的都无关。

举一个极端的例子,设\(D(x)\)狄利克雷函数\(f(x)=x^2D(x)\),在\(x=0\)的邻域内有定义,虽然\(f(x)\)\(x=0\)的去心邻域内处处不连续,但 \[ f'(0)=\lim\limits_{x\to0}\frac{f(x)-f(0)}{x-0}=\lim\limits_{x\to0}\frac{x^2D(x)}{x}=\lim\limits_{x\to0}xD(x)=0 \] 所以\(f(x)\)\(x=0\)处导数存在,并不是像感觉的那样因为处处间断就没有导数。这个例子非常特殊,值得记住。

3.2 导数的性质

可导与连续的关系学过高中数学的都很清楚,这里还是再唠叨一下为什么可导一定连续。如果函数\(f(x)\)在点\(x\)处可导,则\(\lim\limits_{\Delta x\to0}\frac{\Delta y}{\Delta x}=f'(x)\),所以\(\Delta y=f'(x)\Delta x+\alpha\Delta x\),当\(\Delta x\to0\)时,\(\Delta y\to0\),所以在这一点连续。但连续函数在某一点可能导数不存在(\(y=\sqrt[3]{x}\)\(0\)处导数无穷大)或左右导数不相等(绝对值函数),所以连续不一定可导。

下面列出了连续和可导有关的一些结论,内容可能过于啰嗦,但我认为这些都是基础且重要的,可能高等数学学得懵里懵懂就是从忽视这些细节开始的,所以请静下心来理解这些内容,所谓行稳致远如是而已。

\[\begin{align} f(x)在x_0连续\Rightarrow& \begin{cases} f(x)在x_0邻域内有定义 &✔\\[2mm] \lim\limits_{x\to x_0}f(x)=f(x_0) &✔\\[2mm] f(x)在x_0邻域内连续 &❌\\[2mm] f(x)在x_0可导 &❌ \end{cases} \\[5mm] f(x)在x_0某邻域U_\delta(x_0)内连续\Rightarrow& \begin{cases} f(x)在U_\delta(x_0)邻域内有定义 &✔\\[2mm] f(x)在U_\delta(x_0)邻域内处处连续 &✔\\[2mm] f(x)在x_0可导 &❌ \end{cases} \\[5mm] f(x)在x_0某去心邻域\mathring{U}_\delta(x_0)内连续\Rightarrow& \begin{cases} f(x)在去心邻域\mathring{U}_\delta(x_0)内有定义 &✔\\[2mm] f(x)在去心邻域\mathring{U}_\delta(x_0)内处处连续 &✔\\[2mm] f(x)在x_0极限存在 &❌\\[2mm] f(x)在x_0可导 &❌ \end{cases} \\[5mm] f(x)在x_0可导\Rightarrow& \begin{cases} f'(x)在x_0有定义 &✔\\[2mm] f(x)在x_0连续 &✔\\[2mm] f(x)在x_0邻域内连续 &❌\\[2mm] f(x)在x_0邻域内可导 &❌ \end{cases} \\[5mm] f(x)在x_0某邻域U_\delta(x_0)内可导\Rightarrow& \begin{cases} f(x)在U_\delta(x_0)内有定义 &✔\\[2mm] f(x)在U_\delta(x_0)内连续 &✔\\[2mm] f'(x)在U_\delta(x_0)内有定义 &✔\\[2mm] f'(x)在U_\delta(x_0)内连续 &❌ \end{cases} \\[5mm] f(x)在x_0某去心邻域\mathring{U}_\delta(x_0)内可导\Rightarrow& \begin{cases} f(x)在\mathring{U}_\delta(x_0)内有定义 &✔\\[2mm] f(x)在\mathring{U}_\delta(x_0)内连续 &✔\\[2mm] f'(x)在\mathring{U}_\delta(x_0)内有定义 &✔\\[2mm] f'(x)在\mathring{U}_\delta(x_0)内连续 &❌\\[2mm] f(x)在x_0有定义 &❌\\[2mm] f(x)在x_0连续 &❌\\[2mm] f'(x)在x_0有定义 &❌\\[2mm] \end{cases} \\[5mm] f(x)在x_0二阶可导\Rightarrow& \begin{cases} f''(x)在U_\delta(x_0)内有定义 &❌\\[2mm] f''(x)在U_\delta(x_0)内连续 &❌\\[2mm] f''(x)在U_\delta(x_0)内可导 &❌\\[2mm] f''(x)在x_0有定义 &✔\\[2mm] f''(x)在x_0连续 &❌\\[2mm] f''(x)在x_0可导 &❌\\[2mm] f'(x)在U_\delta(x_0)内有定义 &✔\\[2mm] f'(x)在U_\delta(x_0)内连续 &❌\\[2mm] f'(x)在U_\delta(x_0)内可导 &❌\\[2mm] f'(x)在x_0有定义 &✔\\[2mm] f'(x)在x_0连续 &✔\\[2mm] f'(x)在x_0可导 &✔\\[2mm] f(x)在U_\delta(x_0)内有定义 &✔\\[2mm] f(x)在U_\delta(x_0)内连续 &✔\\[2mm] f(x)在U_\delta(x_0)内可导 &✔\\[2mm] f(x)在x_0有定义 &✔\\[2mm] f(x)在x_0连续 &✔\\[2mm] f(x)在x_0可导 &✔\\[2mm] \end{cases} \\[5mm] f(x)在x_0某邻域U_\delta(x_0)内二阶可导\Rightarrow& \begin{cases} f''(x)在U_\delta(x_0)内有定义 &✔\\[2mm] f''(x)在U_\delta(x_0)内连续 &❌\\[2mm] f''(x)在U_\delta(x_0)内可导 &❌\\[2mm] f''(x)在x_0有定义 &✔\\[2mm] f''(x)在x_0连续 &❌\\[2mm] f''(x)在x_0可导 &❌\\[2mm] f'(x)在U_\delta(x_0)内有定义 &✔\\[2mm] f'(x)在U_\delta(x_0)内连续 &✔\\[2mm] f'(x)在U_\delta(x_0)内可导 &✔\\[2mm] f'(x)在x_0有定义 &✔\\[2mm] f'(x)在x_0连续 &✔\\[2mm] f'(x)在x_0可导 &✔\\[2mm] f(x)在U_\delta(x_0)内有定义 &✔\\[2mm] f(x)在U_\delta(x_0)内连续 &✔\\[2mm] f(x)在U_\delta(x_0)内可导 &✔\\[2mm] f(x)在x_0有定义 &✔\\[2mm] f(x)在x_0连续 &✔\\[2mm] f(x)在x_0可导 &✔\\[2mm] \end{cases} \\[5mm] f(x)在x_0某去心邻域\mathring{U}_\delta(x_0)内二阶可导\Rightarrow& \begin{cases} f''(x)在\mathring{U}_\delta(x_0)内有定义 &✔\\[2mm] f''(x)在\mathring{U}_\delta(x_0)内连续 &❌\\[2mm] f''(x)在\mathring{U}_\delta(x_0)内可导 &❌\\[2mm] f''(x)在x_0有定义 &❌\\[2mm] f''(x)在x_0连续 &❌\\[2mm] f''(x)在x_0可导 &❌\\[2mm] f'(x)在\mathring{U}_\delta(x_0)内有定义 &✔\\[2mm] f'(x)在\mathring{U}_\delta(x_0)内连续 &✔\\[2mm] f'(x)在\mathring{U}_\delta(x_0)内可导 &✔\\[2mm] f'(x)在x_0有定义 &❌\\[2mm] f'(x)在x_0连续 &❌\\[2mm] f'(x)在x_0可导 &❌\\[2mm] f(x)在\mathring{U}_\delta(x_0)内有定义 &✔\\[2mm] f(x)在\mathring{U}_\delta(x_0)内连续 &✔\\[2mm] f(x)在\mathring{U}_\delta(x_0)内可导 &✔\\[2mm] f(x)在x_0有定义 &❌\\[2mm] f(x)在x_0连续 &❌\\[2mm] f(x)在x_0可导 &❌\\[2mm] \end{cases} \end{align}\]

3.3 导数的计算

虽然教材上先学的是导数,但使用微分会使理解更加形象,微分就是很小的一个增量,使用它可以方便地与几何联系起来。

3.3.1 常用导数公式推导

幂函数

求导公式大家都很熟悉 \[ (x^\mu)'=\mu x^{\mu-1} \] 但怎么直观地理解前面的系数\(\mu\)?下面就通过两个简单的例子建立起这种直观印象。

\(x^2\)的增量中,主要部分是两个长条的矩形,右下角的正方形随着\(dx\)的减小,其占增量的比例会越来越趋于零,所以微分是\(2xdx\)

\(x^3\)的增量中,主要部分是三个正方形的面,而其余部分的占比也会随着\(dx\)的减小而趋于零,因此微分是\(3x^2dx\)

推广到更高阶的情况,将\((x+dx)^\mu\)进行二项式展开,除第一项\(x^\mu\)以外,最高次项的系数为\(\mu\),而其他次数的项都可以忽略,因此系数就是\(\mu\)

包括指数为负数(\(x^{-1}\))和分数(\(\sqrt{x}\))的情况也同样可以通过观察面积的变化量来得出求导公式,都不难,留给读者自行思考。


三角函数

其实单从图像形状上理解,\(\sin(x)\)的导数确实应该和\(\cos(x)\)长得很像,因为都是周期型的波函数,并且在特殊点上的导数也对应得很好,但为什么\(\sin(x)\)的导数就恰好是\(\cos(x)\)呢,而不是乘了一个系数什么。

通过上图的微分就可以很好的说明,\(d\theta\)即弧长的增量(单位圆半径为1,角度等于弧长),\(d(\sin(\theta))\)即图中垂直的那部分,这两边的夹角为\(\theta\)可以由相似得出。所以\(\frac{d(\sin(\theta))}{d\theta}\)恰好就是\(\cos(\theta)\),这样来看\(\sin(x)\)的导数就恰好是\(\cos(x)\)​,一目了然。


指数函数 \[ (a^x)'=a^x\ln a \]

指数函数的求导公式中最让人疑惑的就是系数\(\ln a\)了,为什么会多这么一个系数?从导数的定义中看: \[ (a^x)'=\lim\limits_{t\to 0}\frac{a^{x+t}-a^x}{t}=\lim\limits_{t\to 0}a^x(\frac{a^{t}-1}{t}) \] 指数函数最神奇的一点就是可以将指数的加法拆成乘法,因此就能提出\(a^x\)。而如果用计算器将一个很小的数代入\(t\)的话,会发现\(\lim\limits_{t\to 0}\frac{a^t-1}{t}\)趋近于一个常数,也就是说它是有极限的,下面就来求这个极限。

\(a^t-1=k\),当\(t\to 0\)时,\(k\to 0\) \[ \begin{align} \lim\limits_{t\to 0}\frac{a^t-1}{t}&=\lim\limits_{k\to 0}\frac{k}{\log_a(k+1)}\\ &=\lim\limits_{k\to 0}\frac{1}{\frac{\log_a(k+1)}{k}}\\ &=\lim\limits_{k\to 0}\frac{1}{\log_a(k+1)^{\frac{1}{k}}}\\ &=\frac{1}{\log_ae}\\ &=\ln a \end{align} \] 证明中巧妙地应用了对数函数的性质,将\(\frac{1}{k}\)移进去,从而构造出了\(e\)的不等式,通过这几步就能看出\(e\)是如何被牵扯进来的。

3.3.2 导数的四则运算

四则运算无非加减乘除,其中最重要的是加和乘,因为减法相当于加上一个负数,除法相当于乘上除数的倒数,而一个函数的倒数可以用复合函数求导来得到,因此这里主要讲解如何直观地理解加法和乘法。

加法的求导理解起来很容易,当自变量取得增量\(dx\)时,函数\(u\)\(v\)都会取得对应的增量\(du\)\(dv\),那么加起来的增量自然就是\(du+dv\),因此和的导数就等于导数的和。 \[ \frac{d(u+v)}{dx}=\frac{du}{dx}+\frac{dv}{dx} \] 乘法的求导单从公式上是看不出什么直观含义的,但同样可以用几何来解释,我们可以分别把两个函数\(g(x)\)\(h(x)\)看作是矩形的长和宽,那么他们的乘积就是矩形的面积,如下图:

显然橙色部分是高阶无穷小可以忽略,而增量就是两条绿色的面积,即\(g(x)\cdot dh+h(x)\cdot dg\),这就是导数乘法公式的几何理解。它还可以推广到有限项的情况,比如三个数相乘,也可以用几何的方法去想象。 \[ (u_1u_2\cdots u_n)'=u_1'u_2\cdots u_n+u_1u_2'\cdots u_n+\cdots+u_1u_2\cdots u_n' \] 当然用导数的定义去推导也完全没有问题,但是从几何推导更有助于我们的理解和记忆。

3.3.3 复合函数求导

复合函数的导数是我之前一直比较迷惑的,虽然证明出来确实是那样,但总觉得缺乏直观的理解,为什么是一层一层的导数相乘?

函数就是一种映射,上图有三条数轴,第一个函数\(h=x^2\)将第一条数轴上的数映射到了第二条数轴上,第二个函数\(y=\sin(h)\)将第二条数轴上的数映射到了第三条数轴上。

如果在第一个数轴上取增量\(dx\)的话,那第二个数轴上的增量就应该是\(dh=2xdx\),第三个数轴上的增量就是\(dy=\cos(h)dh=\cos(h)2xdx\)。这样很自然就将内外函数的导数乘到了一起,因为外函数是在内函数变化的基础上变化的。或者说\(x\)影响了\(h\),在对\(h\)影响的基础上进而影响了\(y\),所以这种影响应该乘起来。

3.3.4 反函数求导

前面说反函数的时候讲到过原函数与反函数的导数互为倒数,因为反函数和原函数是完全等价的,只是交换了xy轴,所以一个是\(\frac{dy}{dx}\),一个是\(\frac{dx}{dy}\),当然相乘为1,从图像切线上来看斜率之积也是1。

这里只拿一个反三角函数求导公式的证明来说明反函数应当如何求导,单从公式看的话确实很难理解为什么反三角函数求导后会出现\(x^2\)\[ y=\arcsin(x) \] 反函数为 \[ x=\sin(y) \] 反函数的导数为 \[ x'=\cos(y) \] 那么根据反函数的求导法则,原函数的导数应该为 \[ y'=\frac{1}{\cos(y)} \] 其实到这里就完了,但是一般来说导数是一个关于自变量的函数,所以可以把\(y\)替换为\(x\)\[ y'=\frac{1}{\cos(y)}=\frac{1}{\sqrt{1-\sin^2(y)}}=\frac{1}{\sqrt{1-x^2}} \] 这里用到了\(x=\sin(y)\)这一已知条件,另外因为\(\arcsin(x)\)的定义域是\([-\frac{\pi}{2},\frac{\pi}{2}]\),所以开方也不需要加负号。理解了如上证明过程就很清楚\(\sqrt{1-x^2}\)是怎么来的了,这也会使你对这个公式印象更加深刻。

3.3.5 隐函数求导

为什么对隐函数求导是对左右两边同时取\(x\)的导数,为什么要那样处理\(y\),隐函数求导的意义是什么?凡此种种,都可以在下面找到答案。

与其说是隐函数求导,更多的时候我们是对曲线上的某一个点求导,导数的意义就是这一点切线的斜率,也就是\(\frac{dy}{dx}\),所以我们只需要求出在这一点附近\(x\)\(y\)的微分,其比值就是斜率了。

接下来我们从等式的角度来看待隐函数,把\(x\)\(y\)仅仅看作是两个变量。如上图的\(\sin(x)y^2=x\),这是一个等式,坐标系中的曲线即表示了满足这个等式的点集,换言之只要\(x\)\(y\)满足上述等式关系,其对应的点就在曲线上。

现在我们在曲线上取某一点的增量\(dx\)\(dy\),如上图右下角:从曲线的角度看,变化后的点也应当落在曲线上(这里一定要想懂);从等式的角度看,由于取得增量后等式仍满足,那么等式左右表达式的增量也应该相同,否则取增量\(dx\)\(dy\)之后,新的点就不满足原来的表达式了。以上解释意在说明,如果等式成立,那么对等式两边的表达式取微分也是成立的

理解了上面的结论,剩下的就是计算问题了。可能你之前一直只做过单变量求导,而不知道对两个变量同时求导怎么做,也就是如果一项同时含有\(x\)\(y\)该怎么处理呢?其实你已经学过了,还记得导数乘法公式的几何意义吗,\(x\)\(y\)都取增量,那\(f(x)\cdot g(y)\)的微分不就是那幅图中绿色的那两部分吗,即\(f(x)\cdot dg(y)+g(y)\cdot df(x)\)。按这种方法对等式两边同时取微分,每一项都只会出现\(dx\)\(dy\)(因为\(dx\cdot dy\)是高阶无穷小),然后再将\(dx\)除到\(dy\)下面,移项就得出导数了。

从微分的角度解释隐函数求导是我认为比较好理解的,至于有的方法讲【对\(x\)直接求导,对\(y\)求导后面加上\(y'\)】,这些大可以理解为一种技巧。总之要理解本质,方法都源于本质。

3.3.6 参数方程求导

参数方程如下: \[ \left\{ \begin{align} y=y(t)\\ x=x(t) \end{align} \right. \] 从微分来理解还是最容易的,\(y\)\(x\)的导数无非是\(y\)的增量除以\(x\)的增量: \[ \frac{dy}{dx}=\frac{y'(t)dt}{x'(t)dt}=\frac{y'(t)}{x'(t)} \] 在求\(y\)\(x\)的二阶导数时要特别注意谁是自变量,是对谁求导数,是对\(x\),而不是\(t\),所以\(y\)\(x\)的二阶导数不是上面的结果再对\(t\)求导数,而是上面的结果再对\(x\)求导数。 \[ \frac{d^2y}{dx^2}=\frac{d(\frac{y'(t)}{x'(t)})}{dx}=\frac{\frac{d(\frac{y'(t)}{x'(t)})}{dt}}{\frac{dx}{dt}}=\frac{y''(t)x'(t)-x''(t)y'(t)}{[x'(t)]^3} \]

3.4 求导公式汇总

\[ \begin{align} (x^a)'&=ax^{a-1}\\ (a^x)'&=a^x\ln a\\ (e^x)'&=e^x\\ (\log_ax)'&=\frac{1}{x\ln a}\\ (\ln x)'&=\frac{1}{x}\\ (\sin x)'&=\cos(x)\\ (\cos x)'&=-\sin(x)\\ (\tan x)'&=\sec^2x\\ (\cot x)'&=-\csc^2x\\ (\sec x)'&=\sec x\tan x\\ (\csc x)'&=-\csc x\cot x\\ (\arcsin x)'&=\frac{1}{\sqrt{1-x^2}}\\ (\arccos x)'&=-\frac{1}{\sqrt{1-x^2}}\\ (\arctan x)'&=\frac{1}{1+x^2}\\ (\text{arccot}x)'&=-\frac{1}{1+x^2}\\ \end{align} \]

3.5 高阶导数

3.8.1 高阶导数的理解

高阶导数其实没什么好解释的,二阶导数就是一阶导数再对\(x\)求导,更高阶导数也是同理。

唯一可能让人有点困惑的就是高阶导数的记法,比如二阶导数记作\(\frac{d^2y}{dx^2}\),分子分母的2到底写在谁的头上总是会让我有些犹豫。

这里可以稍微提一下高阶微分,一阶微分的形式如下: \[ dy=f'(x)dx \] 这里需要注意一下,上式中的自变量是\(x\)\(dx\)是常数。对其两边再求导: \[ d(dy)=d(f'(x)dx) \] 将右边的常数\(dx\)提出来: \[ d(dy)=d(f'(x))dx=f''(x)(dx)^2 \] 左边的\(d(dy)\)记作\(d^2y\),右边的\((dx)^2\)记作\(dx^2\),因此才有了\(\frac{d^2y}{dx^2}\)的记法,希望这能帮助你记忆。

3.8.2 莱布尼兹公式

莱布尼兹公式和二项式定理非常的类似: \[ \begin{align} (uv)^{(n)}&=u^{(n)}v+nu^{(n-1)}v'+\frac{n(n-1)}{2}u^{n-2}v''+\cdots+\\ &\ \ \ \ \ C^k_nu^{(n-k)}v^{(k)}+\cdots+uv^{(n)}\\ &=\sum\limits_{i=0}^{n}C^i_nu^{(n-i)}v^{(i)} \end{align} \] 其实自己求\(uv\)的两三阶导也能发现这个规律,它很符合我们的直观。这里就不再详细证明,可以提一下正儿八经的证明用的是数学归纳法。

当两个函数相乘,如果其中一个是次数较低的幂函数时,就可以使用莱布尼兹公式,因为幂函数在几阶导数之后就会变成零,从而后面的所有项都为零。

3.8.3 常用高阶导数公式

\[ \begin{align} (a^x)^{(n)}&=a^x\ln^na\\ (e^x)^{(n)}&=e^x\\ (\sin\ x)^{(n)}&=\sin(x+\frac{n\pi}{2})\\ (\cos\ x)^{(n)}&=\cos(x+\frac{n\pi}{2})\\ (\ln\ x)^{(n)}&=(-1)^{n-1}\frac{(n-1)!}{x^n}\\ (\frac{1}{ax+b})^{(n)}&=(-1)^n\frac{a^n\cdot n!}{(ax+b)^{n+1}} \end{align} \]

其实以上公式都无需死记,比如三角函数类的公式从图像可以推出,与\(\ln\)有关或是\(\frac{1}{ax+b}\)这一类的都有正负交替、分子阶乘、分母指数的性质。一般算出前两三项,就可以根据规律写出通项公式了。


高等数学(二)导数与微分1
https://shuusui.site/blog/2024/03/13/advmath-2/
作者
Shuusui
发布于
2024年3月13日
更新于
2024年3月13日
许可协议