偏导数

The name of the pictureThe name of the pictureThe name of the pictureClash Royale CLAN TAG#URR8PPP













在数学中,一个多变量的函数的偏导数是它关于其中一个变量的导数,而保持其他变量恒定(相对于全导数,在其中所有变量都允许变化)。偏导数在向量分析和微分几何,以及机器学习中是很有用的。


函数fdisplaystyle ff关于变量xdisplaystyle xx的偏导数写为fx′displaystyle f_x^prime f_x^prime∂f∂xdisplaystyle frac partial fpartial xfracpartial fpartial x偏导数符号∂displaystyle partial partial是全导数符号ddisplaystyle d d的变体,这个符号是阿德里安-马里·勒让德引入的,并在雅可比的重新引入后得到普遍接受。




目录





  • 1 简介


  • 2 定义


  • 3 例子


  • 4 记法


  • 5 正式定义和性质


  • 6 参考文献


  • 7 参见




简介


假设ƒ是一个多元函数。例如:


z=f(x,y)=x2+xy+y2displaystyle z=f(x,y)=x^2+xy+y^2 z = f(x, y) = x^2 + xy + y^2



f = x2 + xy + y2的图像。我们希望求出函数在点(1, 1, 3)的对x的偏导数;对应的切线与xOz平面平行。


因为曲面上的每一点都有无穷多条切线,描述这种函数的导数相当困难。偏导数就是选择其中一条切线,并求出它的斜率。通常,最感兴趣的是垂直于y轴(平行于xOz平面)的切线,以及垂直于x轴(平行于yOz平面)的切线。




这是右图中y = 1时的图像片段。


一种求出这些切线的好办法是把其他变量视为常数。例如,欲求出以上的函数在点(1, 1, 3)的与xOz平面平行的切线。右图中显示了函数的图像以及这个平面。左图中显示了函数在平面y = 1上是什么样的。我们把变量y视为常数,通过对方程求导,我们发现ƒ在点(x, y, z)的。我们把它记为:


∂z∂x=2x+ydisplaystyle frac partial zpartial x=2x+yfracpartial zpartial x = 2x+y

于是在点(1, 1, 3)的与xOz平面平行的切线的斜率是3。


∂f∂x=3displaystyle frac partial fpartial x=3displaystyle frac partial fpartial x=3

在点(1, 1, 3),或称“f在(1, 1, 3)的关于x的偏导数是3”。




定义


函数f可以解释为y为自变量而x为常数的函数:



f(x,y)=fx(y)=x2+xy+y2displaystyle f(x,y)=f_x(y)=,!x^2+xy+y^2f(x,y) = f_x(y) = ,! x^2 + xy + y^2

也就是说,每一个x的值定义了一个函数,记为fx,它是一个一元函数。也就是说:



fx(y)=x2+xy+y2displaystyle f_x(y)=x^2+xy+y^2f_x(y) = x^2 + xy + y^2

一旦选择了一个x的值,例如a,那么f(x,y)便定义了一个函数fa,把y映射到a2 + ay + y2



fa(y)=a2+ay+y2displaystyle f_a(y)=a^2+ay+y^2f_a(y) = a^2 + ay + y^2

在这个表达式中,a常数,而不是变量,因此fa是只有一个变量的函数,这个变量是y。这样,便可以使用一元函数的导数的定义:


fa′(y)=a+2ydisplaystyle f_a'(y)=a+2yf_a'(y)= a + 2y

以上的步骤适用于任何a的选择。把这些导数合并起来,便得到了一个函数,它描述了fy方向上的变化:


∂f∂y(x,y)=x+2ydisplaystyle frac partial fpartial y(x,y)=x+2ydisplaystyle frac partial fpartial y(x,y)=x+2y

这就是f关于y的偏导数,在这裡,∂是一个弯曲的d,称为偏导数符号。为了把它与字母d区分,∂有时读作“der”、“del”、“dah”或“偏”,而不是“dee”。


一般地,函数f(x1,...,xn)在点(a1,...,an)关于xi的偏导数定义为:


∂f∂xi(a1,…,an)=limh→0f(a1,…,ai+h,…,an)−f(a1,…,an)hdisplaystyle frac partial fpartial x_i(a_1,ldots ,a_n)=lim _hto 0frac f(a_1,ldots ,a_i+h,ldots ,a_n)-f(a_1,ldots ,a_n)hdisplaystyle frac partial fpartial x_i(a_1,ldots ,a_n)=lim _hto 0frac f(a_1,ldots ,a_i+h,ldots ,a_n)-f(a_1,ldots ,a_n)h

在以上的差商中,除了xi以外的所有变量都是固定的。这个固定值的选择决定了一个一元函数fa1,…,ai−1,ai+1,…,an(xi)=f(a1,…,ai−1,xi,ai+1,…,an)displaystyle f_a_1,ldots ,a_i-1,a_i+1,ldots ,a_n(x_i)=f(a_1,ldots ,a_i-1,x_i,a_i+1,ldots ,a_n)f_a_1,ldots,a_i-1,a_i+1,ldots,a_n(x_i) = f(a_1,ldots,a_i-1,x_i,a_i+1,ldots,a_n),根据定义,


dfa1,…,ai−1,ai+1,…,andxi(a1,…,an)=∂f∂xi(a1,…,an)displaystyle frac df_a_1,ldots ,a_i-1,a_i+1,ldots ,a_ndx_i(a_1,ldots ,a_n)=frac partial fpartial x_i(a_1,ldots ,a_n)displaystyle frac df_a_1,ldots ,a_i-1,a_i+1,ldots ,a_ndx_i(a_1,ldots ,a_n)=frac partial fpartial x_i(a_1,ldots ,a_n)

这个表达式说明了偏导数的计算可以化为一元导数的计算。


多变量函数的一个重要的例子,是欧几里德空间Rn(例如R2R3)上的标量值函数f(x1,...xn)。在这种情况下,f关于每一个变量xj具有偏导数∂f/∂xj。在点a,这些偏导数定义了一个向量:


∇f(a)=(∂f∂x1(a),…,∂f∂xn(a))displaystyle nabla f(a)=left(frac partial fpartial x_1(a),ldots ,frac partial fpartial x_n(a)right)nabla f(a) = left(fracpartial fpartial x_1(a), ldots, fracpartial fpartial x_n(a)right)

这个向量称为f在点a梯度。如果f在定义域中的每一个点都是可微的,那么梯度便是一个向量值函数∇f,它把点a映射到向量∇fa)。这样,梯度便决定了一个向量场。


一个常见的符号滥用是在欧几里得空间R3中用单位向量 i^,j^,k^displaystyle mathbf hat i ,mathbf hat j ,mathbf hat k mathbfhati, mathbfhatj, mathbfhatk来定义Nabla算子 (∇) 如下:


∇=[∂∂x]i^+[∂∂y]j^+[∂∂z]k^displaystyle nabla =bigg [frac partial partial xbigg ]mathbf hat i +bigg [frac partial partial ybigg ]mathbf hat j +bigg [frac partial partial zbigg ]mathbf hat k nabla = bigg[fracpartialpartial x bigg] mathbfhati + bigg[fracpartialpartial ybigg] mathbfhatj + bigg[fracpartialpartial zbigg] mathbfhatk

或者,更一般地,对于n维欧几里得空间Rn 的坐标(x1, x2, x3,...,xn)和单位向量(e^1,e^2,e^3,…,e^ndisplaystyle mathbf hat e_1 ,mathbf hat e_2 ,mathbf hat e_3 ,dots ,mathbf hat e_n mathbfhate_1, mathbfhate_2, mathbfhate_3, dots , mathbfhate_n):


∇=∑j=1n[∂∂xj]e^j=[∂∂x1]e^1+[∂∂x2]e^2+[∂∂x3]e^3+⋯+[∂∂xn]e^ndisplaystyle nabla =sum _j=1^nbigg [frac partial partial x_jbigg ]mathbf hat e_j =bigg [frac partial partial x_1bigg ]mathbf hat e_1 +bigg [frac partial partial x_2bigg ]mathbf hat e_2 +bigg [frac partial partial x_3bigg ]mathbf hat e_3 +dots +bigg [frac partial partial x_nbigg ]mathbf hat e_n nabla = sum_j=1^n bigg[fracpartialpartial x_jbigg] mathbfhate_j = bigg[fracpartialpartial x_1bigg] mathbfhate_1 + bigg[fracpartialpartial x_2bigg] mathbfhate_2 + bigg[fracpartialpartial x_3bigg] mathbfhate_3 + dots + bigg[fracpartialpartial x_nbigg] mathbfhate_n


例子




圆锥的体积与它的高度和半径有关


考虑一个圆锥的体积V;它与高度h和半径r有以下的关系:



V(r,h)=πr2h3displaystyle V(r,h)=frac pi r^2h3V(r, h) = fracpi r^2 h3

V关于r的偏导数为:


∂V∂r=2πrh3displaystyle frac partial Vpartial r=frac 2pi rh3frac partial Vpartial r = frac 2 pi r h3 它描述了高度固定而半径变化时,圆锥的体积的变化率。

V关于h的偏导数为:


∂V∂h=πr23displaystyle frac partial Vpartial h=frac pi r^23frac partial Vpartial h = fracpi r^23 它描述了半径固定而高度变化时,圆锥的体积的变化率。

现在考虑V关于rh的全导数。它们分别是:


d⁡Vd⁡r=2πrh3⏞∂V∂r+πr23⏞∂V∂h∂h∂rdisplaystyle frac operatorname d Voperatorname d r=overbrace frac 2pi rh3 ^frac partial Vpartial r+overbrace frac pi r^23 ^frac partial Vpartial hfrac partial hpartial rfracoperatorname dVoperatorname dr = overbracefrac2 pi r h3^frac partial Vpartial r + overbracefracpi r^23^frac partial Vpartial hfracpartial hpartial r

以及


d⁡Vd⁡h=πr23⏞∂V∂h+2πrh3⏞∂V∂r∂r∂hdisplaystyle frac operatorname d Voperatorname d h=overbrace frac pi r^23 ^frac partial Vpartial h+overbrace frac 2pi rh3 ^frac partial Vpartial rfrac partial rpartial hfracoperatorname dVoperatorname dh = overbracefracpi r^23^frac partial Vpartial h + overbracefrac2 pi r h3^frac partial Vpartial rfracpartial rpartial h

现在假设,由于某些原因,高度和半径的比k需要是固定的:


k=hr=∂h∂rdisplaystyle k=frac hr=frac partial hpartial rk = frachr = fracpartial hpartial r

这便给出了关于r的全导数:


d⁡Vd⁡r=2πrh3+kπr23displaystyle frac operatorname d Voperatorname d r=frac 2pi rh3+kfrac pi r^23fracoperatorname dVoperatorname dr = frac2 pi r h3 + kfracpi r^23

可以化简为:


d⁡Vd⁡r=kπr2displaystyle frac operatorname d Voperatorname d r=kpi r^2fracoperatorname dVoperatorname dr = kpi r^2

类似地,关于h的全导数是:


d⁡Vd⁡h=kπr2displaystyle frac operatorname d Voperatorname d h=kpi r^2fracoperatorname dVoperatorname dh = kpi r^2

含有未知函数的偏导数的方程,称为偏微分方程,它在物理学、工程学,以及其它应用科学中经常会见到。


与关于rh二者相关的全导数是由雅可比矩阵给出的,它的形式为梯度向量∇V=(∂V∂r,∂V∂h)=(23πrh,13πr2)displaystyle nabla V=(frac partial Vpartial r,frac partial Vpartial h)=(frac 23pi rh,frac 13pi r^2)nabla V =(fracpartial Vpartial r,fracpartial Vpartial h) = (frac23pi rh, frac13pi r^2)



记法


在以下的例子中,设fxyz的函数。


f的一阶偏导数为:


∂f∂x=fx=∂xfdisplaystyle frac partial fpartial x=f_x=partial _xffrac partial f partial x = f_x = partial_x f

二阶偏导数为:


∂2f∂x2=fxx=∂xxfdisplaystyle frac partial ^2fpartial x^2=f_xx=partial _xxffrac partial^2 f partial x^2 = f_xx = partial_xx f

二阶混合偏导数为:


∂2f∂y∂x=∂∂y(∂f∂x)=fxy=∂yxfdisplaystyle frac partial ^2fpartial y,partial x=frac partial partial yleft(frac partial fpartial xright)=f_xy=partial _yxffracpartial^2 fpartial y , partial x = fracpartialpartial y left( fracpartial fpartial x right) = f_xy = partial_yx f

高阶偏导数为:


∂i+j+kf∂xi∂yj∂zk=f(i,j,k)displaystyle frac partial ^i+j+kfpartial x^i,partial y^j,partial z^k=f^(i,j,k)frac partial^i+j+k f partial x^i, partial y^j, partial z^k = f^(i, j, k)

当处理多变量函数时,有些变量可能互相有关,这样就需要明确指定哪些变量是固定的。在诸如统计力学的领域中,f关于x的偏导数,把yz视为常数,通常记为:


(∂f∂x)y,zdisplaystyle left(frac partial fpartial xright)_y,zleft( fracpartial fpartial x right)_y,z


正式定义和性质


像导数一样,偏导数也是定义为一个极限。设URn的一个开子集,f : UR是一个函数。我们定义f在点a = (a1, ..., an) ∈ U关于第i个变量xi的偏导数为:


∂∂xif(a)=limh→0f(a1,…,ai−1,ai+h,ai+1,…,an)−f(a1,…,an)hdisplaystyle frac partial partial x_if(mathbf a )=lim _hrightarrow 0f(a_1,dots ,a_i-1,a_i+h,a_i+1,dots ,a_n)-f(a_1,dots ,a_n) over hfrac partial partial x_i f(mathbfa) =lim_h rightarrow 0
f(a_1, dots , a_i-1, a_i+h, a_i+1, dots ,a_n) -
f(a_1, dots ,a_n) over h "/>

即使在某个给定的点a,所有的偏导数∂f/∂xi(a)都存在,函数仍然不一定在该点连续。然而,如果所有的偏导数在a的一个邻域内存在并连续,那么f在该邻域内完全可微分,且全导数是连续的。在这种情况下,我们称f是一个C1函数。


偏导数∂f∂xdisplaystyle frac partial fpartial xfracpartial fpartial x可以视为定义在U内的另外一个函数,并可以再次求偏导数。如果所有的混合二阶偏导数在某个点(或集合)连续,我们便称f为在该点(或集合)的一个C2函数;在这种情况下,根据克莱罗定理,偏导数可以互相交换:



∂2f∂xi∂xj=∂2f∂xj∂xidisplaystyle frac partial ^2fpartial x_i,partial x_j=frac partial ^2fpartial x_j,partial x_ifracpartial^2fpartial x_i, partial x_j = fracpartial^2f partial x_j, partial x_i


参考文献



  • George B. Thomas & Ross L. Finney. Calculus and Analytic Geometry. Addison-Wesley Publishing Company, Inc. 1994: 833–840. ISBN 0-201-52929-7. 


参见



  • 达朗贝尔算子

  • 复合函数求导法则

  • 旋度

  • 方向導數

  • 散度

  • 外导数

  • 梯度

  • 雅可比矩阵

  • 拉普拉斯算子

  • 二階導數的對稱性


  • 三乘积法则,又称为循环链式法则。







Popular posts from this blog

The Dalles, Oregon

眉山市

清晰法令