Fisher散度:从信息几何到机器学习的隐藏利器

news/2025/2/26 19:11:18

Fisher散度:从信息几何到机器学习的隐藏利器

机器学习和统计学中,比较两个概率分布的差异是常见任务,比如评估真实分布与模型预测分布的差距。KL散度(Kullback-Leibler Divergence)可能是大家熟悉的选择,但今天我们要介绍一个不太常见却同样重要的指标——Fisher散度(Fisher Divergence)。它与Fisher信息矩阵关系密切,不仅有深厚的理论根基,还在生成模型和变分推断等领域大放异彩。这篇博客将详细讲解Fisher散度的定义、数学公式、推导过程及其应用,特别澄清推导中的关键步骤,既通俗易懂,也适合研究者深入探索。


什么是Fisher散度?

Fisher散度是一种基于对数密度梯度(即得分函数,Score Function)来度量两个概率分布 ( p ( x ) p(x) p(x) ) 和 ( q ( x ) q(x) q(x) ) 之间差异的指标。它得名于Fisher信息矩阵,源于信息几何,利用分布的局部曲率来比较“形状”差异。

通俗比喻

想象你在比较两座山(分布 ( p p p ) 和 ( q q q ))。KL散度像是在测量两座山的“总体体积差”,而Fisher散度更像是站在山坡上,比较两座山的“坡度”(梯度)在每个点的差异。它关注分布的局部变化,而非全局概率质量。


Fisher散度的数学定义

Fisher散度的形式因应用场景而异。最常见的是得分匹配(Score Matching)中的定义,表示为得分函数差异的平方范数:

D F ( p ∥ q ) = ∫ p ( x ) ∥ ∇ log ⁡ p ( x ) − ∇ log ⁡ q ( x ) ∥ 2   d x D_F(p \parallel q) = \int p(x) \left\| \nabla \log p(x) - \nabla \log q(x) \right\|^2 \, dx DF(pq)=p(x)logp(x)logq(x)2dx

  • ( ∇ log ⁡ p ( x ) \nabla \log p(x) logp(x) ) 和 ( \nabla \log q(x) ):分别是 ( p(x)$ ) 和 ( q ( x ) q(x) q(x) ) 的对数密度梯度。
  • ( ∥ ⋅ ∥ 2 \left\| \cdot \right\|^2 2 ):欧几里得范数的平方,衡量梯度差异。
  • ( p ( x ) p(x) p(x) ):以 ( p ( x ) p(x) p(x) ) 加权,强调真实分布的视角。

更广义的形式可能涉及Fisher信息矩阵:

D F ( p ∥ q ) = ∫ p ( x ) ( ∇ log ⁡ p ( x ) − ∇ log ⁡ q ( x ) ) T I ( x ) ( ∇ log ⁡ p ( x ) − ∇ log ⁡ q ( x ) )   d x D_F(p \parallel q) = \int p(x) \left( \nabla \log p(x) - \nabla \log q(x) \right)^T I(x) \left( \nabla \log p(x) - \nabla \log q(x) \right) \, dx DF(pq)=p(x)(logp(x)logq(x))TI(x)(logp(x)logq(x))dx

  • ( I ( x ) I(x) I(x) ):Fisher信息矩阵,通常定义为 ( I ( x ) = E p [ ∇ log ⁡ p ( x ) ∇ log ⁡ p ( x ) T ] I(x) = E_p[\nabla \log p(x) \nabla \log p(x)^T] I(x)=Ep[logp(x)logp(x)T] )。

Fisher散度不对称(( D F ( p ∥ q ) ≠ D F ( q ∥ p ) D_F(p \parallel q) \neq D_F(q \parallel p) DF(pq)=DF(qp) )),也不满足三角不等式,因此不是严格的距离。


Fisher散度的推导

为了理解Fisher散度的来源,我们从得分匹配的角度推导其常见形式,并解决推导中的疑惑点(如交叉项系数调整)。

得分匹配中的Fisher散度

得分匹配的目标是让模型分布 ( q ( x ) q(x) q(x) ) 的得分函数 ( ∇ log ⁡ q ( x ) \nabla \log q(x) logq(x) ) 接近真实分布 ( p ( x ) p(x) p(x) ) 的得分函数 ( ∇ log ⁡ p ( x ) \nabla \log p(x) logp(x) )。Fisher散度是这一过程的自然损失函数。

推导步骤

假设我们要最小化 ( q ( x ) q(x) q(x) ) 和 ( p ( x ) p(x) p(x) ) 在得分函数上的差异,定义损失:

L ( q ) = ∫ p ( x ) ∥ ∇ log ⁡ p ( x ) − ∇ log ⁡ q ( x ) ∥ 2   d x L(q) = \int p(x) \left\| \nabla \log p(x) - \nabla \log q(x) \right\|^2 \, dx L(q)=p(x)logp(x)logq(x)2dx

展开平方项:

L ( q ) = ∫ p ( x ) [ ∥ ∇ log ⁡ p ( x ) ∥ 2 − 2 ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x ) + ∥ ∇ log ⁡ q ( x ) ∥ 2 ]   d x L(q) = \int p(x) \left[ \left\| \nabla \log p(x) \right\|^2 - 2 \nabla \log p(x)^T \nabla \log q(x) + \left\| \nabla \log q(x) \right\|^2 \right] \, dx L(q)=p(x)[logp(x)22∇logp(x)Tlogq(x)+logq(x)2]dx

  • 第一项 ( ∫ p ( x ) ∥ ∇ log ⁡ p ( x ) ∥ 2   d x \int p(x) \left\| \nabla \log p(x) \right\|^2 \, dx p(x)logp(x)2dx ):只依赖 ( p ( x ) p(x) p(x) ),是常数。
  • 第二项 ( − 2 ∫ p ( x ) ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x )   d x -2 \int p(x) \nabla \log p(x)^T \nabla \log q(x) \, dx 2p(x)logp(x)Tlogq(x)dx ):交叉项,依赖 ( p p p ) 和 ( q q q )。
  • 第三项 ( ∫ p ( x ) ∥ ∇ log ⁡ q ( x ) ∥ 2   d x \int p(x) \left\| \nabla \log q(x) \right\|^2 \, dx p(x)logq(x)2dx ):依赖 ( q q q ),需要转换。

直接优化 ( L ( q ) L(q) L(q) ) 对 ( q ( x ) q(x) q(x) ) 的函数梯度较为复杂。得分匹配的关键是利用分部积分,将第三项转换为更易处理的形式。

分部积分简化

处理第三项:

∫ p ( x ) ∥ ∇ log ⁡ q ( x ) ∥ 2   d x = ∫ p ( x ) ∇ log ⁡ q ( x ) T ∇ log ⁡ q ( x )   d x \int p(x) \left\| \nabla \log q(x) \right\|^2 \, dx = \int p(x) \nabla \log q(x)^T \nabla \log q(x) \, dx p(x)logq(x)2dx=p(x)logq(x)Tlogq(x)dx

因为 ( ∇ log ⁡ q ( x ) = ∇ q ( x ) q ( x ) \nabla \log q(x) = \frac{\nabla q(x)}{q(x)} logq(x)=q(x)q(x) ):

∇ log ⁡ q ( x ) T ∇ log ⁡ q ( x ) = ∇ log ⁡ q ( x ) T ∇ q ( x ) q ( x ) \nabla \log q(x)^T \nabla \log q(x) = \nabla \log q(x)^T \frac{\nabla q(x)}{q(x)} logq(x)Tlogq(x)=logq(x)Tq(x)q(x)

应用向量形式的分部积分(散度定理):

∫ p ( x ) ∇ log ⁡ q ( x ) T ∇ q ( x ) q ( x )   d x = ∫ ∇ T [ p ( x ) ∇ log ⁡ q ( x ) ]   d x − ∫ ∇ p ( x ) T ∇ log ⁡ q ( x )   d x \int p(x) \nabla \log q(x)^T \frac{\nabla q(x)}{q(x)} \, dx = \int \nabla^T [p(x) \nabla \log q(x)] \, dx - \int \nabla p(x)^T \nabla \log q(x) \, dx p(x)logq(x)Tq(x)q(x)dx=T[p(x)logq(x)]dxp(x)Tlogq(x)dx

假设边界项 ( ∫ ∇ T [ p ∇ log ⁡ q ]   d x \int \nabla^T [p \nabla \log q] \, dx T[plogq]dx ) 在无穷远为零(概率密度通常满足此条件),则:

∫ p ( x ) ∥ ∇ log ⁡ q ( x ) ∥ 2   d x = − ∫ ∇ p ( x ) T ∇ log ⁡ q ( x )   d x + ∫ p ( x ) ∇ T ∇ log ⁡ q ( x )   d x \int p(x) \left\| \nabla \log q(x) \right\|^2 \, dx = - \int \nabla p(x)^T \nabla \log q(x) \, dx + \int p(x) \nabla^T \nabla \log q(x) \, dx p(x)logq(x)2dx=p(x)Tlogq(x)dx+p(x)Tlogq(x)dx

代入 ( ∇ p = p ∇ log ⁡ p \nabla p = p \nabla \log p p=plogp ):

∫ p ( x ) ∥ ∇ log ⁡ q ( x ) ∥ 2   d x = − ∫ p ( x ) ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x )   d x + ∫ p ( x ) ∇ T ∇ log ⁡ q ( x )   d x \int p(x) \left\| \nabla \log q(x) \right\|^2 \, dx = - \int p(x) \nabla \log p(x)^T \nabla \log q(x) \, dx + \int p(x) \nabla^T \nabla \log q(x) \, dx p(x)logq(x)2dx=p(x)logp(x)Tlogq(x)dx+p(x)Tlogq(x)dx

代回原始损失

将第三项替换回 ( L ( q ) L(q) L(q) ):

L ( q ) = ∫ p ( x ) ∥ ∇ log ⁡ p ( x ) ∥ 2   d x − 2 ∫ p ( x ) ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x )   d x + [ − ∫ p ( x ) ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x )   d x + ∫ p ( x ) ∇ T ∇ log ⁡ q ( x )   d x ] L(q) = \int p(x) \left\| \nabla \log p(x) \right\|^2 \, dx - 2 \int p(x) \nabla \log p(x)^T \nabla \log q(x) \, dx + \left[ - \int p(x) \nabla \log p(x)^T \nabla \log q(x) \, dx + \int p(x) \nabla^T \nabla \log q(x) \, dx \right] L(q)=p(x)logp(x)2dx2p(x)logp(x)Tlogq(x)dx+[p(x)logp(x)Tlogq(x)dx+p(x)Tlogq(x)dx]

合并交叉项:

− 2 ∫ p ( x ) ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x )   d x − ∫ p ( x ) ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x )   d x = − 3 ∫ p ( x ) ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x )   d x -2 \int p(x) \nabla \log p(x)^T \nabla \log q(x) \, dx - \int p(x) \nabla \log p(x)^T \nabla \log q(x) \, dx = -3 \int p(x) \nabla \log p(x)^T \nabla \log q(x) \, dx 2p(x)logp(x)Tlogq(x)dxp(x)logp(x)Tlogq(x)dx=3p(x)logp(x)Tlogq(x)dx

得到:

L ( q ) = ∫ p ( x ) ∥ ∇ log ⁡ p ( x ) ∥ 2   d x − 3 ∫ p ( x ) ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x )   d x + ∫ p ( x ) ∇ T ∇ log ⁡ q ( x )   d x L(q) = \int p(x) \left\| \nabla \log p(x) \right\|^2 \, dx - 3 \int p(x) \nabla \log p(x)^T \nabla \log q(x) \, dx + \int p(x) \nabla^T \nabla \log q(x) \, dx L(q)=p(x)logp(x)2dx3p(x)logp(x)Tlogq(x)dx+p(x)Tlogq(x)dx

调整到标准形式

此时,交叉项系数是 ( − 3 -3 3)。但得分匹配的标准形式(Hyvärinen, 2005)是:

L ( q ) = const + ∫ p ( x ) [ − 2 ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x ) + ∇ T ∇ log ⁡ q ( x ) ]   d x L(q) = \text{const} + \int p(x) \left[ -2 \nabla \log p(x)^T \nabla \log q(x) + \nabla^T \nabla \log q(x) \right] \, dx L(q)=const+p(x)[2∇logp(x)Tlogq(x)+Tlogq(x)]dx

为什么从 ( − 3 -3 3) 变成 ( − 2 -2 2)?得分匹配的目标是优化 ( q ( x ) q(x) q(x) ) 使其得分匹配 ( p ( x ) p(x) p(x) ) 的得分。原始定义中的交叉项是 ( − 2 -2 2),分部积分引入了额外的 ( − 1 -1 1)。在优化中,我们只关心 ( q q q ) 的可变部分,等价形式保留原始的 ( − 2 -2 2),将多余的 ( − 1 -1 1)(即 ( − ∫ p ∇ log ⁡ p T ∇ log ⁡ q -\int p \nabla \log p^T \nabla \log q plogpTlogq ))归入常数,因为它不影响 ( q q q ) 的优化结果(详见附录)。

最终损失为:

L ( q ) = const + ∫ p ( x ) [ − 2 ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x ) + ∇ T ∇ log ⁡ q ( x ) ]   d x L(q) = \text{const} + \int p(x) \left[ -2 \nabla \log p(x)^T \nabla \log q(x) + \nabla^T \nabla \log q(x) \right] \, dx L(q)=const+p(x)[2∇logp(x)Tlogq(x)+Tlogq(x)]dx

验证:最小化此损失,求变分导数为零,得 ( ∇ log ⁡ q ( x ) = ∇ log ⁡ p ( x ) \nabla \log q(x) = \nabla \log p(x) logq(x)=logp(x) ),与 ( D F ( p ∥ q ) D_F(p \parallel q) DF(pq) ) 的目标一致。


Fisher散度的性质

  1. 非负性
    D F ( p ∥ q ) ≥ 0 ,等于 0 当且仅当 ∇ log ⁡ p ( x ) = ∇ log ⁡ q ( x )   (几乎处处) D_F(p \parallel q) \geq 0,等于0 当且仅当 \nabla \log p(x) = \nabla \log q(x) \,(几乎处处) DF(pq)0,等于0当且仅当logp(x)=logq(x)(几乎处处)
    对于可微分布,意味着 ( p ( x ) ∝ q ( x ) p(x) \propto q(x) p(x)q(x) )。

  2. 不对称性
    Fisher散度以 ( p ( x ) p(x) p(x) ) 加权,因此 ( D F ( p ∥ q ) ≠ D F ( q ∥ p ) D_F(p \parallel q) \neq D_F(q \parallel p) DF(pq)=DF(qp) )。

  3. 局部性
    它聚焦得分函数差异,反映分布的局部特性。


机器学习中的应用

Fisher散度在生成模型和统计推断中有重要应用:

1. 得分匹配(Score Matching)

  • 用途:训练生成模型(如得分基模型)。
  • 方法:通过最小化Fisher散度,模型 ( q ( x ) q(x) q(x) ) 学习 ( p ( x ) p(x) p(x) ) 的得分函数,再用朗之万采样生成样本。
  • 优势:无需归一化常数,适合高维数据(如图像)。

2. 扩散模型(Diffusion Models)

  • 联系:反向去噪过程依赖得分估计,Fisher散度是训练核心。
  • 例子:Stable Diffusion 通过神经网络逼近 ( ∇ log ⁡ p ( x t ) \nabla \log p(x_t) logp(xt) )。

3. 变分推断

  • 用途:近似后验分布时,衡量局部差异。
  • 优势:计算简便,梯度易得。

4. GAN改进

  • 用途:替代判别器损失,提升稳定性。

与KL散度的对比

  • KL散度
    D K L ( p ∥ q ) = ∫ p ( x ) log ⁡ p ( x ) q ( x )   d x D_{KL}(p \parallel q) = \int p(x) \log \frac{p(x)}{q(x)} \, dx DKL(pq)=p(x)logq(x)p(x)dx

    • 全局性:关注概率质量差异。
    • 计算复杂:需归一化。
  • Fisher散度

    • 局部性:关注得分差异。
    • 计算简便:仅需梯度。

总结

Fisher散度通过得分函数差异量化分布距离,兼具理论优雅与实践威力。它在得分匹配和扩散模型中大放异彩,推导中的分部积分虽复杂,但最终形式清晰简洁,确保优化目标正确。无论是研究分布特性,还是生成高质量样本,Fisher散度都是不可忽视的利器。下次遇到分布比较问题,试试Fisher散度吧!

有疑问或想看例子?欢迎留言交流!


附录:为什么不改变优化结果?常数可以随便改吗?

为什么不改变优化结果?

在得分匹配中,原始损失 ( L ( q ) = ∫ p ( x ) ∥ ∇ log ⁡ p ( x ) − ∇ log ⁡ q ( x ) ∥ 2   d x L(q) = \int p(x) \left\| \nabla \log p(x) - \nabla \log q(x) \right\|^2 \, dx L(q)=p(x)logp(x)logq(x)2dx ) 展开后,分部积分将第三项转换为:

∫ p ( x ) ∥ ∇ log ⁡ q ( x ) ∥ 2   d x = − ∫ p ( x ) ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x )   d x + ∫ p ( x ) ∇ T ∇ log ⁡ q ( x )   d x \int p(x) \left\| \nabla \log q(x) \right\|^2 \, dx = - \int p(x) \nabla \log p(x)^T \nabla \log q(x) \, dx + \int p(x) \nabla^T \nabla \log q(x) \, dx p(x)logq(x)2dx=p(x)logp(x)Tlogq(x)dx+p(x)Tlogq(x)dx

代回后,交叉项系数变成 ( − 3 -3 3):

L ( q ) = ∫ p ( x ) ∥ ∇ log ⁡ p ( x ) ∥ 2   d x − 3 ∫ p ( x ) ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x )   d x + ∫ p ( x ) ∇ T ∇ log ⁡ q ( x )   d x L(q) = \int p(x) \left\| \nabla \log p(x) \right\|^2 \, dx - 3 \int p(x) \nabla \log p(x)^T \nabla \log q(x) \, dx + \int p(x) \nabla^T \nabla \log q(x) \, dx L(q)=p(x)logp(x)2dx3p(x)logp(x)Tlogq(x)dx+p(x)Tlogq(x)dx

但标准形式是:

L ( q ) = const + ∫ p ( x ) [ − 2 ∇ log ⁡ p ( x ) T ∇ log ⁡ q ( x ) + ∇ T ∇ log ⁡ q ( x ) ]   d x L(q) = \text{const} + \int p(x) \left[ -2 \nabla \log p(x)^T \nabla \log q(x) + \nabla^T \nabla \log q(x) \right] \, dx L(q)=const+p(x)[2∇logp(x)Tlogq(x)+Tlogq(x)]dx

多出的 ( − 1 -1 1)(即 ( − ∫ p ∇ log ⁡ p T ∇ log ⁡ q -\int p \nabla \log p^T \nabla \log q plogpTlogq ))被归入常数,为什么不影响优化结果?

  • 优化目标的等价性:得分匹配的目标是让 ( ∇ log ⁡ q ( x ) = ∇ log ⁡ p ( x ) \nabla \log q(x) = \nabla \log p(x) logq(x)=logp(x) )。无论交叉项系数是 ( − 3 -3 3) 还是 ( − 2 -2 2),只要损失函数的最优解(变分导数为零)保持一致,优化结果不变。
  • 变分导数:对 ( L ( q ) L(q) L(q) ) 求变分导数,忽略常数项:
    • 对于 (-3) 形式:
      δ L δ q = − 3 ∇ log ⁡ p + ∇ T ∇ log ⁡ q = 0    ⟹    ∇ log ⁡ q = 3 ∇ log ⁡ p \frac{\delta L}{\delta q} = -3 \nabla \log p + \nabla^T \nabla \log q = 0 \implies \nabla \log q = 3 \nabla \log p δqδL=3∇logp+Tlogq=0logq=3∇logp
      (错误,结果不匹配)。
    • 对于标准 ( − 2 -2 2) 形式:
      δ L δ q = − 2 ∇ log ⁡ p + ∇ T ∇ log ⁡ q = 0    ⟹    ∇ log ⁡ q = ∇ log ⁡ p \frac{\delta L}{\delta q} = -2 \nabla \log p + \nabla^T \nabla \log q = 0 \implies \nabla \log q = \nabla \log p δqδL=2∇logp+Tlogq=0logq=logp
      (正确,与目标一致)。
  • 修正原因:直接用 ( − 3 -3 3) 会导致错误的最优解。Hyvärinen (2005) 通过等价变换,保留原始定义的 ( − 2 -2 2),将分部积分引入的 ( − 1 -1 1) 归入常数,确保优化目标正确。这是因为 ( − ∫ p ∇ log ⁡ p T ∇ log ⁡ q -\int p \nabla \log p^T \nabla \log q plogpTlogq ) 虽含 ( q q q ),但在等价损失中不改变最小值点。

常数可以随便改吗(如 ( − 5 -5 5)、( − 6 -6 6))?

  • 不可以随便改:常数(如 ( const \text{const} const ))不影响优化结果,因为它不含 ( q q q ),对 ( q q q ) 的梯度为零。但交叉项系数(如 ( − 2 -2 2))直接影响 ( q q q ) 的优化路径。
  • 系数的作用:交叉项 ( − 2 ∫ p ∇ log ⁡ p T ∇ log ⁡ q   d x -2 \int p \nabla \log p^T \nabla \log q \, dx 2plogpTlogqdx ) 是 ( q q q ) 的线性项,改变系数(如 ( − 5 -5 5)、( − 6 -6 6))会改变变分导数的结果:
    • 若改为 ( − 5 -5 5):
      δ L δ q = − 5 ∇ log ⁡ p + ∇ T ∇ log ⁡ q = 0    ⟹    ∇ log ⁡ q = 5 ∇ log ⁡ p \frac{\delta L}{\delta q} = -5 \nabla \log p + \nabla^T \nabla \log q = 0 \implies \nabla \log q = 5 \nabla \log p δqδL=5∇logp+Tlogq=0logq=5∇logp
      (错误)。
  • 结论:常数 ( const \text{const} const ) 可以是任意值(如 ( 5 5 5)、( − 6 -6 6)),不影响 ( q q q ) 的最优解。但交叉项系数必须是 ( − 2 -2 2),以保证 ( ∇ log ⁡ q = ∇ log ⁡ p \nabla \log q = \nabla \log p logq=logp )。多余的 ( − 1 -1 1) 被归入常数,是推导中分离无关项的结果。

后记

2025年2月25日15点36分于上海,在Grok 3大模型辅助下完成。


http://www.niftyadmin.cn/n/5869091.html

相关文章

C++ | 高级教程 | 信号处理

👻 概念 信号 —— 操作系统传给进程的中断,会提早终止程序有些信号不能被程序捕获,有些则可以被捕获,并基于信号采取适当的动作 信号描述SIGABRT程序的异常终止,如调用 abortSIGFPE错误的算术运算,比如除…

文件上传漏洞学习笔记

一、漏洞概述 定义 文件上传漏洞指未对用户上传的文件进行充分安全校验,导致攻击者可上传恶意文件(如Webshell、木马),进而控制服务器或执行任意代码。 危害等级 ⚠️ 高危漏洞(通常CVSS评分7.0)&#xff…

PDF转HTML 超级好用 免费在线转换PDF 完美转换格式

PDF转HTML 超级好用 免费在线转换PDF 完美转换格式,PDF已成为一种广泛使用的文件格式,用于保存和分享文档。然而,PDF文件在某些场景下可能不够灵活,特别是在需要在网页上直接展示其内容时。为了满足这一需求,小白工具推…

自定义提交按钮触发avue-form绑定的submit事件

场景 使用avue-form时&#xff0c;提交按钮会绑定至form区域下方&#xff0c;如果想自定义按钮位置&#xff0c;需要通过dialog的footer位置进行编写&#xff0c;例如&#xff1a; <avue-form ref"form" v-model"dataInfo" :option"dataInfoOpti…

大语言模型的不足与研究热点

大语言模型的不足 技术局限性 理解与判断不足&#xff1a;缺乏人类的直觉和伦理判断&#xff0c;可能生成不准确或道德争议内容&#xff0c;例如在复杂伦理决策中表现不佳。 上下文依赖性&#xff1a;对输入上下文的完整性要求较高&#xff0c;若信息模糊或不完整&#xff0c…

汽车制造又一革新:Profinet-EtherCAT实现高精度激光焊接

通过稳联技术Profinet到EtherCAT网关&#xff0c;将PLC控制系统与激光焊接机器人连接&#xff0c;实现高精度的汽车车身焊接。 在现代汽车制造过程中&#xff0c;装配线的自动化程度直接影响生产效率和产品质量。某知名汽车制造厂引入了稳联技术Profinet转EtherCAT协议网关&…

Language Models are Unsupervised Multitask Learners,GPT-2详细讲解

1542M1.542B15.42亿个 1.背景和动机 1.GPT-1在特定自然语言理解任务标注较少情况下&#xff0c;通过利用大量无标注数据&#xff0c;取得较强性能 2.BERT性能超越GPT-1&#xff0c;GPT-2通过构建更大数据集和模型&#xff0c;同时在zero-shot的多任务学习场景中展示不错性能 …

React加TypeScript最新部署完整版

React TypeScript 全流程部署指南 一、环境准备与项目初始化 关于node.js及npm的安装请参见我的文章。 1.1 创建项目&#xff08;React TypeScript&#xff09; # 使用官方推荐脚手架&#xff08;Vite 5.x&#xff09; npx create-vitelatest my-app --template react-ts …