ó
    Ñ‘®i9<  ã                  ó²   • S SK Jr  S SKrS SKrS SKJr  SSKJrJrJr  SSK	J
r
  SSKJrJrJr  SS	KJr  / r " S
 S\5      r " S S\5      r " S S\5      rg)é    )ÚannotationsN)Ú_C_opsé   )ÚcoreÚ	frameworkÚunique_name)Úcheck_variable_and_dtype)Ú_current_expected_placeÚin_dygraph_modeÚin_pir_modeé   )ÚInitializerc                  ón   ^ • \ rS rSrSr     S           SU 4S jjjr S     S	S jjrSrU =r$ )
ÚXavierInitializeré"   a¸  
This class implements the Xavier weight initializer from the paper
`Understanding the difficulty of training deep feedforward neural
networks <http://proceedings.mlr.press/v9/glorot10a/glorot10a.pdf>`_
by Xavier Glorot and Yoshua Bengio.

This initializer is designed to keep the scale of the gradients
approximately same in all the layers. In case of Uniform distribution,
the range is [-x, x], where

.. math::

    x = gain \times \sqrt{\\frac{6.0}{fan\_in + fan\_out}}

In case of Normal distribution, the mean is 0 and the standard deviation
is

.. math::

   gain \times \sqrt{\\frac{2.0}{fan\_in + fan\_out}}


Args:
    uniform (bool, optional): whether to use uniform ,if False use normal distribution. Default is True.
    fan_in (float|None, optional): fan_in for Xavier initialization. If None, it is
            inferred from the variable. Default is None.
    fan_out (float|None, optional): fan_out for Xavier initialization. If None, it is
             inferred from the variable. Default is None.
    seed (int, optional): Random seed. Default is 0.
    gain (float, optional): Scaling Tensor. Default is 1.0.

Note:
    It is recommended to set fan_in and fan_out to None for most cases.

c                ór   >• Uc   eUc   e[         TU ]  5         Xl        X l        X0l        X@l        XPl        g ©N)ÚsuperÚ__init__Ú_uniformÚ_fan_inÚ_fan_outÚ_seedÚ_gain)ÚselfÚuniformÚfan_inÚfan_outÚseedÚgainÚ	__class__s         €Ú\/var/www/html/banglarbhumi/venv/lib/python3.13/site-packages/paddle/nn/initializer/xavier.pyr   ÚXavierInitializer.__init__G   sA   ø€ ð Ñ"Ð"Ð"ØÑÐÐÜ‰ÑÔØŒØŒØŒØŒ
Ø
ó    c                ó–  • U R                  U5      n[        U[        R                  [        R
                  R                  45      (       d   e[        U[        R
                  R                  R                  5      (       d  [        US/ SQS5        U R                  U5      u  p4U R                  c  UOU R                  nU R                  c  UOU R                  nU R                  S:X  a  UR                  R                  U l        [        U[        R                  5      (       a!  UR!                  5       (       a  UR"                  OUR$                  nUR&                  nU[        R(                  R*                  R,                  :X  d9  U[        R(                  R*                  R.                  :X  a›  U R0                  (       dŠ  [        R(                  R*                  R2                  n	UR5                  [6        R8                  " SR;                  SUR<                  S/5      5      UU	[        R(                  R*                  R>                  SS	9n
OjU[        R@                  RB                  [        R@                  RD                  4;   a.  U R0                  (       d  [        R@                  RF                  n	Un
OUn	Un
[I        5       (       Ga  U R0                  (       aj  SXV4;   a  S
nO1U RJ                  [L        RN                  " S[Q        XV-   5      -  5      -  n[R        RT                  " UU	U* UU R                  [W        5       5      n
OjSXV4;   a  S
nO1U RJ                  [L        RN                  " S[Q        XV-   5      -  5      -  n[W        5       n[R        RX                  " US
UU R                  U	U5      n
U[        R(                  R*                  R,                  :X  dl  U[        R(                  R*                  R.                  [        R@                  RB                  [        R@                  RD                  4;   a'  U R0                  (       d  [R        RZ                  " X¨5      n
[        U[        R                  5      (       a]  UR!                  5       (       aH  [        R\                  R^                  R`                  Rc                  X¡Rd                  URf                  5      n
U
Ri                  U5        g[k        5       (       Gaa  U R0                  (       a}  SXV4;   a  S
nO1U RJ                  [L        RN                  " S[Q        XV-   5      -  5      -  n[        Rl                  RU                  U
R$                  U	U* UU R                  [W        5       5      n
OrSXV4;   a  S
nO1U RJ                  [L        RN                  " S[Q        XV-   5      -  5      -  n[R        RX                  " U
R$                  S
UU R                  U	[W        5       5      n
U[        R@                  RB                  [        R@                  RD                  4;   a'  U R0                  (       d  [R        RZ                  " X¨5      $ U
$ U R0                  (       al  SXV4;   a  S
nO1U RJ                  [L        RN                  " S[Q        XV-   5      -  5      -  nURo                  S0 SU
0U
R$                  U	U* UU R                  S.SS9nOsSXV4;   a  S
nO1U RJ                  [L        RN                  " S[Q        XV-   5      -  5      -  nURo                  SSU
0U
R$                  U
R&                  S
UU R                  S.SS9nU[        R(                  R*                  R,                  :X  d9  U[        R(                  R*                  R.                  :X  a4  U R0                  (       d#  URo                  SSU
0SU0U
R&                  US.S9  Xál8        U$ )a%  Initialize the input tensor with Xavier initialization.

Args:
    var(Tensor): Tensor that needs to be initialized.
    block(Block|None, optional): The block in which initialization ops
           should be added. Used in static graph only, default None.

Returns:
    The initialization op
ÚOut)Úuint16Úfloat16Úfloat32Úfloat64Úxavier_initNr   Ú.ÚtmpF)ÚnameÚshapeÚdtypeÚtypeÚpersistableg        g      @g       @Úuniform_random)r/   r0   ÚminÚmaxr   T)r1   ÚinputsÚoutputsÚattrsÚstop_gradientÚgaussian_random)r/   r0   ÚmeanÚstdr   )r1   r7   r8   r9   ÚcastÚX)Úin_dtypeÚ	out_dtype)r1   r6   r7   r8   )9Ú_check_blockÚ
isinstancer   ÚBlockÚpaddleÚpirr   ÚParameterMetar	   Ú_compute_fansr   r   r   ÚprogramÚrandom_seedÚEagerParamBaseÚis_distÚ_local_shaper/   r0   ÚVarDescÚVarTypeÚFP16ÚBF16r   ÚFP32Ú
create_varr   ÚgenerateÚjoinr.   ÚDENSE_TENSORÚDataTypeÚFLOAT16ÚBFLOAT16ÚFLOAT32r   r   ÚmathÚsqrtÚfloatr   r   r
   Úgaussianr=   ÚdistributedÚauto_parallelÚapiÚdtensor_from_localÚprocess_meshÚ
placementsÚ_share_underline_tensor_tor   Ú_pir_opsÚ	append_opÚop)r   ÚvarÚblockÚf_inÚf_outr   r   Úout_var_shapeÚorigin_dtyper@   Úout_varÚlimitr<   Úplacerg   s                  r"   ÚforwardÚXavierInitializer.forwardX   s%  € ð ×!Ñ! %Ó(ˆÜ˜%¤)§/¡/´6·:±:×3CÑ3CÐ!D×EÑEÐEÐEÜ˜#œvŸz™zŸ™×<Ñ<×=Ñ=Ü$ØØÚ;Øô	ð ×(Ñ(¨Ó-‰ˆð Ÿ™Ñ-‘°4·<±<ˆØŸ=™=Ñ0‘%°d·m±mˆà:‰:˜‹?ØŸ™×2Ñ2ˆDŒJô ˜3¤	× 8Ñ 8×9Ñ9¸c¿k¹k¿m¹mð ×Òà—‘ð 	ð —y‘yˆØœ4Ÿ<™<×/Ñ/×4Ñ4Ó4ØœDŸL™L×0Ñ0×5Ñ5Ó5¸d¿m¿mäŸ™×,Ñ,×1Ñ1ˆIØ×&Ñ&Ü ×)Ò)Ø—H‘H˜m¨S¯X©X°uÐ=Ó>óð $ØÜ—\‘\×)Ñ)×6Ñ6Ø!ð 'ð ‰Gð œTŸ]™]×2Ñ2´D·M±M×4JÑ4JÐKÓKØ—M—MäŸ™×-Ñ-ˆIØ‰Gà$ˆIØˆGä×ÒØ}}Ø˜Ð)Ó)Ø‘Eà ŸJ™J¬¯ªØœe FÑ$4Ó5Ñ5ó*ñ Eô !Ÿ.š.Ø!ØØFØØ—J‘JÜ+Ó-ó‘ð ˜Ð)Ó)Ø‘CàŸ*™*¤t§y¢y°´u¸VÑ=MÓ7NÑ1NÓ'OÑOCä/Ó1Ü Ÿ/š/Ø!ØØØ—J‘JØØóð œtŸ|™|×3Ñ3×8Ñ8Ó8Øä—L‘L×(Ñ(×-Ñ-Ü—M‘M×)Ñ)Ü—M‘M×*Ñ*ðóð ŸŸä Ÿ+š+ gÓ<Ü˜#œy×7Ñ7×8Ñ8¸S¿[¹[¿]¹]ô ×&Ñ&×4Ñ4×8Ñ8×KÑKØ×!1Ñ!1°3·>±>óð ð
 ×.Ñ.¨sÔ3ØÜ]Š]Ø}}Ø˜Ð)Ó)Ø‘Eà ŸJ™J¬¯ªØœe FÑ$4Ó5Ñ5ó*ñ Eô !Ÿ/™/×1Ñ1Ø—M‘MØØFØØ—J‘JÜ+Ó-ó‘ð ˜Ð)Ó)Ø‘CàŸ*™*¤t§y¢y°´u¸VÑ=MÓ7NÑ1NÓ'OÑOCÜ Ÿ/š/Ø—M‘MØØØ—J‘JØÜ+Ó-óð ¤§¡×!6Ñ!6¼¿¹×8NÑ8NÐ OÓOØŸŸä—{’{ 7Ó9Ð9àˆNà}}Ø˜Ð)Ó)Ø‘Eà ŸJ™J¬¯ªØœe FÑ$4Ó5Ñ5ó*ñ Eð —_‘_Ø)ØØ" GÐ,à!(§¡Ø!*Ø %˜vØ$Ø $§
¡
ñð #'ð %ð ‘ð ˜Ð)Ó)Ø‘CàŸ*™*¤t§y¢y°´u¸VÑ=MÓ7NÑ1NÓ'OÑOCØ—_‘_Ø*Ø" GÐ,à!(§¡Ø!(§¡Ø #Ø"Ø $§
¡
ñð #'ð %ð ð œtŸ|™|×3Ñ3×8Ñ8Ó8Ø¤§¡× 4Ñ 4× 9Ñ 9Ó9À$Ç-Ç-à—‘ØØ ˜>Ø" C˜Là$+§M¡MØ%1ñð	  ñ ð ŒFØˆIr$   )r   r   r   r   r   )TNNr   ç      ð?)r   Úboolr   úfloat | Noner   ru   r   Úintr    r\   ÚreturnÚNoner   )rh   zpaddle.Tensorri   zpaddle.pir.Block | Nonerw   zpaddle.Tensor | None)	Ú__name__Ú
__module__Ú__qualname__Ú__firstlineno__Ú__doc__r   rq   Ú__static_attributes__Ú__classcell__©r!   s   @r"   r   r   "   sŒ   ø† ñ"ðL Ø#Ø $ØØðàðð ðð ð	ð
 ðð ðð 
÷ð ð$ DHðLØ ðLØ)@ðLà	÷Ló Lr$   r   c                  óN   ^ • \ rS rSrSr    S         SU 4S jjjrSrU =r$ )ÚXavierNormali'  ad  
This class implements the Xavier weight initializer from the paper
`Understanding the difficulty of training deep feedforward neural
networks <http://proceedings.mlr.press/v9/glorot10a/glorot10a.pdf>`_
by Xavier Glorot and Yoshua Bengio, using a normal distribution whose mean is :math:`0` and standard deviation is

.. math::

    gain \times \sqrt{\frac{2.0}{fan\_in + fan\_out}}.


Args:
    fan_in (float|None, optional): fan_in for Xavier initialization, which is
            inferred from the Tensor. Default is None.
    fan_out (float|None, optional): fan_out for Xavier initialization, which is
             inferred from the Tensor. Default is None.
    gain (float, optional): Scaling Tensor. Default is 1.0.
    name (str|None, optional): For details, please refer to :ref:`api_guide_Name`. Generally, no setting is required. Default: None.

Returns:
    A parameter initialized by Xavier weight, using a normal distribution.

Examples:
    .. code-block:: python

        >>> import paddle
        >>> paddle.seed(1)
        >>> data = paddle.ones(shape=[3, 1, 2], dtype='float32')
        >>> weight_attr = paddle.framework.ParamAttr(
        ...     name="linear_weight",
        ...     initializer=paddle.nn.initializer.XavierNormal())
        >>> bias_attr = paddle.framework.ParamAttr(
        ...     name="linear_bias",
        ...     initializer=paddle.nn.initializer.XavierNormal())
        >>> linear = paddle.nn.Linear(2, 2, weight_attr=weight_attr, bias_attr=bias_attr)
        >>> print(linear.weight)
        Parameter containing:
        Tensor(shape=[2, 2], dtype=float32, place=Place(cpu), stop_gradient=False,
        [[-0.21607460,  0.08382989],
         [ 0.29147008, -0.07049121]])

        >>> print(linear.bias)
        Parameter containing:
        Tensor(shape=[2], dtype=float32, place=Place(cpu), stop_gradient=False,
        [1.06076419, 0.87684733])

        >>> res = linear(data)
        >>> print(res)
        Tensor(shape=[3, 1, 2], dtype=float32, place=Place(cpu), stop_gradient=False,
        [[[1.13615966, 0.89018601]],
         [[1.13615966, 0.89018601]],
         [[1.13615966, 0.89018601]]])
c                ó&   >• [         TU ]  SXSUS9  g )NFr   ©r   r   r   r   r    ©r   r   ©r   r   r   r    r.   r!   s        €r"   r   ÚXavierNormal.__init__^  s    ø€ ô 	‰ÑØ &ÀÈð 	ò 	
r$   © ©NNrs   N©
r   ru   r   ru   r    r\   r.   z
str | Nonerw   rx   ©ry   rz   r{   r|   r}   r   r~   r   r€   s   @r"   r‚   r‚   '  sQ   ø† ñ4ðp  $Ø $ØØð	
àð	
ð ð	
ð ð		
ð
 ð	
ð 
÷	
ö 	
r$   r‚   c                  óN   ^ • \ rS rSrSr    S         SU 4S jjjrSrU =r$ )ÚXavierUniformij  aÎ  
This class implements the Xavier weight initializer from the paper
`Understanding the difficulty of training deep feedforward neural
networks <http://proceedings.mlr.press/v9/glorot10a/glorot10a.pdf>`_
by Xavier Glorot and Yoshua Bengio.

This initializer is designed to keep the scale of the gradients
approximately same in all the layers. In case of Uniform distribution,
the range is :math:`[-x,x]`, where

.. math::

    x = gain \times \sqrt{\frac{6.0}{fan\_in + fan\_out}}.

Args:
    fan_in (float|None, optional): fan_in for Xavier initialization, which is
            inferred from the Tensor. Default is None.
    fan_out (float|None, optional): fan_out for Xavier initialization, which is
             inferred from the Tensor. Default is None.
    gain (float, optional): Scaling Tensor. Default is 1.0.
    name (str|None, optional): For details, please refer to :ref:`api_guide_Name`. Generally, no setting is required. Default: None.

Returns:
    A parameter initialized by Xavier weight, using a uniform distribution.

Examples:
    .. code-block:: python

        >>> import paddle
        >>> paddle.seed(1)
        >>> data = paddle.ones(shape=[3, 1, 2], dtype='float32')
        >>> weight_attr = paddle.framework.ParamAttr(
        ...     name="linear_weight",
        ...     initializer=paddle.nn.initializer.XavierUniform())
        >>> bias_attr = paddle.framework.ParamAttr(
        ...     name="linear_bias",
        ...     initializer=paddle.nn.initializer.XavierUniform())
        >>> linear = paddle.nn.Linear(2, 2, weight_attr=weight_attr, bias_attr=bias_attr)
        >>> print(linear.weight)
        Parameter containing:
        Tensor(shape=[2, 2], dtype=float32, place=Place(cpu), stop_gradient=False,
        [[-1.18095720,  0.64892638],
         [ 0.43125069, -1.11156428]])
        >>> print(linear.bias)
        Parameter containing:
        Tensor(shape=[2], dtype=float32, place=Place(cpu), stop_gradient=False,
        [-0.27524316,  1.13808715])

        >>> res = linear(data)
        >>> print(res)
        Tensor(shape=[3, 1, 2], dtype=float32, place=Place(cpu), stop_gradient=False,
        [[[-1.02494967,  0.67544925]],
         [[-1.02494967,  0.67544925]],
         [[-1.02494967,  0.67544925]]])
c                ó&   >• [         TU ]  SXSUS9  g )NTr   r„   r…   r†   s        €r"   r   ÚXavierUniform.__init__£  s    ø€ ô 	‰ÑØ ¸qÀtð 	ò 	
r$   rˆ   r‰   rŠ   r‹   r€   s   @r"   r   r   j  sQ   ø† ñ6ðt  $Ø $ØØð	
àð	
ð ð	
ð ð		
ð
 ð	
ð 
÷	
ö 	
r$   r   )Ú
__future__r   rZ   rD   r   Úbaser   r   r   Úbase.data_feederr	   Úbase.frameworkr
   r   r   Úinitializerr   Ú__all__r   r‚   r   rˆ   r$   r"   Ú<module>r–      s^   ðõ #ã ã Ý ç 0Ñ 0Ý 8÷ñ õ
 %à
€ôB˜ô BôJ@
Ð$ô @
ôFB
Ð%õ B
r$   