َ
    د‘®i<4  م                  َب   • S SK Jr  S SKJr  S SKrS SKJrJr  S SKJ	r
  S SKJr  S SKJr  S SKJr  S S	KJr  S S
KJr  \(       a  S SKJr  S SKJr  S SKJr  / r " S S\5      rg)é    )عannotations)عTYPE_CHECKINGN)ع	frameworkعunique_name)عbase)عVariable)عLayerHelper)عin_pir_mode)ع	Optimizer)عcreate_parameter)عTensor)عOperator)عProgramc                  َ,  ^ • \ rS rSr% SrS\S'   S\S'   S\S'   S	\S
'   S\S'   Sr   S         SU 4S jjjrU 4S jr\	R                  \R                  SS j5       5       rS rS rS r\R                     S         SS jj5       rSrU =r$ )ع	LookAheadé$   aُ  
This implements the Lookahead optimizer of the
paper : https://arxiv.org/abs/1907.08610.

Lookahead keeps two sets of params: the fast_params and
the slow_params. inner_optimizer update fast_params every
training step. Lookahead updates the slow_params and fast_params
every k training steps as follows:

.. math::

    slow\_param_t &= slow\_param_{t-1} + \\alpha * (fast\_param_{t-1} - slow\_param_{t-1})

    fast\_param_t &=  slow\_param_t

Args:
    inner_optimizer (Optimizer): The optimizer that update fast params step by step.
    alpha (float, optional): The learning rate of Lookahead. The default value is 0.5.
    k (int, optional): The slow params is updated every k steps. The default value is 5.
    name (str, optional): Normally there is no need for user to set this property.
        For more information, please refer to :ref:`api_guide_Name`.
        The default value is None.

Examples:

    .. code-block:: python

        >>> import numpy as np
        >>> import paddle
        >>> import paddle.nn as nn

        >>> BATCH_SIZE = 16
        >>> BATCH_NUM = 4
        >>> EPOCH_NUM = 4

        >>> IMAGE_SIZE = 784
        >>> CLASS_NUM = 10
        >>> # define a random dataset
        >>> class RandomDataset(paddle.io.Dataset): # type: ignore[type-arg]
        ...     def __init__(self, num_samples):
        ...         self.num_samples = num_samples
        ...     def __getitem__(self, idx):
        ...         image = np.random.random([IMAGE_SIZE]).astype('float32')
        ...         label = np.random.randint(0, CLASS_NUM - 1,
        ...                                 (1, )).astype('int64')
        ...         return image, label
        ...     def __len__(self):
        ...         return self.num_samples

        >>> class LinearNet(nn.Layer):
        ...     def __init__(self):
        ...         super().__init__()
        ...         self._linear = nn.Linear(IMAGE_SIZE, CLASS_NUM)
        ...         self.bias = self._linear.bias
        ...     @paddle.jit.to_static
        ...     def forward(self, x):
        ...         return self._linear(x)

        >>> def train(layer, loader, loss_fn, opt):
        ...     for epoch_id in range(EPOCH_NUM):
        ...         for batch_id, (image, label) in enumerate(loader()):
        ...             out = layer(image)
        ...             loss = loss_fn(out, label)
        ...             loss.backward()
        ...             opt.step()
        ...             opt.clear_grad()
        ...             print("Train Epoch {} batch {}: loss = {}".format(
        ...                 epoch_id, batch_id, np.mean(loss.numpy())))
        >>> layer = LinearNet()
        >>> loss_fn = nn.CrossEntropyLoss()
        >>> optimizer = paddle.optimizer.SGD(learning_rate=0.1, parameters=layer.parameters())
        >>> lookahead = paddle.incubate.LookAhead(optimizer, alpha=0.2, k=5)

        >>> # create data loader
        >>> dataset = RandomDataset(BATCH_NUM * BATCH_SIZE)
        >>> loader = paddle.io.DataLoader(
        ...     dataset,
        ...     batch_size=BATCH_SIZE,
        ...     shuffle=True,
        ...     drop_last=True,
        ...     num_workers=2)

        >>> # doctest: +SKIP('The run time is too long to pass the CI check.')
        >>> train(layer, loader, loss_fn, lookahead)

r   عinner_optimizerعfloatعalphaعintعkعstrعtyper	   عhelperعslowc                َ  >• Uc   S5       eSUs=::  a  S::  d   S5       e   S5       e[        U[        5      (       a  US:”  d   S5       eXl        U R                  R                  c;  [        R
                  R                  5       R                  5       R                  5       nOU R                  R                  n[        TU ])  UUS S US9  X l        X0l        SU l        [        U R                  R                   5      U l        S U l        S U l        g )	Nzinner optimizer can not be Noneç        ç      ً?zBalpha should be larger or equal to 0.0, and less or equal than 1.0r   zk should be a positive integer)عlearning_rateع
parametersعweight_decayع	grad_clipعnameع	lookahead)ع
isinstancer   r   ع_parameter_listعpaddleعstaticعdefault_main_programعglobal_blockعall_parametersعsuperع__init__r   r   r   r	   ع	__class__ع__name__r   ع_global_step_varع_k_var)عselfr   r   r   r#   r    r.   s         €عc/var/www/html/banglarbhumi/venv/lib/python3.13/site-packages/paddle/incubate/optimizer/lookahead.pyr-   عLookAhead.__init__„   s  ّ€ ً ر*ذMذ,MسMذ*طگeص"کsس"ً 	
طPَ	
ر"ً 	
طPَ	
ذ"ô ک!œS×!ر! a¨!£eذMذ-MسMذ+à.شط×ر×/ر/ر7ن—‘×2ر2س4ك‘“ك‘س!ٌ ً ×-ر-×=ر=ˆJن‰رطط!طططً 	ٌ 	
ً Œ
طŒطˆŒ	ـ! $§.،.×"9ر"9س:ˆŒط $ˆشطˆچَ    c                َZ   >• [         TU ]  X5        U R                  R                  X5        g ©N)r,   ع_set_auxiliary_varr   )r2   عkeyعvalr.   s      €r3   r8   عLookAhead._set_auxiliary_varھ   s$   ّ€ ـ‰ر" 3ش,ط×ر×/ر/°ص9r5   c                َ4  • U R                   R                  5         U R                  5         / nU R                   HK  nUR                  (       d  M  UR                  5       c  M)  UR                  5       nUR                  X#45        MM     U R                  SSUS9  g)a+  
Execute the optimizer and update parameters once.

Returns:
    None

Examples:

    .. code-block:: python

        >>> import paddle
        >>> inp = paddle.rand([1,10], dtype="float32")
        >>> linear = paddle.nn.Linear(10, 1)
        >>> out = linear(inp)
        >>> loss = paddle.mean(out)
        >>> sgd = paddle.optimizer.SGD(learning_rate=0.1,parameters=linear.parameters())
        >>> lookahead = paddle.incubate.LookAhead(sgd, alpha=0.2, k=5)
        >>> loss.backward()
        >>> lookahead.step()
        >>> lookahead.clear_grad()

N)عlossعstartup_programعparams_grads)r   عstepع_increment_global_varr&   ع	trainableع
_grad_ivarعappendع_apply_optimize)r2   r?   عparamعgrad_vars       r3   r@   عLookAhead.step®   s‹   € ً2 	×ر×!ر!ش#à×"ر"ش$طˆط×)ش)ˆEط—?—?ظط×رس!س-ط ×+ر+س-گط×#ر# Uذ$5ض6ٌ *ً 	×رط t¸,ً 	ٍ 	
r5   c                َؤ   • [        U[        R                  [        R                  R                  45      (       d   eU H  nU R                  U R                  U5        M!     g r7   )r%   r   عBlockr'   عpirع_add_accumulatorع	_slow_str)r2   عblockr    عps       r3   ع_create_accumulatorsعLookAhead._create_accumulatorsض   sF   € ـک%¤)§/،/´6·:±:×3Cر3Cذ!D×EرEذEذEمˆAط×!ر! $§.،.°!ض4ٍ r5   c                َ$  • [        5       (       aپ  U R                  cM  [        SS/[        R                  " S5      S[
        R                  R                  R                  SSS9S9U l        [
        R                  " U R                  S5      U l        g U R                  c;  [
        R                  R                  [        R                  " S5      S/S	SS
S9U l        U R                  R                  SSU R                  /0SU R                  /0SS0S9  g )Nعint32é   عlookahead_stepFr   ©عvalueع	force_cpu©عdtypeعshaper#   rB   عinitializerr   r   T©r#   r[   rW   rZ   عpersistableع	incrementعXعOutr@   )r   عinputsعoutputsعattrs)r
   r0   r   r   عgenerater'   عnnr\   عConstantInitializerr_   r(   عcreate_global_varr   ع	append_op)r2   s    r3   rA   عLookAhead._increment_global_varـ   s  € ـڈ=‰=ط×$ر$ر,ـ(8ط!طک#ـ$×-ز-ذ.>س?ط#ـ &§	،	× 5ر 5× Iر Iط!¨Uً !Jً !ٌ)گش%ô %+×$4ز$4°T×5Jر5JبCس$PˆDص!à×$ر$ر,ـ(.¯©×(Gر(Gـ$×-ز-ذ.>س?طک#طط!ط $ً )Hً )گش%ً ڈK‰K×!ر!ط طکd×3ر3ذ4ذ5ط ×!6ر!6ذ 7ذ8طکsگmً	 "ٍ r5   c                َ&  • [         R                  " S/SSS9n[         R                  " S/SSS9n[        5       (       a\  [	        SS/[
        R                  " S5      S[         R                  R                  R                  [        U R                  5      SS9S	9nO@[         R                  R                  [
        R                  " S5      S/U R                  SS
S9n[         R                  " U R                  U5      n[         R                   " U R                  U5      n[         R"                  " USS9n[         R                   " Xd5      n[         R"                  " USS9nU R%                  U R&                  US   5      n	XrS   -  SU-
  U	-  -   n
[         R(                  " X©5        U R*                  US   -  SU R*                  -
  U	-  -   n
Xٹ-  SU-
  US   -  -   n[         R(                  " X²S   5        Xٹ-  SU-
  U	-  -   n[         R(                  " X¹5        g )NrT   rS   عlookahead_ones)r[   rZ   r#   عlookahead_zerosعlookahead_kFrV   rY   Tr]   عfloat32)rZ   r   r   )r'   عonesعzerosr
   r   r   re   rf   r\   rg   r   r   r(   rh   ع	remainderr0   عequalعcastع_get_accumulatorrM   عassignr   )r2   rN   عparam_and_gradعone_varعzero_varعk_varعmodعcond_1عcond_2عslow_varعtmp_varع	tmp_var_1s               r3   ع_append_optimize_opعLookAhead._append_optimize_opْ   sص  € ـ—+’+ Q C¨wذ=MرNˆـ—<’<طگ#کWذ+<ٌ
ˆô ڈ=‰=ـ$ططگcـ ×)ز)¨-س8طـ"ںI™I×1ر1×EرEـ §،›-°5ً Fً ٌ‰Eô —M‘M×3ر3ـ ×)ز)¨-س8طگcط—f‘fطط ً 4ً ˆEô ×زکt×4ر4°eس<ˆن—’کd×3ر3°Wس=ˆـ—’کV¨9ر5ˆن—’کcس,ˆـ—’کV¨9ر5ˆà×(ر(¨¯©¸بر9JسKˆà¨!ر,ر,°°F±
¸hر/FرFˆـڈٹگgش(à—*‘*ک~¨aر0ر0°C¸$؟*¹*ر4Dبر3PرPˆطر$¨¨F©
°nہQر6Gر'GرGˆ	ـڈٹگi°ر!2ش3àر$¨¨F©
°hر'>ر>ˆ	ـڈٹگiص*r5   c                ًَ   • [        U[        [        R                  R                  45      (       d   S5       eU R
                  R                  UUUUS9u  pVU R                  5         U R                  XUS9nXV4$ )aٹ  
Add operations to minimize ``loss`` by updating ``parameters``.

Args:
    loss (Tensor): A ``Tensor`` containing the value to minimize.
    startup_program (Program, optional): :ref:`api_paddle_static_Program` for
        initializing parameters in ``parameters``. The default value
        is None, at this time :ref:`api_paddle_static_default_startup_program` will be used.
    parameters (list, optional): List of ``Tensor`` or ``Tensor.name`` to update
        to minimize ``loss``. The default value is None, at this time all parameters
        will be updated.
    no_grad_set (set, optional): Set of ``Tensor``  or ``Tensor.name`` that don't need
        to be updated. The default value is None.

Returns:
    tuple: tuple (optimize_ops, params_grads), A list of operators appended
    by minimize and a list of (param, grad) tensor pairs, param is
    ``Parameter``, grad is the gradient value corresponding to the parameter.
    In static graph mode, the returned tuple can be passed to ``fetch_list`` in ``Executor.run()`` to
    indicate program pruning. If so, the program will be pruned by ``feed`` and
    ``fetch_list`` before run, see details in ``Executor``.

Examples:

    .. code-block:: python

        >>> import paddle

        >>> inp = paddle.rand([1, 10], dtype="float32")
        >>> linear = paddle.nn.Linear(10, 1)
        >>> out = linear(inp)
        >>> loss = paddle.mean(out)
        >>> sgd = paddle.optimizer.SGD(learning_rate=0.1,parameters=linear.parameters())
        >>> lookahead = paddle.incubate.LookAhead(sgd, alpha=0.2, k=5)
        >>> loss.backward()
        >>> lookahead.minimize(loss)
        >>> lookahead.clear_grad()

zThe loss should be an Tensor.)r>   r    عno_grad_set)r>   r?   )	r%   r   r'   rK   عValuer   عminimizerA   rE   )r2   r=   r>   r    r„   عoptimize_opsr?   ع_s           r3   r†   عLookAhead.minimize&  s‘   € ô^ ک$¤¬6¯:©:×+;ر+;ذ <×=ر=ً 	
ط+َ	
ذ=ً
 &*×%9ر%9×%Bر%Bطط+ط!ط#ً	 &Cً &
ر"ˆً 	×"ر"ش$à× ر طہً !ً 
ˆً ذ)ذ)r5   )r0   r1   r   r   r   r   r   )g      à?é   N)
r   r   r   r   r   r   r#   z
str | NoneعreturnعNone)r‹   rŒ   )NNN)
r=   r   r>   zProgram | Noner    zlist[Tensor] | list[str] | Noner„   zset[Tensor] | set[str] | Noner‹   z2tuple[list[Operator], list[tuple[Tensor, Tensor]]])r/   ع
__module__ع__qualname__ع__firstlineno__ع__doc__ع__annotations__rM   r-   r8   r   عdygraph_onlyعimperative_baseعno_gradr@   rP   rA   rپ   r†   ع__static_attributes__ع__classcell__)r.   s   @r3   r   r   $   s  ّ‡ ٌUًn سطƒLط
ƒFط
ƒIطسà€Iً
 ططً$à"ً$ً ً$ً ً	$ً
 ً$ً 
÷$ً $ُL:ً ×رط×رَ$
َ َ ً$
ٍL5ٍٍ<*+ًX ×رً +/ط6:ط59ً@*àً@*ً (ً@*ً 4ً	@*ً
 3ً@*ً 
<ô@*َ ِ@*r5   r   )ع
__future__r   عtypingr   r'   عpaddle.baser   r   عpaddle.base.dygraphr   r“   عpaddle.base.frameworkr   عpaddle.base.layer_helperr	   عpaddle.frameworkr
   عpaddle.optimizerr   عpaddle.pir.corer   r   r   عpaddle.staticr   ع__all__r   © r5   r3   ع<module>r£      sF   ًُ #ه  م ك .ف 7ف *ف 0ف (ف &ف ,وفف.ف%ً €ôC*گ	ُ C*r5   