ó RÐ¦i<ãóN•SrSSKr"SS\RR5rg)zšAdaHessian Optimizer Lifted from https://github.com/davda54/ada-hessian/blob/master/ada_hessian.py Originally licensed MIT, Copyright 2020, David Samuel éNcó¼^•\rSrSrSrS U4Sjjr\S5rSrSr \ R"5S5r\ R"5SSj5r S rU=r$)Ú Adahessiané aº Implements the AdaHessian algorithm from "ADAHESSIAN: An Adaptive Second OrderOptimizer for Machine Learning" Arguments: params (iterable): iterable of parameters to optimize or dicts defining parameter groups lr (float, optional): learning rate (default: 0.1) betas ((float, float), optional): coefficients used for computing running averages of gradient and the squared hessian trace (default: (0.9, 0.999)) eps (float, optional): term added to the denominator to improve numerical stability (default: 1e-8) weight_decay (float, optional): weight decay (L2 penalty) (default: 0.0) hessian_power (float, optional): exponent of the hessian trace (default: 1.0) update_each (int, optional): compute the hessian trace approximation only after *this* number of steps (to save time) (default: 1) n_samples (int, optional): how many times to sample `z` for the approximation of the hessian trace (default: 1) c óT>•SU::d[SU35eSU::d[SU35eSUSs=::aS:dO [SUS35eSUSs=::aS:dO [SUS35eSUs=::aS::dO [S U35eX€lXplXlS Ul[ R"5RUR5Ul[UUUUUS9n [[U]3X5 UR5HnSUlSURUS'M g) NçzInvalid learning rate: zInvalid epsilon value: rçð?z#Invalid beta parameter at index 0: éz#Invalid beta parameter at index 1: zInvalid Hessian power value: iÿÿÿ)ÚlrÚbetasÚepsÚweight_decayÚ hessian_powerúhessian step)Ú ValueErrorÚ n_samplesÚupdate_eachÚavg_conv_kernelÚseedÚtorchÚ GeneratorÚmanual_seedÚ generatorÚdictÚsuperrÚ__init__Ú get_paramsÚhessÚstate) ÚselfÚparamsr rrr rrrrÚdefaultsÚpÚ __class__s €ÚT/var/www/html/ai-image-ml/venv/lib/python3.13/site-packages/timm/optim/adahessian.pyrÚAdahessian.__init__s4ø€ðb‹yÜÐ6°r°dÐ;Ó<Ð<Øc‹zÜÐ6°s°eÐ<Ó=Ð=Øe˜A‘hÕ$ Õ$ÜÐBÀ5ÈÁ8À*ÐMÓNÐNØe˜A‘hÕ$ Õ$ÜÐBÀ5ÈÁ8À*ÐMÓNÐNØmÕ* sÕ*ÜÐ<¸]¸OÐLÓMÐMà"ŒØ&ÔØ.ÔðˆŒ ÜŸšÓ*×6Ñ6°t·y±yÓAˆŒäØØØØ%Ø'ñ ˆô Œj˜$Ñ(¨Ô:à—‘Ö"ˆAØˆAŒFØ,-ˆDJ‰Jq‰M˜.Ó)ò#ócó•g)NT©©rs r$Úis_second_orderÚAdahessian.is_second_orderFs€àr&có(•SUR5$)z8 Gets all parameters in all param_groups with gradients c3ób# •UH%oSHo"R(dMUv• M M' g7f)r N)Ú requires_grad)Ú.0Úgroupr"s r$Ú Ú(Adahessian.get_params..Os"é€Ð]Ò0eÀ½/°QÏ_Í_—‘¹/‘Ò0ùs‚/¢ /)Úparam_groupsr)s r$rÚAdahessian.get_paramsJs€ñ ^˜t×0Ò0Ó]Ð]r&cóò•UR5Hcn[UR[5(aM$URUSUR -S:XdMIURR 5 Me g)z+ Zeros out the accumulated hessian traces. rrN)rÚ isinstancerÚfloatrrÚzero_)rr"s r$Úzero_hessianÚAdahessian.zero_hessianQsT€ð —‘Ö"ˆAÜ˜aŸf™f¤e×,Ó,°·±¸A±¸~Ñ1NÐQU×QaÑQaÑ1aÐefÕ1fØ—‘—‘–ò#r&cóÌ•/n[SUR55HQnURUSUR-S:XaUR U5 URUS==S- ss'MS [U5S:XagURRUSR:waA[R"USR5RUR5UlUVs/sHo"RPM nn[UR5H¼nUVs/sHCn[R"SSUR!5URURS9S-S - PME nn[R"RX1US X@RS- :S9n[%XeU5H*upxnU=R&Xx-UR-- slM, M¾ gs snfs snf)zm Computes the Hutchinson approximation of the hessian trace and accumulates it for each trainable parameter. có•URSL$©N)Úgrad)r"s r$ÚÚ(Adahessian.set_hessian..as € !§&¡&°Ñ"4r&rrr Né)rÚdeviceg@rT)Úgrad_outputsÚonly_inputsÚretain_graph)ÚfilterrrrÚappendÚlenrrBrrrrr>ÚrangerÚrandintÚsizeÚautogradÚzipr) rr r"ÚgradsÚiÚzsÚh_zsÚh_zÚzs r$Úset_hessianÚAdahessian.set_hessianZs–€ðˆÜÑ4°d·o±oÓ6GÖHˆAØz‰z˜!‰}˜^Ñ,¨t×/?Ñ/?Ñ?À1ÓDØ— ‘ ˜aÔ ØJ‰Jq‰M˜.Ó)¨QÑ.Õ)ñIô ˆv‹;˜!ÓØà>‰>× Ñ F¨1¡I×$4Ñ$4Ó4Ü"Ÿ_š_¨V°A©Y×-=Ñ-=Ó>×JÑJÈ4Ï9É9ÓUˆDŒNá!'Ó(¢˜A—”¡ˆÐ(ät—~‘~Ö&ˆAápvÓwÒpvÐkl”%—-’- 1 a§f¡f£h¸$¿.¹.ÐQR×QYÑQYÑZÐ]`Ñ`ÐcfÔfÑpvˆBÐwÜ—>‘>×&Ñ&Ø¨B¸DÈq×SaÑSaÐdeÑSeÑOeð'ðgˆDä ¨6Ö2‘ ˜Ø—’˜#™' D§N¡NÑ2Ñ2—ó3ò'ùò)ùòxs Ã/GÄ"A G!cóv•SnUbU"5nUR5 UR5 URGHûnUSGHínURb URcM UR (apUR 5S:Xa\[R"UR5RSS/SS9RUR5R5UlURSUS US -- 5 URUn[U5S:Xa7SUS'[R"U5US '[R"U5US'US USpvUSup‰US==S- ss'URU5R!URSU- S9 URU 5R#URURSU - S9 SX…S-- n SX•S-- nUSnX{-R%US-5R!US5n US U -nUR'XmU*S9 GMð GMþ U$)zŸ Performs a single optimization step. Arguments: closure (callable, optional) -- a closure that reevaluates the model and returns the loss (default: None) Nr érAéT)ÚdimÚkeepdimr r r rÚstepÚexp_avgÚexp_hessian_diag_sqr)Úalpha)Úvaluerr)r9rTr3r>rrrYrÚabsÚmeanÚ expand_asÚcloneÚmul_rrHÚ zeros_likeÚadd_Úaddcmul_Úpow_Úaddcdiv_)rÚclosureÚlossr0r"rr\r]Úbeta1Úbeta2Úbias_correction1Úbias_correction2ÚkÚdenomÚ step_sizes r$r[ÚAdahessian.stepvs)€ðˆØÑÙ“9ˆDà×ÑÔØ×ÑÔà×&Õ&ˆEØ˜8•_Ø—6‘6‘> Q§V¡V¡^Ùà×'×'¨A¯E©E«G°q«LÜ"ŸYšY q§v¡vÓ.×3Ñ3¸¸A¸ÈÐ3ÐM×WÑWÐXY×X^ÑX^Ó_×eÑeÓgA”Fð—‘q˜5 ™;¨¨~Ñ)>Ñ>Ñ>Ô?àŸ ™ 1™ ôu“: “?Ø$%E˜&‘Mä',×'7Ò'7¸Ó':E˜)Ñ$ä38×3CÒ3CÀAÓ3FEÐ/Ñ0à/4°YÑ/?ÀÐG\ÑA]Ð,Ø$ W™~‘Øf“ Ñ"“ ð—‘˜UÓ#×(Ñ(¨¯©°q¸5±yÐ(ÑAØ#×(Ñ(¨Ó/×8Ñ8¸¿¹ÀÇÁÈqÐSXÉyÐ8ÑYà#$ u°f± Ñ'=Ñ#=Ð Ø#$ u°f± Ñ'=Ñ#=Ð à˜/Ñ*Ø,Ñ?×EÑEÀaÈ!ÁeÓL×QÑQÐRWÐX]ÑR^Ó_ð" $™KÐ*:Ñ: Ø— ‘ ˜7°)° Ô<ôI%ñ'ðNˆr&)rrrrr)gš™™™™™¹?)gÍÌÌÌÌÌì?g+‡ÙÎ÷ï?g:Œ0âŽyE>rrr r Fr=)Ú__name__Ú __module__Ú__qualname__Ú__firstlineno__Ú__doc__rÚpropertyr*rr9rÚno_gradrTr[Ú__static_attributes__Ú __classcell__)r#s@r$rr s{ø†ñð&ØØØØØØØ!÷*.ðXñóðò^òð‡]‚]ƒ_ñ3óð3ð6‡]‚]ƒ_ó5óö5r&r)rxrÚoptimÚ Optimizerrr(r&r$Úrs'ðñó ôc—‘×&Ñ&õcr&