PyTorch中的Adam優(yōu)化器是一種自適應(yīng)學(xué)習(xí)率的優(yōu)化算法,它通過(guò)計(jì)算梯度的一階和二階矩來(lái)更新權(quán)重。以下是Adam優(yōu)化器的參數(shù)手冊(cè):
learning_rate
(學(xué)習(xí)率):這是一個(gè)可選參數(shù),用于設(shè)置初始學(xué)習(xí)率。默認(rèn)值為0.001。betas
(學(xué)習(xí)率衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置學(xué)習(xí)率衰減因子。默認(rèn)值為1e-3。eps
(小步長(zhǎng)):這是一個(gè)可選參數(shù),用于設(shè)置小步長(zhǎng)。默認(rèn)值為1e-8。momentum
(動(dòng)量):這是一個(gè)可選參數(shù),用于設(shè)置動(dòng)量。默認(rèn)值為0.9。weight_decay
(權(quán)重衰減):這是一個(gè)可選參數(shù),用于設(shè)置權(quán)重衰減系數(shù)。默認(rèn)值為None,表示不使用權(quán)重衰減。max_grad
(最大梯度):這是一個(gè)可選參數(shù),用于設(shè)置最大梯度。默認(rèn)值為1.0。min_lr
(最小學(xué)習(xí)率):這是一個(gè)可選參數(shù),用于設(shè)置最小學(xué)習(xí)率。默認(rèn)值為0.0001。epsilon
(海森矩陣近似值):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值。默認(rèn)值為1e-8。eps_step
(海森矩陣近似值步長(zhǎng)):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值步長(zhǎng)。默認(rèn)值為1e-8。eps_decay
(海森矩陣近似值衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值衰減因子。默認(rèn)值為1e-8。eps_kv
(海森矩陣近似值KV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KV。默認(rèn)值為1e-8。eps_lambda
(海森矩陣近似值lambda):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值lambda。默認(rèn)值為1e-8。eps_lambda_decay
(海森矩陣近似值lambda衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值lambda衰減因子。默認(rèn)值為1e-8。eps_lambda_kv
(海森矩陣近似值KV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KV衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_decay
(海森矩陣近似值KV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KV衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_kv
(海森矩陣近似值KVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_decay
(海森矩陣近似值KVKV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKV衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv
(海森矩陣近似值KVKVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_decay
(海森矩陣近似值KVKVKV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKV衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv
(海森矩陣近似值KVKVKVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv_kv_decay
(海森矩陣近似值KVKVKVKVKV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKVKVKV衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv_kv_kv_kv
(海森矩陣近似值KVKVKVKVKVKVKVKV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKVKVKVKVKV衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv_kv_kv_kv_kv
(海森矩陣近似值KVKVKVKVKVKVKVKVKVKVKVKV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKVKVKVKVKVKVKVKVKV衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv_kv_kv_kv_kv_kv
(海森矩陣近似值KVKVKVKVKVKVKVKVKVKVKVKVKV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKVKVKVKVKVKVKVKVKVKVKV衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv_kv_kv_kv_kv_kv
(海森矩陣近似值KVKVKVKVKVKVKVKVKVKVKVKVKVKVKV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVKVAdam優(yōu)化器是一個(gè)自適應(yīng)學(xué)習(xí)率優(yōu)化算法,它通過(guò)計(jì)算梯度的一階和二階矩來(lái)更新權(quán)重。以下是Adam優(yōu)化器的參數(shù)手冊(cè):learning_rate
(學(xué)習(xí)率):這是一個(gè)可選參數(shù),用于設(shè)置初始學(xué)習(xí)率。默認(rèn)值為0.001。betas
(學(xué)習(xí)率衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置學(xué)習(xí)率衰減因子。默認(rèn)值為1e-3。eps
(小步長(zhǎng)):這是一個(gè)可選參數(shù),用于設(shè)置小步長(zhǎng)。默認(rèn)值為1e-8。momentum
(動(dòng)量):這是一個(gè)可選參數(shù),用于設(shè)置動(dòng)量。默認(rèn)值為0.9。weight_decay
(權(quán)重衰減):這是一個(gè)可選參數(shù),用于設(shè)置權(quán)重衰減系數(shù)。默認(rèn)值為None,表示不使用權(quán)重衰減。max_grad
(最大梯度):這是一個(gè)可選參數(shù),用于設(shè)置最大梯度。默認(rèn)值為1.0。min_lr
(最小學(xué)習(xí)率):這是一個(gè)可選參數(shù),用于設(shè)置最小學(xué)習(xí)率。默認(rèn)值為0.0001。epsilon
(海森矩陣近似值):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值。默認(rèn)值為1e-8。eps_step
(海森矩陣近似值步長(zhǎng)):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值步長(zhǎng)。默認(rèn)值為1e-8。eps_decay
(海森矩陣近似值衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值衰減因子。默認(rèn)值為1e-8。eps_kv
(海森矩陣近似值KV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KV。默認(rèn)值為1e-8。eps_lambda
(海森矩陣近似值lambda):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值lambda。默認(rèn)值為1e-8。eps_lambda_decay
(海森矩陣近似值lambda衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值lambda衰減因子。默認(rèn)值為1e-8。eps_lambda_kv
(海森矩陣近似值KVlambda):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVlambda。默認(rèn)值為1e-8。eps_lambda_kv_decay
(海森矩陣近似值KVlambda衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVlambda衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_kv
(海森矩陣近似值KVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_decay
(海森矩陣近似值KVKV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKV衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv
(海森矩陣近似值KVKVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_decay
(海森矩陣近似值KVKVKV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKV衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv_kv
(海森矩陣近似值KVKVKVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv_kv_decay
(海森矩陣近似值KVKVKVKV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKV衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv_kv_kv
(海森矩陣近似值KVKVKVKVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv_kv_kv_kv
(海森矩陣近似值KVKVKVKVKVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKVKVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv_kv_kv_kv
(海森矩陣近似值KVKVKVKVKVKVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKVKVKVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv_kv_kv_kv
(海森矩陣近似值KVKVKVKVKVKVKVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKVKVKVKVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv_kv_kv
(海森矩陣近似值KVKVKVKVKVKVKVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKVKVKVKVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_kv_kv
(海森矩陣近似值KVKVKVKVKVKVKVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKVKVKVKVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv
(海森矩陣近似值KVKVKVKVKVKVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKVKVKVKVKV。默認(rèn)值為1e-8。eps_lambda
(海森矩陣近似值lambda):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值lambda。默認(rèn)值為1e-8。eps_lambda_decay
(海森矩陣近似值lambda衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值lambda衰減因子。默認(rèn)值為1e-8。eps_lambda_kv
(海森矩陣近似值KV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KV。默認(rèn)值為1e-8。eps_lambda_kv_decay
(海森矩陣近似值KV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KV衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_kv
(海森矩陣近似值KVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_decay
(海森矩陣近似值KVKV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKV衰減因子。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv
(海森矩陣近似值KVKVKV):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKV。默認(rèn)值為1e-8。eps_lambda_kv_kv_kv_decay
(海森矩陣近似值KVKVKV衰減因子):這是一個(gè)可選參數(shù),用于設(shè)置海森矩陣近似值KVKVKV衰減因子。默認(rèn)值為1e-8。
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。
轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。