非常抱歉,我們暫時無法提供預覽,您可以試試: 免費下載 ITU-T G.107 AMD 1-2006 前三頁,或者稍后再訪問。
您也可以嘗試購買此標準,
點擊右側 “購買” 按鈕開始采購(由第三方提供)。
點擊下載后,生成下載文件時間比較長,請耐心等待......
例如,如果目標是使阻力系數Cd(t)實時最小化,瞬時獎勵方程Rt則可以定義為?那么DDPG算法中相應的Q值方程Qπ 可表示為特定策略下未來獎勵的預期折現額:式中,E 表示計算期望的數學運算符,rt =EπRt 。γ表示時間上的折扣因子,其值通常在0~1范圍內。s和a分別表示當前狀態和動作。我們需要在每個時間步驟通過優化來優化。換句話說,時間t的最優建筑配置會最大化其價值函數。...
4.內蒙古地區多年大氣可降水量及其轉化效率研究………………王慧清付亞男 包福祥 孟雪峰??????????????????5.額濟納旗典型地表沙塵釋放潛力及沙塵天氣頻發成因………………李寬賈曉鵬 熊鑫 王海兵 李鋼鐵6.西藏高海拔地區氣象數據缺失條件下的ET0計算研究………………湯鵬程 徐冰 高占義高曉瑜7.一種基于SWAT模型的干旱牧區生態脆弱性評價方法-----以艾布蓋河流域為例………………宋一凡...
Copyright ?2007-2022 ANTPEDIA, All Rights Reserved
京ICP備07018254號 京公網安備1101085018 電信與信息服務業務經營許可證:京ICP證110310號