Neceri atbrīvoties no grāmatām (Umberto Eko)
+371 27000041, +371 27000045
(darba dienās 9:00-17:00 latviešu)
+371 27000041
+371 27000045

(darba dienās 10:00-17:00)

Pastiprināšanas mācīšanās algoritmi Python valodā

29.99 €
Nav noliktavā
Pastiprināšanas mācīšanās algoritmi Python valodā
29.99 €
Šī grāmata palīdzēs lasītājam apgūt nostiprināšanas mācīšanās algoritmus un iemācīties tos īstenot, veidojot pašmācības aģentus.
Pirmajā daļā aplūkoti dažādi DP elementi, darbības joma, instrumenti, kas nepieciešami darbam DP vidē. Otrā un trešā daļa ir par algoritmiem. Autors cita starpā parāda, kā apvienot Q-mācības ar nervu tīkliem sarežģītu problēmu risināšanai, apraksta stratēģijas gradienta metodes, TRPO un PPO, kas ļauj palielināt produktivitāti un stabilitāti, kā arī deterministiskos algoritmus DDPG un TD3. Lasītājs uzzinās, kā darbojas atdarinoša mācību tehnika, iepazīsies ar pētniecības algoritmiem, kuru pamatā ir augšējā ticamības robeža (UCB un UCB1) un metaalgoritms ESBAS. Publikācija paredzēta tiem, kuri interesējas par pētījumiem mākslīgā intelekta jomā, savā darbā pielieto dziļu mācīšanos vai vēlas apgūt pastiprinājumu mācīšanos no nulles. Priekšnoteikums ir Python zināšanas darba līmenī.
Skatīt arī:

Jums varētu būt interesanti:

Переход в облако. Практическое руководство по организации облачных вычислений для ученых и IT-специалистов
Informācijas tehnoloģijas
Pāreja uz mākoņpakalpojumiem: praktisks ceļvedis mākoņdatošanā zinātniekiem un IT speciālistiem
Anielle Huana, Montess Djego, Iglesiass Havjers Rodeiro
14.99 €
Ielikt grozā
Совершенный код. Практическое руководство по разработке программного обеспечения
Informācijas tehnoloģijas
Kods pabeigts: praktisks programmatūras izstrādes ceļvedis
McConnell Steve
49.99 €
Ielikt grozā
Excel 2019 Библия пользователя
Informācijas tehnoloģijas
Excel 2019 lietotāja Bībele
Alexander Michael, Kusleika Richard, Wokenbach John
99.99 €
Ielikt grozā