Neceri atbrīvoties no grāmatām (Umberto Eko)
+371 27000041, +371 27000045
(darba dienās 9:00-17:00 latviešu)
+371 27000041
+371 27000045

(darba dienās 10:00-17:00)

Pastiprināšanas mācīšanās algoritmi Python valodā

29.99 €
Nav noliktavā
Pastiprināšanas mācīšanās algoritmi Python valodā
29.99 €
Šī grāmata palīdzēs lasītājam apgūt nostiprināšanas mācīšanās algoritmus un iemācīties tos īstenot, veidojot pašmācības aģentus.
Pirmajā daļā aplūkoti dažādi DP elementi, darbības joma, instrumenti, kas nepieciešami darbam DP vidē. Otrā un trešā daļa ir par algoritmiem. Autors cita starpā parāda, kā apvienot Q-mācības ar nervu tīkliem sarežģītu problēmu risināšanai, apraksta stratēģijas gradienta metodes, TRPO un PPO, kas ļauj palielināt produktivitāti un stabilitāti, kā arī deterministiskos algoritmus DDPG un TD3. Lasītājs uzzinās, kā darbojas atdarinoša mācību tehnika, iepazīsies ar pētniecības algoritmiem, kuru pamatā ir augšējā ticamības robeža (UCB un UCB1) un metaalgoritms ESBAS. Publikācija paredzēta tiem, kuri interesējas par pētījumiem mākslīgā intelekta jomā, savā darbā pielieto dziļu mācīšanos vai vēlas apgūt pastiprinājumu mācīšanos no nulles. Priekšnoteikums ir Python zināšanas darba līmenī.
Skatīt arī:

Jums varētu būt interesanti:

Разработка требований  к программному обеспечению
Informācijas tehnoloģijas
Programmatūras prasību izstrāde
Vigers Karls, Bītijs Džojs
29.99 €
Ielikt grozā
Совершенный код. Практическое руководство по разработке программного обеспечения
Informācijas tehnoloģijas
Kods pabeigts: praktisks programmatūras izstrādes ceļvedis
Makkonels Stīvs
49.99 €
Ielikt grozā
Алгоритмы. Руководство по разработке
Informācijas tehnoloģijas
Algoritmi: izstrādes rokasgrāmata
Skiena Stefans
39.99 €
Ielikt grozā