Neceri atbrīvoties no grāmatām (Umberto Eko)
+371 27000041, +371 27000045
(darba dienās 9:00-17:00 latviešu)
+371 27000041
+371 27000045

(darba dienās 10:00-17:00)

Pastiprināšanas mācīšanās algoritmi Python valodā

29.99 €
Nav noliktavā
Pastiprināšanas mācīšanās algoritmi Python valodā
29.99 €
Šī grāmata palīdzēs lasītājam apgūt nostiprināšanas mācīšanās algoritmus un iemācīties tos īstenot, veidojot pašmācības aģentus.
Pirmajā daļā aplūkoti dažādi DP elementi, darbības joma, instrumenti, kas nepieciešami darbam DP vidē. Otrā un trešā daļa ir par algoritmiem. Autors cita starpā parāda, kā apvienot Q-mācības ar nervu tīkliem sarežģītu problēmu risināšanai, apraksta stratēģijas gradienta metodes, TRPO un PPO, kas ļauj palielināt produktivitāti un stabilitāti, kā arī deterministiskos algoritmus DDPG un TD3. Lasītājs uzzinās, kā darbojas atdarinoša mācību tehnika, iepazīsies ar pētniecības algoritmiem, kuru pamatā ir augšējā ticamības robeža (UCB un UCB1) un metaalgoritms ESBAS. Publikācija paredzēta tiem, kuri interesējas par pētījumiem mākslīgā intelekta jomā, savā darbā pielieto dziļu mācīšanos vai vēlas apgūt pastiprinājumu mācīšanos no nulles. Priekšnoteikums ir Python zināšanas darba līmenī.
Skatīt arī:

Jums varētu būt interesanti:

Excel 2019 Библия пользователя
Informācijas tehnoloģijas
Excel 2019 lietotāja Bībele
Alexander Michael, Kusleika Richard, Wokenbach John
99.99 €
Ielikt grozā
Компьютерные науки. Базовый курс
Informācijas tehnoloģijas
Datorzinātnes: pamatkurss
Brillov Dennis, Brookshire J. Glenn
99.99 €
Ielikt grozā
Java для чайников
Informācijas tehnoloģijas
Java iesācējiem
Baird Barry
39.99 €
Ielikt grozā