"topic:advantage-actor-critic" — Search

43 results for “topic:advantage-actor-critic”

High-quality single file implementation of Deep Reinforcement Learning algorithms with research-friendly features (PPO, DQN, C51, DDPG, TD3, SAC, PPG)

Python9.3k1.0kUpdated 1 hour ago

a2cactor-criticadvantage-actor-criticaleatarideep-learningdeep-reinforcement-learninggymmachine-learningphasic-policy-gradientppoproximal-policy-optimizationpythonpytorchreinforcement-learningwandb

ikostrikov/pytorch-a2c-ppo-acktr-gail

PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR) and Generative Adversarial Imitation Learning (GAIL).

Python3.9k842Updated 2 days ago

a2cacktractor-criticadvantage-actor-criticaleataricontinuous-controldeep-learningdeep-reinforcement-learninghessiankfackronecker-factored-approximationmujoconatural-gradientsppoproximal-policy-optimizationpytorchreinforcement-learningroboschoolsecond-order

qfettes/DeepRL-Tutorials

Contains high quality implementations of Deep Reinforcement Learning algorithms written in PyTorch

Jupyter Notebook1.1k327Updated 2 weeks ago

a2cactor-criticadvantage-actor-criticcategorical-dqndeep-q-networkdeep-recurrent-q-networkdeep-reinforcement-learningdeeprl-tutorialsdouble-dqndueling-dqngaemulti-step-learningnoisy-networksppoprioritized-experience-replaypython3pytorchquantile-regressionrainbowreinforcement-learning

Kismuz/btgym

Scalable, event-driven, deep-learning-friendly backtesting library

Python1.0k261Updated 2 weeks ago

a3cadvantage-actor-criticalgorithmic-trading-libraryalgoritmic-tradingbacktesting-trading-strategiesbacktraderdeep-reinforcement-learninggym-environmenthacktoberfestopenai-gympolicy-gradientpolicy-optimisationquantitive-financereinforcement-learningstatistical-arbitragetensorflowtime-seriesunreal

cpnota/autonomous-learning-library

A PyTorch library for building deep reinforcement learning agents.

Python65573Updated 1 month ago

a2cadvantage-actor-criticddpgdeep-deterministic-policy-gradientdeep-q-learningdeep-reinforcement-learningdqndqn-pytorchppoproximal-policy-optimizationreinforcement-learningreinforcement-learning-algorithmssacsoft-actor-critic

ChenglongChen/pytorch-DRL

PyTorch implementations of various Deep Reinforcement Learning (DRL) algorithms for both single agent and multi-agent.

Python610109Updated 1 day ago

a2cacktractor-criticadvantage-actor-criticddpgdeep-deterministic-policy-gradientdeep-q-networkdeep-reinforcement-learningdqndrlmadrlmulti-agentppoproximal-policy-optimizationpytorchreinforcement-learningrl

Omegastick/pytorch-cpp-rlArchived

PyTorch C++ Reinforcement Learning

C++53187Updated 1 week ago

a2cactor-criticadvantage-actor-criticcontinuous-controlcpluspluscpplibtorchppoproximal-policy-optimizationpytorchpytorch-cpp-frontendpytorch-rlreinforcement-learningreinforcement-learning-algorithms

PacktPublishing/Hands-On-Intelligent-Agents-with-OpenAI-Gym

Code for Hands On Intelligent Agents with OpenAI Gym book to get started and learn to build deep reinforcement learning agents using PyTorch

Python397157Updated 3 weeks ago

actor-criticadvantage-actor-criticcarla-driving-simulatorcarla-simulatordeep-reinforcement-learningdqnintelligent-agentslearning-agentsopenai-gympytorchpytorch-a3cpytorch-carla

bentrevett/pytorch-rlArchived

Tutorials for reinforcement learning in PyTorch and Gym by implementing a few of the popular algorithms. [IN PROGRESS]

Jupyter Notebook29578Updated 1 week ago

a2cactor-criticadvantage-actor-criticgeneralized-advantage-estimationpolicy-gradientpytorchpytorch-implementationpytorch-implmentionpytorch-rlpytorch-tutorialpytorch-tutorialsreinforcement-learningreinforcement-learning-algorithmsrl

inoryy/tensorflow2-deep-reinforcement-learning

Code accompanying the blog post "Deep Reinforcement Learning with TensorFlow 2.1"

Jupyter Notebook20650Updated 6 months ago

a2cadvantage-actor-criticdeep-reinforcement-learningkerastensorflowtensorflow2

lcswillems/torch-ac

Recurrent and multi-process PyTorch implementation of deep reinforcement Actor-Critic algorithms A2C and PPO

Python20666Updated 1 month ago

a2ca3cactor-criticadvantage-actor-criticdeep-reinforcement-learningminigridmulti-processppoproximal-policy-optimizationpytorchrecurrentrecurrent-neural-networksreinforcement-learningreward-shaping

CherryPieSexy/imitation_learning

PyTorch implementation of some reinforcement learning algorithms: A2C, PPO, Behavioral Cloning from Observation (BCO), GAIL.

Python14915Updated 3 months ago

a2cadvantage-actor-criticdeep-learningdeep-reinforcement-learninggailgail-ppoimitation-learningpolicy-gradientppoppo-algoppo-pytorchproximal-policy-optimizationpytorchrecurrent-pporeinforcement-learning

jcwleo/curiosity-driven-exploration-pytorch

Curiosity-driven Exploration by Self-supervised Prediction

Python14732Updated 1 week ago

advantage-actor-criticcuriosity-drivenicmproximal-policy-optimizationpytorchreinforcement-learning

Urinx/ReinforcementLearning

Reinforcing Your Learning of Reinforcement Learning

Python9622Updated 1 month ago

advantage-actor-criticalphagoalphago-zeroatari-2600cartpoleddpgdoomdqnfrozenlakegomokumctspolicy-gradientppoq-learningreinforcement-learningspace-invaderstic-tac-toe

rpatrik96/pytorch-a2c

A well-documented A2C written in PyTorch

Python529Updated 7 months ago

a2cactor-criticadvantageadvantage-actor-criticbaselinesdeep-learningdeep-neural-networksdeep-reinforcement-learningepisode-rolloutopenai-gympythonpython3pytorchpytorch-implementationpytorch-tutorialreinforcement-learningreinforcement-learning-agentreinforcement-learning-algorithmsstable-baselines

med-air/DEX

[ICRA 2023] Demonstration-Guided Reinforcement Learning with Efficient Exploration for Task Automation of Surgical Robot

Python4612Updated 1 month ago

advantage-actor-criticautomation-roboticsawacddpggailgoal-conditioned-rlhindsight-experience-replaypytorch-rlreinforcement-learningsacsqilsurgical-robots

popovicidaniela/Master-Thesis

Deep Reinforcement Learning in Autonomous Driving: the A3C algorithm used to make a car learn to drive in TORCS; Python 3.5, Tensorflow, tensorboard, numpy, gym-torcs, ubuntu, latex

TeX383Updated 3 months ago

a3cactor-criticadvantage-actor-criticasynchronousautonomous-drivingdeep-learningdeep-neural-networksdeep-reinforcement-learninggym-torcslatexmulti-threadingmultithreadingnumpypythonpython-3-5reinforcement-learningreinforcement-learning-algorithmstensorboardtensorflowtorcs

dionhaefner/yahtzotron

The friendly robot that beats you in Yahtzee 🤖 🎲

Python223Updated 9 months ago

advantage-actor-critichaikujaxreinforcement-learningyahtzeeyatzy

monoelh/deep-reinforcement-learning_DDQN_PPO_HER

MLP-framework (pure numpy) and DDQN-framework for OpenAI's Gym games. +test code for PPO added. +Hindsight Experience Replay(HER) bitflip-DQN example. +prioritized replay.

Jupyter Notebook192Updated 6 months ago

advantage-actor-criticddqnddqn-frameworkdeep-q-networkdeep-reinforcement-learninggamehindsight-experience-replaymlp-frameworknumpyopenai-gympolicy-networkppoprioritized-replay

Akella17/Deep-Bayesian-Quadrature-Policy-Optimization

Official implementation of the AAAI 2021 paper Deep Bayesian Quadrature Policy Optimization.

Python177Updated 5 months ago

actor-criticadvantage-actor-criticbayesian-quadraturecontinuous-controldeep-learningdeep-reinforcement-learninggaussian-processesmonte-carlomujoconatural-policy-gradientpolicy-gradientprobablistic-numericspytorchreinforcement-learningroboschooltrust-region-policy-optimization

Po-Hsun-Su/dprl

Deep reinforcement learning package for torch7

Lua168Updated 11 months ago

advantage-actor-criticdeep-reinforcement-learningdqntorch7

chagmgang/pysc2_rl

No description provided.

Python100Updated 2 years ago

a2cadvantage-actor-criticdeep-learningdeep-q-learningppoproximal-policy-optimizationpysc2pysc2-mini-gamesreinfrocement-learning

saif99j/GAIL

🌊 Implement advanced algorithms for USV path planning using reinforcement and imitation learning, ensuring efficient and safe navigation in complex environments.

Python60Updated just now

actor-criticadvantage-actor-criticbipedcontinuous-controldeep-reinforcement-learninggailgenerative-adversarial-networkimitation-learninginverse-reinforcement-learningirlkfackronecker-factored-approximationopenai-gympytorchroboschooltensorflowtrpovail

ayush5harma/EspeonArchived

It's a Raspberry Pi Pokémon that gamifies WiFi Hacking by learning from its surrounding WiFi environment utilising deep Reinforcement Learning.

Python53Updated 6 months ago

advantage-actor-criticbettercap-ngdeep-reinforcement-learninginternet-of-thingswireless-security

rystrauss/interactArchived

Implementations of deep reinforcement learning algorithms.

Python30Updated 1 year ago

a2cadvantage-actor-criticartificial-intelligenceddpgdeep-learningdeep-q-learningdqnphasic-policy-gradientppoprioritized-experience-replayproximal-policy-optimizationreinforcement-learningsacsoft-actor-critictd3tensorflow

nitish-kalan/CartPole-v1-Advantage-Actor-Critic-A2C-Keras

Solving CartPole-v1 environment in Keras with Advantage Actor Critic (A2C) algorithm an Deep Reinforcement Learning algorithm

Python34Updated 2 years ago

actor-criticadvantage-actor-criticcartpole-gamebotcartpole-v1machine-learningreinforcement-learningreinforcement-learning-algorithms

KosmidisMixalis/Socially-Aware-Robot-Navigation-with-Stochastic-Advantage-Actor-Critic

No description provided.

C++20Updated 1 day ago

advantage-actor-criticclearpath-ridgebackdeep-reinforcement-learningpythonros-noeticsocial-navigation

AliBakly/CartPole-A2C-reinforcement-learning

This repository contains the implementation of the K-workers, n-step Advantage Actor-Critic (A2C) algorithm applied to the CartPole environment, as part of a reinforcement learning project for the EPFL Spring Semester 2024 course on Artificial Neural Networks and Reinforcement Learning.

Jupyter Notebook10Updated 1 year ago

advantage-actor-criticartificial-intelligencecartpolepytorchreinforcement-learning

TristanDonze/Deep-RL-Blackbox-Challenge

PPO and A2C implementations for a noisy blackbox environment challenge

Python00Updated 4 months ago

actor-criticadvantage-actor-criticdeep-reinforcement-learningproximal-policy-optimizationreinforcement-learning

dodoseung/a2c-advantage-actor-critic-pytorch

The pytorch implemetation of a2c

Python00Updated 4 years ago

a2ca2c-pytorchadvantage-actor-criticdeep-reinforcement-learningpytorch

Page 1 of 2