仓库 - xiangdangY (xiangdangy)

PyTorch0.4 implementation of: actor critic / proximal policy optimization / acer / ddpg / twin dueling ddpg / soft actor critic / generative adversarial imitation learning / hindsight experience replay

最近更新：接近5年前

1

1

0

xiangdangY/glow

Code for reproducing results in "Glow: Generative Flow with Invertible 1x1 Convolutions"

Python

最近更新：接近5年前

1

0

0

xiangdangY/PythonRobotics

Python sample codes for robotics algorithms.

最近更新：接近5年前

1

1

0

xiangdangY/phd

Prepare for phd

最近更新：接近5年前

1

0

0

xiangdangY/Reco-papers

Classic papers and resources on recommendation

Python

最近更新：接近5年前

1

0

0

xiangdangY/BCQ

PyTorch implementation of BCQ for "Off-Policy Deep Reinforcement Learning without Exploration"

Python

最近更新：接近5年前

1

1

0

xiangdangY/pretrained-models.pytorch

Pretrained ConvNets for pytorch: NASNet, ResNeXt, ResNet, InceptionV4, InceptionResnetV2, Xception, DPN, etc.

Python

最近更新：接近5年前

1

0

0

xiangdangY/Statistical-Learning-Method_Code

手写实现李航《统计学习方法》书中全部算法

最近更新：接近5年前

1

0

0

xiangdangY/pytorch-a2c-ppo-acktr-gail

PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR) and Generative Adversarial Imitation Learning (GAIL).

Python

最近更新：接近5年前

xiangdangY

1 0 1 xiangdangY/LaMCTS forked from mirrors_facebookresearch/LaMCTS

3 0 0 Kris/IDC

1 0 0 xiangdangY/DBSCAN-Cluster

1 0 0 xiangdangY/PRML

1 0 0 xiangdangY/Value-Iteration-Networks-PyTorch

1 0 0 xiangdangY/javaScript

1 0 0 xiangdangY/road_detecting

1 0 0 xiangdangY/Sectar

1 0 1 xiangdangY/RL-Adventure

1 0 0 xiangdangY/softqlearning

1 0 0 xiangdangY/pytorch-value-iteration-networks

1 0 0 xiangdangY/RL-Adventure-2

1 1 0 xiangdangY/glow

1 0 0 xiangdangY/PythonRobotics

1 1 0 xiangdangY/phd

1 0 0 xiangdangY/Reco-papers

1 0 0 xiangdangY/BCQ

1 1 0 xiangdangY/pretrained-models.pytorch

1 0 0 xiangdangY/Statistical-Learning-Method_Code

1 0 0 xiangdangY/pytorch-a2c-ppo-acktr-gail

搜索帮助

1

0

1

xiangdangY/LaMCTS forked from mirrors_facebookresearch/LaMCTS

3

0

0

Kris/IDC

1

0

0

xiangdangY/DBSCAN-Cluster

1

0

0

xiangdangY/PRML

1

0

0

xiangdangY/Value-Iteration-Networks-PyTorch

1

0

0

xiangdangY/javaScript

1

0

0

xiangdangY/road_detecting

1

0

0

xiangdangY/Sectar

1

0

1

xiangdangY/RL-Adventure

1

0

0

xiangdangY/softqlearning

1

0

0

xiangdangY/pytorch-value-iteration-networks

1

0

0

xiangdangY/RL-Adventure-2

1

1

0

xiangdangY/glow

1

0

0

xiangdangY/PythonRobotics

1

1

0

xiangdangY/phd

1

0

0

xiangdangY/Reco-papers

1

0

0

xiangdangY/BCQ

1

1

0

xiangdangY/pretrained-models.pytorch

1

0

0

xiangdangY/Statistical-Learning-Method_Code

1

0

0

xiangdangY/pytorch-a2c-ppo-acktr-gail