Tensorboard support added

2ac37596 · Egli Adrian (IT-SCI-API-PFI) · 7365be1a · 2ac37596
Commit 2ac37596 authored 4 years ago by Egli Adrian (IT-SCI-API-PFI)
--- a/reinforcement_learning/rl_agent_test.py
+++ b/reinforcement_learning/rl_agent_test.py
@@ -3,6 +3,7 @@ from collections import namedtuple

 import gym
 import numpy as np
+from torch.utils.tensorboard import SummaryWriter

 from reinforcement_learning.dddqn_policy import DDDQNPolicy
 from reinforcement_learning.ppo_agent import PPOPolicy
@@ -36,6 +37,9 @@ def cartpole(use_dddqn=False):
    episode = 0
    checkpoint_interval = 20
    scores_window = deque(maxlen=100)
+
+    writer = SummaryWriter()
+
    while True:
        episode += 1
        state = env.reset()
@@ -79,6 +83,10 @@ def cartpole(use_dddqn=False):
                                                                                                                  policy.memory)),
                  end=" ")

+        writer.add_scalar("CartPole/value", tot_reward, episode)
+        writer.add_scalar("CartPole/smoothed_value", np.mean(scores_window), episode)
+        writer.flush()
+

 if __name__ == "__main__":
    cartpole()