ai-on-browser
diff --git a/‎README.md
Lines changed: 1 addition & 1 deletion b/‎README.md
Lines changed: 1 addition & 1 deletion
diff --git a/‎js/model_selector.js
Lines changed: 1 addition & 0 deletions b/‎js/model_selector.js
Lines changed: 1 addition & 0 deletions
diff --git a/‎js/view/a2c.js
Lines changed: 208 additions & 0 deletions b/‎js/view/a2c.js
Lines changed: 208 additions & 0 deletions
@@ -43,7 +43,7 @@ Javascript AI package and demo on the browser.
 | edge detection | Roberts cross, Sobel, Prewitt, Laplacian, LoG, Canny, Snakes |
 | word embedding | Word2Vec |
 | recommendation | association analysis |
-| markov decision process | Dynamic programming, Monte carlo, Q learning, SARSA, Policy gradient, DQN, Genetic algorithm |
+| markov decision process | Dynamic programming, Monte carlo, Q learning, SARSA, Policy gradient, DQN, DDQN, A2C, Genetic algorithm |
 | game | |
 
 ## Datas
 
@@ -404,6 +404,7 @@ const AIMethods = [
 			{ value: 'sarsa', title: 'SARSA' },
 			{ value: 'policy_gradient', title: 'Policy Gradient' },
 			{ value: 'dqn', title: 'DQN / DDQN' },
+			{ value: 'a2c', title: 'A2C' },
 			{ value: 'genetic_algorithm', title: 'Genetic Algorithm' },
 		],
 	},
 
@@ -0,0 +1,208 @@
+import A2CAgent from '../../lib/model/a2c.js'
+
+class A2CCBAgent {
+	constructor(env, resolution, layers, optimizer, use_worker, cb) {
+		this._agent = new A2CAgent(env, resolution, 50, layers, optimizer)
+		cb && cb()
+	}
+
+	set method(value) {
+		this._agent.method = value
+	}
+
+	terminate() {}
+
+	get_score(env, cb) {
+		const score = this._agent.get_score(env)
+		cb && cb(score)
+	}
+
+	get_action(env, state, cb) {
+		const action = this._agent.get_action(env, state)
+		cb && cb(action)
+	}
+
+	update(action, state, next_state, reward, done, learning_rate, batch, cb) {
+		this._agent.update(action, state, next_state, reward, done, learning_rate, batch)
+		cb && cb()
+	}
+}
+
+var dispA2C = function (elm, env) {
+	let resolution = 20
+	if (env.type === 'grid') {
+		env.env._max_step = 1000
+		resolution = Math.max(...env.env.size)
+	}
+	const builder = new NeuralNetworkBuilder()
+
+	const use_worker = false
+	let readyNet = false
+	let agent = null
+	let cur_state = env.reset(agent)
+
+	const render_score = cb => {
+		if (env.type === 'grid') {
+			agent.get_score(env, score => {
+				env.render(() => score)
+				cb && cb()
+			})
+		} else {
+			env.render()
+			cb && cb()
+		}
+	}
+
+	const step = (cb, render = true) => {
+		if (!readyNet) {
+			cb && cb()
+			return
+		}
+		const learning_rate = +elm.select('[name=learning_rate]').property('value')
+		const batch = +elm.select('[name=batch]').property('value')
+		agent.get_action(env, cur_state, action => {
+			let [next_state, reward, done] = env.step(action, agent)
+			agent.update(action, cur_state, next_state, reward, done, learning_rate, batch, () => {
+				const end_proc = () => {
+					cur_state = next_state
+					cb && cb(done)
+				}
+				if (render) {
+					render_score(end_proc)
+				} else {
+					end_proc()
+				}
+			})
+		})
+	}
+
+	const reset = cb => {
+		if (!readyNet) {
+			cb && cb()
+			return
+		}
+		cur_state = env.reset(agent)
+		render_score(() => {
+			cb && cb()
+		})
+	}
+
+	elm.append('span').text(' Hidden Layers ')
+	builder.makeHtml(elm, { optimizer: true })
+	agent = new A2CCBAgent(env, resolution, builder.layers, builder.optimizer, use_worker, () => {
+		readyNet = true
+		setTimeout(() => {
+			render_score(() => {
+				elm.selectAll('input').property('disabled', false)
+			})
+		}, 0)
+	})
+	elm.append('input')
+		.attr('type', 'button')
+		.attr('value', 'New agent')
+		.on('click', () => {
+			agent.terminate()
+			agent = new A2CCBAgent(env, resolution, builder.layers, builder.optimizer, use_worker, () => {
+				readyNet = true
+				reset()
+			})
+			elm.select('[name=greedy_rate]').property('value', 1)
+		})
+	elm.append('input').attr('type', 'button').attr('value', 'Reset').on('click', reset)
+	elm.append('span').text(' Learning rate ')
+	elm.append('input')
+		.attr('type', 'number')
+		.attr('name', 'learning_rate')
+		.attr('min', 0)
+		.attr('max', 100)
+		.attr('step', 0.01)
+		.attr('value', 0.001)
+	elm.append('span').text(' Batch size ')
+	elm.append('input')
+		.attr('type', 'number')
+		.attr('name', 'batch')
+		.attr('value', 10)
+		.attr('min', 1)
+		.attr('max', 100)
+		.attr('step', 1)
+	elm.append('input')
+		.attr('type', 'button')
+		.attr('value', 'Step')
+		.on('click', () => step())
+	let isRunning = false
+	const epochButton = elm
+		.append('input')
+		.attr('type', 'button')
+		.attr('value', 'Epoch')
+		.on('click', () => {
+			isRunning = !isRunning
+			epochButton.attr('value', isRunning ? 'Stop' : 'Epoch')
+			skipButton.property('disabled', isRunning)
+			if (isRunning) {
+				;(function loop() {
+					if (isRunning) {
+						step(done => {
+							setTimeout(() => (done ? reset(loop) : loop()))
+						})
+					} else {
+						setTimeout(() => {
+							render_score(() => {
+								epochButton.attr('value', 'Epoch')
+							})
+						}, 0)
+					}
+				})()
+			}
+		})
+	const skipButton = elm
+		.append('input')
+		.attr('type', 'button')
+		.attr('value', 'Skip')
+		.on('click', () => {
+			isRunning = !isRunning
+			skipButton.attr('value', isRunning ? 'Stop' : 'Skip')
+			epochButton.property('disabled', isRunning)
+			if (isRunning) {
+				let lastt = new Date().getTime()
+				;(function loop() {
+					while (isRunning) {
+						let dn = false
+						step(done => {
+							dn = done
+							if (use_worker) {
+								done ? reset(loop) : loop()
+							}
+						}, true)
+						if (use_worker) {
+							return
+						}
+						const curt = new Date().getTime()
+						if (dn) {
+							reset()
+						}
+						if (curt - lastt > 200) {
+							lastt = curt
+							setTimeout(loop, 0)
+							return
+						}
+					}
+					render_score(() => {
+						skipButton.attr('value', 'Skip')
+					})
+				})()
+			}
+		})
+	env.plotRewards(elm)
+
+	elm.selectAll('input').property('disabled', true)
+
+	return () => {
+		isRunning = false
+		agent.terminate()
+	}
+}
+
+export default function (platform) {
+	platform.setting.ml.usage = 'Click "step" to update.'
+	platform.setting.terminate = dispA2C(platform.setting.ml.configElement, platform)
+}