カテゴリ: サブカル
サイバーパンク的な食べ物
世界を変えた発明
-
- カテゴリ:
- サブカル
1000年後の人類がどうなっているか予想しよう
-
- カテゴリ:
- サブカル
なんでサイバーパンクは流行らないんだよ
【ゲーム】マリオってそんなストーリーだったの!? マリオシリーズのストーリーを時系列に並べたら意外な結果に
【話題】人工知能「DQN」が見せる未来 人間を脅かす日はいつくるのか?
-
- カテゴリ:
- サブカル
1: なつあかねφ ★ 2015/02/27(金) 16:30:52.46 ID:???
人間の脳が学習する仕組みを再現するディープラーニングの研究が進んだことで、コンピューターによる人工知能
(AI)の技術が飛躍的な進化を遂げています。Googleが500億円で買収したといわれているイギリスのベンチャー
企業「DeepMind」が開発したエージェントプログラム「DQN(Deep Q-Network)」は一度プログラムを起動させる
とあとは人間が手を加えなくても「スペースインベーダー」や「ブロック崩し」といったゲームを一人で勝手に
練習し、ハイスコアをたたき出す方法を学習できるレベルに達しており、今後のAI開発をさらに加速させるブレーク
スルーになると考えられています。
Google DeepMind
http://deepmind.com/
Human-level control through deep reinforcement learning : Nature : Nature Publishing Group
http://www.nature.com/nature/journal/v518/n7540/full/nature14236.html
DeepMindが開発しているDQNがスペースインベーダーをプレイしているムービーがこちら。人間によるプレイと
は少し異なる動きを見せることはあるものの、トーチカで身を守りながらインベーダーや上部を横切るUFOを撃墜
して着実にステージをクリアする様子を見ることができます。
DeepMindではDQNに49種類のゲームを与えてプレイ方法を学習させたところ、最終的に29種類のゲームで
人間よりも高いスコアをたたき出すことに成功したとのこと。以下のムービーでは、最初はゲームのルールすら
わかっていなかったようなDQNが100回、200回とプレイを重ねるうちに「ポイントをゲットするためには、どのように
動けばいいのか」を学習している様子がわかります。
Mnih Supplementary Data video 2 R3 - YouTube
https://www.youtube.com/watch?v=cjpEIotvwFY
プレイ回数が600回に達した頃には、ブロックの端を重点的に狙いって壁に穴を開け、上部のスペースにポン
(ボール)を送り込んで大量得点をゲットする技(トンネル)を会得。最終的にDQNは人間の13倍という高い得点を
ゲットすることに成功しているそうです。
DeepMindでは、DQNの学習プログラムに強化学習(RL: Reinforcement Learning)と呼ばれる手法を取り入れ、
学習の効率をアップさせているとのこと。RLとは、ある環境下にいるエージェントが一連の行動を通じて報酬が最も
多く得られるような方策を学習するというもので、これはまさにゲームでハイスコアを狙うために人間があらゆる
方策を試すことと同じ方法といえます。
このように、コンピューターによる人工知能の開発は加速度的に進化を続けており、将来的には人間の脳が完全
に再現される時代が来ても不思議ではないと思えるほどに達しているといえそう。テスラやスペースXを創った
イーロン・マスク氏が「人工知能の進化には注意が必要」と語っているように、将来は人間を超える能力をコン
ピューターが手にしてしまうリスクを考えておくことが必要になってくるのかもしれません。
一方で、DeepMindの創業者であるデミス・ハサビス氏は「まだ脅威に達するには10年以上の時間が必要」と語って
います。まだ先の話であるとはいえ、DQNを「ドキュン」と呼んで笑っていられるのも今だけなのかもしれません。
Inside DeepMind - YouTube
https://www.youtube.com/watch?v=xN1d3qHMIEQ
引用元:Gigazine 2015/02/26
http://gigazine.net/news/20150226-google-deepmind/
(AI)の技術が飛躍的な進化を遂げています。Googleが500億円で買収したといわれているイギリスのベンチャー
企業「DeepMind」が開発したエージェントプログラム「DQN(Deep Q-Network)」は一度プログラムを起動させる
とあとは人間が手を加えなくても「スペースインベーダー」や「ブロック崩し」といったゲームを一人で勝手に
練習し、ハイスコアをたたき出す方法を学習できるレベルに達しており、今後のAI開発をさらに加速させるブレーク
スルーになると考えられています。
Google DeepMind
http://deepmind.com/
Human-level control through deep reinforcement learning : Nature : Nature Publishing Group
http://www.nature.com/nature/journal/v518/n7540/full/nature14236.html
DeepMindが開発しているDQNがスペースインベーダーをプレイしているムービーがこちら。人間によるプレイと
は少し異なる動きを見せることはあるものの、トーチカで身を守りながらインベーダーや上部を横切るUFOを撃墜
して着実にステージをクリアする様子を見ることができます。
DeepMindではDQNに49種類のゲームを与えてプレイ方法を学習させたところ、最終的に29種類のゲームで
人間よりも高いスコアをたたき出すことに成功したとのこと。以下のムービーでは、最初はゲームのルールすら
わかっていなかったようなDQNが100回、200回とプレイを重ねるうちに「ポイントをゲットするためには、どのように
動けばいいのか」を学習している様子がわかります。
Mnih Supplementary Data video 2 R3 - YouTube
https://www.youtube.com/watch?v=cjpEIotvwFY
プレイ回数が600回に達した頃には、ブロックの端を重点的に狙いって壁に穴を開け、上部のスペースにポン
(ボール)を送り込んで大量得点をゲットする技(トンネル)を会得。最終的にDQNは人間の13倍という高い得点を
ゲットすることに成功しているそうです。
DeepMindでは、DQNの学習プログラムに強化学習(RL: Reinforcement Learning)と呼ばれる手法を取り入れ、
学習の効率をアップさせているとのこと。RLとは、ある環境下にいるエージェントが一連の行動を通じて報酬が最も
多く得られるような方策を学習するというもので、これはまさにゲームでハイスコアを狙うために人間があらゆる
方策を試すことと同じ方法といえます。
このように、コンピューターによる人工知能の開発は加速度的に進化を続けており、将来的には人間の脳が完全
に再現される時代が来ても不思議ではないと思えるほどに達しているといえそう。テスラやスペースXを創った
イーロン・マスク氏が「人工知能の進化には注意が必要」と語っているように、将来は人間を超える能力をコン
ピューターが手にしてしまうリスクを考えておくことが必要になってくるのかもしれません。
一方で、DeepMindの創業者であるデミス・ハサビス氏は「まだ脅威に達するには10年以上の時間が必要」と語って
います。まだ先の話であるとはいえ、DQNを「ドキュン」と呼んで笑っていられるのも今だけなのかもしれません。
Inside DeepMind - YouTube
https://www.youtube.com/watch?v=xN1d3qHMIEQ
引用元:Gigazine 2015/02/26
http://gigazine.net/news/20150226-google-deepmind/
【【話題】人工知能「DQN」が見せる未来 人間を脅かす日はいつくるのか?】の続きを読む