Sorry, you have Javascript Disabled! To see this page as it is meant to appear, please enable your Javascript!

ディープラーニングの研究分野その3

AI、データサイエンス

2020.02.24

https://www.simulationroom999.com/blog/jdla-deep-learning-for-general-2020-1/

目次

はじめに
音声認識
強化学習
まとめ

はじめに

ディープラーニングの研究分野である、音声認識と強化学習について記載する。

WaveNet、出力層、隠れ層、入力層、強化学習、方策(ポリシー)ベース(UNREAL)、行動/状態価値関数ベース(Q関数ベース)、モデルべーズ(A3C)、報酬、行動、状態、環境、モデル学習、環境モデル、経験の模倣(プラン更新)

音声認識

RNNの聴覚、音声分野の成果としてWaveNet(ウェーブネット)が存在する。
WaveNetは音声合成(Speech synthesis)と音声認識(Speech recognition)の両方を行えるモデル。

強化学習

強化学習(Reinforcement Learning：RL)の応用はDQN(Deep Q Networks)以降、多数存在。
強化学習の改善手法は以下３つであり、これらすべてを導入したモデルがRAINBOWとなる。

方策(ポリシー)ベース(UNREAL)
行動/状態価値関数ベース(Q関数ベース)
モデルベース(A3C)

まとめ

やや発展中の領域
強化学習はセルフプレイにより、無限に強化される可能性を持っている。

コメント

タイトルとURLをコピーしました