AI、データサイエンス

AI、データサイエンス

ディープラーニングの研究分野 その2

ディープラーニングの研究分野の一つである、自然言語処理分野について記載する。 word2vecは、「単語→ベクトル」の意で、ベクトル空間モデルや単語埋め込みモデルとも言われている。 "単語の意味は、その周辺の単語によって決まる " という言語学の主張をニューラルネットワークで実現したもの。 有名な例は以下。
AI、データサイエンス

ディープラーニングの研究分野 その1

物体を検出することと、物体を認識することは別 しかし、「物体を認識」する過程で「物体を検出」している可能性もある 物体検出は矩形のバンディングボックスと画素単位のセマンティックセグメンテーションに分けられる。 双方をくみあわせることでインスタンスセグメンテーションが実現可能。 R-CNN→fast RCNN→faster RCNN。
AI、データサイエンス

ディープラーニングのテクニック その4

ディープラーニングの合わせ技のようなものが存在。 それらについて記載する。 教師あり学習、教師なし学習以外に強化学習と呼ばれる分野も存在する。 強化学習とは「行動を学習する仕組み」になる。 教師あり学習と混同し易いが、一連の行動系列の結果としての報酬を最大とするように学習する。 明確な答えがあるわけではない。
AI、データサイエンス

ディープラーニングのテクニック その3

ディープラーニングのもう一つの有名どころのモデルとしてRNNについて記載する。 時間軸に対して何かパターンを持っているデータは時間軸に沿って入力される。 時間情報を反映できるような仕組みとして、リカレントニューラルネットワーク(Recurrent Neural Network:RNN)が使用される。
AI、データサイエンス

ディープラーニングのテクニック その2

ディープラーニングの有名どころのモデルとしてCNNについて記載する。 画像データは座標情報(縦横)の2次元に、色情報を加えたもので、数値情報としては3次元になる。 畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)は座標情報の2次元データを入力するモデルとなる。
AI、データサイエンス

ディープラーニングのテクニック その1

ディープラーニングは様々なテクニックの集合体と言える。 ここでは以下の代表的なテクニックを記載する。 勾配消失の問題の最大の原因はシグモイド関数の導関数の最大値が0.25と小さいことであった。 よって、このシグモイド関数を別の物に置き換えることでこの問題が回避できるのでないか? というアプローチの元、シグモイド関数
AI、データサイエンス

ディープラーニング概要

前回までは、AIの歴史やディープラーニングのブレイクスルー前の話が主だった。 今回からディープラーニングの話に突入。 ディープラーニングの基本構造の由来はニューラルネットワーク。 ニューラルネットワーク自体は隠れ層を持つことで非線形分類ができるようになったもの。 単純パーセプトロンと比べると複雑なことができるとはいえる
AI、データサイエンス

機械学習の評価手法

前回は、機械学習の各種手法について取り扱った。 実際に学習するに当たって、以下の手法や考え方がある。 学習データの扱い方 評価指標 機械学習にて手元のデータを学習することで、そのデータの分類、回帰ができるようになるが、重要なのは未知のデータに対しての予測能力である。 しかし、機械学習にとっての未知は、人間にとっても
AI、データサイエンス

機械学習の手法

機械学習の手法は大きく分けて以下となる。 機械学習の手法そのもの 機械学習の評価手法 今回は「機械学習の手法そのもの」について記載する。 学習種類は大きく分けて以下。 教師あり学習 教師なし学習 強化学習 教師あり学習とは以下と定義されている。 与えられたデータ(入力)と元に、そのデータがどんなパターン(出力)になるの
AI、データサイエンス

人工知能の問題点 その2

前回の続き。 ただし、今回の問題点はディープラーニングにより解決されているものも含まれる。 知識獲得のボトルネック 特徴量設計の問題 シンギュラリティ(技術的特異点) 機械翻訳の歴史は以下となる。 1970年代後半:ルールベース機械翻訳 1990年代以降:統計的機械翻訳 コンピュータが「意味」を理解しているため、