【ETF】MATLAB、Pythonで株価予測 その21【VTI⑥】

【ETF】MATLAB、Pythonで株価予測 その21【VTI⑥】株価予測
【ETF】MATLAB、Pythonで株価予測 その21【VTI⑥】

バックナンバーはこちら。
https://www.simulationroom999.com/blog/stock-predict-matlabpython-backnumber/

スポンサーリンク

はじめに

前回は、チャートの取得範囲と分析、予測に使用する列を確定した。
チャート取得範囲は2020年10月~2021年9月。
これは米国の事業年度に合わせている。
参照列はClose(終値)とした。

実際に分析、予測するには少しデータ成形してある方が良いので、事前にやってしまう。

スポンサーリンク

登場人物

博識フクロウのフクさん

指差しフクロウ

イラストACにて公開の「kino_k」さんのイラストを使用しています。
https://www.ac-illust.com/main/profile.php?id=iKciwKA9&area=1

エンジニア歴8年の太郎くん

技術者太郎

イラストACにて公開の「しのみ」さんのイラストを使用しています。
https://www.ac-illust.com/main/profile.php?id=uCKphAW2&area=1

スポンサーリンク

データ整形方針

太郎くん
太郎くん

使用するデータも確定したことだし、
そろそろ一発FFTに掛けてみよう!

フクさん
フクさん

ちょい待ち!

太郎くん
太郎くん

何・・・まだなんかあるの?

フクさん
フクさん

事前にデータ整形を掛けておいた方が良いかなって思って。

太郎くん
太郎くん

データ整形?

フクさん
フクさん

うん。
と言っても、機械学習で言われてるほどのことはやらないけど。

太郎くん
太郎くん

具体的には何するの?

フクさん
フクさん

日足終値全体の平均値を取って、それをそれぞれの日足終値から引く
ってだけ。

太郎くん
太郎くん

なんでそんなことを・・・。

フクさん
フクさん

まぁやらなくても何とかなるんだけど、
信号のオフセット除去くらいはやっておいた方が周波数0[Hz]は除去できる。
除去しなくても影響は無いとは思うが、
可能な限り不要な情報は事前に抹殺しておきたい

太郎くん
太郎くん

言われてみると、振動解析でも似たようなことしたことあるなー。
あれは、周波数0[Hz]成分の除去だったのか???

フクさん
フクさん

まぁ似たようなことをやってる可能性は高いな。

太郎くん
太郎くん

それをMATLABかPythonでやる感じ?

フクさん
フクさん

それでも良いけど、csvだからExcelでやっつけてしまおう。

スポンサーリンク

データ整形

フクさん
フクさん

やることはシンプル。

  • 平均値を算出
  • 各終値から平均値を引いた値を格納する列を用意。
  • その列の値だけをテキストエディタにコピペしてcsvとして保存。
太郎くん
太郎くん

なんか普通にMATLABでもできそうだなー。

フクさん
フクさん

全部が数値なら簡単なんだけど、列の文字列とかが入ってるとちょっと扱い難くはなるな。

太郎くん
太郎くん

え?そうなの?
じゃー、やっぱり事前にやっておこう。

フクさん
フクさん

PythonはPandasとかで一撃で処理できたりするが、
MATLABはversionによってはcsvの対処が難しいことがあるんでね。

太郎くん
太郎くん

今回はMATLABとPythonの両方でやってみようとしている感じのタイトルだから、
MATLAB都合の問題があるなら、そうそうに排除してしまった方が良さげだね。

フクさん
フクさん

とりあえずExcelの画面を出しておく。

Yahooファイナンスから取得したVTIチャートの終値の平均を各終値から引いて周波数0Hzを除去する作業、全終値の平均値、各終値から全終値の平均を引いたもの、この列をテキストエディタにコピペして、csvとして保存
太郎くん
太郎くん

まぁ確かに対した作業ではなかったな。

フクさん
フクさん

ちなみに、グラフ表示するとこんな感じだな。

VTIチャート整形後、VTI  Oct/20~Sep/21
太郎くん
太郎くん

ホントずっと右肩上がりだ・・・。
(そうそうに大半の資産をぶっこんでおきたい・・・。)

スポンサーリンク

まとめ

フクさん
フクさん

まとめだよ。

  • データ整形方針。
    • 単純に平均値を出して、各要素から平均値を引く。
    • バイアス除去になり、周波数0[Hz]が無くなる。
    • MATLABのVersionによってはcvs読み込みに難点があるので、可能な限りシンプルなデータに整形しておく。
  • グラフ表示してみた。
    • ずっと右肩上がり。
    • 本来であれば、一回投資したら放置が正解。

バックナンバーはこちら。

コメント

タイトルとURLをコピーしました