# 日本の中小銘柄をPythonで漁っている話 @hirokiky http://slides.hirokiky.org/finpy2017lt.html --- ## 日本の中小銘柄を追う ファンダメンタル + 業界とか人間的な僕が知ってる部分 --- ## finpy(になってる?) * Python * Pandas * JupyterNotebook --- ## 流れ 1. データをとりあえず手で取ってきたり解析する 2. JupyterNotebook上でやる 3. Pythonファイルにまとめる --- ## Pythonファイルにまとめる利点 * Jupyterでカオス化の回避 * 共通のパーツを作る --- ## 共通化していった処理 * 有報や短信を表すクラスか * 有報を取ってくる関数 * XBRLに日本語ラベルを適応する関数 * 「魔法の公式」を適応する関数 --- ## 解析元のデータ 金融庁の出しているXBRLファイルを、[有報キャッチャー](http://ufocatch.com/)さんから取得してCSV化、解析 --- ## 決算まとめCSVは他にすでにある [決算プロのCSV](http://ke.kabupro.jp/doc/down40.htm) --- ## 決算プロさんのカラム * 売上高 * 営業利益 * 純利益 などなど --- ## 僕にはデータが足りない情報 * 流動資産 * 発行済株式総数 * 従業員数 * 特別損失 などなど --- ## データが欲しい --- ## なぜデータが欲しい * データが少なければ分類はできない * 少ない次元や観点で見ていれば必ず失敗する --- ## 1次元では分類できなくても ![1次元では分類できない](images/finpy/one_d.png) --- ## 2次元なら分類できる ![2次元なら分類できる](images/finpy/two_d.png) --- ## これは機械学習の話ですが 人間でも同じこと --- ## データを見ている強み * 証券会社の「銘柄別財務情報」にない情報 * 決算プロのサマリーCSVにない情報 --- ## じゃぁどうするか もとの情報(XBRL)から解析する --- ## XBRLは超だるい ものすごく複雑な仕様のXML --- ## どうするか がんばる、けど大変。 --- ## 今の悩み 2013年以前のデータで拡張でないLabelLinkbaseへのリンクがXSDから取れない --- ## 公開しています、が。。 少しデータ古いまま、バグありでちょっとダメ(近日更新予定です。。)。 https://github.com/hirokiky/jp_fin_reports/ --- ## 理想 * 流動資産とか細かいデータも取れるCSV * 2008年とか古いデータも含むCSV --- ## FAQ: どうやって銘柄選ぶ? * 賢明なる投資家 + 独自 * 業界での首位性 * 業界の安定性(地域性) --- ## FAQ: (米株|大型|FX)やらないの? * 日本人が知ってるデータじゃないとこを強みにしたい * 大規模な人が狙わないところを狙いたい * テクニカルで昔大失敗した * あくまでも資産として持ちたい(現物しかやんない) ## FAQ: 儲かりまっか? ぼちぼちでんな --- class: small-image ## お前誰よ * @hirokiky * [BeProud Inc](http://beproud.jp/) で[PyQ](https://pyq.jp/)を作っています ![BeProud](images/beproud.png) --- ## おわり よきfinpyライフを!