EstrildaEstrilda

Tech

EDGARからデータ取得:ティッカーとCIKの関連を割り出す

#プログラミング#EDGAR

EDGARからデータ取得:ティッカーとCIKの関連を割り出す

EDGARを知っているでしょうか?

EDGARはSEC(米国証券取引委員会)へ提出が義務付けられている書類データを取り扱う公的なシステムの名称です。1996年以降から原則としてアメリカ国内の全ての公開会社の開示書類が公開されています。

前述したように開示書類が原則すべて公開されているため、企業の決算情報なども一次情報としてEDGARから取得可能です。長くなるため複数の記事に分割し最終的にEDGARからForm 10-Kを取得することを目指します。

今回は「目当ての企業のティッカーと取引所をEDGARから取得する方法」をまとめてみたいと思います。

EDGARのデータ開示

前提としてEDGARから取得できるデータは「XBRL」という財務諸表などの国際規格に従った形式です。(別途XBRLについてまとめた記事を作成しているので参照ください)

Form概要
10-K年次報告書
10-K/A年次報告書の修正
10-Q四半期報告書
10-Q/A四半期報告書の修正

代表的な上記を覚えておけば良いでしょう。末尾の「/A」は修正を意味しています。その他の書類についてはEDGARを参照してください。

参考:Accessing EDGAR Data

企業とCIKの紐づけ

EDGARでは「CIK」(Central Index Key)という一意の識別子があり、よく登場します。CIKはSECへ企業が書類を提出するためのサインアップ時に割り当てられるもので、企業ごとに固有です。

CIKとティッカーと企業名がEDGAR上でどのように関連付けられているかは下記の公開ファイルにて確認が可能です。定期的に更新がアナウンスされていますが、正確性や範囲が保証されたものではない点に留意が必要です。

ファイル情報
company_tickers.jsonCIK, ティッカー, 会社名
company_tickers_exchange.jsonCIK, ティッカー,会社名,取引所
AAPLのCIKを調べてみる

例としてAppleを company_tickers_exchange.jsonで確認してみます。

{
  "fields": ["cik", "name", "ticker", "exchange"],
  "data": [
    [320193, "Apple Inc.", "AAPL", "Nasdaq"],
    ...
  ]
}
CIK会社名ティッカー取引所
320193Apple Inc.AAPLNasdaq

上記の情報でEDGARに認識されていることが分かります。

CIKの注意点

なお後述するEDGARのAPIでCIKを用いる場合、10桁の0埋めが必要です。AAPLの場合は「0000320193」となります。

まとめ

company_tickers_exchange.jsonを使うことで、各企業のティッカーと上場している取引所が割り出せるようになりました。

ティッカーは基本的に重複しないため「ティッカーからCIK」もしくは「CIKからティッカー」のどちらもがこのJSONを使うことで割り出しが可能となります。