Boatrace

No description available

Generate Convert Improve

Install / Use

/learn @griCe14807/Boatrace

About this skill

Quality Score

0/100

README

boatrace

競艇予想を行うプロジェクト.下記の機能があります。

データベース作成. これまでのレース結果をpandas dfに格納
データ解析
自動投票

リポジトリをクローンして使用

git clone https://github.com/griCe14807/boatrace.git

1. データベース作成

レース毎の情報をまとめたpandas.dfを返す

Requirement

pip3 install pandas
pip3 install Beautifulsoup

使い方 (in python)

import loader (from /boatrace/src/data_preparing/loader.py)

モジュールのロード

race_result_df = loader.make_race_result_df()

これまでのレース結果をpandas.DataFrameに格納
格納されたデータの期間を見たい時は、reace_result_df.date.max()およびreace_result_df.date.min()
格納されるデータの種類は/boatrace/column_descriptions.xlsxを参照

racer_df = loader.load_racer_data()

選手ごとの成績やidといった情報を格納したDataFrameを作成
格納されるデータの種類は/boatrace/column_descriptions.xlsxを参照

merged_df = loader.merge_statistic_df(race_result_df, racer_df)

選手情報をレース毎のデータフレームに新しいカラムとして追加し、解析用のDataFrameを作成
- 第一引数：レースのDataFrame
- 第二引数：レーサーごとの統計値のdfを入力。

全てのデータを用いて解析を行うことはまれなので、必要なカラムを指定して小さなDataFrameを作成し、inputにすることを推奨。

元データの準備

レース結果

データソースは公式のダウンロードサイトからのレース結果ダウンロード + 公式サイトからのスクレイプ

データダウンロード

公式のダウンロードサイトdata/results_race/lzh`へ格納 (下記スクリプトを実行)
ダウンロードしたデータを解凍し、./boatrace/data/results_raceフォルダへ移動（手動）

$ src/data_preparing/downloader_race_results.py

※ git clone した場合，19年1月1日〜12月8日のデータがダウンロード済み。

※ 一部レースのデータがうまくパースできないため、パースできないデータはlzhフォルダに残してある

公式サイトからのデータスクレイプ

motor_data_csv_makerを実行. 下の例では8/15から8/17までcrawlし、csv形式で保存

（実行例）
$ python3 src/data_preparing/race_result_supplement_csv_maker.py -k beforeinfo -s 20190815 -e 20190818

必要な引数は以下の3つ

k スクレイプ元のデータ種を指定。keyは下記四つのいづれかを指定。
- "racelist": 出走表 (例) からデータスクレイプ
- "beforeinfo"：直前情報 (例) からデータスクレイプ
- "odds3t"：3連単オッズ (例) をスクレイプ
- "odds2tf"：2連単オッズ (例) をスクレイプ
s スクレイプ開始日
e スクレイプ終了日（一日後を指定）

保存先はdata/motor_and_boat

※ git clone した場合，19年1月1日〜8月15日のデータがダウンロード済み。

選手情報

https://www.boatrace.jp/owpc/pc/extra/data/download.htmlからレーサー期別成績をダウンロード（手動）し，data\racerへ格納

年に二回、4月〜10月分と11月から3月分のデータがまとめてアップロードされるため、そのたびに追加。

※ git clone した場合，19年4月までのデータがダウンロード済み。

2. 解析

準備したデータをロードし、解析を行う。

スクリプトは，共有しやすいよう src/analyze/ 以下にipython notebookファイルとして保存．これまでに行った解析は下記

racertime_scatter_and_rank_bar.ipynb: 対象レースに対して，出場レーサーのこれまでのタイムを散布図にplot
k-NN.ipynb: 一枠の選手が一着になるかどうかをk-NNを用いて予想．
logistic_regression_1.ipynb: LRを用いて1着の一位率および2-6艇の3着以内率を予測。また、Regression結果を用いて様々な条件でbetしてみた時の回収率を計算。
logistic_regression_2.ipynb: 基本logistic_regression_1と同じだが、特徴量を増やした。LR_analyzer, LR_voterはこのアルゴリズムを用いている。

3. 自動投票

Requirement

必要モジュールのインストール

pip3 install selenium

ChromeDriverのインストール

Google Chronme のバージョンに対応したChromeDriverをインストール

Google Chromeのバージョンはgoogle-chrome-stable -versionで確認
Google Chromeのバージョンと対応するChromeDriverのバージョンの確認は下記url (https://sites.google.com/a/chromium.org/chromedriver/downloads)

インストールしたGoogle Chromeに対応するversionをダウンロード（下のコード例では2.34）し、/usr/local/bin/へ移動

wget https://chromedriver.storage.googleapis.com/2.34/chromedriver_linux64.zip
unzip chromedriver_linux64.zip
mv chromedriver /usr/local/bin/

投票アルゴリズムの作成

過去のレースデータを用いた学習

$ python3 src/automated_voting/voting_algolithms/LR_analyzer.py

学習済みのclfは"src/automated_voting/voting_algolithms/LR_dump" に保存される。

学習結果を用いて指定したレース結果を予測

下の例では、2019年7月21日に戸田競艇場で行われる第11レースを予想。クロールを行う関係上、展示タイムが表示されて以降（投票締め切りの10分前以降程度）に実行する必要あり

$ python3 src/automated_voting/voting_algolithms/LR_voter.py -rno 11R -jcd 戸　田 -hd 2019/07/21

アウトプットは、

[1号艇の1着率, 2-6号艇が3着以内に入る確率]

例：[0.60, 0.68, 0.64, 0.49, 0.21, 0.17]
推奨bet list (3連単). 推奨betがない場合空のリストが返される

例：["1-2-3", "1-2-4"]

デフォルトでは、1号艇の1着率が0.6以上、2号艇の3位以内率が0.5以上かつ3-6号艇の中で3着以内率0.5以上のものiがあった場合に2-1-iの形で3連単bet

自動投票

※自分のID, passwardをスクリプトに直うちしているため共有なし

crontab用のスクリプトを作成

crontab_generater を実行

printされたものをcrontab -eにコピペ（手動）

これで、automated_voterが定期的に実行される。

Related Skills

node-connect

349.7k

Diagnose OpenClaw node connection and pairing failures for Android, iOS, and macOS companion apps

frontend-design

109.7k

Create distinctive, production-grade frontend interfaces with high design quality. Use this skill when the user asks to build web components, pages, or applications. Generates creative, polished code that avoids generic AI aesthetics.

openai-whisper-api

349.7k

Transcribe audio via OpenAI Audio Transcriptions API (Whisper).

qqbot-media

349.7k

QQBot 富媒体收发能力。使用 <qqmedia> 标签，系统根据文件扩展名自动识别类型（图片/语音/视频/文件）。