Titanic - Maクロスバリデーションによる学習c

LightGBMのハイパーパラメータ一例

learning_rate：初期値0.1：学習率。各過程の学習をどの程度反映させるかを決める。

max_bin：初期値225：1つの分岐に入るデータ数の最大数。細かくすると細かく分かれ、大きくすると汎用性が高まる。

num_leaves：初期値31：1つの木に含まれる葉の最大数。木の複雑さを制御。

min_data_in_leaf：初期値20：決定木中における1つの葉における最小のデータ数。過学習をコントロールするための値。データ数によって調整

一通りの流れは理解できたが、実際順位を上げるためにどういったプロセスを進むべきかのかがいまいちわからなかった（ハイパーパラメータ調整・クロスバリデーションなど以外に根本的に手法を変えるなど）

参加者の知見を共有できるDiscussion（議論の一覧）やCode（ノートブックの一覧）を一通り読みあさる。

コンペ内でのトライ＆エラーが書いてあって勉強になった。

モデルとしては、LightGBMで試す→特徴量エンジニアリングが重要（既存特徴量から新しい特徴量を作る）→ドメイン知識も重要

通勤中にじっくり見よう↓

個別モデルで行き詰まったら、スタッキング試す？

kerygota’s diary