iLTM: 表形式データ向けの大規模基盤モデル
表形式データのモデリングにおいて、長らく実務のデファクトスタンダードとして君臨してきたのは勾配ブースティング決定木(GBDT)でした。画像や自然言語の分野で深層学習が席巻する中、表形式データだけは「GBDTが最適解」とい […]
機械学習モデルにおける不確実性
今日、機械学習モデルは、私たちの生活やビジネスのあらゆる側面に浸透しています。しかしながら、その高い予測精度とは裏腹に、モデルの信頼性や頑健性には依然として重大な課題が残されています。 実際、レベル5の自動運転車がカメラ […]
データ分析や機械学習における外れ値の扱い方
データ分析や機械学習の分野において、「外れ値」の存在は避けて通れない課題の一つです。外れ値とは、データセットの中で他の大多数のデータポイントから大きくかけ離れた値のことを指します。これらは測定誤差、入力ミス、あるいは特異 […]