LoRAによる大規模言語モデルのファインチューニング

ChatGPTをはじめとする大規模言語モデル(LLM)は、その高度な言語処理能力で注目を集めています。しかし、LLMベンダーが提供するモデルを利用する場合、利用料金の問題や、機密情報を含むデータの外部への漏洩リスクが懸念 […]

Pythonで始める因果推論入門

昨今、ビジネスでは、データに基づいた意思決定がますます求められています。しかし、データから得られるのは、あくまで相関関係です。因果関係を正しく理解することで、我々はより確実な予測を行い、効果的な対策を立てることができるよ […]

2024年、LLM研究の最前線:必読論文総まとめ

大規模言語モデル(LLM)は、もはや一部の研究者や開発者にとどまらず、私たちの生活に身近な存在となっています。文章生成、翻訳、情報検索など、その応用の場は多岐にわたります。 しかし、LLMの進化はそれだけにとどまりません […]

TabNet: 表形式データ向け深層学習モデル

ディープラーニングは画像やテキストなどの分野で大きな成功を収めていますが、表形式データにおいては未だに決定木をベースにしたブースティング手法が主流です。しかし、表形式データは実世界において最も一般的なデータであり、ディー […]

TSMixer: 多層パーセプトロンベースの多変量時系列モデル

近年、時系列データの予測においては、再帰型ニューラルネットワークやAttention機構を用いた深層学習モデルが主流となっています。これらのモデルは、複雑な時系列データを捉える能力に優れていますが、一方でモデルの複雑化に […]

機械学習によるレコメンデーション入門

レコメンドシステムは、ユーザーの過去の行動履歴や、似たような趣味を持つ他のユーザーの行動データなどをもとに、そのユーザーが興味を持ちそうな商品やコンテンツを予測し、提案する情報フィルタリングシステムの一種です。 協調フィ […]

距離学習入門 ~様々なタスクに応用できる機械学習手法~

距離学習(Metric Learning)は、データ間の類似度を学習する 機械学習の一手法です。従来の教師あり学習が、与えられたデータから特定のラベルや値を予測することを目的とするのに対し、距離学習は、データ間の関係性そ […]

LitServe: 機械学習モデルの効率的なデプロイ

機械学習モデルは、FlaskやFlastAPIなどのWebフレームワークを使用して、WebAPIとしてデプロイされることが一般的です。これらのフレームワークは、WebAPIを構築するための便利な機能が豊富に含まれています […]

機械学習における表形式データのオーグメンテーション

機械学習において、表形式データは最も広く使用されているデータ形式の1つです。しかし、高品質な表形式データを大量に取得することは依然として大きな課題となっています。この課題を克服するために、オーグメンテーション技術が注目さ […]