m2cgen: 機械学習モデルの多言語トランスパイル

近年のAI(人工知能)の発展は目覚ましく、様々な分野でその技術が活用されています。機械学習モデルの構築は、その中心的な役割を担っており、Pythonはその開発言語として広く利用されています。scikit-learnなどの […]

Data-centric AI: データ中心のAIとは何か?

近年のAI(人工知能)の発展は目覚ましく、我々の生活や社会のあらゆる領域に大きな影響を与えています。その躍進を支える重要な要素の一つが、機械学習モデル構築のための豊富で高品質なデータです。 これまでのAI開発では、アルゴ […]

深層学習×状態空間モデル: Mambaアーキテクチャの概要

近年、普段の生活やビジネスでは欠かせないAI技術ですが、ChatGPTをはじめとする大規模言語モデル(LLM)の登場で、Transformerと呼ばれるアーキテクチャが注目を集めています。Transformerは、文章や […]

LoRAによる大規模言語モデルのファインチューニング

ChatGPTをはじめとする大規模言語モデル(LLM)は、その高度な言語処理能力で注目を集めています。しかし、LLMベンダーが提供するモデルを利用する場合、利用料金の問題や、機密情報を含むデータの外部への漏洩リスクが懸念 […]

Pythonで始める因果推論入門

昨今、ビジネスでは、データに基づいた意思決定がますます求められています。しかし、データから得られるのは、あくまで相関関係です。因果関係を正しく理解することで、我々はより確実な予測を行い、効果的な対策を立てることができるよ […]

2024年、LLM研究の最前線:必読論文総まとめ

大規模言語モデル(LLM)は、もはや一部の研究者や開発者にとどまらず、私たちの生活に身近な存在となっています。文章生成、翻訳、情報検索など、その応用の場は多岐にわたります。 しかし、LLMの進化はそれだけにとどまりません […]

TabNet: 表形式データ向け深層学習モデル

ディープラーニングは画像やテキストなどの分野で大きな成功を収めていますが、表形式データにおいては未だに決定木をベースにしたブースティング手法が主流です。しかし、表形式データは実世界において最も一般的なデータであり、ディー […]

TSMixer: 多層パーセプトロンベースの多変量時系列モデル

近年、時系列データの予測においては、再帰型ニューラルネットワークやAttention機構を用いた深層学習モデルが主流となっています。これらのモデルは、複雑な時系列データを捉える能力に優れていますが、一方でモデルの複雑化に […]

機械学習によるレコメンデーション入門

レコメンドシステムは、ユーザーの過去の行動履歴や、似たような趣味を持つ他のユーザーの行動データなどをもとに、そのユーザーが興味を持ちそうな商品やコンテンツを予測し、提案する情報フィルタリングシステムの一種です。 協調フィ […]

距離学習入門 ~様々なタスクに応用できる機械学習手法~

距離学習(Metric Learning)は、データ間の類似度を学習する 機械学習の一手法です。従来の教師あり学習が、与えられたデータから特定のラベルや値を予測することを目的とするのに対し、距離学習は、データ間の関係性そ […]