LangFair: LLMアプリケーションのバイアスと公平性を評価する

近年、大規模言語モデル(LLM) は、テキスト生成、分類、推薦など、様々な分野で活用されています。しかし、LLMにはバイアスが存在することが指摘されており、特定のグループに対して不公平な結果を生み出す可能性があります。こ […]

NGBoost – 機械学習における確率分布推定のブースティングアルゴリズム

近年、機械学習は様々な分野で重要な役割を果たしており、その応用範囲はますます広がっています。特に、回帰問題において、従来の機械学習モデルは、与えられた特徴量に基づいて単一の「最も可能性の高い」予測値、つまり点推定を返すこ […]

The Multimodal Universe: 天文学向け大規模機械学習用ビッグデータ

天文学は、その観測対象の広大さと複雑さから、常に膨大なデータを扱う分野です。近年、技術の進歩に伴い、画像、スペクトル、時系列データなど、多種多様な形式のデータが取得できるようになりました。これらのデータを統合的に解析する […]

m2cgen: 機械学習モデルの多言語トランスパイル

近年のAI(人工知能)の発展は目覚ましく、様々な分野でその技術が活用されています。機械学習モデルの構築は、その中心的な役割を担っており、Pythonはその開発言語として広く利用されています。scikit-learnなどの […]

Data-centric AI: データ中心のAIとは何か?

近年のAI(人工知能)の発展は目覚ましく、我々の生活や社会のあらゆる領域に大きな影響を与えています。その躍進を支える重要な要素の一つが、機械学習モデル構築のための豊富で高品質なデータです。 これまでのAI開発では、アルゴ […]

深層学習×状態空間モデル: Mambaアーキテクチャの概要

近年、普段の生活やビジネスでは欠かせないAI技術ですが、ChatGPTをはじめとする大規模言語モデル(LLM)の登場で、Transformerと呼ばれるアーキテクチャが注目を集めています。Transformerは、文章や […]

LoRAによる大規模言語モデルのファインチューニング

ChatGPTをはじめとする大規模言語モデル(LLM)は、その高度な言語処理能力で注目を集めています。しかし、LLMベンダーが提供するモデルを利用する場合、利用料金の問題や、機密情報を含むデータの外部への漏洩リスクが懸念 […]

深層学習モデルの軽量化: PyTorchによる知識蒸留の実践

近年、ディープラーニングは画像認識、自然言語処理など、様々な分野で目覚ましい成果を上げています。特に、大規模なニューラルネットワークは、大量のデータを学習し、高度なタスクをこなす能力を持っています。しかし、これらのモデル […]

Large Concept Models: 大規模概念モデルとは何か?

近年、大規模言語モデル(LLM)は人工知能分野に革命をもたらし、多くの自然言語タスクにおいて事実上のデファクト・スタンダードとなっています。しかし、現在のLLMは、単語単位で入力と出力を処理するという点で、人間の情報分析 […]

Pythonで始める因果推論入門

昨今、ビジネスでは、データに基づいた意思決定がますます求められています。しかし、データから得られるのは、あくまで相関関係です。因果関係を正しく理解することで、我々はより確実な予測を行い、効果的な対策を立てることができるよ […]