クラス不均衡データにおける機械学習モデルの構築
クラス不均衡データとは、あるクラスのデータが圧倒的に多く、他のクラスのデータが非常に少ない状態のデータセットを指します。このようなデータで機械学習モデルを構築すると、多数派クラスに偏った予測をしてしまい、少数派クラスの予 […]
WordLlama: 超軽量の単語埋め込みモデル
WordLlamaとは? WordLlamaは、大規模言語モデル(LLM)の部品を再利用して作られた、効率的でコンパクトな単語表現モデルです。LLMから抽出した単語の埋め込み情報を基に、様々な自然言語処理タスクで活用でき […]
Ollama: ローカルPCでLLMを動かしてみる!
Ollamaは、ローカルPCでオープンソースの大規模言語モデル(LLM)を簡単に利用できる、非常に魅力的なツールです。今回は、Windows環境にOllamaを導入し、LLMを利用する方法について紹介します。 Ollam […]
Introduction to LangChain
LangChainとは? LangChainは、大規模言語モデル(LLM)を活用したアプリケーション開発のためのフレームワークで、LLMアプリケーションのライフサイクルを簡素化できます。 具体的には、以下のオープンソース […]
KAN: Kolmogorov–Arnold Networks
ディープラーニングモデルの多くは、多層パーセプトロン(MLP)に大きく依存していますが、MLPには、解釈が難しさや、Transformerなどのモデルでは埋め込みパラメータ以外のほぼすべてのパラメータを消費してしまうとい […]
「統計的に有意」にだまされてはいけない
科学論文やニュース記事などで、「統計的に有意」という表現を目にしたことがあるのではないでしょうか?一見、説得力がありそうなこの言葉ですが、実は誤解を招きやすい側面も持ち合わせています。 今回は、「統計的に有意」が本当の意 […]