以前、Amplitudeは、K平均アルゴリズムに依存して、ペルソナチャートのクラスターを生成していました。ただし、このアプローチには、2つの重要な制限があります:
このような理由から、私たちは、お客様がデータの中から意味のあるユーザー行動のパターンを特定するために、クラスタリングをより効果的に活用する方法を模索し始めました。その作業を通じて、最終的に、K-Meansを非負のマトリックスファクトリックス(NMF)に置き換えることにしました。
データセットを考えると、クラスタリングアルゴリズムは、各パーティション内の類似性が最大になるようなパーティションの方法を探します。また、異なるパーティション間の同様性を同時に最小化するよう、セットをパーティション化する方法を探します。
元の「イベントスペース」で高次元の問題を避けるために、NMFは、より理解可能な「行動スペース」に到達するために、数学的次元減少を明示的に実行します。さらに、この方法は、頻度に基づいてイベントを計量し、各ユーザーのイベントカウントを正規化することで、異常値が出る確率を減少させます。よりシンプルな行動スペースに投影された場合、特定の行動次元に沿って類似のユーザーは、簡単にクラスター/グループ化されます。
注意:行動スペースの寸法の数は、指定されたクラスターの数です;この組み込みの接続のため、NMFクラスターは非常に階層的な傾向になります。
NMFの機能についての詳細は、この記事を参照してください。
Need help? Contact Support
Visit Amplitude.com
Have a look at the Amplitude Blog
Learn more at Amplitude Academy
© 2025 Amplitude, Inc. All rights reserved. Amplitude is a registered trademark of Amplitude, Inc.