Articles

顧客セグメンテーション:機械学習がマーケティングをスマートにする方法

By Mona Eslamijam

機械学習顧客セグメンテーション

この記事は、AIアプリケーションがどのように機能するかの詳細を探る一連の記事”人工知能の解体”の一部です。

マーケティングチームが解決しなければならない重要な課題の一つは、”獲得あたりのコスト”(CPA)を最小限に抑え、投資収益率を高める方法でリソースを割 これは、セグメンテーション、彼らの行動や特性に基づいて、異なるグループに顧客を分割するプロセスを介して可能です。

顧客セグメント化は、マーケティングキャンペーンの無駄を減らすのに役立ちます。 どの顧客がお互いに似ているかがわかっている場合は、適切な人にキャンペーンをターゲットにする方が良いでしょう。

顧客セグメンテーションは、製品の推奨、価格設定、アップセーリング戦略などの他のマーケティングタスクにも役立ちます。

顧客のセグメンテーションは、以前は困難で時間のかかる作業であり、顧客をグループ化する方法を見つけるために、異なるテーブルを手動で熟読し、データを照会する時間を必要としていました。 しかし、近年では、データの統計的規則性を見つける人工知能アルゴリズムである機械学習のおかげで、はるかに簡単になりました。 機械学習モデルは、顧客データを処理し、さまざまな機能にわたって繰り返しパターンを発見することができます。 多くの場合、機械学習アルゴリズムは、マーケティングアナリストが直感的にデータを手動で調べることで見つけることが非常に困難な顧客セグメントを見つけるのを助けることができます。

顧客セグメンテーションは、人工知能と人間の直感の組み合わせが、その部分の合計よりも大きいものをどのように作成できるかの完璧な例です。

k-means clustering algorithm

k-means clustering
K-means clusteringは、特定の数のクラスターの周りにラベルのないデータポイントを配置する機械学習アルゴリズムです。

機械学習アルゴリズムにはさまざまな種類があり、それぞれが特定のタイプのタスクに適しています。 顧客セグメンテーションに便利なアルゴリズムの中には、k-meansクラスタリングがあります。

K-meansクラスタリングは教師なし機械学習アルゴリズムです。 教師なしアルゴリズムには、その性能を評価するための地上真理値またはラベル付きデータがありません。 K-meansクラスタリングの背後にある考え方は非常に簡単です:データをより類似したクラスターに配置します。

たとえば、顧客データに年齢、収入、支出スコアが含まれている場合、適切に構成されたk-meansモデルは、顧客を属性が近いグループに分割するのに役立ちます。 この設定では、クラスター間の類似性は、顧客の年齢、収入、および支出スコアの差を計算することによって測定されます。

k-meansモデルを学習するときは、データを分割するクラスターの数を指定します。 モデルは、ランダムに配置された重心で始まり、各クラスターの中心を決定する変数です。 モデルは学習データを調べ、重心がそれらに近いクラスターに割り当てます。 すべてのトレーニングインスタンスが分類されると、重心のパラメータはクラスターの中心に再調整されます。 同じプロセスが繰り返され、トレーニングインスタンスが微調整された重心に再割り当てされ、データポイントの再配置に基づいて重心が再調整されます。 ある時点で、モデルは収束し、データを反復処理しても、インスタンスがクラスターを切り替えたり、重心がパラメータを変更したりすることはありません。

ユーチューブポスター

顧客セグメントの適切な数を決定する

k-means machine learningアルゴリズムを成功させるための鍵の一つは、クラスターの数を決定することです。 モデルは提供する任意の数のクラスターに収束しますが、すべての構成が適切であるとは限りません。 場合によっては、データを迅速に視覚化することで、モデルに含める必要があるクラスタの論理数を明らかにすることができます。 たとえば、次の図では、学習データには2つの特徴(x1とx2)があり、それらを散布図にマッピングすると、識別しやすい5つのクラスターが表示されます。

k-クラスター化されていないデータを意味します

問題に3つの特徴(x1、x2、x3など)がある場合、データを3D空間で視覚化でき、クラスターを特定するのが困難になります。 3つの特徴を超えて、1つの画像内のすべての特徴を視覚化することは不可能であり、散布図行列を使用して異なる特徴のペアの相関を視覚化す

散布図行列
散布図行列は、フィーチャの異なるペア間の相関を視覚化します。 この例では、問題空間は四つの特徴で構成されています。

データのクラスタリングに役立つもう一つのトリックは、データポイントの相関を調べ、スプリアスであるか、より少ない情報を含む特徴を削除する機械学習技術である次元削減です。 次元の削減により、問題空間が簡素化され、データの視覚化が容易になり、クラスタリングの機会を見つけることができます。

しかし、多くの場合、上記の手法を使用してもクラスターの数は明らかではありません。 このような場合は、最適なクラスターが見つかるまで、さまざまな数のクラスターを試してみる必要があります。

しかし、どのように最適な構成を見つけるのですか? K-meansモデルは、クラスタ内のインスタンスとその重心との間の平均距離である慣性によって比較できます。 一般に、慣性が低いモデルはより一貫性があります。

しかし、慣性だけでは機械学習モデルのパフォーマンスを評価するのに十分ではありません。 クラスターの数を増やすと、インスタンスとそのクラスターの重心間の距離が常に短くなります。 そして、すべての単一のインスタンスが独自のクラスターになると、慣性はゼロに低下します。 しかし、顧客ごとに1つのクラスターを割り当てる機械学習モデルは必要ありません。

最適なクラスター数を見つけるための効率的な手法の一つは、クラスターを追加しても慣性が大幅に低下しない点が見つかるまで、機械学習モデルを徐々に増やすelbow法です。 これは機械学習モデルの肘と呼ばれます。 例えば、次の画像では、肘は四つのクラスターに立っています。 それを超えるクラスタを追加すると、非効率的な機械学習モデルになります。

k-means clustering elbow method
elbow methodは、クラスタの追加と慣性の減少との比較を比較することによって、k-means機械学習モデルの最も効率的な構成を見つけます。

k-meansクラスタリングと顧客セグメントを

使用するように設定すると、機械学習モデルは、各クラスター重心までの距離を測定することによって、新規顧客が属するセグメントを決定することができます。 あなたが使用するためにこれを置くことができる多くの方法があります。

たとえば、新しい顧客を獲得するときは、その顧客に製品の推奨事項を提供したいと思うでしょう。 機械学習モデルは、顧客のセグメントとそのセグメントに関連する最も一般的な製品を判断するのに役立ちます。

商品マーケティングでは、クラスタリングアルゴリズムはキャンペーンの再調整に役立ちます。 たとえば、異なるセグメントに属する顧客のランダムサンプルを使用して広告キャンペーンを開始できます。 キャンペーンをしばらく実行した後、どのセグメントがより応答性が高いかを調べ、それらのセグメントのメンバーの広告のみを表示するようにキャンペー または、キャンペーンの複数のバージョンを実行し、機械学習を使用して、異なるキャンペーンへの回答に基づいて顧客をセグメント化することもできます。 一般的には、広告キャンペーンをテストして調整するためのツールがさらに多く用意されています。

アンサンブル学習

K-meansクラスタリングは、高速で効率的な機械学習アルゴリズムです。 しかし、それはすぐに論理的な顧客セグメントにあなたのデータをオンにします魔法の杖ではありません。 まず、マーケティングキャンペーンの設定と、それらに関連する機能の種類を定義する必要があります。 たとえば、キャンペーンが特定のロケールを対象とする場合、地理的な場所は関連する機能ではなく、その特定の地域のデータをフィルタリングする方が良 同様に、男性向けの健康製品を宣伝する場合は、顧客データをフィルタリングして男性のみを含めるようにし、機械学習モデルの機能の1つとして性別を含めることを避ける必要があります。

場合によっては、過去に購入した製品などの追加情報を含めたい場合があります。 この場合、顧客-製品行列、顧客を行として、アイテムを列として、各顧客とアイテムの交点で購入されたアイテムの数を持つテーブルを作成する必要があ 製品の数が多すぎる場合は、製品が多次元ベクトル空間で値として表される埋め込みを作成することを検討することができます。

全体として、機械学習はマーケティングと顧客セグメンテーションにおいて非常に効果的なツールです。 それはおそらくすぐに人間の判断と直感を置き換えることはありませんが、以前は不可能だったレベルに人間の努力を強化するのに役立ちます。

著者について

モナ-エスラミジャム

モナEslamijamは、ダラスのテキサス大学でビジネス分析(MSc)を卒業しています。