LLMを用いて非構造化データから顧客理解を深化|Snowflake Cortexを用いた新たな分析

ビジネスの成長には、顧客を深く理解することが不可欠です。
これまで、多くの企業では、顧客の購入履歴やサイトの閲覧行動を分析することで、「ユーザーが何をしたか」という行動の結果からユーザー像の理解を深めてきました。
しかし、顧客に対する理解度をさらに一段階引き上げるためには、その背景にある「なぜその行動に至ったのか」を理解することが重要です。
atarayoでは、AIを用いて、非構造データから顧客の興味傾向を把握する新たな分析に取り組んでいます。この記事では、LLMを用いた非構造化データの分析手法についてご紹介します。
なぜ今、新たな分析が必要なのか?
最近では分析ツールが普及してきたことで、ユーザーの注文履歴やWEBの行動履歴などを統合し、LTV(顧客生涯価値)やアクティブ度(どれほどサービスや商品に熱意をもって関わっているか)といった分析は多く実施されています。
一方、メールコンテンツやランディングページなどの非構造化データ(画像、動画、文章データなど)を用いた分析については、技術的なハードルも高くなかなか実施されてきませんでした。そのため、ユーザーがどのような訴求を見て購入に至ったのかという「きっかけ」については理解が進んでいませんでした。
例えば、メールから商品が購入された場合、これまでの分析では、「このメールが売上に貢献した」という結果は分かっても、「メールのどの部分(どの訴求)が響いたのか」までは分からないという状況でした。
このギャップを埋めるために使用するのが、LLM(大規模言語モデル)です。LLMは、膨大なテキストデータから人間のように文章を理解し、要約や分類などを行うことができます。このLLMの技術を用いてメールのコンテンツを分析し、ユーザーの行動履歴と組み合わせることで、「顧客の興味傾向」をより深く理解し、一人ひとりのユーザーに合わせたサービスの提供が可能になります。
分析方法と実績
メールマーケティングにおいて、件名と本文はユーザーが開封するかどうかを判断したり、本文内のクリックや購入を決める上で、非常に重要な要素となります。
ユーザーは、メールの件名や本文を読んで、自分が興味のあるの内容なのかを判断し、開封またはクリックします。つまり、メールのテキストデータとその後の行動データを組み合わせることで、ユーザーの興味傾向を推定することが可能です。
今回の分析では、テキストデータの分析・分類にSnowflake Cortexを用いています。
具体的には、過去に配信した大量のメールの中から、件名のテキストデータを抽出、Snowflake Cortexに分析させてタグを生成します。タグデータを開封・クリック率といったメールの行動データと紐づけることで、「ユーザーはどのような訴求内容に反応するのか」を推定することができます。
この分析により、ユーザーが反応しやすいカテゴリの訴求内容がわかり、パーソナライズされたメールコンテンツの配信に繋げることが可能になります。
実際の支援の中でも、数百万人いる顧客像の把握、メールコンテンツの改善、他のマーケティングチャネルの配信内容の改善など、日々の運用で活用いただいています。
なぜSnowflake Cortexを用いるのか?
メールなどのテキストデータを、人間が集計・分析することは、配信数が多いほど難しくなります。
atarayoでは、データ分析基盤として多くの企業で利用されているSnowflakeに統合された、LLM(大規模言語モデル)の機能群である「Snowflake Cortex」を以下の理由により、活用しています。
1. データ移動が不要で、セキュリティも安心
今回クライアント様が使用しているデータ分析基盤がSnowflakeであったこともあり、既存環境を最大限活かし、迅速かつ安全に新しい分析を進められるという点で最適な選択でした。
2. 複数のLLMモデルを使い分けられる
3.分析パイプラインを構築しやすい
Snowflake Cortexでできること
Snowflake Cortexは、単なるテキスト分析ツールではありません。様々な機能で、より深いインサイトを引き出すことができます。
まず大きな特徴として、自由形式テキストの構造化・分類の機能が挙げられます。
メールの本文や問い合わせ内容、SNSのコメントといった自由な文章から、感情、カテゴリ、優先度といった必要な情報を自動で抽出・分類。これにより、これまで分析が難しかった非構造化データを、分析可能な「構造化データ」に変換することが可能になります。
また、SQL分析結果の自然言語解釈ができることも特徴です。
また、最新の機能では、AIが自ら考えて複数のタスクを自動で実行する「エージェント機能」や、開発者がSQLをより効率的に記述できるように支援する「Copilot機能」も提供されており、さらなるデータ活用の可能性を広げています。
分析の精度を高めるプロンプト設計
Snowflake Cortexに限らず、AIを使って精度の高い結果を引き出すには、的確な指示(プロンプト)を与えることが非常に重要となります。atarayoでは、プロンプト設計時には以下を押さえ、精度の高い分析に繋げています。
・役割の明確化
・出力形式の厳密な指定
・ビジネス要件の反映
・マスタデータ・辞書の活用
・抽出ルールの厳格な明文化
今後の展望
今後atarayoは、AIを活用した新たな分析をさらに発展させ、以下のような取り組みを通じて、顧客との関係をより深く、強固なものにしていきたいと考えています。
・カスタマーサポートの最適化
・コンテンツ生成の自動化
また、この分析はEC領域に限らず、多様な領域で活用できます。特に広告領域では、以下のような活用が期待できると考えています。
・広告クリエイティブの自動分析と最適化
・競合分析の自動化
AIを活用した新たな分析は、メール施策の内容やPDF、SNSのコメントといった非構造化データを価値あるものにし、顧客提供価値の向上、企業の成長を支える強力な武器となります。
atarayoでは今後も、AIの力を最大限に引き出し、お客様の持続的な事業成長を支援できるよう進化し続けます。