「CRMのコンタクト数は3,000件あるけど、半分は古いデータだと思う」「同じ会社のデータが5つも重複している」「電話番号の形式がバラバラで、検索してもヒットしない」 CRMに蓄積されたデータが「汚れている」と感じている企業は少なくありません。そして、汚れたデータの上にどんなに優れたレポートを作っても、出てくる数字は信用できません。 「ゴミを入れれば、ゴミが出る(Garbage In, Garbage Out)」——これはデータ管理の世界で最も有名な格言です。 この記事では、CRMのデータクレンジング(データの清掃・整理)の手順と、HubSpotの機能を使った自動化の方法を解説します。 なぜデータクレンジングが必要なのか 汚れたデータがもたらす損害 データの品質が低いことによるビジネスへの影響は、想像以上に大きいものです。 影響具体例 営業効率の低下間違った電話番号に電話してしまう。退職した人にメールを送る 顧客体験の悪化同じ顧客に2回同じメールが届く。名前を間違えて呼んでしまう レポートの信頼性低下重複データのせいで実際より多くの顧客がいるように見える メール配信の品質低下バウンス率が上がり、ドメインレピュテーションが下がる 意思決定の誤り不正確なデータに基づいて経営判断してしまう データは「放置すると腐る」 CRMのデータは、何もしなくても年間25〜30%が劣化すると言われています。 担当者が転職する 会社の電話番号が変わる 会社が合併・統合する メールアドレスが無効になる 定期的なクレンジングを行わなければ、CRMのデータは毎年どんどん使い物にならなくなっていきます。 CRMデータの「汚れ」の種類 汚れ1:重複データ 同じ会社や同じ人のデータが、複数件登録されている状態です。 発生原因 展示会で集めた名刺を毎回インポートしている Webフォームから同じ人が2回問い合わせている(異なるメールアドレスで) 営業担当者が「もう登録されているか」を確認せずに新規作成している 複数のデータソース(名刺管理アプリ、Excel、旧CRM)からインポートした 汚れ2:表記ゆれ 同じものを異なる書き方で登録している状態です。 カテゴリ表記ゆれの例 会社名「株式会社ABC」「(株)ABC」「ABC株式会社」「ABC」 電話番号「03-1234-5678」「0312345678」「03(1234)5678」 住所「東京都港区」「港区」「東京 港区」 役職「代表取締役」「代表取締役社長」「CEO」「社長」 汚れ3:不正確なデータ 情報が間違っている、または古くなっている状態です。 転職した担当者のメールアドレスが残っている 会社の電話番号が変わっているのに更新されていない 住所が移転前のまま 従業員数が3年前のデータ 汚れ4:不完全なデータ 必要な情報が入力されていない状態です。 メールアドレスはあるが、会社名がない 会社名はあるが、担当者名がない 商談金額が入力されていない ライフサイクルステージが設定されていない 汚れ5:不要なデータ CRMに残す必要がないデータが蓄積している状態です。 テストで作成したダミーデータ 競合他社からのスパム問い合わせ 営業対象外の個人からの問い合わせ 10年以上前の取引で、今後の営業可能性がない企業 データクレンジングの手順 ── 5ステップ ステップ1:現状把握 ── データの「健康診断」 まず、今のCRMデータがどの程度「汚れているか」を把握します。 確認すべき指標 指標確認方法目安 重複率重複の可能性があるレコード数 / 全レコード数5%以下が目標 メールバウンス率バウンスしたメールアドレスの数 / 全メールアドレス数2%以下が目標 空欄率主要項目が空欄のレコード数 / 全レコード数20%以下が目標 古いデータ率1年以上更新がないレコード数 / 全レコード数把握するだけでOK HubSpotでは、「コンタクト」画面でフィルターを使って、これらの指標を確認できます。 ステップ2:重複データの統合 HubSpotの重複管理機能 HubSpotには、重複の可能性があるコンタクトや企業を自動的に検出する機能があります(Professional以上)。 「コンタクト」→「アクション」→「重複の管理」をクリック HubSpotが検出した重複候補のペアが表示される 各ペアを確認し、「統合」または「却下」を選択 統合する場合、どちらのデータを優先するかを選択 統合時の注意点 メインのレコード(残す方)を慎重に選ぶ アクティビティ履歴は統合先に移行される 関連するディール(取引)やチケットも統合先に紐づけ直される ステップ3:表記ゆれの統一 会社名の統一ルール BeforeAfter(統一ルール) (株)ABC株式会社ABC ABC株式会社株式会社ABC ABC株式会社ABC 統一のヒント まず「ルール」を決める(例:会社名は正式名称で登録。株式会社は前に付ける) HubSpotのプロパティ設定で「ドロップダウン」や「ラジオボタン」にできる項目は自由入力を避ける 一括更新は、エクスポート → Excelで加工 → 再インポートの手順で行う 電話番号の統一ルール BeforeAfter 031234567803-1234-5678 03(1234)567803-1234-5678 +81-3-1234-567803-1234-5678 HubSpotのワークフローで、電話番号のフォーマット変換を自動化することも可能です。 ステップ4:不正確・古いデータの更新 メールアドレスの検証 バウンスしたメールアドレスをリストアップ HubSpotでは、ハードバウンスしたメールアドレスは自動的に「配信不可」にマークされる ソフトバウンスが連続しているアドレスも確認が必要 企業情報の更新 HubSpotには、企業のドメインを基に、従業員数、業種、住所などの情報を自動で補完・更新する機能があります(HubSpot Insights)。この機能を活用すれば、手動で更新する手間を大幅に削減できます。 ステップ5:不要データの削除またはアーカイブ 削除の判断基準 条件アクション テスト・ダミーデータ削除 3年以上やりとりがなく、今後の営業可能性がないアーカイブ(別リストに移動) バウンスしたメールアドレスのみで、他の連絡手段がない削除を検討 競合企業のスパム問い合わせ削除 注意: 一括削除は取り消せません。削除前に必ずバックアップ(エクスポート)を取りましょう。 HubSpotで使えるデータクレンジング自動化 自動化1:プロパティの入力規制 自由入力ではなく、選択式のプロパティを使うことで、新しいデータの「汚れ」を防ぎます。 プロパティ自由入力(NGパターン)選択式(推奨パターン) 業種テキスト入力ドロップダウン選択 従業員規模テキスト入力ドロップダウン(10名以下、11-50名、51-200名...) 問い合わせ種別テキスト入力チェックボックス選択 リードソーステキスト入力ドロップダウン選択 自動化2:ワークフローによるデータ正規化 ワークフローを使って、入力されたデータを自動的に正規化できます。 例1:都道府県名の自動正規化 「東京」→「東京都」、「大阪」→「大阪府」のように、入力された値を自動的に正式名称に変換するワークフローを設定します。 例2:ライフサイクルステージの自動設定 フォーム送信 → ライフサイクルステージを「リード」に自動設定 商談(ディール)が作成 → ステージを「商談化済み」に自動更新 受注 → ステージを「顧客」に自動更新 自動化3:定期的なデータレビューの自動化 以下のワークフローを設定して、データ品質を自動的に監視しましょう。 ワークフロー例:「要確認」データの自動検出 トリガー:コンタクトの「メールアドレス」が空欄で、「電話番号」も空欄 アクション:プロパティ「データ品質ステータス」を「要確認」に設定 追加アクション:CRM管理者にメール通知 データクレンジングのスケジュール 日次チェック(毎日5分) 新規コンタクトに重複がないか確認 今日バウンスしたメールアドレスの確認 週次チェック(週1回15分) 「要確認」ステータスのコンタクト処理 直近1週間のインポートデータの品質確認 月次チェック(月1回30分) 重複管理ツールで重複候補を処理 主要プロパティの空欄率を確認 メールのバウンス率を確認 四半期チェック(3ヶ月に1回2時間) 全データの「健康診断」(ステップ1の指標を再測定) 表記ゆれの一括修正 不要データの削除・アーカイブ データ品質ルールの見直し データ品質を維持するための組織ルール ルール1:「入力ガイドライン」を作る 新しいデータを入力する際のルールを1ページにまとめ、チーム全員に共有しましょう。 入力ガイドラインに含めるべき内容 項目ルール 会社名正式名称で入力。株式会社は前に付ける 電話番号ハイフン付き(例:03-1234-5678) 住所都道府県から入力 担当者名姓と名を分けて入力 メールアドレス小文字で入力 ルール2:「データオーナー」を任命する データ品質の責任者を1人決めましょう。全社のデータ品質を管理する権限と責任を持たせます。 データオーナーの役割 月次のデータ品質レポートを経営会議で報告 入力ガイドラインの策定と更新 新メンバーへの入力ルールの教育 データクレンジングの計画と実行 ルール3:インポート前のチェックリスト 外部データをCRMにインポートする前に、以下を確認するルールを作りましょう。 CSVファイルに重複データがないか確認したか 会社名の表記は統一されているか 電話番号のフォーマットは統一されているか 既にCRMに存在するコンタクトとの重複チェックは行ったか 不要なデータ(テストデータ等)は除外したか データクレンジングの効果測定 クレンジングの効果を数字で示すことで、経営陣への報告や、今後の改善計画の策定に役立ちます。 測定すべき指標 指標BeforeAfter改善率 コンタクト総数5,000件3,200件(不要データ削除後)-36% 重複率12%2%-83% メールバウンス率8%1.5%-81% 主要項目の空欄率35%10%-71% メール開封率12%22%+83% 注目ポイント: コンタクト総数が減ることは悪いことではありません。「質の低い5,000件」より「質の高い3,200件」の方が、ビジネスの成果につながります。 よくある質問 Q1. データクレンジングにはどのくらい時間がかかりますか? 初回は2〜5日程度かかることが多いです。ただし、完璧を目指す必要はありません。「80%の品質」を目指して、残りの20%は運用しながら改善していきましょう。 Q2. 一人でできますか? データ量が1,000件以下なら1人で十分です。それ以上の場合は、チームで分担(例:A〜Mの会社名は○○さん、N〜Zは△△さん)することをおすすめします。 Q3. 外部のデータクレンジングツールは必要ですか? HubSpotのProfessional以上のプランには、重複管理や自動補完の機能が含まれています。多くの中小企業では、HubSpotの標準機能で十分です。データ量が10万件を超える場合や、複雑な名寄せが必要な場合は、専用ツールの導入を検討しましょう。 まとめ:きれいなデータは「最高の投資」 CRMのデータクレンジングは、地味で面倒な作業に見えるかもしれません。しかし、きれいなデータは以下のすべてを改善します。 営業の効率(正しい連絡先に確実にアプローチ) マーケティングの効果(適切なセグメントに適切なメッセージ) 経営判断の精度(信頼できるレポート) 顧客体験の質(名前を間違えない、重複メールを送らない) きれいなデータは、CRMの「燃料」です。どんなに高性能なCRMでも、汚い燃料では走れません。 まずは今日、CRMのデータを開いて「健康診断」を始めてみてください。