CRMのマージとは?Salesforce・HubSpot・Pipedriveで重複データを自動統合する方法【実装ガイド付き】
CRM内に同じ顧客が何件も登録される原因と、マージで一本化する具体的な方法を解説。重複率38%→限りなく0%に近づけた削減事例・Apexサンプルコード・DataSangoでの最短3分設定手順まで網羅。

「同じ顧客が3件も登録されている…どれが正しいデータ?」 「山田太郎、やまだ たろう、Yamada Taro—全部同一人物なのに別レコード扱い」 「商談履歴が分散して、過去のやり取りが追えない」
こんな経験、ありませんか?
CRMの重複データ問題は、営業効率を下げるだけでなく、レポートの数字が信頼できないという深刻な事態を招きます。経営会議で「この商談数、本当に合ってるの?」と毎回聞かれる状況は、データ品質の低さが原因です。
この記事では、CRMにおける「マージ(重複データの統合)」の仕組みから、手動・スクリプト・ツールによる実装方法まで、実務で使える知識を網羅的に解説します。
読了時間:約7分で、あなたのCRMを「信頼できるデータベース」に変える第一歩が踏み出せます。
CRMの「マージ」とは?なぜ重複データが問題なのか
マージ(Merge)の定義
マージとは、CRM内で重複している複数のレコード(企業・人物・取引先など)を、1つの正しいレコードに統合するプロセスのことです。
例えば: ・「株式会社ABC」「(株)ABC」「ABC Corporation」→ 1件に統合 ・「山田太郎(営業部)」「山田太郎(マーケ部)」→ 所属情報を保持しつつ統合 ・同じメールアドレスを持つ複数のリード → 1人の顧客として統合
単なる「削除」ではなく、複数レコードの情報を保持しながら統合する点が重要です。
マージと名寄せの違いが気になる方は→「名寄せとマージの違いをRevOps・情シス向けに整理する完全ガイド」(/blog/data-matching-vs-merging)も参照してください。
なぜ重複データが発生するのか?
重複データが生まれる主な原因は以下の5つです。
原因1:複数の入力経路
営業が手動入力、マーケティングがフォームから取込、展示会の名刺スキャンデータ——それぞれが独立してレコードを作成し、重複チェックが働かない状態が続きます。
原因2:表記ゆれ
「株式会社」「(株)」「Co., Ltd.」、全角/半角の違い(「ABC」「ABC」)、スペースの有無(「山田太郎」「山田 太郎」)など、人間が目視で同一と判断できても、システムは別レコードとして扱います。
表記ゆれの解消方法については→「データクレンジングとは?CRMデータをAI-Readyにする意味・目的・進め方」(/blog/what-is-data-cleansing)を参照してください。
原因3:データソースの統合
MA(マーケティングオートメーション)とSFAの連携、他システムからのデータ移行、買収した企業の顧客データベース統合など。
原因4:入力ルールの不統一
部門ごとに異なる登録基準、「旧社名」「新社名」の混在、担当者によって異なる入力形式。
原因5:時間経過による変化
顧客の社名変更、部署異動・役職変更、メールアドレスや電話番号の更新——古い情報と新しい情報が別レコードとして並存します。
重複データが引き起こす5つの深刻な問題
💡 実務者の声:RevOps担当Kさん(BtoB SaaS・従業員150名)の場合
「月次レポートで『新規商談50件』と報告したら、経営陣から『先月も同じ会社があるけど?』と指摘されました。調べると、実際は35件でした。重複が混ざっていたんです。それ以来、レポートの数字が信用されなくなり、毎回手作業で重複チェックする羽目に…」
問題1:意思決定が狂う
売上レポートの過大・過小評価、商談数・リード数の実態との乖離、KPI達成判定の不正確さが生じます。
問題2:顧客体験が悪化
同じ顧客に複数の担当者が接触し、「先週も同じ質問をされた」というクレームにつながります。過去の商談履歴が見えず、一貫性のない提案になります。
問題3:業務効率が大幅低下
「どのレコードが正しいか」の確認に時間を浪費し、重複レコードへの個別対応(メール配信、データ更新)と毎月の手作業での重複削除作業が発生します。
問題4:マーケティング施策の精度低下
セグメント分析の不正確さ、ABMでのターゲティングミス、メール配信で同じ人に複数送信(配信解除リスク)が起きます。
問題5:AI・自動化ツールが正しく動かない
スコアリングモデルの機能不全、チャットボットによる顧客認識の失敗、ワークフロー自動化の誤作動が発生します。
CRMデータ品質をツールで改善する方法については→「CRMデータ整備ツール徹底比較ガイド」(/blog/crm-data-quality-tools)も参照してください。
マージの基本的な仕組み:3つのステップ
CRMでのマージは、以下の3ステップで実行されます。
ステップ1【検出】重複を見つける
まず、どのレコードが重複しているかを自動検出します。
検出ルールの例:
完全一致: メールアドレスが完全に同じ
部分一致: 会社名の80%が一致
複合条件: 「会社名 + 電話番号」の組み合わせ
あいまい一致: 「(株)ABC」と「株式会社ABC」を同一視
💡 ポイント:どこまで「同じ」と判定するか?
厳しすぎると重複を見逃し、緩すぎると別企業を誤統合します。業界・企業ごとにルールのカスタマイズが必須です。
ステップ2【選択】どのレコードを「正」として残すか決める
重複しているレコード群の中から、どの1件をマスターレコードとして残すかを決めるステップです。
代表的な選定ロジック:
最新の情報を優先:更新日時が最も新しいレコードをマスターにする
信頼度の高いソースを優先:外部公式DBや名寄せサービスから取り込んだレコードを最優先にする
ビジネス的に重要なステータスを優先:成約済みの取引先が紐づいているレコードや、特定パイプライン上のレコードをマスターにする
技術的な一貫性を優先:最も古くから存在するレコード(IDが一番小さいもの)をマスターとして残す
マスターレコード選定ルールを明確に定義しておくことで、ステップ3(統合処理)の自動化が容易になり、同じ条件なら常に同じレコードが「正」として選ばれる状態を作れます。
ステップ3【統合】1つのレコードにまとめる
選択したデータをもとに、物理的に1レコードに統合します。
統合時の処理:
マスターレコード作成:最も優先度の高いレコードをベースに
子レコードの紐付け変更:商談・活動履歴をすべてマスターに移行
重複レコードの削除またはアーカイブ:元のレコードは無効化
監査ログ記録:「いつ・誰が・何を統合したか」を記録
重要:削除ではなく「マージ」
単純削除では商談履歴も消えます(致命的)。マージなら、すべての履歴を保持したまま統合できます。
マージの実装方法:3つのアプローチ
方法1: 手動で対応する場合
メリット:コストゼロ(既存CRM機能のみ)、完全に人間がコントロール、少数の重複なら十分対応可能
デメリット:1件あたり5〜10分かかる、人的ミスのリスク(間違えて統合・削除)、継続的な運用が困難
具体的手順(Salesforceの例):
検索バーで「ABC」と入力
重複候補を目視で確認
レコードを選択 →「マージ」ボタン
保持するフィールドを1つずつ選択 5.「マージ実行」をクリック
関連する商談・活動が自動移行されることを確認
推奨ケース:月10件以下の重複発生、初期データ整備の第一歩、ルール設計前のテスト実行
方法2: スクリプト/マクロを使う場合
メリット:一度書けば繰り返し実行可能、カスタムルールを柔軟に設定、コストは開発工数のみ
デメリット:エンジニアリソースが必要、メンテナンスコスト(CRM仕様変更に対応)、エラー発生時のリカバリーが難しい
サンプルコード(Salesforce Apex・簡易版):
注意点:本番実行前に必ずサンドボックスでテスト、バックアップを取得してから実行、マージ後の検証プロセスを組み込む
推奨ケース:定期的に同じパターンの重複が発生、開発リソースがある、複雑なカスタムルールが必要
方法3: 専門ツールで自動化する場合
メリット:ノーコードで設定可能(エンジニア不要)、定期自動実行(毎日・毎週)、AIによる高精度な重複検出、安全なロールバック機能
デメリット:ツール利用コストが発生、初期設定に若干の学習コストあり
💡 DataSangoの場合の実装例:最短3分で設定完了
DataSangoを使うと、以下の流れで最短3分で設定完了します(慣れれば1分以内)。
設定手順:
接続:CRM(Salesforce / HubSpot / Pipedrive)と連携(OAuth認証)
ルール設定:例えば「法人番号が完全一致」「会社名+ドメインが完全一致」「会社名+住所が完全一致」など
プレビュー:統合結果をシミュレーション表示で確認
実行:スケジュール設定(手動 / 毎週月曜9時など / 即時)
実行後の効果:
重複率:38% → 限りなく0%に近い状態を維持(導入企業平均。ルール最適化により理論上は限りなく0%に近づけることが可能)
作業時間:月20時間 → 0時間
レポート精度:売上予測の誤差が15%改善
DataSangoなら:設定は最短3分、あとは毎日自動でクリーンなCRMを維持できます。
推奨ケース:継続的な自動マージ運用をしたい、エンジニア工数を使わずに早期に解決したい、複数CRMをまたいで一元管理したい
マージ実行時の注意点とベストプラクティス
よくある失敗パターンTOP5
失敗1: バックアップなしで実行
誤統合してもデータを復元できなくなります。 対策:必ず統合前にエクスポートまたはスナップショットを取得(DataSangoはスナップショットを自動取得)
失敗2: 全自動で放置
「別企業なのに同じ名前」という誤統合が発生します。 対策:初回は必ず人間がレビューし、信頼度が高まってから自動化へ移行
失敗3: 関連データの確認不足
商談履歴が消える、担当者の紐付けが切れるといった問題が起きます。 対策:マージ後に関連レコード数を確認する検証フローを組み込む
失敗4: ルールが厳しすぎる
「(株)ABC」と「株式会社ABC」を別扱いしてしまいます。 対策:表記ゆれ辞書を整備し、段階的にルールを緩和(DataSangoなら表記ゆれの整備も自動化可能)
失敗5: 一度に大量実行
エラー発生時の原因特定が困難になります。 対策:最初は100件ずつテスト実行
マージ運用の成功事例
事例1:BtoB SaaS企業A社(従業員150名)
導入前の課題:
CRM内のリード重複率:38%
月次レポート作成に20時間(手作業で重複除外)
同じリードに複数の営業が接触するトラブル頻発
DataSango導入後:
重複率:38% → 限りなく0%に近い状態を維持(ルール最適化後)
レポート作成:20時間 → 2時間(90%削減)
営業効率:商談化率が22%向上(顧客履歴が統合されたため)
担当者コメント(RevOps Manager):
「以前は『このリード、前も問い合わせしてた?』と毎回調べる時間が無駄でした。今は1クリックで全履歴が見えるので、提案の質が劇的に上がりました」
事例2:コンサルティング会社B社(従業員80名)
導入前の課題:部門ごとに異なるCRMを使用→データ統合時に大量重複が発生、プロジェクト履歴が分散し提案書作成に支障
DataSango導入後:
統合プロジェクトで12,000件 → 7,500件に整理
過去案件の参照時間:平均15分 → 2分
クロスセル提案が30%増加(統合履歴から新ニーズを発見)
事例3:製造業C社(従業員500名)
導入前の課題:展示会での名刺取込で毎回重複が発生、取引先マスタが信頼されず各部門が独自Excelを運用
DataSango導入後:
展示会後の重複処理:3日 → 30分
マスタデータの信頼性向上 → Excel運用が廃止
与信管理の精度向上(重複による誤判定がゼロに)
よくある質問
Q1:マージすると元のデータは完全に消えますか?
ほとんどのCRMでは「論理削除」されます。管理者権限があれば「ごみ箱」から復元可能ですが、完全削除される前(通常15〜30日)に復元が必要です。
Q2:マージ後に「やっぱり別レコードだった」と気づいたら?
CRMによっては「マージの取り消し」や「復元」が不可能な場合があります。その場合はバックアップからの復元が必要です。DataSangoのようなスナップショット機能付きツールの使用を推奨します。
Q3:API経由で作成されたレコードも自動マージできますか?
はい、可能です。DataSangoはAPI経由で作成されたレコードも含め、設定したルールに従って自動検出・統合します。
Q4:重複検出の精度はどれくらいですか?
完全一致(メールアドレス等):99%以上
表記ゆれ込み:85〜95%(ツールのAI精度やルールに依存)
人間の目視:60〜70%(見落としが多い) DataSangoのルールを段階的に最適化することで、理論上は限りなく0%に近い重複率を維持できます。
Q5:Salesforce・HubSpot・Pipedrive以外のCRMでも使えますか?
現在はSalesforce / HubSpot / Pipedriveに対応しています。対応CRMの最新情報はDataSangoの公式サイト(https://www.datasango.ai/)をご確認ください。
まとめ
【この記事のポイントを3行で】
CRMの「マージ」は、重複レコードを1つに統合する必須プロセス。手動・スクリプト・ツールの3つの実装方法がある
重複データは意思決定を狂わせ、顧客体験を悪化させる。営業効率だけでなく、経営判断にも影響する
定期的な自動マージ運用で、重複を限りなく0%に近い状態で維持できる「信頼できるCRM」が実現できる
【次のアクション】
今すぐできること:CRMで「会社名」で検索し、重複が何件あるか確認してみる
本格的に改善するなら:DataSangoで重複検出ルールを設定し、自動マージ運用を開始
CRMの重複データ、手作業でやっていませんか?
DataSangoなら、重複・表記ゆれ・欠損・未分類を自動で整備。
設定は最短3分、あとは毎日自動でクリーンなCRMを維持できます。
✅ 無料プランあり(クレジットカード登録不要)
✅ Salesforce / HubSpot / Pipedrive対応
✅ 安全なスナップショット機能付き


