CRMのマージとは?Salesforce・HubSpot・Pipedriveで重複データを自動統合する方法【実装ガイド付き】

CRM内に同じ顧客が何件も登録される原因と、マージで一本化する具体的な方法を解説。重複率38%→限りなく0%に近づけた削減事例・Apexサンプルコード・DataSangoでの最短3分設定手順まで網羅。

「同じ顧客が3件も登録されている…どれが正しいデータ?」 「山田太郎、やまだ たろう、Yamada Taro—全部同一人物なのに別レコード扱い」 「商談履歴が分散して、過去のやり取りが追えない」

こんな経験、ありませんか?

CRMの重複データ問題は、営業効率を下げるだけでなく、レポートの数字が信頼できないという深刻な事態を招きます。経営会議で「この商談数、本当に合ってるの?」と毎回聞かれる状況は、データ品質の低さが原因です。

この記事では、CRMにおける「マージ(重複データの統合)」の仕組みから、手動・スクリプト・ツールによる実装方法まで、実務で使える知識を網羅的に解説します。

読了時間:約7分で、あなたのCRMを「信頼できるデータベース」に変える第一歩が踏み出せます。

CRMの「マージ」とは?なぜ重複データが問題なのか

マージ(Merge)の定義

マージとは、CRM内で重複している複数のレコード(企業・人物・取引先など)を、1つの正しいレコードに統合するプロセスのことです。

例えば: ・「株式会社ABC」「(株)ABC」「ABC Corporation」→ 1件に統合 ・「山田太郎(営業部)」「山田太郎(マーケ部)」→ 所属情報を保持しつつ統合 ・同じメールアドレスを持つ複数のリード → 1人の顧客として統合

単なる「削除」ではなく、複数レコードの情報を保持しながら統合する点が重要です。

マージと名寄せの違いが気になる方は→「名寄せとマージの違いをRevOps・情シス向けに整理する完全ガイド」(/blog/data-matching-vs-merging)も参照してください。

なぜ重複データが発生するのか?

重複データが生まれる主な原因は以下の5つです。

原因1:複数の入力経路

営業が手動入力、マーケティングがフォームから取込、展示会の名刺スキャンデータ——それぞれが独立してレコードを作成し、重複チェックが働かない状態が続きます。

原因2:表記ゆれ

「株式会社」「(株)」「Co., Ltd.」、全角/半角の違い(「ABC」「ABC」)、スペースの有無(「山田太郎」「山田 太郎」)など、人間が目視で同一と判断できても、システムは別レコードとして扱います。

表記ゆれの解消方法については→「データクレンジングとは?CRMデータをAI-Readyにする意味・目的・進め方」(/blog/what-is-data-cleansing)を参照してください。

原因3:データソースの統合

MA(マーケティングオートメーション)とSFAの連携、他システムからのデータ移行、買収した企業の顧客データベース統合など。

原因4:入力ルールの不統一

部門ごとに異なる登録基準、「旧社名」「新社名」の混在、担当者によって異なる入力形式。

原因5:時間経過による変化

顧客の社名変更、部署異動・役職変更、メールアドレスや電話番号の更新——古い情報と新しい情報が別レコードとして並存します。

重複データが引き起こす5つの深刻な問題

💡 実務者の声:RevOps担当Kさん(BtoB SaaS・従業員150名)の場合

「月次レポートで『新規商談50件』と報告したら、経営陣から『先月も同じ会社があるけど?』と指摘されました。調べると、実際は35件でした。重複が混ざっていたんです。それ以来、レポートの数字が信用されなくなり、毎回手作業で重複チェックする羽目に…」

問題1:意思決定が狂う

売上レポートの過大・過小評価、商談数・リード数の実態との乖離、KPI達成判定の不正確さが生じます。

問題2:顧客体験が悪化

同じ顧客に複数の担当者が接触し、「先週も同じ質問をされた」というクレームにつながります。過去の商談履歴が見えず、一貫性のない提案になります。

問題3:業務効率が大幅低下

「どのレコードが正しいか」の確認に時間を浪費し、重複レコードへの個別対応(メール配信、データ更新)と毎月の手作業での重複削除作業が発生します。

問題4:マーケティング施策の精度低下

セグメント分析の不正確さ、ABMでのターゲティングミス、メール配信で同じ人に複数送信(配信解除リスク)が起きます。

問題5:AI・自動化ツールが正しく動かない

スコアリングモデルの機能不全、チャットボットによる顧客認識の失敗、ワークフロー自動化の誤作動が発生します。

CRMデータ品質をツールで改善する方法については→「CRMデータ整備ツール徹底比較ガイド」(/blog/crm-data-quality-tools)も参照してください。

マージの基本的な仕組み:3つのステップ

CRMでのマージは、以下の3ステップで実行されます。

ステップ1【検出】重複を見つける

まず、どのレコードが重複しているかを自動検出します。

検出ルールの例:

  • 完全一致: メールアドレスが完全に同じ

  • 部分一致: 会社名の80%が一致

  • 複合条件: 「会社名 + 電話番号」の組み合わせ

  • あいまい一致: 「(株)ABC」と「株式会社ABC」を同一視

💡 ポイント:どこまで「同じ」と判定するか?

厳しすぎると重複を見逃し、緩すぎると別企業を誤統合します。業界・企業ごとにルールのカスタマイズが必須です。

ステップ2【選択】どのレコードを「正」として残すか決める

重複しているレコード群の中から、どの1件をマスターレコードとして残すかを決めるステップです。

代表的な選定ロジック

  • 最新の情報を優先:更新日時が最も新しいレコードをマスターにする

  • 信頼度の高いソースを優先:外部公式DBや名寄せサービスから取り込んだレコードを最優先にする

  • ビジネス的に重要なステータスを優先:成約済みの取引先が紐づいているレコードや、特定パイプライン上のレコードをマスターにする

  • 技術的な一貫性を優先:最も古くから存在するレコード(IDが一番小さいもの)をマスターとして残す

マスターレコード選定ルールを明確に定義しておくことで、ステップ3(統合処理)の自動化が容易になり、同じ条件なら常に同じレコードが「正」として選ばれる状態を作れます。


ステップ3【統合】1つのレコードにまとめる

選択したデータをもとに、物理的に1レコードに統合します。

統合時の処理:

  • マスターレコード作成:最も優先度の高いレコードをベースに

  • 子レコードの紐付け変更:商談・活動履歴をすべてマスターに移行

  • 重複レコードの削除またはアーカイブ:元のレコードは無効化

  • 監査ログ記録:「いつ・誰が・何を統合したか」を記録

重要:削除ではなく「マージ」

単純削除では商談履歴も消えます(致命的)。マージなら、すべての履歴を保持したまま統合できます。


マージの実装方法:3つのアプローチ

方法1: 手動で対応する場合

メリット:コストゼロ(既存CRM機能のみ)、完全に人間がコントロール、少数の重複なら十分対応可能

デメリット:1件あたり5〜10分かかる、人的ミスのリスク(間違えて統合・削除)、継続的な運用が困難

具体的手順(Salesforceの例):

  1. 検索バーで「ABC」と入力

  2. 重複候補を目視で確認

  3. レコードを選択 →「マージ」ボタン

  4. 保持するフィールドを1つずつ選択 5.「マージ実行」をクリック

  5. 関連する商談・活動が自動移行されることを確認

推奨ケース:月10件以下の重複発生、初期データ整備の第一歩、ルール設計前のテスト実行

方法2: スクリプト/マクロを使う場合

メリット:一度書けば繰り返し実行可能、カスタムルールを柔軟に設定、コストは開発工数のみ

デメリット:エンジニアリソースが必要、メンテナンスコスト(CRM仕様変更に対応)、エラー発生時のリカバリーが難しい

サンプルコード(Salesforce Apex・簡易版):

// 重複検出:会社名が完全一致
List<Account> duplicates = [
SELECT Id, Name, Phone, CreatedDate
FROM Account
WHERE Name = '株式会社ABC'
ORDER BY CreatedDate ASC
];
// 最も古いレコードをマスターにする
Account master = duplicates[0];
// 残りのレコードをマージ対象に
for (Integer i = 1; i < duplicates.size(); i++) {
Database.merge(master, duplicates[i], false);
}
// 重複検出:会社名が完全一致
List<Account> duplicates = [
SELECT Id, Name, Phone, CreatedDate
FROM Account
WHERE Name = '株式会社ABC'
ORDER BY CreatedDate ASC
];
// 最も古いレコードをマスターにする
Account master = duplicates[0];
// 残りのレコードをマージ対象に
for (Integer i = 1; i < duplicates.size(); i++) {
Database.merge(master, duplicates[i], false);
}
// 重複検出:会社名が完全一致
List<Account> duplicates = [
SELECT Id, Name, Phone, CreatedDate
FROM Account
WHERE Name = '株式会社ABC'
ORDER BY CreatedDate ASC
];
// 最も古いレコードをマスターにする
Account master = duplicates[0];
// 残りのレコードをマージ対象に
for (Integer i = 1; i < duplicates.size(); i++) {
Database.merge(master, duplicates[i], false);
}


注意点:本番実行前に必ずサンドボックスでテスト、バックアップを取得してから実行、マージ後の検証プロセスを組み込む

推奨ケース:定期的に同じパターンの重複が発生、開発リソースがある、複雑なカスタムルールが必要

方法3: 専門ツールで自動化する場合

メリット:ノーコードで設定可能(エンジニア不要)、定期自動実行(毎日・毎週)、AIによる高精度な重複検出、安全なロールバック機能

デメリット:ツール利用コストが発生、初期設定に若干の学習コストあり


💡 DataSangoの場合の実装例:最短3分で設定完了

DataSangoを使うと、以下の流れで最短3分で設定完了します(慣れれば1分以内)。

設定手順:

  1. 接続:CRM(Salesforce / HubSpot / Pipedrive)と連携(OAuth認証)

  2. ルール設定:例えば「法人番号が完全一致」「会社名+ドメインが完全一致」「会社名+住所が完全一致」など

  3. プレビュー:統合結果をシミュレーション表示で確認

  4. 実行:スケジュール設定(手動 / 毎週月曜9時など / 即時)

実行後の効果

  • 重複率:38% → 限りなく0%に近い状態を維持(導入企業平均。ルール最適化により理論上は限りなく0%に近づけることが可能)

  • 作業時間:月20時間 → 0時間

  • レポート精度:売上予測の誤差が15%改善

DataSangoなら:設定は最短3分、あとは毎日自動でクリーンなCRMを維持できます。

推奨ケース:継続的な自動マージ運用をしたい、エンジニア工数を使わずに早期に解決したい、複数CRMをまたいで一元管理したい



マージ実行時の注意点とベストプラクティス

よくある失敗パターンTOP5

失敗1: バックアップなしで実行

誤統合してもデータを復元できなくなります。 対策:必ず統合前にエクスポートまたはスナップショットを取得(DataSangoはスナップショットを自動取得)

失敗2: 全自動で放置

「別企業なのに同じ名前」という誤統合が発生します。 対策:初回は必ず人間がレビューし、信頼度が高まってから自動化へ移行

失敗3: 関連データの確認不足

商談履歴が消える、担当者の紐付けが切れるといった問題が起きます。 対策:マージ後に関連レコード数を確認する検証フローを組み込む

失敗4: ルールが厳しすぎる
「(株)ABC」と「株式会社ABC」を別扱いしてしまいます。 対策:表記ゆれ辞書を整備し、段階的にルールを緩和(DataSangoなら表記ゆれの整備も自動化可能)

失敗5: 一度に大量実行
エラー発生時の原因特定が困難になります。 対策:最初は100件ずつテスト実行


マージ運用の成功事例

事例1:BtoB SaaS企業A社(従業員150名)

導入前の課題:

  • CRM内のリード重複率:38%

  • 月次レポート作成に20時間(手作業で重複除外)

  • 同じリードに複数の営業が接触するトラブル頻発


DataSango導入後:

  • 重複率:38% → 限りなく0%に近い状態を維持(ルール最適化後)

  • レポート作成:20時間 → 2時間(90%削減)

  • 営業効率:商談化率が22%向上(顧客履歴が統合されたため)


担当者コメント(RevOps Manager)
「以前は『このリード、前も問い合わせしてた?』と毎回調べる時間が無駄でした。今は1クリックで全履歴が見えるので、提案の質が劇的に上がりました」

事例2:コンサルティング会社B社(従業員80名)

導入前の課題:部門ごとに異なるCRMを使用→データ統合時に大量重複が発生、プロジェクト履歴が分散し提案書作成に支障

DataSango導入後

  • 統合プロジェクトで12,000件 → 7,500件に整理

  • 過去案件の参照時間:平均15分 → 2分

  • クロスセル提案が30%増加(統合履歴から新ニーズを発見)


事例3:製造業C社(従業員500名)

導入前の課題:展示会での名刺取込で毎回重複が発生、取引先マスタが信頼されず各部門が独自Excelを運用

DataSango導入後

  • 展示会後の重複処理:3日 → 30分

  • マスタデータの信頼性向上 → Excel運用が廃止

  • 与信管理の精度向上(重複による誤判定がゼロに)


よくある質問

Q1:マージすると元のデータは完全に消えますか?
ほとんどのCRMでは「論理削除」されます。管理者権限があれば「ごみ箱」から復元可能ですが、完全削除される前(通常15〜30日)に復元が必要です。

Q2:マージ後に「やっぱり別レコードだった」と気づいたら?
CRMによっては「マージの取り消し」や「復元」が不可能な場合があります。その場合はバックアップからの復元が必要です。DataSangoのようなスナップショット機能付きツールの使用を推奨します。

Q3:API経由で作成されたレコードも自動マージできますか?
はい、可能です。DataSangoはAPI経由で作成されたレコードも含め、設定したルールに従って自動検出・統合します。

Q4:重複検出の精度はどれくらいですか?

  • 完全一致(メールアドレス等):99%以上

  • 表記ゆれ込み:85〜95%(ツールのAI精度やルールに依存)

  • 人間の目視:60〜70%(見落としが多い) DataSangoのルールを段階的に最適化することで、理論上は限りなく0%に近い重複率を維持できます。

Q5:Salesforce・HubSpot・Pipedrive以外のCRMでも使えますか?
現在はSalesforce / HubSpot / Pipedriveに対応しています。対応CRMの最新情報はDataSangoの公式サイト(https://www.datasango.ai/)をご確認ください。


まとめ

【この記事のポイントを3行で】

  1. CRMの「マージ」は、重複レコードを1つに統合する必須プロセス。手動・スクリプト・ツールの3つの実装方法がある

  2. 重複データは意思決定を狂わせ、顧客体験を悪化させる。営業効率だけでなく、経営判断にも影響する

  3. 定期的な自動マージ運用で、重複を限りなく0%に近い状態で維持できる「信頼できるCRM」が実現できる

【次のアクション】

  • 今すぐできること:CRMで「会社名」で検索し、重複が何件あるか確認してみる

  • 本格的に改善するなら:DataSangoで重複検出ルールを設定し、自動マージ運用を開始


CRMの重複データ、手作業でやっていませんか?

DataSangoなら、重複・表記ゆれ・欠損・未分類を自動で整備。
設定は最短3分、あとは毎日自動でクリーンなCRMを維持できます。

✅ 無料プランあり(クレジットカード登録不要)
✅ Salesforce / HubSpot / Pipedrive対応
✅ 安全なスナップショット機能付き