MAISON CODE .
/ Data · CDP · Reverse ETL · Measurement · Architecture

Das Composable CDP: Warum Ihr Lager die Quelle der Wahrheit ist

Hören Sie auf, Segment 100.000 US-Dollar pro Jahr zu zahlen. Ein technischer Leitfaden zum Composable CDP-Stack: Snowflake, dbt und Hightouch (Reverse ETL).

AB
Alex B.
Das Composable CDP: Warum Ihr Lager die Quelle der Wahrheit ist

Die „Customer Data Platform“ (CDP)-Branche ist einer der größten Schläger im SaaS-Bereich. Tools wie Segment, mParticle oder Salesforce CDP berechnen Ihnen die Kosten basierend auf „Monthly Tracked Users“ (MTU). Wenn ein Benutzer Ihre Website einmal besucht, zahlen Sie. Wenn Sie 10 Millionen verstaubte E-Mails aus dem Jahr 2015 in Ihrer Datenbank haben, zahlen Sie. Die Rechnungen von Unternehmen übersteigen oft 200.000 €/Jahr, nur um Daten zu speichern, die Sie bereits besitzen.

Im Jahr 2025 zerstören die besten Ingenieurteams das monolithische CDP. Sie wechseln zum Composable CDP. Die Logik ist einfach: Ihr Data Warehouse (Snowflake/BigQuery) ist das CDP. Es ist günstig, skalierbar und Sie besitzen es. Sie benötigen lediglich eine Pipe, um die Daten aus aus dem Lager zu Ihren Marketing-Tools (Klaviyo/Meta) zu verschieben. Diese Pipe ist Reverse ETL (Hightouch).

Warum Maison Code darüber spricht

Bei Maison Code Paris fungieren wir als das architektonische Gewissen unserer Kunden. Wir übernehmen oft „moderne“ Stacks, die ohne grundlegendes Verständnis für Skalierung gebaut wurden.

Wir diskutieren dieses Thema, weil es einen kritischen Wendepunkt in der technischen Reife darstellt. Die korrekte Implementierung unterscheidet ein fragiles MVP von einer widerstandsfähigen Plattform auf Unternehmensniveau.

1. Das Segment Architektur: Entbündelung

Das monolithische CDP macht drei Dinge:

  1. Ereignissammlung: analytics.track()
  2. Identitätsauflösung: Zusammenführung von „user_123“ mit „cookie_abc“.
  3. Aktivierung: Zielgruppen zu Facebook-Anzeigen weiterleiten.

Das Composable CDP teilt dies auf:

  1. Sammlung: Rudderstack (Open Source) oder Snowplow.
  2. Speicher: Snowflake (Günstiger Speicher).
  3. Transformation: dbt (SQL-Logik).
  4. Aktivierung: Hightouch (das „Reverse ETL“).

„Meerjungfrau Grafik LR Untergraph Quellen Store[Shopify] ->|Fivetran| Lager Web[Web-Events] ->|Rudderstack| Lager Ende

subgraph Warehouse[Schneeflocke]
    Raw[Rohtabellen] ->|dbt| Gold[Gold-Kundentisch]
Ende

Unterabschnitt Aktivierung
    Gold -->|Hightouch| FB[Facebook-Anzeigen]
    Gold -->|Hightouch| E-Mail[Klaviyo]
Ende

2. Die Macht von SQL: Identitätsauflösung

In Segment bleiben Sie bei der Logik des Identitätsdiagramms hängen. In Snowflake schreiben Sie die Logik in SQL (dbt). Sie haben unendliche Flexibilität.

Szenario: Sie möchten „Offline-Shop-Käufe“ mit „Online-Websurfen“ verknüpfen. Das Segment hat damit Probleme, wenn die E-Mail nicht perfekt übereinstimmt. In dbt können Sie Fuzzy-Matching-Logik schreiben.

„sql — models/gold/dim_users.sql MIT web_users AS ( WÄHLEN SIE EINDEUTIGE E-Mail-Adresse und Cookie-ID AUS raw.web_events ), pos_users AS ( WÄHLEN Sie E-Mail, Telefon, Treuekarte AUS raw.pos_transactions aus ) AUSWÄHLEN COALESCE(w.email, p.email) als master_email, w.cookie_id, p.loyalty_card, – Benutzerdefinierte Logik: Wenn sie im Geschäft gekauft haben, sind sie VIP FALL WENN p.loyalty_card NICHT NULL IST, DANN ‘VIP’ ELSE ‘Standard’ ENDE als Segment VON web_users w FULL OUTER JOIN pos_users p ON w.email = p.email „

Sie haben jetzt eine „gold.dim_users“-Tabelle, die die Single Source of Truth für das gesamte Unternehmen darstellt.

3. Aktivierung: Synchronisierung mit dem Edge

Marketingtools (Klaviyo) sind dumme Datenbanken. Wir müssen ihnen sagen, wem sie eine E-Mail senden sollen. Anstatt ein benutzerdefiniertes Python-Skript „snowflake_to_klaviyo.py“ zu erstellen (das jede Woche kaputt geht), verwenden wir Hightouch. Hightouch fragt einfach Ihre Goldtabelle ab und ordnet die Felder zu.

Abfrage: „sql WÄHLEN Sie E-Mail, Vorname, Lieblingsfarbe VON dim_users WHERE segment = ‘VIP’ AND last_purchase_date < NOW() - INTERVAL ‘90 DAYS’ „

Zuordnung:

  • „E-Mail“ -> Klaviyo „E-Mail“.
  • favorite_color -> Klaviyo custom_properties.color

Hightouch führt dies alle 15 Minuten aus. Es verarbeitet Ratenbegrenzungen, Wiederholungsversuche und API-Änderungen.

4. Betriebsanalyse: Slack-Benachrichtigungen

CDPs sind in der Regel „nur Marketing“. Aber das Composable CDP dient auch der Technik und dem Vertrieb. Wir können Hightouch verwenden, um Daten an Slack zu senden.

Anwendungsfall: Ausfälle mit hohem Wert Wenn ein Benutzer mit einem LTV > 5.000 € die Fehlermeldung „Zahlung fehlgeschlagen“ erhält. Standardablauf: Der Benutzer sieht einen Fehler. Blätter. Wir verlieren einen VIP. Zusammensetzbarer Ablauf:

  1. dbt modelliert „failures_last_hour“.
  2. Hightouch synchronisiert dies mit dem Slack-Kanal „#vip-support“.
  3. Der Supportmitarbeiter sieht: „VIP Alex hat die Zahlung fehlgeschlagen. Telefon: 555-0199“.
  4. Agent ruft Alex sofort an. „Kann ich Ihnen helfen, die Bestellung abzuschließen?“

Dies ist Datenaktivierung. Es verwandelt eine riesige Datenbank in umsetzbare Einnahmen.

5. Datenschutz und Governance (DSGVO)

In einem monolithischen CDP ist das Löschen eines Benutzers ein Albtraum. Sie müssen Segment bitten, es zu löschen, und dann hoffen, dass es weitergegeben wird. In Composable löschen Sie die Zeile in Snowflake. Hightouch erkennt den Löschvorgang (Diff) und sendet automatisch eine „DELETE“-Anfrage an Facebook, Google und Klaviyo. Eine Abfrage erzwingt die DSGVO in Ihrem gesamten Stack.

Apple (Safari) tötet clientseitige Cookies nach 7 Tagen (ITP). Wenn ein Benutzer am Montag zu Besuch kommt und am nächsten Mittwoch wiederkommt, geht Segment davon aus, dass es sich um einen neuen Benutzer handelt. Ihre Namensnennung ist fehlerhaft. Serverseitiges Tracking behebt dieses Problem. Da wir die Domain („data.maisoncode.paris“) kontrollieren, können wir „HttpOnly“-Cookies setzen, die zwei Jahre gültig sind. Rudderstack erledigt dies sofort. Dadurch werden 20 % der verlorenen Attribution für Kunden mit hohem Apple-Traffic (Mode/Luxus) wiederhergestellt.

7. Algorithmen zur Identitätsauflösung

Woher wissen Sie, dass „user_123“ „alex@gmail.com“ ist? Es gibt zwei Strategien:

  1. Deterministisch: Exakte Übereinstimmung. (E-Mail = E-Mail). Genauigkeit 100 %. Übereinstimmungsrate 40 %.
  2. Probabilistisch: „Gleiche IP + gleiches Gerätemodell + gleicher Standort“. Genauigkeit 80 %. Übereinstimmungsrate 90 %. Für CDPs bevorzugen wir Deterministisch. Wir möchten nicht der falschen Person eine E-Mail senden. Für Anzeigen-Targeting aktivieren wir jedoch die Wahrscheinlichkeitsausrichtung. Es ist in Ordnung, wenn 10 % der Leute die falsche Anzeige sehen, wenn das bedeutet, dass sich Ihre Reichweite verdoppelt. Mit Snowflake können Sie beide Diagramme gleichzeitig ausführen.

8. Die Kostengleichung

Vergleichen wir einen Client mit 500.000 MTUs.

Segment (Geschäftsplan):

  • Protokoll: Im Lieferumfang enthalten
  • Personas: Add-on
  • Gesamt: ~60.000 €/Jahr.

Zusammensetzbarer Stapel:

  • Rudderstack (Open Source): 0 € (gehostet auf AWS).
  • Snowflake: 500 €/Monat (Speicher + Rechenleistung).
  • Hightouch: 800 €/Monat.
  • Gesamt: ~15.000 €/Jahr.

Ersparnis: 75 %. Außerdem sind Sie Eigentümer der Daten. Wenn Sie Hightouch kündigen, haben Sie weiterhin Ihre Snowflake-Tische. Wenn Sie „Segmentieren“ abbrechen, geht Ihr Diagramm verloren.

7. Der „Echtzeit“-Mythos

Vermarkter schreien gerne: „Wir brauchen Echtzeit-Personalisierung!“ Ingenieure müssen fragen: „Wirklich?“ Szenario A: Benutzer verlässt den Warenkorb.

  • Benötigt: E-Mail innerhalb von 1 Stunde senden.
  • Werkzeug: Lager (Charge). Ausreichend. Szenario B: Benutzer klickt auf „Rote Schuhe“. Homepage Hero sollte umgehend auf „Red Shoes“ umstellen.
  • Benötigt: < 200 ms Latenz.
  • Tool: Edge Middleware (Vercel/Cloudflare). Das Warehouse ist für Strategische Daten (E-Mail, Anzeigen, Analysen) vorgesehen. Der Edge ist für Taktische Daten (UI-Personalisierung) vorgesehen. Versuchen Sie nicht, Snowflake dazu zu zwingen, Abfragen in Sekundenbruchteilen durchzuführen. Das ist nicht seine Aufgabe.

8. Die Kostenfalle „kostenloser“ Analysen

Google Analytics 4 (GA4) ist kostenlos. Aber es wird gesampelt. Und der BigQuery-Export kann teuer werden (0,05 € pro abgefragtem GB). Aber im Vergleich zu Adobe Analytics (über 100.000 US-Dollar) ist es ein Schnäppchen. Die Falle: Alles speichern. Ingenieure neigen dazu, „mouse_move“, „scroll_ Depth_10 %“, „scroll_ Depth_20 %“ zu protokollieren. Dadurch entstehen „Datensümpfe“. Milliarden Lärmreihen. Regel: Verfolgen Sie ein Ereignis nur, wenn ihm eine Geschäftsfrage beigefügt ist. „Welche Entscheidung werden wir ändern, wenn wir die Scrolltiefe verfolgen?“ Wenn die Antwort „Keine“ lautet, löschen Sie den Tracking-Code. Speichern Sie die Bytes.

9. Fazit

Daten sind Schwerkraft. Je mehr Daten Sie in ein proprietäres SaaS (Segment/Salesforce) stecken, desto schwieriger ist es, es zu verlassen. Die Datenbank ist die einzige Technologie, die 40 Jahre überlebt hat. Wetten Sie auf SQL. Wetten Sie auf das Lager. Bauen Sie Rohre, keine Silos.


Datenausgaben reduzieren?

Bezahlen Sie für „MTUs“, die nicht konvertiert werden?

Erstellen Sie einen zusammensetzbaren Stack. Lesen Sie mehr über Attribution SQL und Serverseitiges Tagging.

„Aber Segment ist Echtzeit. Snowflake ist Batch.“ WAHR. Data Warehouses haben Latenz (Laden von Daten + DBT-Build). Normalerweise 15-30 Minuten. Wenn Sie eine Personalisierung in Sekundenbruchteilen benötigen (z. B. die Anzeige eines Popups basierend auf dem Klick, den sie gerade vor einer Sekunde ausgeführt haben), ist das Composable CDP zu langsam. Lösung: Verwenden Sie die clientseitige Edge-Personalisierung (Edge Middleware) für den „Hot“-Pfad. Verwenden Sie Composable CDP für den „kalten“ Pfad (E-Mail, Anzeigen, Aufbewahrung).

8. Fazit

Daten sind Schwerkraft. Je mehr Daten Sie in ein proprietäres SaaS (Segment/Salesforce) stecken, desto schwieriger ist es, es zu verlassen. Die Datenbank ist die einzige Technologie, die 40 Jahre überlebt hat. Wetten Sie auf SQL. Wetten Sie auf das Lager. Bauen Sie Rohre, keine Silos.

Datenausgaben reduzieren?

Bezahlen Sie für „MTUs“, die nicht konvertiert werden?

Erstellen Sie einen zusammensetzbaren Stack. Beauftragen Sie unsere Architekten.