Angekündigt im Mai 2025: Dataproc Serverless ist jetzt Google Cloud Serverless for Apache Spark

Google Cloud Serverless for Apache Spark

Konzentrieren Sie sich auf Ihren Code, nicht auf Ihre Infrastruktur

Führen Sie Ihre Apache Spark-Jobs einfacher auf einer anpassbaren Zero-Ops-Plattform, intelligenter dank Gemini-Unterstützung und schneller dank der Leistung der Lightning Engine aus.

Apache Spark ist eine Marke der Apache Software Foundation.

Features

Branchenführende Leistung

Mit der Lightning Engine, unserer vektorisierten Engine der nächsten Generation, können Sie Ihre Aufträge beschleunigen. Sie profitieren von einer mehr als 4,3‑mal schnelleren Leistung und niedrigeren Gesamtkosten bei Ihren serverlosen Spark-Arbeitslasten – automatisch.

Informationen zu Lightning Engine

Zero-Ops mit intelligentem Autoscaling

Dank intelligentem Autoscaling entfällt die Clusterverwaltung. Die Ressourcen werden automatisch hoch- und herunterskaliert, um den Anforderungen Ihres Jobs perfekt zu entsprechen. So wird maximale Leistung und Kosteneffizienz gewährleistet, ohne dass Sie für Leerlaufzeiten bezahlen müssen.

Informationen zum Autoscaling

KI-basierte Entwicklung

Beschleunigen Sie Ihren gesamten Workflow. Mit Gemini Code Assist in BigQuery Studio können Sie PySpark-, Scala- und Java-Code schreiben und debuggen und GPU-beschleunigte Umgebungen mit vorkonfigurierten ML-Laufzeiten starten.

Gemini-Unterstützung kennenlernen

Einheitliche Spark- und SQL-Nutzung

Vermeiden Sie Kontextwechsel. Sie können Ihre Arbeitslasten in einer einzigen Umgebung wie BigQuery Studio entwickeln und ausführen. Dabei lassen sich leistungsstarkes SQL und die Flexibilität von PySpark nahtlos in einem Notebook kombinieren.

Informationen zu PySpark in BigQuery Studio

Zwei Leistungsstufen

Zwei Leistungsstufen	Es gibt verschiedene Stufen für spezifische Anforderungen – von der Standard-Batchverarbeitung bis hin zu den anspruchsvollsten, leistungskritischen Jobs.
Stufe	Optimal für
Standard	Ideal für kosteneffiziente Batchverarbeitung, Datentransformationen und allgemeine Spark-Jobs. Allgemeine Spark-ETL Geplante Datenpipelines Kostensensitive Batchjobs
Premium	Für die anspruchsvollsten Arbeitslasten mit maximaler Leistung durch die Lightning Engine, KI-/ML-Beschleunigung und interaktive Funktionen. Leistungskritische Jobs mit der Lightning Engine für eine 4,3‑fache Steigerung Interaktive Data Science und Analysen GPU-beschleunigte KI und ML Komplexe, umfangreiche Datenverarbeitung

Dienststufen von Serverless Spark in Google im Detail vergleichen.

Zwei Leistungsstufen

Es gibt verschiedene Stufen für spezifische Anforderungen – von der Standard-Batchverarbeitung bis hin zu den anspruchsvollsten, leistungskritischen Jobs.

Standard

Optimal für

Ideal für kosteneffiziente Batchverarbeitung, Datentransformationen und allgemeine Spark-Jobs.

Allgemeine Spark-ETL
Geplante Datenpipelines
Kostensensitive Batchjobs

Premium

Optimal für

Für die anspruchsvollsten Arbeitslasten mit maximaler Leistung durch die Lightning Engine, KI-/ML-Beschleunigung und interaktive Funktionen.

Leistungskritische Jobs mit der Lightning Engine für eine 4,3‑fache Steigerung
Interaktive Data Science und Analysen
GPU-beschleunigte KI und ML
Komplexe, umfangreiche Datenverarbeitung

Dienststufen von Serverless Spark in Google im Detail vergleichen.

Funktionsweise

Entwickeln Sie Ihre Apache Spark-Anwendung in Ihren bevorzugten Tools, einschließlich BigQuery Studio-Notebooks. Sie senden Ihren serverlosen Spark-Job mit einem einzigen Befehl und Google erledigt den Rest – Sie müssen keine Cluster erstellen, konfigurieren oder verwalten.

Gängige Einsatzmöglichkeiten

Interaktive Data Science

Data Scientists können Daten untersuchen und schnell Spark ML-Modelle iterieren. Vereinheitlichen Sie SQL und Spark in einem einzigen BigQuery Studio-Notebook und wechseln Sie nahtlos von der Datenexploration mit SQL zur Modellentwicklung mit PySpark, ohne jemals die Infrastruktur verwalten zu müssen.

Tutorials, Kurzanleitungen und Labs

Interaktive Data Science

Data Scientists können Daten untersuchen und schnell Spark ML-Modelle iterieren. Vereinheitlichen Sie SQL und Spark in einem einzigen BigQuery Studio-Notebook und wechseln Sie nahtlos von der Datenexploration mit SQL zur Modellentwicklung mit PySpark, ohne jemals die Infrastruktur verwalten zu müssen.

Automatisierte ETL-Pipelines

Erstellen Sie robuste, ereignisgesteuerte Spark-ETL-Pipelines, die bei Bedarf automatisch skaliert werden. Sie zahlen nur für das, was Sie nutzen. Das macht die Lösung ideal für unregelmäßige oder unvorhersehbare Arbeitslasten.

Schneller von Daten zur Spark-Produktion

Tutorials, Kurzanleitungen und Labs

Automatisierte ETL-Pipelines

Erstellen Sie robuste, ereignisgesteuerte Spark-ETL-Pipelines, die bei Bedarf automatisch skaliert werden. Sie zahlen nur für das, was Sie nutzen. Das macht die Lösung ideal für unregelmäßige oder unvorhersehbare Arbeitslasten.

KI/ML in großem Umfang

Mit serverlosem Spark können Sie das Training umfangreicher Modelle und Batch-Inferenz beschleunigen. Mit einem einzigen Befehl können Sie NVIDIA-GPUs mit vorkonfigurierten Bibliotheken anhängen.

Lernressourcen

KI/ML in großem Umfang

Mit serverlosem Spark können Sie das Training umfangreicher Modelle und Batch-Inferenz beschleunigen. Mit einem einzigen Befehl können Sie NVIDIA-GPUs mit vorkonfigurierten Bibliotheken anhängen.

Preise

Transparente, wertorientierte Preisgestaltung	Die Preise für Serverless for Apache Spark basieren auf der sekundengenauen Nutzung von Rechenleistung (DCUs), GPUs und Shuffle-Speicher.
Dienste und Nutzung	Abotyp	Preis (in $)
Data Compute Unit (DCU)	Standard	Ab 0,06 $ pro Stunde
Data Compute Unit (DCU)	Premium	Ab 0,089 $ pro Stunde
Zufällige Speicherung	Standard	Ab 0,04 $ pro GB/Monat
Zufällige Speicherung	Premium	Ab 0,1 $ pro GB/Monat
Preise für Beschleuniger	a100 40 GB	Ab 3,52069 $ pro Stunde
	a100 80 GB	Ab 4,713696 $ pro Stunde
	L4	Ab 0,672048 $ pro Stunde

Preisinformationen für Google Cloud Serverless for Apache Spark ansehen

Transparente, wertorientierte Preisgestaltung

Die Preise für Serverless for Apache Spark basieren auf der sekundengenauen Nutzung von Rechenleistung (DCUs), GPUs und Shuffle-Speicher.

Data Compute Unit (DCU)

Abotyp

Standard

Preis (in $)

Starting at

0,06 $

pro Stunde

Premium

Abotyp

Starting at

0,089 $

pro Stunde

Zufällige Speicherung

Abotyp

Standard

Preis (in $)

Starting at

0,04 $

pro GB/Monat

Premium

Abotyp

Starting at

0,1 $

pro GB/Monat

Preise für Beschleuniger

Abotyp

a100 40 GB

Preis (in $)

Starting at

3,52069 $

pro Stunde

a100 80 GB

Abotyp

Starting at

4,713696 $

pro Stunde

L4

Abotyp

Starting at

0,672048 $

pro Stunde

Preisinformationen für Google Cloud Serverless for Apache Spark ansehen

Preisrechner

Monatliche Kosten nach Region berechnen.

Individuelles Angebot

Wenden Sie sich an unser Vertriebsteam, wenn Sie ein individuelles Angebot für Ihr Unternehmen erhalten möchten.

Sofort loslegen

Anleitung für den Einstieg

Sie haben ein großes Projekt?

Produktdokumentation

BigQuery-Connector mit Serverless for Apache Spark verwenden

GPUs mit Serverless for Apache Spark verwenden

Anwendungsszenario

Business Case für Google Cloud Serverless for Apache Spark erstellen

Die wirtschaftlichen Vorteile von Google Cloud Dataproc und Serverless Spark im Vergleich zu alternativen Lösungen

Hier erfahren Sie, wie Sie mit Serverless for Apache Spark im Vergleich zu lokalen und anderen Cloud-Lösungen die Gesamtbetriebskosten deutlich senken und den Geschäftswert steigern können.

Unter anderem im Bericht:

Dataproc und Serverless for Apache Spark können im Vergleich zu anderen cloudbasierten Spark-Alternativen Kosteneinsparungen von 18–60 % erzielen.

Erfahren Sie, wie Google Cloud Serverless for Apache Spark eine 21% bis 55% bessere Preis-Leistungs-Relation als andere serverlose Spark-Angebote bieten kann.

Erfahren Sie, wie Dataproc und Google Cloud Serverless for Apache Spark die Bereitstellung von Spark vereinfachen und die betriebliche Komplexität reduzieren.

FAQs

Wann sollte ich Serverless for Apache Spark und wann Dataproc verwenden?

Wählen Sie Serverless for Apache Spark, wenn Sie sich auf Ihren Code konzentrieren und die gesamte Infrastrukturverwaltung eliminieren möchten. Es eignet sich ideal für neue Spark-Pipelines, interaktive Analysen und Jobs mit unvorhersehbarer Nachfrage, bei denen Geschwindigkeit und Einfachheit im Vordergrund stehen.

Entscheidungshilfe ansehen

Muss ich meine eigenen Bibliotheken (z. B. PyTorch oder XGBoost) installieren?

Der Premium-Tarif ist für KI/ML konzipiert und bietet vorkonfigurierte ML-Laufzeiten mit gängigen Bibliotheken wie PyTorch, XGBoost und scikit-learn. So entfällt die komplexe Einrichtung und Sie können in wenigen Minuten mit Ihren Data-Science-Arbeitslasten beginnen.

Informationen zu GPU-Arbeitslasten und Laufzeiten

Wie erziele ich die beste Leistung und wie funktioniert das Preismodell?

Für maximale Leistung können Sie den Premium-Tarif auswählen, der auf der Lightning Engine basiert. Die Preise basieren auf einem nutzungsbasierten Modell, bei dem Sie pro Sekunde nur für die Dauer der Ausführung Ihres Jobs zahlen. Dies ist sehr kosteneffizient, da die Kosten für inaktive Cluster entfallen.

Detaillierte Preisübersicht ansehen

Google Cloud Serverless for Apache Spark

Konzentrieren Sie sich auf Ihren Code, nicht auf Ihre Infrastruktur

Produkthighlights

Branchenführende Leistung

Zero-Ops mit intelligentem Autoscaling

KI-basierte Entwicklung

Einheitliche Spark- und SQL-Nutzung

Entwickeln Sie Ihre Apache Spark-Anwendung in Ihren bevorzugten Tools, einschließlich BigQuery Studio-Notebooks. Sie senden Ihren serverlosen Spark-Job mit einem einzigen Befehl und Google erledigt den Rest – Sie müssen keine Cluster erstellen, konfigurieren oder verwalten.

Interaktive Data Science

Tutorials, Kurzanleitungen und Labs

Interaktive Data Science

Automatisierte ETL-Pipelines

Tutorials, Kurzanleitungen und Labs

Automatisierte ETL-Pipelines

KI/ML in großem Umfang

Lernressourcen

KI/ML in großem Umfang

Preisrechner

Individuelles Angebot

Sofort loslegen

Anleitung für den Einstieg

Sie haben ein großes Projekt?

Produktdokumentation

BigQuery-Connector mit Serverless for Apache Spark verwenden

GPUs mit Serverless for Apache Spark verwenden

Ähnliche Inhalte

Wann sollte ich Serverless for Apache Spark und wann Dataproc verwenden?

Muss ich meine eigenen Bibliotheken (z. B. PyTorch oder XGBoost) installieren?

Wie erziele ich die beste Leistung und wie funktioniert das Preismodell?