BeamOnDatabricks

This repository provides a demo of my walk-through on how to run an Apache Beam Pipeline on Azure Databricks.

Import Maven Project
Setup project's JDK to 1.8
Create fat-jar using maven lifecycle
Attach the shaded jar to a Databricks Job
a. Select Runtime version 6.4
b. Add --runner=SparkRunner --usesProvidedSparkContext to Job's parameters
c. Configure other Job parameters as you prefer
Run your Databricks Job!

N.B. The same method should work on any other Spark Cluster too.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
src/main/java		src/main/java
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pom.xml		pom.xml

Provide feedback