Утилита Sqoop позволяет импортировать данные из Managed Service for PostgreSQL в кластер Yandex Data Processing. В зависимости от конфигурации кластера Yandex Data Processing вы можете выполнить импорт в одно из следующих хранилищ:
- бакет Yandex Object Storage;
- директорию HDFS;
- Apache Hive;
- Apache HBase.
Подготовка инфраструктуры для виртуальной машины, Object Storage, Yandex Data Processing и Managed Service for PostgreSQL через Terraform описана в практическом руководстве, необходимый для настройки конфигурационный файл clusters-postgresql-data-proc-and-vm.tf расположен в этом репозитории.