Dataprep Microservice with PGVector

🚀1. Start Microservice with Python（Option 1）

1.1 Install Requirements

pip install -r requirements.txt

1.2 Start PGVector

Please refer to this readme.

1.3 Setup Environment Variables

export PG_CONNECTION_STRING=postgresql+psycopg2://testuser:testpwd@${your_ip}:5432/vectordb
export INDEX_NAME=${your_index_name}
export LANGCHAIN_TRACING_V2=true
export LANGCHAIN_API_KEY=${your_langchain_api_key}
export LANGCHAIN_PROJECT="opea/gen-ai-comps:dataprep"

1.4 Start Document Preparation Microservice for PGVector with Python Script

Start document preparation microservice for PGVector with below command.

python prepare_doc_pgvector.py

🚀2. Start Microservice with Docker (Option 2)

2.1 Start PGVector

Please refer to this readme.

2.2 Setup Environment Variables

export PG_CONNECTION_STRING=postgresql+psycopg2://testuser:testpwd@${your_ip}:5432/vectordb
export INDEX_NAME=${your_index_name}
export LANGCHAIN_TRACING_V2=true
export LANGCHAIN_API_KEY=${your_langchain_api_key}
export LANGCHAIN_PROJECT="opea/dataprep"

2.3 Build Docker Image

cd comps/dataprep/langchain/pgvector/docker
docker build -t opea/dataprep-pgvector:latest --build-arg https_proxy=$https_proxy --build-arg http_proxy=$http_proxy -f comps/dataprep/langchain/pgvector/docker/Dockerfile .

2.4 Run Docker with CLI (Option A)

docker run -d --name="dataprep-pgvector" -p 6007:6007 --ipc=host -e http_proxy=$http_proxy -e https_proxy=$https_proxy -e PG_CONNECTION_STRING=$PG_CONNECTION_STRING  -e INDEX_NAME=$INDEX_NAME -e TEI_ENDPOINT=$TEI_ENDPOINT opea/dataprep-pgvector:latest

2.5 Run with Docker Compose (Option B)

cd comps/dataprep/langchain/pgvector/docker
docker compose -f docker-compose-dataprep-pgvector.yaml up -d

🚀3. Consume Microservice

Once document preparation microservice for PGVector is started, user can use below command to invoke the microservice to convert the document to embedding and save to the database.

curl -X POST \
    -H "Content-Type: application/json" \
    -d '{"path":"/path/to/document"}' \
    http://localhost:6007/v1/dataprep

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Dataprep Microservice with PGVector

🚀1. Start Microservice with Python（Option 1）

1.1 Install Requirements

1.2 Start PGVector

1.3 Setup Environment Variables

1.4 Start Document Preparation Microservice for PGVector with Python Script

🚀2. Start Microservice with Docker (Option 2)

2.1 Start PGVector

2.2 Setup Environment Variables

2.3 Build Docker Image

2.4 Run Docker with CLI (Option A)

2.5 Run with Docker Compose (Option B)

🚀3. Consume Microservice

Files

README.md

Latest commit

History

README.md

File metadata and controls

Dataprep Microservice with PGVector

🚀1. Start Microservice with Python（Option 1）

1.1 Install Requirements

1.2 Start PGVector

1.3 Setup Environment Variables

1.4 Start Document Preparation Microservice for PGVector with Python Script

🚀2. Start Microservice with Docker (Option 2)

2.1 Start PGVector

2.2 Setup Environment Variables

2.3 Build Docker Image

2.4 Run Docker with CLI (Option A)

2.5 Run with Docker Compose (Option B)

🚀3. Consume Microservice