Distribuidos - TP1

Configurar cantidad de nodos por query
Ejecución con Docker
Comparación de resultados
Usar dataset reducido

Configurar cantidad de nodos por query

Para actualizar el archivo compose.yaml con la cantidad de nodos deseada, modificar las constantes del script cmd/compose/main.go y luego ejecutar el comando:

make write-compose

Ejecución con Docker

Para levantar los procesos, ejecutar:

make compose-up

Para ver los logs del sistema, ejecutar:

make compose-logs

Para terminar los procesos, ejecutar

make compose-down

Para ver las diferencias entre las librerías de lenguaje de Go y Python, ejecutar los scripts:

go run ./cmd/detect-language/main.go 
python3 ./cmd/detect-language/main.py

Aclaración: es conveniente correr estos scripts en paralelo ya que tardan bastante tiempo.

Luego ejecutar:

./cmd/detect-language/diff.sh

Comparación de resultados

Para comparar los resultados, primero hay que obtener los valores de referencia. Tenemos un script de Python que los resuelve, pero necesitamos usar el mismo detector de lenguaje, para asegurar que los resultados sean los mismo. Para eso, ejecutamos:

go run ./scripts/filter-english-negative/main.go .data/reviews.csv .data/reviews-english-negative.csv

Luego, resolvemos las consultas localmente, ejecutando:

python ./scripts/solve.py .data/ .py-results/

Este guardara los resultados correctos en .py-results/

Para compararlos, ejecutamos:

./scripts/compare.sh .results/ .py-results/

Usar dataset reducido

Primero, tenemos que generar un dataset reducido de datos. Para eso, ejecutamos:

go run ./scripts/reduce/main.go

Después, tenemos que modificar el compose para que use el dataset reducido. Tenemos que cambiar cuál carpeta de los datos se bindea al contenedor del cliente. Se puede hacer manualmente, o automáticamente ejecutando:

sed -i 's|./.data:/.data|./.data-reduced:/.data|' ./scripts/compose/main.go # linux
sed -i '' 's|./.data:/.data|./.data-reduced:/.data|' ./scripts/compose/main.go # osx

Luego, regeneramos el compose:

make write-compose

Luego de ejecutar el sistema, podemos adaptar la sección de comparación de resultados para utilizar el dataset reducido.

Name		Name	Last commit message	Last commit date
Latest commit History 90 Commits
.github/workflows		.github/workflows
cmd		cmd
database		database
middleware		middleware
protocol		protocol
restarter-protocol		restarter-protocol
scripts		scripts
utils		utils
.dockerignore		.dockerignore
.gitignore		.gitignore
.killer-config		.killer-config
.restarter-config		.restarter-config
CODEOWNERS		CODEOWNERS
Dockerfile		Dockerfile
Makefile		Makefile
README.md		README.md
compose.yaml		compose.yaml
go.mod		go.mod
go.sum		go.sum

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Distribuidos - TP1

Configurar cantidad de nodos por query

Ejecución con Docker

Comparación de resultados

Usar dataset reducido

About

Releases

Packages

Contributors 3

Languages

JulianGCalderon-FIUBA/distribuidos-tp1

Folders and files

Latest commit

History

Repository files navigation

Distribuidos - TP1

Configurar cantidad de nodos por query

Ejecución con Docker

Comparación de resultados

Usar dataset reducido

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages