- Configurar cantidad de nodos por query
- Ejecución con Docker
- Comparación de resultados
- Usar dataset reducido
Para actualizar el archivo compose.yaml
con la cantidad de nodos deseada, modificar las constantes del script cmd/compose/main.go
y luego ejecutar el comando:
make write-compose
Para levantar los procesos, ejecutar:
make compose-up
Para ver los logs del sistema, ejecutar:
make compose-logs
Para terminar los procesos, ejecutar
make compose-down
Para ver las diferencias entre las librerías de lenguaje de Go y Python, ejecutar los scripts:
go run ./cmd/detect-language/main.go
python3 ./cmd/detect-language/main.py
Aclaración: es conveniente correr estos scripts en paralelo ya que tardan bastante tiempo.
Luego ejecutar:
./cmd/detect-language/diff.sh
Para comparar los resultados, primero hay que obtener los valores de referencia. Tenemos un script de Python que los resuelve, pero necesitamos usar el mismo detector de lenguaje, para asegurar que los resultados sean los mismo. Para eso, ejecutamos:
go run ./scripts/filter-english-negative/main.go .data/reviews.csv .data/reviews-english-negative.csv
Luego, resolvemos las consultas localmente, ejecutando:
python ./scripts/solve.py .data/ .py-results/
Este guardara los resultados correctos en .py-results/
Para compararlos, ejecutamos:
./scripts/compare.sh .results/ .py-results/
Primero, tenemos que generar un dataset reducido de datos. Para eso, ejecutamos:
go run ./scripts/reduce/main.go
Después, tenemos que modificar el compose para que use el dataset reducido. Tenemos que cambiar cuál carpeta de los datos se bindea al contenedor del cliente. Se puede hacer manualmente, o automáticamente ejecutando:
sed -i 's|./.data:/.data|./.data-reduced:/.data|' ./scripts/compose/main.go # linux
sed -i '' 's|./.data:/.data|./.data-reduced:/.data|' ./scripts/compose/main.go # osx
Luego, regeneramos el compose:
make write-compose
Luego de ejecutar el sistema, podemos adaptar la sección de comparación de resultados para utilizar el dataset reducido.