Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Preparación de datos de los ficheros juridicas1y2 #5

Open
wants to merge 28 commits into
base: main
Choose a base branch
from
Open
Show file tree
Hide file tree
Changes from all commits
Commits
Show all changes
28 commits
Select commit Hold shift + click to select a range
b48af6c
Preparacion y exportacion de datos de juridicas
Apr 4, 2022
9b3ed17
Creado report perfilado datos juridicas1y2
Apr 4, 2022
9f5f062
Creados ficheros con cabeceras y cif separado
Apr 4, 2022
fbf4355
Comentada la creación del report pandas profiling
Apr 4, 2022
7e5ef48
Creado perfilado datos convocatorias
Apr 4, 2022
cc4c95f
Borrador cruce datos. Pendiente unión dataframes.
Apr 4, 2022
87bfed9
Aclaración sobre ID e IDConv en ambos ficheros
Apr 4, 2022
cdf8f50
Version inicial del dataset cruzado
Apr 4, 2022
fad93dc
Merge branch 'JaimeObregon:main' into main
elsatch Apr 4, 2022
4efaf5a
Reorganizada la estructura para mayor claridad
Apr 4, 2022
7284a61
Merge branch 'main' of github.com:elsatch/subvenciones
Apr 4, 2022
0ff0c56
Explicación:no se puede saber la provincia via CIF
elsatch Apr 5, 2022
900fa15
Formateo adicional del contenido
elsatch Apr 5, 2022
d061bb4
Creada información sobre convocantesN123
elsatch Apr 6, 2022
2da2e9b
Información y análisis sobre los convocantes
Apr 6, 2022
5530e21
Delete descarga-estructura-admon-N.ipynb
elsatch Apr 6, 2022
393971e
Revisado el formato y eliminado lo obsoleto
Apr 6, 2022
11f4827
Merge branch 'main' of github.com:elsatch/subvenciones
Apr 6, 2022
a00a684
Creado notebook para analisis de similaridad
elsatch Apr 6, 2022
aa5bb17
Descargados últimos cambios
elsatch Apr 6, 2022
b3c5573
Breve aclaración sobre posibles usos
elsatch Apr 6, 2022
b65e634
Publicados resultados iniciales de similitud N1
Apr 7, 2022
9e6440d
Creado encabezado fichero descargas
elsatch Apr 7, 2022
16ecf91
Merge branch 'main' of https://github.com/elsatch/subvenciones
elsatch Apr 7, 2022
e6f45f9
Generado primer borrador de Great Expectations
Apr 11, 2022
f976995
Actualizado formato, mejor visualización en github
Apr 11, 2022
ab6b5c4
Visualizacion estructura Nivel C y otros
Apr 11, 2022
7f04389
Creación de visualizaciones por mes y año de conv.
Apr 11, 2022
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
Binary file added files/juridicas_1_cif.csv.gz
Binary file not shown.
Binary file added files/juridicas_2_cif.csv.gz
Binary file not shown.
5,662 changes: 5,662 additions & 0 deletions notebooks/analisis-similaridad-convocantes.ipynb

Large diffs are not rendered by default.

63 changes: 63 additions & 0 deletions notebooks/consulta-basica-convocatorias.ipynb
Original file line number Diff line number Diff line change
@@ -0,0 +1,63 @@
{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Consulta básica convocatorias\n",
"El objetivo de este cuaderno es descargar en formato csv los datos relativos a las últimas cinco subvenciones publicadas en el portal oficial de subvenciones.\n",
"\n",
"La URL de la Base de datos nacional de subvenciones es: "
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"import requests\n",
"import pandas as pd\n",
"# import BeautifulSoup as bs4"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Vamos a empezar trabajando con una sola convocatoria, para cómo se estructura la información. Al entrar en la página nos encontramos con que una de las últimas convocatorias es la 620078. Escogemos esta convocatoria en la tabla de la página de inicio y pulsamos sobre el número de convocatoria.\n",
"\n",
"En el navegador se nos abre la URL: https://www.infosubvenciones.es/bdnstrans/GE/es/convocatoria/620078\n",
"\n",
"En el pie de esta página encontramos también una URL de descaga de PDF: \n",
"https://www.infosubvenciones.es/bdnstrans/GE/es/convocatoria/exportar/620078\n",
"\n",
"Trataremos de descargar estos contenidos utilizando la librería Requests de Python."
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"interpreter": {
"hash": "b0fa6594d8f4cbf19f97940f81e996739fb7646882a419484c72d19e05852a7e"
},
"kernelspec": {
"display_name": "Python 3.9.10 64-bit",
"language": "python",
"name": "python3"
},
"language_info": {
"name": "python",
"version": "3.9.10"
},
"orig_nbformat": 4
},
"nbformat": 4,
"nbformat_minor": 2
}
71 changes: 71 additions & 0 deletions notebooks/convocatorias_por_año.html

Large diffs are not rendered by default.

71 changes: 71 additions & 0 deletions notebooks/convocatorias_por_mes_completo.html

Large diffs are not rendered by default.

71 changes: 71 additions & 0 deletions notebooks/convocatorias_por_mes_completo_interactivo.html

Large diffs are not rendered by default.

71 changes: 71 additions & 0 deletions notebooks/convocatorias_por_mes_desde_enero_2016.html

Large diffs are not rendered by default.

71 changes: 71 additions & 0 deletions notebooks/convocatorias_por_mes_desde_enero_2016_interactivo.html

Large diffs are not rendered by default.

Loading