Balancing acts:

Geopolitical pressures and justifications of the European Commission's digital policies

Code Repository for TRIAS project paper #1

by Christian Rauh & Milan Schröder

WZB Berlin Social Science Center

Scripts:

pipeline.R: full data analysis pipeline

Text preparation

00_connect_DB.R: Establish database connection
01_read_corpus.R: Read EC Corpus data from database
02_clean_corpus.R: Clean EC Corpus data
03_tokenize_corpus.R: Individual tokens of EC corpus (mild pre-processing)
04_corpus_descriptives.Rmd: Descriptives on EC corpus

Extract data

10_semantic_similarity_weights.R: Extracts different semantic similarity weights on token level from pre-trained GLOVE 6b 300d word embedding model (digitality, economy, security, lib. rights, conflictual/cooperative language)
11_semantic_similarity_coding.R: Applies semantic similarity weights to tokenized EC communication texts and aggregates corresponding scores to paragraph level
12_12_semantic_similiarity_digital_validation.R: Compare various cut-offs in semantic similarity coding for "digitality" against human codes
XXX 1x_digitality_zeroshot.ipynb: alternative simple zeroshot classification for benchmarking
XXX 12_create_validation_sample.R: validation sample creation
XXX 13_scaling_validation_results.Rmd: validation sample results & cutoff selection
20_country_mentions.R: identification of country mentions in EC communication texts along newsmap dictionary
XXX 21_country_mentions_descriptives.Rmd: descriptives on country identification

Analyse data

XXX 30_analysis.Rmd: ...

Data:

...

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
data		data
output		output
.gitattributes		.gitattributes
.gitignore		.gitignore
00_connectDB.R		00_connectDB.R
01_read_corpus.R		01_read_corpus.R
02_clean_corpus.R		02_clean_corpus.R
03_tokenize_corpus.R		03_tokenize_corpus.R
04_corpus_descriptives.Rmd		04_corpus_descriptives.Rmd
10_semantic_similarity_weights.R		10_semantic_similarity_weights.R
11_digitality_zs.ipynb		11_digitality_zs.ipynb
11_semantic_similarity_coding.R		11_semantic_similarity_coding.R
12_create_validation_sample.R		12_create_validation_sample.R
12_semantic_similiarity_digital_validation.R		12_semantic_similiarity_digital_validation.R
13_DP_identification_validation.Rmd		13_DP_identification_validation.Rmd
1x_digitality_zeroshot.ipynb		1x_digitality_zeroshot.ipynb
1x_prepare_zs_sample.R		1x_prepare_zs_sample.R
20_country_mentions.R		20_country_mentions.R
21_country_mentions_descriptives.Rmd		21_country_mentions_descriptives.Rmd
30_DescriptiveAnalyses.R		30_DescriptiveAnalyses.R
31_match_geopolitics_digital.R		31_match_geopolitics_digital.R
33_multivariate_analysis.Rmd		33_multivariate_analysis.Rmd
LICENSE		LICENSE
README.md		README.md
TRIAS-paper1.Rproj		TRIAS-paper1.Rproj
X-CorpusDescriptives.R		X-CorpusDescriptives.R
X_ConceptMoversDistances.R		X_ConceptMoversDistances.R
X_GPT.R		X_GPT.R
X_Phi3.R		X_Phi3.R
pipeline.R		pipeline.R

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Balancing acts:

Geopolitical pressures and justifications of the European Commission's digital policies

Code Repository for TRIAS project paper #1

by Christian Rauh & Milan Schröder

WZB Berlin Social Science Center

Scripts:

Text preparation

Extract data

Analyse data

Data:

About

Releases

Packages

Contributors 2

Languages

License

milanschroeder/TRIAS-paper1

Folders and files

Latest commit

History

Repository files navigation

Balancing acts:

Geopolitical pressures and justifications of the European Commission's digital policies

Code Repository for TRIAS project paper #1

by Christian Rauh & Milan Schröder

WZB Berlin Social Science Center

Scripts:

Text preparation

Extract data

Analyse data

Data:

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages