#Packages used
library(haven)
library(tidyverse)
library(ggpubr)
library(scales)
#Prep Data
selects <- read_dta("495_Selects_CumulativeFile_Data_1971-2019_v2.2.0.dta")

selects.short <- selects %>%  select(year, age,sex, lr1,vdn1b,ip13, ip14) %>%
  filter(year >= 2018) %>% 
  filter(lr1 >= 0) %>% 
  filter(ip13 >= 1) %>% 
  filter(ip14 >=0) %>% 
  filter(age > 0)
#2018 gender gap visualization
group.df <- selects.short %>% group_by(age,sex) %>% summarise(mean_lr = mean(lr1))

ggplot(data=group.df, aes(x=(age), y=(mean_lr),colour= as.factor(sex)))+
  geom_point(alpha = 0.5)+
  geom_smooth()+
  scale_color_manual(values=c("blue","#eb7e83"), labels= c("Männer","Frauen"))+
  theme(legend.title = element_blank())+
  labs(title = "2018 wählten junge Frauen linker als gleichaltrige Männer.",
       subtitle = "Selbstpositionierung von Frauen und Männern nach Alter, 0 = links, 10 = rechts", y= "links-rechts",x= "Age")

#1971 gender gap visualization

selects.old.gg <- selects %>%  select(year, age,sex, lr1,vdn1b,ip13) %>%
  filter(year == 1971) %>% 
  mutate(geschlecht = case_when(sex <=0 ~ "Mann",
                                sex == 1 & age %in% seq(18,50) ~ "F18-50",
                                TRUE ~ "F51+")) %>% 
  filter(lr1 >= 0) %>% 
  filter(age >0)

group.df <- selects.old.gg %>% group_by(age,sex) %>% summarise(mean_lr = mean(lr1))


ggplot(data=group.df, aes(x=(age), y=(mean_lr),colour= as.factor(sex)))+
  geom_point(alpha = 0.5)+
  geom_smooth()+
  scale_color_manual(values=c("blue","#eb7e83"), labels= c("Männer","Frauen"))+
  theme(legend.title = element_blank())+
  labs(title = "1971 wählten die Frauen nicht linker als die Männer. Ältere Frauen wählten sogar konservativer.",
       subtitle = "Selbstpositionierung von Frauen und Männern nach Alter, 0 = links, 10 = rechts", y= "links-rechts",x= "Alter")