#' --- #' title: Datan ryhmittely ja datan visualisoinnit #' date: '`r Sys.time()`' #' output: #' html_document: #' theme: united #' toc: true #' toc_float: true #' number_sections: yes #' code_folding: show #' --- #' #' # group_by #' #' *1.1. `dplyr`-paketti sisältää datan `starwars`. Kukin rivi on yksi elokuvan hahmo. Miten saat eri sukupuolten mediaanipituuden käyttämällä funktioita `group_by`, `summarise` ja `median`? * #+ group_by_summarise, eval = FALSE default_answer() #' *1.2. `dplyr`-paketti sisältää datan `starwars`. Kukin rivi on yksi elokuvan hahmo. Miten luot dataan uudeksi muuttujaksi otuksien kotimaailmakohtaisen keskiarvopainon funktioilla `group_by`, `mutate` ja `mean`? * #+ group_by_mutate, eval = FALSE default_answer() #' *1.3. `dplyr`-paketti sisältää datan `starwars`. Kukin rivi on yksi elokuvan hahmo. Miten saat eri sukupuolten mediaanipituuden silmien värin mukaan käyttämällä funktioita `group_by`, `summarise` ja `median`? * #+ filter_multiple_summarise, eval = FALSE default_answer() #' *1.4. Lue ESS-data R:ään. Ryhmittele se maan mukaan ja laske kullekin maalle yleisen luottamuksen keskiarvo (koodi ´ppltrst`) ja järjestä maat ko. arvon mukaan laskevaan järjestykseen * #+ group_by_ess_ppltrst, eval = FALSE default_answer() #' *1.5. Tuo R:ään QOG-projektin Basic-datan aikasarja komennolla `dat <- rqog::read_qog(which_data = "basic", data_type = "time-series", year = 2019)`. Valitse datasta Transparency index (koodi `diat_ti`) ja laske tästä kunkin Suomen ja Suomen naapurimaiden keskiarvot vuosilta 2000-2010. (funktio `mean(x, nr.rm = TRUE)` * #+ group_by_ess_qog_basic_diat_ti, eval = FALSE default_answer() #' *1.6. Tuo R:ään QOG-projektin Basic-datan aikasarja komennolla `dat <- rqog::read_qog(which_data = "basic", data_type = "time-series", year = 2019)`. Valitse datasta Transparency index (koodi `diat_ti`) ja laske Pohjoismaiden yhteinen keskiarvo kullekin vuodelle 2000-2010. (funktio `mean(x, nr.rm = TRUE)` * #+ group_by_ess_qog_basic_diat_ti_2, eval = FALSE default_answer() #' *1.7. Tuo R:ään QOG-projektin Basic-datan aikasarja komennolla `dat <- rqog::read_qog(which_data = "basic", data_type = "time-series", year = 2019)`. Minkä maan Transparency index (koodi `diat_ti`) -indikaattorin keskiarvo on ollut korkein vuosina 2000-2010 * #+ group_by_ess_qog_basic_diat_ti_3, eval = FALSE default_answer() #' # visualise #' #' *2.1. Tuo R:ään QOG-projektin OECD-datan aikasarja komennolla `dat <- rqog::read_qog(which_data = "oecd", data_type = "time-series", year = 2019)`. Piirrä funktiolla `geom_line()` viivakuvio, jossa x-akselilla on vuosi ja y-akselilla YK:n ihnimillisen kehityksen indeksi ja viivan väri on maan nimen mukaan. * #+ ggplot2_geom_line, eval = FALSE default_answer() #' *2.2. `dplyr`-paketti sisältää datan `starwars`. Tee hajontakuvio (scatterplot), jossa hahmon pituus on x-akselilla, paino y-akselilla ja pisteen väri on hahmon sukupuoli. Anna otsikoksi 'Starwars-hahmot' ja aseta teemaksi `classic` base-fonttikoolla 8 * #+ ggplot2_theme_default, eval = FALSE default_answer() #' *2.3. `dplyr`-paketti sisältää datan `starwars`. Tee hajontakuvio (scatterplot), jossa hahmon pituus on x-akselilla, paino y-akselilla ja pisteen väri on hahmon sukupuoli. Anna otsikoksi 'Starwars-hahmot' ja aseta teemaksi `classic` base-fonttikoolla 8. Lisäksi aseta pallon värille uusi paletti Dark1 funktiolla `scale_color_brewer()` * #+ ggplot2_color, eval = FALSE default_answer() #' *2.4. `dplyr`-paketti sisältää datan `starwars`. Tee hajontakuvio (scatterplot), jossa hahmon pituus on x-akselilla, paino y-akselilla ja pisteen label on hahmon nimi. Anna otsikoksi 'Starwars-hahmot'. Anna kuvan teemaksi `minimal`. Tee luennolla esitetyt vaiheet, jotta saat fontit extrafont-paketin käytettäväksi, ja määritä koko kuvan basefontiksi sekä pisteen labeleiden fontiksi joku koneeltasi löytyvät erikoinen fontti. Laske lisäksi labelit pisteiden alapuolelle * #+ ggplot2_font, eval = FALSE default_answer() #' *2.5. `dplyr`-paketti sisältää datan `starwars`. Tee hajontakuvio (scatterplot), jossa hahmon pituus on x-akselilla, paino y-akselilla. Aseta x-akselin tekstit 45-asteen kulmaan. (vinkki: theme(element.* = element_text(kulma = 45) ) ) * #+ ggplot2_theme_modify1, eval = FALSE default_answer() #' *2.6. `dplyr`-paketti sisältää datan `starwars`. Tee hajontakuvio (scatterplot), jossa hahmon pituus on x-akselilla, paino y-akselilla ja pisteen väri on hahmon sukupuoli. Piilota värin selite eli 'legend'. * #+ ggplot2_theme_modify2, eval = FALSE default_answer() #' *2.7. `dplyr`-paketti sisältää datan `starwars`. Tee hajontakuvio (scatterplot), jossa hahmon pituus on x-akselilla, paino y-akselilla ja pisteen label on hahmon nimi. käytä funktiota `ggrepel::geom_label_repel()`-pisteiden nimeämiseen * #+ ggplot2_ggrepel1, eval = FALSE default_answer() #' *2.8. `dplyr`-paketti sisältää datan `starwars`. Tee hajontakuvio (scatterplot), jossa hahmon pituus on x-akselilla, paino y-akselilla. Tallenna kuva levylle .png-muodossa nimellä plotti.png, jonka leveys on 8, korkeus 6 sekä dpi 300 * #+ ggplot2_export_png, eval = FALSE default_answer() #' *2.9. `dplyr`-paketti sisältää datan `starwars`. Tee hajontakuvio (scatterplot), jossa hahmon pituus on x-akselilla, paino y-akselilla. Tallenna kuva levylle .pdf muodossa vaakasuorassa A4-koossa! * #+ ggplot2_export_pdf_a4, eval = FALSE default_answer() #' *2.10. Tuo R:ään QOG-projektin basic-datan aikasarja komennolla `dat <- rqog::read_qog(which_data = "basic", year = 2019, data_type = "time-series")`. Valitse datasta Yhdysvallat, Kiina ja Venäjä. Piirrä funktiolla `geom_col()` tolppakuvio, jossa x-akselilla on vuosi ja y-akselilla YK:n ihnimillisen kehityksen indeksi ja eri maat paneleissa "facetoituina" (funktio `facet_wrap()`). Anna kuviolle otsikko "Inhimillisen kehityksen indeksi" * #+ ggplot2_geom_col_facet, eval = FALSE default_answer() #' *2.11. Tuo R:ään QOG-projektin basic-datan aikasarja komennolla `dat <- rqog::read_qog(which_data = "basic", year = 2019, data_type = "time-series")`. Miten saat tehtyä tällaisen kuvan http://courses.markuskainu.fi/utur2019/kuvat/hdi.png * #+ ggplot2_geom_line_qog, eval = FALSE default_answer() #' *2.12. Tuo R:ään QOG-projektin basic-datan aikasarja komennolla `dat <- rqog::read_qog(which_data = "basic", year = 2019, data_type = "time-series")`. Miten saat tehtyä tällaisen kuvan http://courses.markuskainu.fi/utur2019/kuvat/ggplot2_geom_line_bkt.png * #+ ggplot2_geom_line_bkt, eval = FALSE default_answer() #' *2.13. Tuo R:ään QOG-projektin basic-datan aikasarja komennolla `dat <- rqog::read_qog(which_data = "basic", year = 2019, data_type = "time-series")`. Miten saat tehtyä tällaisen kuvan http://courses.markuskainu.fi/utur2019/kuvat/ggplot2_geom_histogram_qog.png * #+ ggplot2_geom_histogram_qog, eval = FALSE default_answer() #' *2.14. Lue ess-data R:ään. Piirrä siitä tolppakuvio tapausten määrästä per maa joka näyttä tältä: http://courses.markuskainu.fi/utur2019/kuvat/ggplot2_geom_bar_ess.png * #+ ggplot2_geom_bar_ess, eval = FALSE default_answer() #' *2.15. Lue ess-data R:ään. Piirrä siitä tolppakuvio otoksen iän maittaisista keskiarvoista joka näyttä tältä: http://courses.markuskainu.fi/utur2019/kuvat/ggplot2_geom_col_geom_text_ess.png * #+ ggplot2_geom_col_geom_text_ess, eval = FALSE default_answer() #' *2.16. Lue ess-data R:ään. Piirrä siitä tolppakuvio tapausten määrästä joka näyttä tältä: http://courses.markuskainu.fi/utur2019/kuvat/ggplot2_geom_scatter_geom_text_ess.png * #+ ggplot2_geom_scatter_geom_text_ess, eval = FALSE default_answer() #' *2.17. Tuo R:ään QOG-projektin OECD-datan aikasarja komennolla `dat <- rqog::read_qog(which_data = "oecd", data_type = "time-series", year = 2019)`. Piirrä joka näyttää tältä http://courses.markuskainu.fi/utur2019/kuvat/ggplot2_facet1.png * #+ ggplot2_facet1, eval = FALSE default_answer() #' *2.18. Tuo R:ään QOG-projektin basic-datan poikkileikkausaineisto komennolla `dat <- rqog::read_qog(which_data = "basic", data_type = "cross-sectional", year = 2019)`. Piirrä kuvio joka näyttää tältä http://courses.markuskainu.fi/utur2019/kuvat/ggplot2_facet2.png * #+ ggplot2_facet2, eval = FALSE default_answer()