Linkki kotitehtävän lähdekoodiin gitlab:ssa

library(knitr)
opts_chunk$set(list(echo=TRUE,eval=FALSE,cache=FALSE,warning=TRUE,message=TRUE))

1 Viides kotitehtävä eli harjoitustyö

  1. kotitehtävän tarkoituksena on soveltaa itsenäisesti kurssilla opittuja data-analyysin vaiheita ja laatia itseä kiinnostavasta aiheesta suppea data-analyysi, jossa

  2. haetaan dataa verkosta joko tiedostosta tai rajapinnasta
  3. dataja puhdistetaan ja yhdistellään toisiin
  4. datoja muokataan ja tehdään niihin uusia muuttujia ja lasketaan yhteenvetoja
  5. analyysin tuloksia selvitetään tualukoilla, kuvioilla ja mahdollisesti myös tilastollisilla malleilla
  6. koko prosessi kirjoitetaan yhtenä toistettavana .Rmd-dokumenttina (Laadi raportti tähän tiedostoon!)

2 Mahdollisia aiheita

2.1 Verotiedot

Viime päivinä paljon mielenkiintoa on saanut verotiedot. Jarno Tuimala kirjoitti kaksi blogipostausta aiheesta r-ohjelmointi.org -blogiin:

Etenkin kakkososan koodin alussa olevalla Tilastokeskuksen rajapinnasta dataa hakevalla koodilla saat jo sellaisen aineiston, jonka pohjalta voit myös tehdä gradun ja väitellä.

Saat datan helpoiten komennolla load(url("http://courses.markuskainu.fi/utur2016/database/verotiedot2015.RData"))

## Usan presidentinvaalit

Presidentinvaalit ovat tiistaina ja R-yhteisö vääntää kuumeisesti erilaisia ennusteita mielipidetiedusteluihin perustuen. Tiistain jälkeen saatavilla

## Avointa dataa Turusta


2016 Markus Kainu.

Creative Commons -lisenssi
Tämä teos on lisensoitu Creative Commons Nimeä 4.0 Kansainvälinen -lisenssillä.

Tämä sivusto on tehty R:ssä Rmarkdown-paketin uusimmassa kehitysversion uudella render_site()`-funktiolla, jonka tekee staattisten responsiivisten verkkosivujen tekemisen helpoksi. Katso ohjeet: