{"id":181,"date":"2021-12-21T10:58:50","date_gmt":"2021-12-21T08:58:50","guid":{"rendered":"https:\/\/blogit.xamk.fi\/datalab\/?p=181"},"modified":"2021-12-21T10:58:50","modified_gmt":"2021-12-21T08:58:50","slug":"harjoittelu-datalab","status":"publish","type":"post","link":"https:\/\/blogit.xamk.fi\/datalab\/2021\/12\/21\/harjoittelu-datalab\/","title":{"rendered":"Harjoittelu:  DataLAB"},"content":{"rendered":"\n<p>Kokonaisuudessaan harjoitteluni koostui useasta osasta. Minulla oli hieman aikaisempaa ty\u00f6kokemusta, jota kykenin hy\u00f6dynt\u00e4m\u00e4\u00e4n osana perusharjoittelua. Lopun perusharjoittelun ja syvent\u00e4v\u00e4n harjoittelun suorituspaikkana toimi DataLAB, jossa ty\u00f6skentelin muutaman isomman projektin ja teht\u00e4v\u00e4n parissa. Harjoittelun suoritin toukokuun 2021 ja joulukuun 2021 v\u00e4lill\u00e4.<\/p>\n\n\n\n<p class=\"has-large-font-size\"><strong>H\u00e4vikki-projekti<\/strong><\/p>\n\n\n\n<p>H\u00e4vikki-projektiin haettiin data-analytiikan opiskelijaa kev\u00e4\u00e4ll\u00e4 2021. Projekti oli kuvauksen perusteella kiinnostava ja mik\u00e4 t\u00e4rkeint\u00e4, siin\u00e4 p\u00e4\u00e4si vaikuttamaan oikeisiin ja olemassa oleviin ongelmiin. Projektin tarkoitus oli selvitt\u00e4\u00e4 v\u00e4hitt\u00e4istavarakaupoista ker\u00e4tt\u00e4v\u00e4n datan avulla, voiko ruoan h\u00e4vikki\u00e4 ennustaa.<\/p>\n\n\n\n<p>Pitk\u00e4lti projektin ty\u00f6kaluna toimi R-studio. Projektin ensimm\u00e4isess\u00e4 vaiheessa h\u00e4vikki\u00e4 ennustettiin regressiomallien avulla. Projektin toisessa vaiheessa saatiin lis\u00e4\u00e4 dataa k\u00e4ytt\u00f6\u00f6n ja l\u00e4hestymistapaa vaihdettiin. H\u00e4vikin esiintyvyytt\u00e4 alettiin tarkastelemaan keskiarvon ja keskihajonnan avulla, joita laskettiin sit\u00e4 mukaa kun p\u00e4ivi\u00e4 kertyi. T\u00e4ll\u00e4 tavoin ennusteen tarkkuus parani, mit\u00e4 enemm\u00e4n dataa saatiin ker\u00e4tty\u00e4.<\/p>\n\n\n\n<p>H\u00e4vikki-projekti sai my\u00f6s jatkoa syksyll\u00e4 2021 data-analytiikan opintoihin sis\u00e4ltyv\u00e4n projektin yhteydess\u00e4. Projektin tarkoituksena oli l\u00f6yt\u00e4\u00e4 sopiva m\u00e4\u00e4ritelm\u00e4 ongelmallisille tuotteille, joilla on suurempi riski aiheuttaa h\u00e4vikki\u00e4.<\/p>\n\n\n\n<p class=\"has-large-font-size\"><strong>Kes\u00e4teht\u00e4v\u00e4t<\/strong><\/p>\n\n\n\n<p>Kes\u00e4n ajaksi sain kolme isompaa teht\u00e4v\u00e4\u00e4 suoritettavaksi. Ensimm\u00e4isen\u00e4 teht\u00e4v\u00e4n\u00e4 oli luoda frekvenssej\u00e4 kuvaava puudiagrammi hy\u00f6dynt\u00e4en R-Studiota. Esimerkiksi kyselytutkimuksen analysoinnissa voi olla hy\u00f6dyllist\u00e4 k\u00e4ytt\u00e4\u00e4 puudiagrammia, sill\u00e4 se kuvaa selke\u00e4sti muuttujien jakautumista sek\u00e4 n\u00e4ytt\u00e4\u00e4 lis\u00e4ksi niiden arvot ja frekvenssit. Kirjoitin aiheesta my\u00f6s erillisen blogin: <a href=\"https:\/\/blogit.xamk.fi\/datalab\/2021\/12\/20\/frekvensseja-kuvaava-puudiagrammi\/\" target=\"_blank\" rel=\"noreferrer noopener\">Frekvenssej\u00e4 kuvaava puudiagrammi<\/a>.<\/p>\n\n\n\n<p>Toinen kes\u00e4teht\u00e4v\u00e4ni oli muokata BRFSS-data kyselytutkimusainestoa vuodelta 2019, jossa on tutkittu Yhdysvaltain kansalaisten terveytt\u00e4 ja elintapoja. Tarkoituksena oli saada aikaan selke\u00e4mpi ja suomennettu kokonaisuus, joka sis\u00e4lt\u00e4\u00e4 jatkuvia ja ep\u00e4jatkuvia muuttujia hy\u00f6dynt\u00e4en R-Studiota. Tarkemmin muokkauksesta kerron blogissa: <a href=\"https:\/\/blogit.xamk.fi\/datalab\/2021\/12\/20\/brfss-datan-muokkaus\/\" target=\"_blank\" rel=\"noreferrer noopener\">BRFSS-datan muokkaus<\/a>.<\/p>\n\n\n\n<p>Kolmas kes\u00e4teht\u00e4v\u00e4ni oli R-Studion avulla tarkastella logistista regressiota. Teht\u00e4v\u00e4n\u00e4 oli esitell\u00e4 logistisen regression teoriaa, mallin tekeminen, ennustaminen ja selvitt\u00e4\u00e4 mallin toimivuus. Teht\u00e4v\u00e4ss\u00e4 hy\u00f6dynsin aiemmin muokkaamaani BRFSS-dataa.<\/p>\n\n\n\n<p class=\"has-large-font-size\"><strong>Muuta<\/strong><\/p>\n\n\n\n<p>DataLAB pit\u00e4\u00e4 sis\u00e4ll\u00e4\u00e4n my\u00f6s muita ty\u00f6teht\u00e4vi\u00e4. Niihin kuuluu kuukausittaiset palaverit, joissa k\u00e4yd\u00e4\u00e4n l\u00e4pi sen hetken ty\u00f6tilanteita ja jatkotoimenpiteit\u00e4. Kouvolan kampukselle avatun FUEL-tila my\u00f6t\u00e4 my\u00f6s DataLAB sai fyysiset toimitilat syksyll\u00e4 2021. Olin itse mukana tekem\u00e4ss\u00e4 muuttoa ja j\u00e4rjestelyit\u00e4 uusissa tiloissa. DataLAB piti FUEL-tilan avajaisissa my\u00f6s omaa pistett\u00e4, jossa esiteltiin aikaan saatuja t\u00f6it\u00e4. Omalta osaltani esittelin kev\u00e4\u00e4ll\u00e4 2021 tehty\u00e4 H\u00e4vikki-projektia.<\/p>\n\n\n\n<p class=\"has-large-font-size\"><strong>Lopuksi<\/strong><\/p>\n\n\n\n<p>Harjoittelusta opin paljon. Teht\u00e4v\u00e4t olivat v\u00e4lill\u00e4 haastavia, mutta koen sen olleen my\u00f6s suuri etu. Hienoa oli my\u00f6s p\u00e4\u00e4st\u00e4 vaikuttamaan oikeisiin ongelmiin sek\u00e4 n\u00e4hd\u00e4 oma ty\u00f6ns\u00e4 j\u00e4lki, ja ett\u00e4 siit\u00e4 oli my\u00f6s hy\u00f6ty\u00e4. DataLAB tarjoaa monipuolisia ty\u00f6teht\u00e4vi\u00e4 opiskelijoille, joten siell\u00e4 harjoittelun suorittamista kannattaa ehdottomasti pit\u00e4\u00e4 mahdollisuutena.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Kokonaisuudessaan harjoitteluni koostui useasta osasta. Minulla oli hieman aikaisempaa ty\u00f6kokemusta, jota kykenin hy\u00f6dynt\u00e4m\u00e4\u00e4n osana perusharjoittelua. Lopun perusharjoittelun ja syvent\u00e4v\u00e4n harjoittelun suorituspaikkana toimi DataLAB, jossa ty\u00f6skentelin muutaman isomman projektin ja teht\u00e4v\u00e4n parissa. Harjoittelun suoritin toukokuun 2021 ja joulukuun 2021 v\u00e4lill\u00e4. H\u00e4vikki-projekti H\u00e4vikki-projektiin haettiin data-analytiikan opiskelijaa kev\u00e4\u00e4ll\u00e4 2021. Projekti oli kuvauksen perusteella kiinnostava ja mik\u00e4 t\u00e4rkeint\u00e4, siin\u00e4 [&hellip;]<\/p>\n","protected":false},"author":301,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"inline_featured_image":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-181","post","type-post","status-publish","format-standard","hentry","category-yleinen"],"jetpack_featured_media_url":"","_links":{"self":[{"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/posts\/181","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/users\/301"}],"replies":[{"embeddable":true,"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/comments?post=181"}],"version-history":[{"count":1,"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/posts\/181\/revisions"}],"predecessor-version":[{"id":182,"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/posts\/181\/revisions\/182"}],"wp:attachment":[{"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/media?parent=181"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/categories?post=181"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/tags?post=181"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}