{"id":190,"date":"2022-09-04T13:49:57","date_gmt":"2022-09-04T10:49:57","guid":{"rendered":"https:\/\/blogit.xamk.fi\/datalab\/?p=190"},"modified":"2022-09-04T13:51:30","modified_gmt":"2022-09-04T10:51:30","slug":"datalab-harjoittelu","status":"publish","type":"post","link":"https:\/\/blogit.xamk.fi\/datalab\/2022\/09\/04\/datalab-harjoittelu\/","title":{"rendered":"Datalab harjoittelu"},"content":{"rendered":"\n<p>Harjoittelussani oli tarkoitus tehd\u00e4 teht\u00e4vi\u00e4 Exceliss\u00e4 ja tutustua syvemmin sen ominaisuuksiin. Tarkastelin erityisesti analysointity\u00f6kalua, mik\u00e4 on Excelin lis\u00e4osa. Se antaa mahdollisuuden analysoida isoakin m\u00e4\u00e4r\u00e4 dataa helposti. Analysointity\u00f6kalun tutkiminen on ollut eritt\u00e4in kiinnostava ja opettava kokemus.<\/p>\n\n\n\n<h1 class=\"has-large-font-size wp-block-heading\">Data<\/h1>\n\n\n\n<p>N\u00e4ihin t\u00f6ihin data on ker\u00e4tty Yahoo financista. Ker\u00e4sin dataa kullan, raaka\u00f6ljyn, platinan ja hopean hinnan muutoksista. Data oli vuoden 2012 alusta vuoden 2022 huhtikuun loppuun. Tarkemmin sanoen data koostui p\u00e4ivitt\u00e4isist\u00e4 p\u00e4\u00e4t\u00f6shinnoista. Yahoo financista ei ollut suoraa lataus mahdollisuutta n\u00e4ist\u00e4 tiedoista, joten tietojen ker\u00e4yksess\u00e4 piti k\u00e4ytt\u00e4\u00e4 luovuutta. Lopulta sain siirretty\u00e4 tiedot Exceliin komentoja Ctrl-C ja Ctrl-V k\u00e4ytt\u00e4en. Aluksi siirretty\u00e4 dataa piti muokata, sill\u00e4 luvut olivat muodossa 1,000.00, mit\u00e4 Excel ei ymm\u00e4rt\u00e4nyt. Muokkaus perusmuotoon 1000,00 tehtiin k\u00e4ytt\u00e4en Exceliss\u00e4 komennolla Ctrl-F avautuvaa Korvaa-ty\u00f6kalua. Korvaa-ty\u00f6kalulla muutin my\u00f6s p\u00e4iv\u00e4m\u00e4\u00e4r\u00e4t muodosta kk.pp.vv muotoon pp.kk.vv.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"931\" height=\"480\" src=\"https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image.png\" alt=\"\" class=\"wp-image-191\" srcset=\"https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image.png 931w, https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-300x155.png 300w, https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-768x396.png 768w\" sizes=\"auto, (max-width: 931px) 100vw, 931px\" \/><figcaption>Kuva 1 Viiva diagrammi raaka-aineiden hinta indeksist\u00e4<\/figcaption><\/figure>\n\n\n\n<p>Valitsin arvokkaita raaka aineita, koska niist\u00e4 voi n\u00e4hd\u00e4 mit\u00e4 maailman taloudessa tapahtuu. Kullan, hopean ja platinan hinnat Yahoo finanssissa annettiin dollareina unssilta. \u00d6ljyn hinta sen sijaan annettiin dollareina tynnyrilt\u00e4.<\/p>\n\n\n\n<p>Kullalta oli ensimm\u00e4inen raaka-aine, jonka p\u00e4\u00e4tin valita. Kulta on perinteisesti ollut sijoittajien turvasatama markkinoiden ep\u00e4vakaina aikoina (Talousanomat, 2019). Kulta on siis historiallisesti luotettava ja tasainen arvon osoittaja taloudessa. Yll\u00e4 olevasta k\u00e4yr\u00e4st\u00e4 voit n\u00e4hd\u00e4 kullan hinnan on muutokset prosentteina viimeisen 10 vuoden aikana. Kullan hinta on noussut 70 prosenttia eli noin 800 dollaria viimeisen 10 vuoden aikana.<\/p>\n\n\n\n<p>Hopea valittiin sen halvan hinnan ja sen k\u00e4yt\u00f6st\u00e4 taloudessa. Hopean hintaa heiluttaa paitsi koronatilanne my\u00f6s toiveet teollisuuden tuotannon elpymisest\u00e4 ja lis\u00e4kysynn\u00e4st\u00e4 ja toisaalta huoli tuotannon riitt\u00e4vyydest\u00e4 (Taloussanomat, 2020). Hopean hinta on korkeimmillaan noussut 170 prosenttia. Hopean alhaisen hinnan takia t\u00e4m\u00e4 muutos on ollut vain kymmenien dollarien verran.<\/p>\n\n\n\n<p>Platina taas on arvoltaan kullan ja hopean v\u00e4liss\u00e4. Ei liian kallis jalometalli mutta ei my\u00f6sk\u00e4\u00e4n liian halpa. Kuvan 1 mukaan platinan hinta on laskenut huomattavasti viimeisen 10 vuoden aikana. Platinan hinta on pudonnut 40 prosenttia eli noin 700 dollaria.<\/p>\n\n\n\n<p>Raaka\u00f6ljyn valitsi Ukrainan sodasta seuranneesta hinnan noususta. Jolloin korrelaatio olisi helpompi huomata hinnan muutoksista. \u00d6ljyn hinta on noussut 29 prosenttia eli noin 20 dollaria viimeisen 10 vuoden aikana. \u00d6ljyn hinta vuonna 2020 putosi 88 prosenttia. Seuraavan kahden vuoden aikana \u00f6ljyn hinta nousi huimat 117 prosenttia.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-1.png\" alt=\"\" class=\"wp-image-192\" width=\"450\" height=\"516\" srcset=\"https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-1.png 640w, https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-1-261x300.png 261w\" sizes=\"auto, (max-width: 450px) 100vw, 450px\" \/><figcaption>Kuva 2 N\u00e4kym\u00e4 datasta Exceliss\u00e4<\/figcaption><\/figure>\n\n\n\n<p>Datan k\u00e4sittelyyn k\u00e4ytettiin Excelin apuohjelmaa analysointity\u00f6kalut. Analysointity\u00f6kalut voi aktivoida asetuksista. Kyseisell\u00e4 ty\u00f6kalulla voit tehd\u00e4 monenlaisia data-analyysej\u00e4 suurellekin m\u00e4\u00e4r\u00e4lle dataa helposti. Sen helppok\u00e4ytt\u00f6isyys ja k\u00e4ytt\u00e4j\u00e4yst\u00e4v\u00e4llisyys k\u00e4y ilmi nopeasti.<\/p>\n\n\n\n<h1 class=\"has-large-font-size wp-block-heading\">Korrelaatio<\/h1>\n\n\n\n<p>Yksi analysointity\u00f6kaluista on nimelt\u00e4\u00e4n Korrelaatio. Kyseinen ty\u00f6kalu hy\u00f6dynt\u00e4\u00e4 Pearsonin korrelaatiokerrointa, joka mittaa lineaarisen yhteyden voimakkuutta kahden muuttujan v\u00e4lill\u00e4. Ty\u00f6kalulla pystyt helposti laskemaan (pareittaiset) korrelaatiokertoimet usean muuttujan tilanteessa (Kuvat 3 ja 4). Huomaa, ett\u00e4 jos k\u00e4yt\u00e4t ainoastaan KORRELAATIO-komentoa Exceliss\u00e4, saat vain yhden korrelaatiokertoimen. Korrelaatio-ty\u00f6kalun tutkiminen ja sen k\u00e4ytt\u00f6\u00f6n perehtyminen oli kiinnostava projekti ja oli hyvin opettavaista.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-2.png\" alt=\"\" class=\"wp-image-193\" width=\"533\" height=\"178\" srcset=\"https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-2.png 645w, https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-2-300x100.png 300w\" sizes=\"auto, (max-width: 533px) 100vw, 533px\" \/><figcaption>Kuva 3 Esimerkki korrelaatio matriisista<\/figcaption><\/figure>\n\n\n\n<p>Korrelaatio on voimakkaampi mit\u00e4 l\u00e4hemp\u00e4n\u00e4 korrelaatiokerroin on 1 tai -1. Se on sit\u00e4 heikompi mit\u00e4 l\u00e4hemp\u00e4n\u00e4 se on nollaa. Matriisista (Kuva 3) n\u00e4et, ett\u00e4 kullalla ja raaka\u00f6ljyll\u00e4 on heikko suora korrelaatio. Platinalla ja kullalla on sen sijaan heikko suora korrelaatio. Hopealla ja platinalla on voimakas suora korrelaatio. Platinalla ja raaka\u00f6ljyll\u00e4 sek\u00e4 Hopealla ja kullalla on taas vahva korrelaatio. Raaka\u00f6ljyll\u00e4 on vahva korrelaatio hopean kanssa.<\/p>\n\n\n\n<p>Korrelaatio matriisia tutkiessani huomasin, miten datasetin laajuus vaikutti suuresti matriisiin. Datan ker\u00e4ys suppeasti tai pienelt\u00e4 aikav\u00e4lilt\u00e4 voi vaikuttaa korrelaatiomatriisiin tuloksiin. Kuvan 4 data on ker\u00e4tty vuoden alusta alkaen toukokuun alkuun. Kuvien 3 ja 4 matriisit ovat selv\u00e4sti hyvin erilaiset.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-3.png\" alt=\"\" class=\"wp-image-194\" width=\"531\" height=\"184\" srcset=\"https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-3.png 791w, https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-3-300x104.png 300w, https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-3-768x266.png 768w\" sizes=\"auto, (max-width: 531px) 100vw, 531px\" \/><figcaption>Kuva 4 Esimerkki suppean datan k\u00e4yt\u00f6st\u00e4 korrelaatio matriisissa<\/figcaption><\/figure>\n\n\n\n<h1 class=\"has-large-font-size wp-block-heading\">Tunnusluvut<\/h1>\n\n\n\n<p>Toinen ty\u00f6kalu mihin tutustuin, oli Tunnusluvut-ty\u00f6kalu. Se on hyvin k\u00e4yt\u00e4nn\u00f6llinen ty\u00f6kalu, jonka avulla voit saada datasta laskea datasta perustunnusluvut, kuten keskiarvon, moodin ja mediaanin. Huomaa, ett\u00e4 moodi voi n\u00e4ky\u00e4 my\u00f6s muodossa #puuttuu! (kuva 5), jos datasetiss\u00e4 ei ole yht\u00e4k\u00e4\u00e4n samanlaista arvoa. Kuvassa 5 voit n\u00e4hd\u00e4, mit\u00e4 kaikkea Tunnusluvut-ty\u00f6kalulla saadaan selville. T\u00e4m\u00e4 ty\u00f6kalu vaikuttaa tehokkaalta ty\u00f6v\u00e4lineelt\u00e4, joten aion tulla k\u00e4ytt\u00e4m\u00e4\u00e4n sit\u00e4 tulevaisuudessa. Mielest\u00e4ni sill\u00e4 on paljon potentiaalisia hy\u00f6tyj\u00e4.<\/p>\n\n\n\n<p>Kullan t\u00e4m\u00e4nhetkinen hinta on keskiarvon yl\u00e4puolella yll\u00e4tt\u00e4v\u00e4n paljon. Kullan hinta on nyt 1909,30 (dollaria unssilta) verrattuna koko datan keskiarvoon 1522,71. Kullan hinta on vaihdellut paljon vuosien varrella, t\u00e4m\u00e4n voi n\u00e4hd\u00e4 kohdasta Alue, joka tarkoittaa tunnuslukua vaihteluv\u00e4li (joka kertoo suurimman pienimm\u00e4n arvon erotuksen). Mielest\u00e4ni kiinnostavin havainto koskien tunnuslukuja oli raaka\u00f6ljyn halvin hinta, mik\u00e4 oli vain -37,63 dollaria tynnyrilt\u00e4. T\u00e4m\u00e4 oli mielest\u00e4ni hyvin kiinnostava havainto.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-4.png\" alt=\"\" class=\"wp-image-195\" width=\"512\" height=\"429\" srcset=\"https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-4.png 703w, https:\/\/blogit.xamk.fi\/datalab\/wp-content\/uploads\/sites\/56\/2022\/09\/image-4-300x251.png 300w\" sizes=\"auto, (max-width: 512px) 100vw, 512px\" \/><figcaption>Kuva 5 esimerkki tunnusluvut ty\u00f6kalusta<\/figcaption><\/figure>\n\n\n\n<h1 class=\"has-large-font-size wp-block-heading\">Pohdinta<\/h1>\n\n\n\n<p>Mielest\u00e4ni aikani analysointity\u00f6kalu apuohjelman parissa on ollut todella palkitsevaa ja kiinnostava. Opin jopa t\u00e4m\u00e4n blogikirjoituksen aikana uusia asioita Excelist\u00e4. Odotan innolla, mit\u00e4 teht\u00e4vi\u00e4 tulee viel\u00e4 harjoitteluni aikana. Haluaisin tutkia my\u00f6s muita apuohjelmia ja saada niist\u00e4 tietoja.<\/p>\n\n\n\n<h1 class=\"has-large-font-size wp-block-heading\">L\u00e4hteet<\/h1>\n\n\n\n<p>STT\u2013AFP. 2019. Kullan hinta singahti ylimmilleen kuuteen vuoteen<a>. <\/a>Talousanomat 21.6.2019. Verkkolehti. Saatavissa: <a href=\"https:\/\/www.is.fi\/taloussanomat\/art-2000006150257.html\">https:\/\/www.is.fi\/taloussanomat\/art-2000006150257.html<\/a><\/p>\n\n\n\n<p>Startel\u2013Bloomberg. 2020. Kullan hinta harppasi enn\u00e4tyslukemiin, hopea kalleinta seitsem\u00e4\u00e4n vuoteen. Talousanomat 22.7.2020. Verkkolehti. Saatavissa: <a href=\"https:\/\/www.is.fi\/taloussanomat\/art-2000006578695.html\">https:\/\/www.is.fi\/taloussanomat\/art-2000006578695.html<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Harjoittelussani oli tarkoitus tehd\u00e4 teht\u00e4vi\u00e4 Exceliss\u00e4 ja tutustua syvemmin sen ominaisuuksiin. Tarkastelin erityisesti analysointity\u00f6kalua, mik\u00e4 on Excelin lis\u00e4osa. Se antaa mahdollisuuden analysoida isoakin m\u00e4\u00e4r\u00e4 dataa helposti. Analysointity\u00f6kalun tutkiminen on ollut eritt\u00e4in kiinnostava ja opettava kokemus. Data N\u00e4ihin t\u00f6ihin data on ker\u00e4tty Yahoo financista. Ker\u00e4sin dataa kullan, raaka\u00f6ljyn, platinan ja hopean hinnan muutoksista. Data oli vuoden [&hellip;]<\/p>\n","protected":false},"author":313,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"inline_featured_image":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-190","post","type-post","status-publish","format-standard","hentry","category-yleinen"],"jetpack_featured_media_url":"","_links":{"self":[{"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/posts\/190","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/users\/313"}],"replies":[{"embeddable":true,"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/comments?post=190"}],"version-history":[{"count":6,"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/posts\/190\/revisions"}],"predecessor-version":[{"id":201,"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/posts\/190\/revisions\/201"}],"wp:attachment":[{"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/media?parent=190"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/categories?post=190"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogit.xamk.fi\/datalab\/wp-json\/wp\/v2\/tags?post=190"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}