Useimmat Excel-käyttäjät tuntevat pivot-taulukon. Pivot-taulukossa voidaan nopeasti tiivistää tilastollisia perustietoja (esimerkiksi summien tai keskiarvojen avulla) ja näyttää nämä tiedot mielekkäämmässä muodossa.
Mutta ennen kuin voit aloittaa tietojen pivottamisen, sinun on ehkä järjestettävä tietosi uudelleen – toisin sanoen sinun on ”purettava” tietosi.
How to Unpivot in Excel
Miltä unpivot näyttää Excelissä? Tarkastellaan perusesimerkkiä: joukko opiskelijoita tekee kukin joka kuukausi kokeen algebran luokassaan. Haluat pystyä analysoimaan tarkemmin kunkin opiskelijan suorituksia. Tämä ei kuitenkaan onnistu, jos jokaiselle kuukaudelle on oma sarakkeensa, mikä on tavallisin tapa, jolla näitä tietoja seurataan. Kun muodostat pivot-taulukon näistä tiedoista, testipisteitä on yhdeksässä eri kentässä – yksi kullekin lukuvuoden kuukaudelle – eikä pivot-taulukko pysty laskemaan vuotuista kokonaissummaa. Jotta voimme purkaa pivot-tietojamme, meidän on saatava tiedot näyttämään laajemman sijasta pidemmiltä luomalla aggregoitu ”kuukausi”-sarake, kuten alla olevassa kuvassa näkyy. Kun kaikki kuukaudet ovat yhdessä sarakkeessa, luodaan toinen sarake kunkin oppilaan kullekin kuukaudelle vastaaville koetuloksille.
Miten pääsemme alkuun? Ensin meidän on muunnettava tietomme taulukoksi. Nopein tapa tehdä tämä on yksinkertaisesti painamalla + T.Kun meillä on taulukkomme, ”Data”-välilehdeltä löytyvässä ”Get and Transform Data” -ryhmässä napsautamme ”From Table/Range”. Tällöin Excel avaa Power Query Editorin. Kun olemme Power Query Editorissa, napsautamme hiiren kakkospainikkeella ”Name” -saraketta ja valitsemme ”Unpivot Other Columns”. Kun teet näin, huomaat nyt, että tiedot ovat haluamassamme muodossa – kuukausille ja koetuloksille on luotu omat sarakkeet. Nyt meidän tarvitsee vain nimetä nämä uudet sarakkeet uudelleen klikkaamalla hiiren oikealla painikkeella sarakkeiden yläosaa. Kun olemme nimenneet sarakkeet uudelleen, napsautamme yksinkertaisesti ”Close and Load” (Sulje ja lataa) näytön vasemmassa yläkulmassa. Näin luodaan toinen arkki, jota voimme käyttää Excel-pivottiemme perustana. Jos päätämme päivittää tietojamme ja lisätä esimerkiksi kesäkuukaudet, jos opiskelijat päättävät ottaa kesäkursseja, meidän tarvitsee vain päivittää tietomme alkuperäisellä välilehdellä ja napsauttaa hiiren oikealla painikkeella ja ”Päivitä” pivottimattomat tietomme uudella välilehdellä.
Seuraava vaihe: Pivot-taulukot
Nyt olemme saavuttaneet tavoitteemme: olemme purkaneet pivot-tiedot niin, että ne ovat hyväksyttävässä muodossa pivot-taulukon luomista varten. Emme aio käsitellä tässä artikkelissa pivot-taulukon luomisen erityisiä ”miten”, mutta tärkein askel, jonka voit ottaa ennen pivot-taulukon luomista, on ymmärtää, mitä kysymystä haluat kysyä tiedoistasi ja miksi. Pivot-taulukon luomisesta ei ole juurikaan hyötyä, jos se ei vastaa liiketoimintasi kannalta oleelliseen kysymykseen. Esimerkiksi opiskelijatietojemme perusteella saattaisimme haluta ymmärtää opiskelijoiden keskimääräisen koepistemäärän kuukausittain nähdäksemme, oliko opiskelijoilla vaikeuksia tietyissä oppiaineissa.
Unpivot- ja pivot-toiminnot eivät tietenkään rajoitu Exceliin. Pivot SQL on yleinen toiminto monilla toimialoilla, joilla on SQL-palvelimia. Pivot SQL:n prosessi näyttää paljon erilaiselta kuin Excelin pivot, koska se perustuu kyselykieleen, mutta lopputavoite on sama.
Poistuminen Excelin Unpivot- ja Pivot-funktioista
Trifactassa rakastetaan hyvää pivot-taulukkoa. Excelin unpivot- ja pivot-toiminnot ovat kaikin puolin Excelin tehokkaimpia toimintoja. Mutta gigatavun suuruisten tietomäärien käsitteleminen Excelillä voi olla hankalaa tai jopa mahdotonta. Siksi Trifacta on rakentanut tuotteen, joka tarjoaa tutut pivot-taulukkotoiminnot, mutta ylivoimaisella visuaalisella käyttöliittymällä ja älykkäillä vuorovaikutustoiminnoilla. Näin saat pivot-taulukon monipuolisen näkymän ilman epäintuitiivista prosessia. Se tarkoittaa myös sitä, että saat Excelin unpivot-taulukon aggregointitehon ilman hankalaa käytäntöä, joka liittyy useiden taulukoiden tekemiseen.
Kun tietojen linjataulukoista on tullut yhä tärkeämpiä, olemme nähneet siirtymisen pois Excelistä, koska sovelluksen avulla on käytännössä mahdotonta seurata kaikkia muunnoksia, jotka on tehty, milloin ja kenen toimesta. Trifactan avulla jokainen muutos on aina selkeästi lueteltu näytön oikeassa reunassa.
Alue, jolla Trifacta näkee Excelin kaikkialle levinneen käytön häviävän eniten, on rahoituspalvelut ja pankkitoiminta. Rahoituspalveluala on historiallisesti tukeutunut enimmäkseen Exceliin, joka on toiminut perustana toimialan kehityssuuntausten ja kriittisten laskelmien, kuten laina- ja leasingtappiovarauksen (ALLL), tiedottamisessa. Yksi merkittävimmistä neljännesvuosittaisista tilinpäätösarvioista, ALLL, osoittaa, kuinka paljon pankilla on varantoa luottotappioiden korvaamiseksi, ja sillä on valtava vaikutus tulokseen ja pääomaan. ALLL on myös laskelma, joka on johdettu lähes yksinomaan Excelin avulla. Mainstreet Technologiesin joulukuussa 2015 tekemässä tutkimuksessa yli 64 prosenttia vastanneista rahoituslaitoksista ilmoitti käyttävänsä edelleen Exceliä, ja 66 prosenttia ilmoitti etsivänsä muita teknisiä ratkaisuja ennen FASB:n CECL-julkaisua, joka julkaistaan vuonna 2020.
Excel institutionalisoitui, koska se on tehokas ja suhteellisen helppo. Rahoitusalalla ja muilla aloilla ollaan kuitenkin ymmärtämässä, että Excelillä on muitakin rajoituksia kuin vain tietokokonaisuuksien kokorajoitukset. On arvioitu, että lähes 90 prosentissa taulukkolaskentaohjelmista on virheitä, joita pahentaa valvonnan puute, kun taulukkolaskentaohjelmat siirtyvät työkavereiden välillä. Itse asiassa suhteellisen yksinkertainen Excelin leikkaa ja liitä -kaavavirhe aiheutti vuonna 2012 sen, että JP Morgan laski väärin erään rahaston VaR-riskiprofiilin, mikä aiheutti 2 miljardin dollarin tappion.
Kokorajoitusten lisäksi seuranta ja tietojen linjataulukko eivät ole missään tärkeämpiä kuin rahoituspalvelualalla, jossa tarkat tarkastukset ja sääntelyn mukainen raportointi ovat sääntö. Trifacta tekee tietojen seurannasta yksinkertaista ja mahdollistaa keskeisten tietojen reaaliaikaisen inventoinnin.
Kuinka Trifacta muokkasi Unpivot Excel -muuntoa
Vaikka Trifacta tarjoaa ennakoivan ja visuaalisesti miellyttävän tavan suorittaa pivot-muunnos, keskitymme tässä Unpivot Excel -käskyyn. Tätä toimintoa käytetään useimmiten, kun tietoja siirretään tietojen syöttövaiheesta analyysivaiheeseen (esim. tietojen normalisointi). Tietojen syöttö on helpointa, kun kullekin avaimelle (etunimi) annetaan yksi rivi ja tietopisteelle (työtunnit) yksi sarake. Tässä muodossa tietojen kirjaaminen on helppoa, mutta aggregointi ja yhteenlasku vaikeutuvat huomattavasti.
Trifacta uudistaa tietoja yhdistämällä yhden tai useamman sarakkeen avain- ja arvosarakkeiksi. Avaimet ovat syöttösarakkeiden nimiä, ja arvosarakkeet ovat lähteen solujen arvoja. Tietorivit monistetaan, kerran kutakin syöttösaraketta kohti. Unpivot-saraketta voidaan soveltaa useisiin sarakkeisiin samassa muunnoksessa. Kaikki sarakkeet puretaan samoihin avain- ja arvosarakkeisiin. Näin järjestettyjen tietojen avulla voidaan tehdä uusia aggregointeja ja löytää uusia oivalluksia. Trifactan ratkaisu unpivot Excel-toiminnon murheisiin on todella tarkoitettu kaikille, joiden on järjestettävä datansa tehokkaasti ja tarkasti.
Pivotin tai unpivotin Excel-komennon varsinaisen toiminnon lisäksi Trifactassa on sisäänrakennettu toiminto, jonka avulla voit viedä suoraan Tableauhun. Trifacta on rakennettu Tableau-käyttäjiä ajatellen: tiedämme, että pivot/unpivot on olennainen toiminto, ja olemme tehneet tuloksien näkemisestä helpompaa ja nopeampaa ilman Excelin sotkuisuutta.
Jos haluat oppia lisää tietojen käsittelystä, kokeile ilmaista pilvituotettamme Trifacta Wrangleria!