A legtöbb Excel-felhasználó ismeri a pivot-táblázatot. Egy pivot-táblával gyorsan össze lehet foglalni alapvető statisztikai adatokat (például összegekkel vagy átlagokkal), és ezeket az adatokat értelmesebb formában lehet megjeleníteni.
De mielőtt elkezdené az adatok pivotizálását, előfordulhat, hogy át kell rendeznie az adatokat – más szóval “fel kell oldania” az adatokat.
Hogyan kell unpivotálni az Excelben
Milyennek tűnik az unpivotálás az Excelben? Vegyünk egy egyszerű példát: egy diákcsoport minden hónapban tesztet ír az algebraórán. Szeretné, ha közelebbről elemezni tudná az egyes tanulók teljesítményét. Ezt azonban nem teheti meg úgy, hogy minden hónapra külön oszlopot tart, mivel ezt az adatot leggyakrabban így követik nyomon. Ha ezekből az adatokból pivot-táblázatot készít, kilenc különböző mezőben lesznek tesztpontszámok – a tanév minden hónapjára egy -, és a pivot-táblázat nem lesz képes éves végösszeg kiszámítására. Ahhoz, hogy feloldjuk az adatainkat, szélesebb helyett hosszabbnak kell tennünk az adatokat egy összesített “hónap” oszlop létrehozásával, ahogy az alábbi képen látható. Az összes hónapot egy oszlopban tartva egy másik oszlopot hozunk létre az egyes diákok megfelelő teszteredményei számára minden hónapban.
Hogyan kezdjünk hozzá? Először is át kell alakítanunk az adatainkat táblázattá. Ennek leggyorsabb módja, ha egyszerűen megnyomjuk a + T billentyűt.Miután megvan a táblázatunk, az “Adatok” lapon található “Adatok lekérdezése és átalakítása” csoportban a “Táblázatból/tartományból” gombra kattintunk. Ez arra fogja késztetni az Excelt, hogy nyissa meg a Power Query Editor-t. Ha már a Power Query Editorban vagyunk, akkor a jobb gombbal kattintsunk a “Name” oszlopra, és válasszuk a “Unpivot Other Columns” lehetőséget. Azt fogja észrevenni, hogy az adatok most már a kívánt formátumban vannak – külön oszlopot hoztunk létre a hónapoknak és a teszteredményeknek. Most már csak annyit kell tennünk, hogy átnevezzük ezeket az új oszlopokat, ha jobb egérgombbal kattintunk az oszlopok tetejére. Mihelyt befejeztük az oszlopok átnevezését, egyszerűen kattintsunk a képernyő bal felső sarkában a “Bezárás és betöltés” gombra. Ezáltal létrehozunk egy másik lapot, amelyet az Excel osztópontjaink alapjául használhatunk. Ha úgy döntünk, hogy frissítjük az adatainkat, és hozzáadjuk például a nyári hónapokat, ha a diákok úgy döntenek, hogy nyári kurzusokat vesznek fel, akkor csak frissítenünk kell az adatainkat az eredeti lapon, majd jobb klikk és “Frissítés” a nem pivotált adatainkat az új lapon.
A következő lépés: Pivotok
Most elértük a célunkat: a pivotok feloldása, hogy az adatok elfogadható formátumban legyenek egy pivot-táblázat létrehozásához. Ebben a cikkben nem fogunk belemenni egy pivot-tábla létrehozásának konkrét “hogyanjába”, de a legfontosabb lépés, amit egy pivot-tábla létrehozása előtt megtehet, hogy megértse, milyen kérdést szeretne feltenni az adatainak, és miért. A pivot-táblázat létrehozása nem sokat ér, ha az nem ad választ a vállalkozása szempontjából releváns kérdésre. Például a tanulói adataink alapján talán szeretnénk megérteni a tanulók átlagos teszteredményét havonta, hogy megtudjuk, a tanulóknak nehézségeik voltak-e bizonyos tantárgyakkal.
Az unpivot és pivot funkciók természetesen nem korlátozódnak az Excelre. A Pivot SQL számos SQL-kiszolgálóval rendelkező iparágban elterjedt funkció. A pivot SQL folyamata sokkal másképp néz ki, mint egy Excel pivot, mivel egy lekérdezési nyelvre támaszkodik, de a végcél ugyanaz.
Az Excel Unpivot és Pivot funkciókról való eltávolodás
A Trifactánál szeretjük a jó pivot táblázatokat. Az Excel unpivot és pivot minden tekintetben az Excel legerősebb funkciói. De gigabájtnyi adat kezelése az Excelben nehézkes vagy akár megfizethetetlen is lehet. Ezért a Trifacta olyan terméket hozott létre, amely a megszokott pivot-tábla funkciókat kínálja, de kiváló vizuális felülettel és intelligens interakciókkal. Ez azt jelenti, hogy megkapja a pivot-táblázat sokoldalú nézetét, az unintuitív folyamat nélkül. Ez azt is jelenti, hogy megkapja az Excel unpivot összesítő erejét a több táblázat készítésének kényelmetlen gyakorlata nélkül.
Amint az adatok vonalvezetése egyre fontosabbá vált, úgy láttuk, hogy eltávolodunk az Excel-től, mivel az alkalmazás gyakorlatilag lehetetlenné teszi az összes olyan átalakítás nyomon követését, amelyet mikor és ki végzett. A Trifacta segítségével minden egyes módosítás a képernyő jobb oldalán mindig egyértelműen látható.
Az a terület, ahol a Trifacta úgy látja, hogy az Excel mindenütt jelenlévő használata leginkább a pénzügyi szolgáltatásokban és a bankszektorban oszlik el. A pénzügyi szolgáltatási ágazat történelmileg leginkább az Excelre támaszkodott az iparági trendek és kritikus számítások, például a hitel- és lízingveszteségekre képzett céltartalék (ALLL) tájékoztatásának alapjaként. A negyedéves pénzügyi kimutatások egyik legjelentősebb becslése, az ALLL megmutatja, hogy egy banknak mekkora tartalékkal rendelkezik a rossz követelések ellensúlyozására, és óriási hatással van a nyereségre és a tőkére. Az ALLL szintén egy olyan számítás, amelyet szinte kizárólag az Excel segítségével vezettek le. A Mainstreet Technologies 2015. decemberi felmérésében a megkérdezett pénzintézetek több mint 64%-a mondta, hogy még mindig az Excelt használja, és 66%-uk azt mondta, hogy más technológiai megoldásokat keres a FASB CECL 2020-ban megjelenő kiadása előtt.
Az Excel azért vált intézményesítetté, mert nagy teljesítményű és viszonylag egyszerű. A pénzügyek és más ágazatok azonban kezdik felismerni, hogy az Excelnek nem csak az adatkészlet méretének korlátai vannak. Becslések szerint a táblázatok közel 90%-a hibás, amit tovább ront az ellenőrzések hiánya, mivel a táblázatok a munkatársak között cserélődnek. Valójában 2012-ben egy viszonylag egyszerű Excel kivágás és beillesztés képlet hibája volt az, ami miatt a JP Morgan tévesen számította ki egy alap VaR kockázati profilját, ami 2 milliárd dolláros veszteséget okozott.
A méretkorlátozásokon túlmenően a nyomon követés és az adatok egymásra épülése sehol sem olyan fontos, mint a pénzügyi szolgáltatások ágazatában, ahol szigorú ellenőrzések és a szabályozói jelentéstétel a jellemző. A Trifacta egyszerűvé teszi az adatok nyomon követését, lehetővé téve a kulcsfontosságú adatok valós idejű leltározását.
Hogyan alakította át a Trifacta az Unpivot Excel transzformációt
Míg a Trifacta előrejelző és vizuálisan kellemes módot kínál a pivot transzformáció végrehajtására, itt az Unpivot Excel parancsra összpontosítunk. Ezt a funkciót leggyakrabban akkor használjuk, amikor az adatokat az adatbeviteli szakaszból az elemzési szakaszba helyezzük át (pl. adatok normalizálása). Az adatbevitel akkor a legegyszerűbb, ha minden kulcshoz (keresztnév) egy sort, egy adatponthoz (ledolgozott órák) pedig egy oszlopot rendelünk. Ez a formátum megkönnyíti az adatok rögzítését; az aggregálás és az összegzés azonban sokkal nehezebbé válik.
Trifacta megreformálja az adatokat egy vagy több oszlop kulcs- és értékoszlopokká történő összevonásával. A kulcsok a bemeneti oszlopok nevei, az értékoszlopok pedig a forrásból származó cellaértékek. Az adatok sorai duplikálódnak, minden bemeneti oszlophoz egyszer. Az unpivot oszlop több oszlopra is alkalmazható ugyanabban az átalakításban. Minden oszlopot ugyanazon kulcs- és értékoszlopokba unpivotál. Az így elrendezett adatokkal új aggregációkat lehet végezni, és új felismeréseket lehet találni. A Trifacta megoldása az unpivot Excel-funkció gondjaira valóban mindenkinek szól, akinek hatékonyan és pontosan kell rendszereznie az adatait.
A pivot vagy unpivot Excel-parancs tényleges funkcióján túl a Trifacta beépített funkcióval rendelkezik a közvetlen Tableau-ba történő exportáláshoz. A Trifacta a Tableau-felhasználók szem előtt tartásával készült: tudjuk, hogy a pivot/unpivot alapvető funkció, és könnyebbé és gyorsabbá tettük az eredmények megtekintését az Excel rendetlenségének alkalmazása nélkül.
Ha többet szeretne megtudni az adatfeldolgozásról, próbálja ki ingyenes felhőtermékünket, a Trifacta Wranglert!