De meeste Excel-gebruikers kennen de weg in een draaitabel. Een draaitabel kan snel statistische basisgegevens samenvatten (bijvoorbeeld met sommen of gemiddelden) en die gegevens in een meer betekenisvolle indeling weergeven.
Maar voordat u kunt beginnen met het draaien van uw gegevens, moet u mogelijk uw gegevens opnieuw rangschikken – met andere woorden, u moet uw gegevens “ontpivotten”.
Hoe unpivot je in Excel
Hoe ziet unpivot er in Excel uit? Neem een eenvoudig voorbeeld: een groep leerlingen maakt elke maand een toets voor hun algebra-les. U wilt de prestaties van elke leerling nauwkeuriger kunnen analyseren. U kunt dit echter niet doen door voor elke maand een aparte kolom te hebben, wat de meest gebruikelijke manier is om deze gegevens bij te houden. Wanneer u van die gegevens een draaitabel maakt, zullen er negen verschillende velden met toetsscores zijn – één voor elke maand van het schooljaar – en de draaitabel zal geen jaartotaal kunnen berekenen. Om onze gegevens te ontkoppelen, moeten we de gegevens langer laten lijken in plaats van breder door een geaggregeerde “maand”-kolom te maken, zoals te zien is in de onderstaande afbeelding. Met alle maanden in één kolom, wordt een andere kolom gemaakt voor de overeenkomstige testscores van elke leerling voor elke maand.
Dus, hoe gaan we aan de slag? Eerst moeten we onze gegevens omzetten in een tabel. De snelste manier om dit te doen is door simpelweg op + T te drukken.Als we onze tabel hebben, onder de groep “Gegevens ophalen en transformeren” in het tabblad “Gegevens”, gaan we klikken op “Van tabel/bereik.” Dit zal Excel vragen om de Power Query Editor te openen. Eenmaal in de Power Query Editor, klikken we met de rechtermuisknop op de kolom “Naam” en selecteren we “Andere kolommen splitsen”. U ziet nu dat de gegevens de door ons gewenste indeling hebben: er is een aparte kolom gemaakt voor de maanden en voor de testscores. Nu hoeven we alleen nog maar deze nieuwe kolommen een nieuwe naam te geven door met de rechtermuisknop op de bovenkant van de kolommen te klikken. Als we klaar zijn met het hernoemen van de kolommen, klikken we gewoon op “Sluiten en laden” in de linkerbovenhoek van het scherm. Hiermee maken we een ander blad dat we kunnen gebruiken als basis voor onze Excel draaipunten. Als we besluiten onze gegevens bij te werken en bijvoorbeeld de zomermaanden toe te voegen als de studenten besluiten zomercursussen te volgen, hoeven we alleen onze gegevens op het oorspronkelijke tabblad bij te werken en met de rechtermuisknop te klikken en onze niet-gedivoteerde gegevens op het nieuwe tabblad te “vernieuwen”.
De volgende stap: Pivots
Nu hebben we ons doel bereikt: het ontpivotten van gegevens zodat ze in een acceptabel formaat zijn om een draaitabel te maken. We gaan in dit artikel niet in op de specifieke “how-tos” van het maken van een draaitabel, maar de belangrijkste stap die u kunt nemen voordat u een draaitabel maakt, is begrijpen welke vraag u wilt stellen aan uw gegevens en waarom. Het maken van een draaitabel heeft weinig zin als het geen antwoord geeft op een relevante vraag voor uw bedrijf. Bijvoorbeeld, op basis van onze student gegevens, willen we misschien inzicht in de gemiddelde student test score per maand om te zien of de studenten moeite hadden met bepaalde onderwerpen.
De unpivot en pivots functies zijn niet beperkt tot Excel, natuurlijk. Pivot SQL is een veel voorkomende functie in veel sectoren met SQL-servers. Het proces van een pivot SQL ziet er heel anders uit dan een Excel pivot, omdat het berust op een querytaal, maar het einddoel is hetzelfde.
De beweging weg van Excel Unpivot en Pivot Functies
Bij Trifacta is er liefde voor een goede pivot tabel. Excel unpivot en pivot zijn in alle opzichten de krachtigste functies in Excel. Maar omgaan met gigabytes aan gegevens met Excel kan onhandelbaar of zelfs onbetaalbaar zijn. Daarom heeft Trifacta een product ontwikkeld dat vertrouwde draaitabelfunctionaliteit biedt, maar met een superieure visuele interface en intelligente interacties. Dit betekent dat u het veelzijdige beeld van de draaitabel krijgt, zonder het onintuïtieve proces. Het betekent ook dat u het aggregatievermogen van de Excel unpivot krijgt, zonder de onhandige praktijk van het maken van meerdere tabellen.
Naarmate de gegevens lineage belangrijker is geworden, hebben we een beweging weg van Excel gezien, omdat de toepassing het vrijwel onmogelijk maakt om alle transformaties bij te houden die zijn gemaakt, wanneer, en door wie. Met Trifacta, is elke verandering duidelijk vermeld aan de rechterkant van uw scherm te allen tijde.
Een gebied waar Trifacta het alomtegenwoordige gebruik van Excel het meest ziet afnemen is in de financiële dienstverlening en het bankwezen. De financiële-dienstensector heeft historisch gezien vooral vertrouwd op Excel als basis voor informatie over trends in de sector en kritische berekeningen, zoals de Allowance for Loan and Lease Losses (ALLL). Een van de belangrijkste kwartaalschattingen van de jaarrekening, de ALLL, geeft aan hoeveel een bank in reserve heeft om oninbare vorderingen te compenseren, en heeft een enorme invloed op winst en kapitaal. ALLL is ook een berekening die bijna uitsluitend met behulp van Excel is afgeleid. In een enquête van december 2015 van Mainstreet Technologies zei meer dan 64% van de respondenten van financiële instellingen dat ze nog steeds Excel gebruiken, en 66% zei dat ze op zoek zijn naar andere tech-oplossingen in de aanloop naar de FASB CECL-release die in 2020 uitrolt.
Excel werd geïnstitutionaliseerd omdat het krachtig en relatief eenvoudig is. Financiën en andere sectoren realiseren zich echter dat Excel meer heeft dan alleen beperkingen in de grootte van datasets. Naar schatting bevat bijna 90% van de spreadsheets fouten, die nog worden verergerd door het gebrek aan controle wanneer spreadsheets tussen collega’s worden doorgegeven. In feite was het een relatief eenvoudige Excel knip- en plakformule fout in 2012 die JP Morgan veroorzaakte een verkeerde berekening van een fonds VaR risicoprofiel op het deuntje van een $ 2B verlies.
Boven grootte beperkingen, nergens is tracking en data lineage belangrijker dan in de financiële dienstensector, waar nauwgezette audits en wettelijke rapportage heersen. Trifacta maakt het traceren van gegevens eenvoudig, waardoor real-time inventarisaties van belangrijke gegevens mogelijk zijn.
Hoe Trifacta de Unpivot Excel Transform veranderde
Terwijl Trifacta een voorspellende en visueel aantrekkelijke manier biedt om een pivot transformatie uit te voeren, zullen we ons hier richten op het Unpivot Excel commando. Deze functie wordt het vaakst gebruikt om gegevens van de invoer- naar de analysefase te verplaatsen (bv. normaliseren van gegevens). Gegevensinvoer is het gemakkelijkst wanneer men één rij toewijst aan elke sleutel (Voornaam) en één kolom aan een gegevenspunt (Gewerkte uren). Met deze indeling kunnen gegevens gemakkelijk worden geregistreerd; aggregatie en sommatie worden echter veel moeilijker.
Trifacta hervormt de gegevens door een of meer kolommen samen te voegen tot sleutel- en waardekolommen. De sleutels zijn de namen van de inputkolommen, en de waardekolommen zijn de celwaarden uit de bron. Rijen met gegevens worden gedupliceerd, eenmaal voor elke inputkolom. De unpivot kolom kan worden toegepast op meerdere kolommen in dezelfde transformatie. Alle kolommen worden ontpivot in dezelfde sleutel- en waardekolommen. Met gegevens die op deze manier zijn gerangschikt, kunnen nieuwe aggregaties worden gemaakt en nieuwe inzichten worden gevonden. Trifacta’s oplossing voor het ongedaan maken van Excel-functie-ellende is echt voor iedereen die zijn gegevens efficiënt en nauwkeurig moet ordenen.
Naast de eigenlijke functie van een pivot- of unpivot Excel-opdracht, heeft Trifacta de ingebouwde functionaliteit om rechtstreeks naar Tableau te exporteren. Trifacta is gebouwd met Tableau-gebruikers in gedachten: we weten dat pivot/unpivot een essentiële functie is, en we hebben het gemakkelijker en sneller gemaakt om uw resultaten te zien, zonder de rommeligheid van Excel te gebruiken.
Om meer te leren over data wrangling, probeer ons gratis cloud-product, Trifacta Wrangler!