Większość użytkowników Excela zna swoją drogę wokół tabeli przestawnej. Tabela przestawna może szybko podsumować podstawowe informacje statystyczne (na przykład za pomocą sum lub średnich) i wyświetlić te dane w bardziej znaczącym formacie.
Ale zanim zaczniesz przestawiać swoje dane, być może będziesz musiał zmienić ich układ – innymi słowy, musisz je „rozpiąć”.
Jak wyznaczyć niepodzielność w Excelu
Jak wygląda wyznaczanie niepodzielności w Excelu? Rozważmy podstawowy przykład: zestaw studentów, z których każdy co miesiąc rozwiązuje test z algebry. Chciałbyś móc dokładniej przeanalizować wyniki każdego ucznia. Jednak nie można tego zrobić, mając osobną kolumnę dla każdego miesiąca, co jest sposobem, w jaki te dane są najczęściej śledzone. Po utworzeniu tabeli przestawnej z tych danych, będzie w niej dziewięć różnych pól z wynikami testów – jedno dla każdego miesiąca roku szkolnego – a tabela przestawna nie będzie w stanie obliczyć sumy rocznej. Aby rozpiąć nasze dane, musimy sprawić, że dane będą wyglądały na dłuższe, a nie szersze, tworząc kolumnę „miesiąc”, jak pokazano na poniższym obrazku. Mając wszystkie miesiące w jednej kolumnie, kolejna kolumna jest tworzona dla odpowiednich wyników testu każdego ucznia dla każdego miesiąca.
Więc, jak zacząć? Po pierwsze, musimy przekształcić nasze dane w tabelę. Najszybszym sposobem na zrobienie tego jest po prostu naciśnięcie + T.Po tym jak mamy naszą tabelę, w grupie „Pobierz i przekształć dane” znajdującej się w zakładce „Dane”, klikamy „Z tabeli / zakresu”. Spowoduje to wyświetlenie w Excelu prośby o otwarcie Power Query Editor. Po wejściu do edytora zapytań, klikamy prawym przyciskiem myszy na kolumnę „Nazwa” i wybieramy opcję „Podziel inne kolumny”. Po wykonaniu tej czynności zauważysz, że dane są w pożądanym przez nas formacie – osobna kolumna została utworzona dla miesięcy i dla wyników testu. Teraz wszystko, co musimy zrobić, to zmienić nazwy tych nowych kolumn, klikając prawym przyciskiem myszy na górze kolumn. Po zakończeniu zmiany nazwy kolumn, po prostu kliknij „Zamknij i załaduj” w lewym górnym rogu ekranu. Spowoduje to utworzenie kolejnego arkusza, który posłuży nam za podstawę naszych tabel przestawnych w Excelu. Jeśli zdecydujemy się zaktualizować nasze dane i dodać, na przykład, miesiące letnie, jeśli studenci zdecydowali się na kursy letnie, będziemy musieli tylko zaktualizować nasze dane w oryginalnej zakładce i kliknąć prawym przyciskiem myszy i „Odśwież” nasze niepivotowane dane w nowej zakładce.
Następny krok: Pivoty
Teraz osiągnęliśmy nasz cel: odpivotować dane tak, aby były w formacie akceptowalnym do utworzenia tabeli przestawnej. Nie będziemy się zagłębiać w szczegóły tworzenia tabeli przestawnej w tym artykule, ale najważniejszym krokiem, jaki możesz podjąć przed utworzeniem tabeli przestawnej, jest zrozumienie, jakie pytanie chcesz zadać swoim danym i dlaczego. Tworzenie tabeli przestawnej nie przyniesie większego pożytku, jeśli nie będzie ona odpowiadała na pytanie istotne dla Twojej firmy. Na przykład, w oparciu o dane naszych studentów, możemy chcieć zrozumieć średni wynik testu w miesiącu, aby sprawdzić, czy studenci mieli trudności z określonymi przedmiotami.
Funkcje unpivot i pivot nie są oczywiście ograniczone do Excela. Pivot SQL jest wspólną funkcją w wielu branżach z serwerami SQL. Proces pivot SQL wygląda o wiele inaczej niż pivot Excel, ponieważ opiera się na języku zapytań, ale cel końcowy jest taki sam.
Odejście od funkcji Excel Unpivot i Pivot
W Trifacta, jest miłość do dobrej tabeli przestawnej. Excel unpivot i pivot są ze wszech miar najpotężniejszymi funkcjami w Excelu. Ale radzenie sobie z gigabajtami danych w Excelu może być nieporęczne, a nawet zaporowe. Dlatego Trifacta zbudowała produkt, który oferuje znaną funkcjonalność tabeli przestawnej, ale z lepszym interfejsem wizualnym i inteligentnymi interakcjami. Oznacza to, że użytkownik otrzymuje wieloaspektowy widok tabeli przestawnej, bez nieintuicyjnego procesu. Oznacza to również, że otrzymujesz moc agregacji z Excel unpivot bez kłopotliwej praktyki konieczności tworzenia wielu tabel.
As data lineage has become more important, we have seen a move away from Excel, as the application makes it virtually impossible to track all of the transformations that have been made, when, and by whom. Z Trifacta, każda zmiana jest wyraźnie wyszczególniona po prawej stronie ekranu przez cały czas.
Obszar, w którym Trifacta widzi wszechobecne użycie Excela rozprasza się najbardziej jest w usługach finansowych i bankowości. Branża usług finansowych historycznie opierała się głównie na Excelu jako podstawie do informowania o trendach branżowych i krytycznych obliczeniach, takich jak Allowance for Loan and Lease Losses (ALLL). Jeden z najważniejszych szacunków kwartalnych sprawozdań finansowych, ALLL, pokazuje, jaką kwotę bank posiada w rezerwie na pokrycie złych długów i ma ogromny wpływ na zyski i kapitał. ALLL jest również kalkulacją, która została wyprowadzona prawie wyłącznie przy użyciu Excela. W ankiecie Mainstreet Technologies z grudnia 2015 r. ponad 64% respondentów z instytucji finansowych stwierdziło, że nadal korzysta z Excela, a 66% stwierdziło, że poszukuje innych rozwiązań technologicznych przed wydaniem FASB CECL, które toczy się w 2020 r.
Excel stał się zinstytucjonalizowany, ponieważ jest potężny i stosunkowo łatwy. Jednakże, finanse i inne sektory zdają sobie sprawę, że Excel ma więcej niż tylko ograniczenia rozmiaru zbioru danych. Szacuje się, że prawie 90% arkuszy kalkulacyjnych zawiera błędy, a sytuację pogarsza brak kontroli nad arkuszami, które są przekazywane między współpracownikami. W rzeczywistości, to właśnie stosunkowo prosty błąd formuły Excel wytnij i wklej w 2012 roku spowodował, że JP Morgan błędnie obliczył profil ryzyka VaR funduszu, co przyniosło stratę w wysokości 2 miliardów dolarów.
Poza ograniczeniami rozmiaru, nigdzie śledzenie i linia danych nie są tak ważne, jak w sektorze usług finansowych, gdzie rządzą rygorystyczne audyty i sprawozdawczość regulacyjna. Trifacta sprawia, że śledzenie danych jest proste, umożliwiając inwentaryzację kluczowych danych w czasie rzeczywistym.
Jak Trifacta przekształciła transformację Unpivot Excel
While Trifacta oferuje przewidywalny i wizualnie przyjemny sposób wykonania transformacji przestawnej, tutaj skupimy się na poleceniu Unpivot Excel. Funkcja ta jest najczęściej wykorzystywana przy przenoszeniu danych z etapu wprowadzania danych do etapu analizy (np. normalizacja danych). Wprowadzanie danych jest najłatwiejsze, gdy każdemu kluczowi (Imię) przyporządkowuje się jeden wiersz, a punktowi danych (Przepracowane godziny) jedną kolumnę. Ten format ułatwia zapis danych; jednak agregacja i sumowanie stają się o wiele trudniejsze.
Trifacta reformuje dane poprzez połączenie jednej lub więcej kolumn w kolumny klucza i wartości. Klucze to nazwy kolumn wejściowych, a kolumny wartości to wartości komórek ze źródła. Wiersze danych są duplikowane, raz dla każdej kolumny wejściowej. Kolumna unpivot może być zastosowana do wielu kolumn w tym samym przekształceniu. Wszystkie kolumny są niepodzielone na te same kolumny kluczowe i wartości. Z danymi ułożonymi w ten sposób, nowe agregacje mogą być dokonywane i znajdowane nowe spostrzeżenia. Rozwiązanie Trifacta dla niedoli funkcji unpivot Excel jest naprawdę dla każdego, kto potrzebuje zorganizować swoje dane efektywnie i dokładnie.
Poza rzeczywistą funkcją pivot lub unpivot polecenia Excel, Trifacta ma wbudowaną funkcjonalność do eksportu bezpośrednio do Tableau. Trifacta została zbudowana z myślą o użytkownikach Tableau: wiemy, że funkcja pivot/unpivot jest niezbędna, dlatego ułatwiliśmy i przyspieszyliśmy wyświetlanie wyników, bez konieczności korzystania z bałaganu Excela.
Aby dowiedzieć się więcej na temat przetwarzania danych, wypróbuj nasz darmowy produkt w chmurze, Trifacta Wrangler!