La plupart des utilisateurs d’Excel connaissent leur chemin autour d’un tableau croisé dynamique. Un tableau croisé dynamique peut rapidement résumer des informations statistiques de base (avec des sommes ou des moyennes, par exemple) et afficher ces données dans un format plus significatif.
Mais avant de pouvoir commencer à faire pivoter vos données, vous pouvez avoir besoin de réorganiser vos données – en d’autres termes, vous devez « dépivoter » vos données.
Comment dépivoter dans Excel
À quoi ressemble le dépivotage dans Excel ? Prenons un exemple de base : un ensemble d’étudiants passent chacun un test chaque mois pour leur cours d’algèbre. Vous souhaitez pouvoir analyser de plus près les performances de chaque élève. Cependant, vous ne pouvez pas le faire en ayant une colonne distincte pour chaque mois, ce qui est la façon dont ces données sont le plus souvent suivies. Lorsque vous construisez un tableau croisé dynamique à partir de ces données, il y aura neuf champs différents avec les résultats des tests – un pour chaque mois de l’année scolaire – et le tableau croisé dynamique ne sera pas en mesure de calculer un total annuel. Pour déplier nos données, nous devons les faire paraître plus longues au lieu d’être plus larges en créant une colonne » mois » agrégée, comme le montre l’image ci-dessous. Avec tous les mois dans une colonne, une autre colonne est créée pour les résultats des tests correspondants de chaque élève pour chaque mois.
Alors, comment commençons-nous ? Tout d’abord, nous devons convertir nos données en un tableau. La façon la plus rapide de le faire est simplement en appuyant sur + T.Après que nous ayons notre tableau, sous le groupe « Obtenir et transformer les données » trouvé dans l’onglet « Données », nous allons cliquer sur « À partir du tableau/de la plage. » Cela va demander à Excel d’ouvrir l’éditeur Power Query. Une fois dans l’éditeur Power Query, nous allons cliquer avec le bouton droit de la souris sur la colonne « Nom » et sélectionner « Unpivot Other Columns. » En faisant cela, vous remarquerez maintenant que les données sont dans le format que nous voulons – une colonne séparée a été créée pour les mois et pour les résultats des tests. Maintenant, tout ce que nous avons à faire est de renommer ces nouvelles colonnes en faisant un clic droit sur le haut des colonnes. Une fois que nous avons fini de renommer les colonnes, nous allons simplement cliquer sur « Fermer et charger » dans le coin supérieur gauche de l’écran. Cela créera une autre feuille que nous pourrons utiliser comme base de nos pivots Excel. Si nous décidons de mettre à jour nos données et d’ajouter, par exemple, les mois d’été si les étudiants ont décidé de suivre des cours d’été, il nous suffira de mettre à jour nos données dans l’onglet original et de cliquer avec le bouton droit de la souris et de « Rafraîchir » nos données non pivotées dans le nouvel onglet.
La prochaine étape : Pivots
Maintenant, nous avons atteint notre objectif : dépivoter les données afin qu’elles soient dans un format acceptable pour créer un tableau croisé dynamique. Nous n’allons pas entrer dans le » comment faire » spécifique de la création d’un tableau croisé dynamique dans cet article, mais l’étape la plus importante que vous pouvez prendre avant de créer un tableau croisé dynamique est de comprendre quelle question vous voulez poser à vos données et pourquoi. La création d’un tableau croisé dynamique ne sert pas à grand-chose s’il ne répond pas à une question pertinente pour votre entreprise. Par exemple, sur la base de nos données sur les étudiants, nous pourrions vouloir comprendre la note moyenne des tests des étudiants par mois pour voir si les étudiants avaient des difficultés avec des sujets particuliers.
Les fonctions unpivot et pivots ne sont pas limitées à Excel, bien sûr. Le pivot SQL est une fonction commune à de nombreuses industries avec des serveurs SQL. Le processus d’un pivot SQL semble très différent d’un pivot Excel puisqu’il s’appuie sur un langage d’interrogation, mais l’objectif final est le même.
L’éloignement des fonctions Excel unpivot et pivot
À Trifacta, on aime un bon tableau croisé dynamique. Excel unpivot et pivot sont de l’avis général les fonctions les plus puissantes d’Excel. Mais traiter des gigaoctets de données avec Excel peut être lourd, voire prohibitif. C’est pourquoi Trifacta a construit un produit qui offre la fonctionnalité familière de tableau croisé dynamique, mais avec une interface visuelle supérieure et des interactions intelligentes. Cela signifie que vous obtenez la vue multi-facettes du tableau croisé dynamique, sans le processus peu intuitif. Cela signifie également que vous obtenez la puissance d’agrégation de l’unpivot d’Excel sans la pratique maladroite de devoir faire de multiples tableaux.
A mesure que le lignage des données est devenu plus important, nous avons vu un abandon d’Excel, car l’application rend pratiquement impossible le suivi de toutes les transformations qui ont été faites, quand et par qui. Avec Trifacta, chaque changement est clairement répertorié à droite de votre écran à tout moment.
Un domaine où Trifacta voit l’utilisation omniprésente d’Excel se dissiper le plus est dans les services financiers et bancaires. Historiquement, le secteur des services financiers s’est surtout appuyé sur Excel pour informer les tendances du secteur et les calculs critiques, comme la provision pour pertes sur prêts et baux (ALLL). L’une des estimations les plus importantes des états financiers trimestriels, la ALLL, montre le montant qu’une banque a en réserve pour compenser les mauvaises créances, et elle a un impact énorme sur les bénéfices et le capital. L’ALLL est également un calcul qui a été dérivé presque exclusivement à l’aide d’Excel. Dans une enquête de Mainstreet Technologies de décembre 2015, plus de 64 % des institutions financières interrogées ont déclaré qu’elles utilisaient encore Excel, et 66 % ont dit qu’elles cherchaient d’autres solutions technologiques avant la publication du FASB CECL qui se déploie en 2020.
Excel s’est institutionnalisé parce qu’il est puissant et relativement facile. Cependant, la finance et d’autres secteurs se rendent compte qu’Excel a plus que des limites de taille de jeu de données. On estime que près de 90% des feuilles de calcul comportent des erreurs, aggravées par l’absence de contrôles lorsque les feuilles de calcul passent entre collègues. En fait, c’est une erreur de formule de copier-coller Excel relativement simple en 2012 qui a entraîné JP Morgan à mal calculer le profil de risque VaR d’un fonds, à hauteur d’une perte de 2 milliards de dollars.
Au delà des limites de taille, nulle part le suivi et la lignée des données ne sont plus importants que dans le secteur des services financiers, où les audits minutieux et les rapports réglementaires règnent. Trifacta rend le suivi des données simple, permettant des inventaires en temps réel des données clés.
Comment Trifacta a transformé la transformation Excel Unpivot
Bien que Trifacta offre une façon prédictive et visuellement agréable d’exécuter une transformation pivot, nous allons ici nous concentrer sur la commande Excel Unpivot. Cette fonction est utilisée le plus souvent lorsqu’il s’agit de faire passer des données de l’étape de saisie à l’étape d’analyse (par exemple, la normalisation des données). La saisie des données est plus facile lorsqu’on attribue une ligne à chaque clé (Prénom) et une colonne à un point de données (Heures travaillées). Ce format permet d’enregistrer facilement les données ; cependant, l’agrégation et la sommation deviennent beaucoup plus difficiles.
Trifacta réforme les données en fusionnant une ou plusieurs colonnes en colonnes de clés et de valeurs. Les clés sont les noms des colonnes d’entrée, et les colonnes de valeur sont les valeurs des cellules de la source. Les lignes de données sont dupliquées, une fois pour chaque colonne d’entrée. La colonne de dépivotage peut être appliquée à plusieurs colonnes dans la même transformation. Toutes les colonnes sont dépivotées dans les mêmes colonnes de clés et de valeurs. Avec des données arrangées de cette façon, de nouvelles agrégations peuvent être faites et de nouvelles idées trouvées. La solution de Trifacta pour les maux de la fonction Excel de dépivotage est vraiment pour tous ceux qui ont besoin d’organiser leurs données de manière efficace et précise.
Au delà de la fonction réelle d’une commande Excel de pivot ou de dépivotage, Trifacta a la fonctionnalité intégrée pour exporter directement vers Tableau. Trifacta a été construit avec les utilisateurs de Tableau à l’esprit : nous savons que le pivot/dépivot est une fonction essentielle, et nous avons rendu plus facile et plus rapide de voir vos résultats, sans employer le désordre d’Excel.
Pour en savoir plus sur le wrangling de données, essayez notre produit cloud gratuit, Trifacta Wrangler!