Dans cet article, je veux parler des différents systèmes qui existent dans votre entreprise dans lequel on peut bâtir des rapports. Aussi je veux vous fournir des questions à vous poser pour s’assurer qu’on se connecte à la bonne source de données selon votre type de rapport.
Aujourd’hui, grâce à la démocratisation des outils de reporting et à leur grande facilité à se connecter à plusieurs sources de données différentes il est très facile de créer des rapports en utilisant plusieurs sources. Toutefois, on doit prendre le temps de s’arrêter et de se demander si notre rapport est connecté aux bonnes données.
Types de systèmes
Dans cette section, je vais détailler 4 systèmes : le système source, le lac de données, l’entrepôt de données et le cube de données.
Systèmes Sources
Vos systèmes sources sont les systèmes que votre entreprise utilise au quotidien pour effectuer ses activités. Que ça soit votre ERP pour effectuer votre comptabilité ou vos suivis d’inventaire ou de production, votre CRM pour le suivi de vos clients ou des applications maison pour assister vos processus internes. Ces logiciels ont souvent des rapports intégrés et on peut souvent s’y connecter pour faire des rapports personnalisés.
Lac de données
Le lac de données est un système qui n’est pas présent dans toutes les organisations, mais celui-ci regroupe habituellement toutes les données de l’entreprise dans un format brut et transformé. Il permet aussi de gérer des données difficiles à intégrer dans des bases de données traditionnelles tel que les images et les vidéos. Le lac de données s’apparente au disque dur de votre ordinateur.
Entrepôt de données
L’entrepôt de données est un système classique en intelligence d’affaires. Il s’agit d’une base de données modélisée différemment du système source. Ce dernier vise à écrire des informations rapidement et l’entrepôt vise à lire des informations rapidement à des fins de reporting. Toutefois, il y a un effort à faire pour modéliser et transformer nos données.
Cube de données
Le cube de données agit comme une couche d’abstraction sur votre entrepôt de données. Cela signifie qu’il est souvent difficile pour un utilisateur final d’interagir avec une base de données tel qu’un entrepôt de données. Le cube est conçu pour être facilement navigable via un fichier Excel et un tableau croisé dynamique, utilise le langage de l’utilisateur et permet des calculs plus avancés tel que des comparatifs d’une année à l’autre (Year over year).
Les questions à se poser avant de créer mon rapport
Maintenant que vous en savez davantage sur ces quatre systèmes, revenons à nos rapports. Je veux vous partager des questions et des règles du pouce utiles pour s’assurer que votre rapport utilise la bonne source. Car, on ne veut pas être obligé de modifier une source en milieu de développement et perdre du temps précieux.
Quel est le temps de rafraichissement nécessaire?
Une des premières questions à se poser est avec quel décalage de données suis-je prêt à vivre. Plus notre rapport est proche du système source, plus notre donnée est près du temps réel. Si notre rapport est sensible à cette question, plus on doit être prêt du temps réel. N’oubliez pas par compte que votre rapport va faire pression sur votre système source et vous ne voulez pas empêcher les gens de l’utiliser pour leurs activités quotidiennes pour du reporting.
Est-ce que je suis intéressé à intégrer des données de plusieurs systèmes?
Ici, on veut savoir si votre rapport doit contenir des données de plus d’un système. Même si les outils de reporting modernes peuvent faire le travail d’intégration, il est sage d’utiliser des outils d’intégration de données plus robustes pour faire le travail. Ça ne vous empêche pas d’utiliser votre outil de reporting pour faire une preuve de concept et ensuite opérationnaliser le tout dans un outil plus robuste.
Est-ce que mon besoin est régulier ou ad-hoc?
Ensuite, il faut se demander si le rapport qu’on demande sera utilisé d’une façon régulière ou de façon ponctuelle. Pour réaliser un développement dans un entrepôt ou un cube, cela prend du temps et des ressources. Vous ne voulez pas investir ce temps pour une analyse que vous avez à faire pour un événement spécial et qui n’arrivera pas par la suite. Ces systèmes sont à leur meilleur pour des questions connues. Pour un besoin ad-hoc, votre lac de données vous sera d’une très grande utilité.
Est-ce que je suis intéressé à avoir un historique?
Une de mes questions préférées. Il faut se demander si on veut voir les données à un temps X et non en temps réel. Ce que je veux dire c’est de voir les données telles qu’elles étaient dans le passé (e.g. historique du gestionnaire d’un employé). Souvent, les systèmes sources gardent la version la plus à jour de cette information, mais votre lac de données, votre entrepôt de données et votre cube ont ces informations. En termes techniques, on appelle cela Slowly Changing Dimensions.
Est-ce que j’ai besoin de transformations complexes?
La dernière question à se poser est quels types de transformations de données sont nécessaires pour réaliser mon rapport. Si les transformations sont complexes (e.g. comparatif année actuelle vs année précédente), il est sage de faire ce type de transformation à l’extérieur de votre système source. Si le besoin est ad-hoc, votre lac vous servira bien, si le besoin est régulier, prenez le temps de développer le tout dans votre entrepôt de données.
Ce qui est bien avec ces questions est le fait que même si vous n’avez pas tous ces systèmes en place, vos réponses peuvent aussi vous pousser à mettre en place l’un d’eux.
Conclusion
Dans cet article, nous avons vu 4 différents endroits où vous pouvez prendre vos données pour construire vos rapports. Je vous ai aussi donné cinq questions à vous poser pour prendre une décision plus éclairée dans la sélection de votre source. J’espère que cet article va vous aider et si vous avez d’autres questions à proposer, n’hésitez pas à les ajouter en commentaire !
Gabriel Guimond-Prevost – Architecte de données
Groupe Neos Inc.