L’analyse de données fait référence au processus d’examen de grandes quantités de données brutes ou non organisées pour formuler des conclusions à partir des données. Il est fréquemment utilisé dans les affaires pour générer des plans d’action ou pour identifier des modèles et des tendances dans les affaires et pour aider les entreprises à mieux comprendre le comportement des clients. Il est également utilisé par les économistes et les professionnels universitaires dans de nombreuses disciplines pour aider à formuler, soutenir ou réfuter des théories.
Dans de nombreuses situations, de grandes quantités de données sont collectées pour être étudiées. Par exemple, les économistes peuvent recevoir des milliers de réponses à des enquêtes ou peuvent parcourir des quantités infinies de données gouvernementales et de recensement sur d’énormes segments de la population. D’autres universitaires peuvent également recevoir de nombreux grands ensembles d’informations non organisées ; par exemple, un scientifique étudiant un remède potentiel contre le cancer peut recevoir les résultats des tests de centaines, voire de milliers ou de millions de patients. Dans les affaires, les données peuvent également être collectées sous la forme de données de vente, de reçus de clients, de transactions ou d’autres types d’informations.
Toutes ces données fournissent des informations et contiennent probablement des modèles et des tendances qui peuvent aider à façonner et à régir le comportement. Pour utiliser l’information, cependant, les données doivent être organisées, analysées et comprises. L’analyse de données fait référence au processus d’organisation et d’analyse de toutes ces données.
Tout comme il existe de nombreux types et sources de données, il existe de nombreuses méthodes d’analyse différentes. Certaines données doivent être organisées manuellement et codées à la main. D’autres grandes bases de données d’informations peuvent être passées au crible à l’aide de programmes informatiques spécialisés qui simplifient et simplifient le processus d’analyse des données.
Le processus et la procédure d’analyse des données dépendent non seulement de la manière dont les données sont organisées, mais également de ce que recherche une personne. Par exemple, un économiste peut examiner des données pour trouver des modèles d’achat ou de dépenses qui expliquent le comportement. Une entreprise peut examiner les données pour identifier les faiblesses de la chaîne d’approvisionnement du client ou les problèmes avec un employé donné.
Chaque entreprise développe généralement ses propres méthodes d’analyse de données qui lui permettent de résoudre les problèmes de l’entreprise donnée. Une compagnie d’assurance maladie, par exemple, peut avoir une base de données de millions de réclamations payées. Les employés en charge de l’analyse des données seraient chargés de générer et d’exécuter des algorithmes pour détecter les anomalies potentielles. Le programme informatique et les algorithmes pourraient ainsi être exécutés pour identifier les domaines dans lesquels de fausses réclamations auraient pu être payées et qui devraient faire l’objet d’une enquête.