Découverte des connaissances dans des bases de données historiques d’une société de marketing

Article original

Découverte des connaissances dans des bases de données historiques d’une entreprise de marketing

Découverte des connaissances dans des bases de données Historique d’une entreprise de négoce

Tania Morgado-Garcíai, Daniel Antonio-Limaii, Alejandro Roste-Suáreziii

I Corporation Copextel SA, La Havane, Cuba
Université d’État de Santa Elena, Équateur
III Université technologique de La Havane José Antonio Echeverría, Havane, Cuba

Résumé

Avec le développement des technologies, le volume énorme de Les bases de données et la nécessité d’obtenir une connaissance utile d’entre eux, l’exploitation minière des données devient un outil stratégique pour les entreprises, en tant que soutien à la prise de décision. Une société cubaine créée en 1991, dont le nom n’est pas mentionné pour des raisons de confidentialité, qui est distinguée en étant un fournisseur de solutions intégrées, offre des ingénieurs de produits et de services dans une gamme variée de sphères avec un personnel hautement qualifié. Il présente de grands volumes de données résultant de la gestion de chacune de ses unités organisationnelles, mais des analyses ne sont pas effectuées pour identifier les modèles et les comportements cachés dans les données. Dans ce travail, un processus de découverte de connaissances dans des bases de données a été élaboré dans la société susmentionnée comme aide à la prise de décision. À cet égard, les aspects liés à l’exploitation minière des données et à son application dans l’environnement des indicateurs économiques-financiers et de gestion ont été obtenus, des modèles d’association et de regroupement ont été obtenus qui soutiendra le travail des gestionnaires aux différents niveaux de l’organisation.

Mots-clés: mines de données, regroupement, connaissances, société.

Résumé

avec le développement des technologies, le grand volume de bases de données et la nécessité d’obtenir une connaissance utile d’entre elles, Les mines de données deviennent un outil stratégique pour les entreprises, qui soutiennent la prise de décision. Une société cubaine, créée en 1991, qui n’est pas mentionnée pour des raisons de confidentialité, pourquoi se distingue en tant que fournisseur d’actionneur de solutions Compinersive, propose des produits et des services d’ingénierie dans un large éventail de domaines avec un personnel hautement qualifié. Il a de grands volumes de données résultant de la gestion de chaque unités organisationnelles de sites, mais aucune analyse n’est effectuée pour identifier les modèles et les comportements cachés dans des données. Cet article présente un processus de découverte de la connaissance dans des bases de données dans la société susmentionnée comme une aide à la prise de décision. À cet égard, des aspects liés à l’exploitation minière des données et à la demande de données dans l’environnement des indicateurs financiers économiques et de la gestion ont été des modèles détaillés, d’association et de clustering qui soutiendront les travaux des gestionnaires à différents niveaux de l’organisation ont été obtenus.

mots clés: Minig de données, regroupement, connaissances, société.

Introduction

Au cours des dernières années, le développement technologique dans la zone de calcul et de transmission de données, il a permis de Le stockage et la gestion de grands volumes de données. Les entreprises commencent aujourd’hui à des environnements hautement concurrentiels et à un changement continu. La dynamique du marché entraîne la nécessité de disposer d’informations adéquates au moment indiqués afin que les gestionnaires puissent prendre des décisions commerciales appropriées. Par conséquent, ils ont compris que de grands volumes de données résidant sur leurs systèmes peuvent, et doivent être analysés et exploités pour obtenir de nouvelles connaissances ,.

Exploitation d’exploitation de données ou d’exploitation d’informations est le processus d’extraction utile, compréhensible et innovant. Connaissance des gros volumes de données, son objectif principal étant de trouver des informations cachées ou implicites, qui n’est pas possible d’obtenir par des méthodes statistiques classiques. L’entrée du processus minier est formée par divers conteneurs d’informations, cela inclut des bases de données relationnelles, des magasins de données (Datawarehouse), des documents en texte libre, des données Web, entre autres ,.

une définition traditionnelle définissez, En tant qu’à une étape du processus de KDD (découverte des connaissances dans des bases de données) consiste à appliquer une analyse de données et de découverte d’algorithmes qui, selon des limitations d’efficacité informatique acceptables, produisent un groupe particulier de modèles ou de modèles sur les données.

Mining de données offre la possibilité d’organisation de détecter des problèmes potentiels et de prendre les mesures nécessaires pour les éviter ou atténuer l’impact.Appliquée de manière appropriée, des rapports sur les mines de données aux organisations de nombreux avantages entre lesquels sont: une plus grande efficacité dont il est moins de temps pour corriger les erreurs et récupérer les paiements; Informations précipitations qui vous permet de réduire les surprises et d’analyser les causes des problèmes et de mieux contrôler grâce à la prévention et à la détection des activités permettant une surveillance des trous de contrôle interne.

Votre champ d’application est large et différent, en fait, dans toutes les activités où les données sont générées. Dans et plusieurs exemples de son application sont exposés.

avec une approche non traditionnelle, les auteurs présentent des données minières comme un processus systématique et social impliquant les différents systèmes et phases de l’exploitation minière ainsi que de leur respectif. environnements. Dans l’exploitation minière de données, les problèmes et les applications sont normalement entourés de facteurs organisationnels et sociaux de différentes entreprises. Ces facteurs constituent l’environnement minier du monde réel et leur attention est nécessaire, car ils reflètent les besoins réels de la société et des utilisateurs, et constituent l’environnement des connaissances identifiées. L’intelligence qui découle de la participation de facteurs et de ressources de l’organisation dans les modèles miniers constitue une intelligence organisationnelle. Il se compose de nombreux aspects parmi lesquels sont les suivants:

  • les structures organisationnelles liées aux aspects clés, telles que l’emplacement des données.
  • comportement organisationnel, comme pour la compréhension de L’entreprise et les données, comment les individus et les groupes agissent dans l’organisation.
  • Règlements commerciaux qui incluent des règles, des politiques, des protocoles, des normes.
  • processus métier et les flux de travail.
  • Les acteurs de l’organisation et de ses fonctions.

Le processus de KDD

Fayyad et al. Pour définir le processus de KDD comme suit: « Un processus non trivial de modèles valides, nouveaux, potentiellement utiles et compréhensibles cachés dans les données ». Il est composé de cinq phases décrites ci-dessous:

1. Collecte d’intégration et de données: Dans cette phase, les sources d’information sont déterminées qui peuvent être utiles et où les obtenir.

2. Sélection, nettoyage et transformation: Comprend la détection des valeurs aberrantes, des données manquantes ou perdantes, de construire de nouveaux attributs et numériques numériques ou discrétiser les attributs.

3. Mining de données: L’objectif de cette phase est de produire de nouvelles connaissances. Pour cela, un modèle est construit qui n’est rien de plus qu’une description des motifs et des relations entre les données pouvant être utilisées pour faire des prévisions, afin de mieux comprendre les données ou d’expliquer les situations antérieures. Comprend:

  • Choisissez le type de modèle.
  • Déterminez quel type de tâche minière est le plus approprié.
  • choisissez l’algorithme d’exploitation qui résolve la Tâche et obtenez le type de modèle que vous recherchez.

4. Évaluation et interprétation: Il existe différentes mesures d’évaluation des modèles: précis, compréhensible (intelligible) et intéressant (utile et roman).

5. Diffusion: Une fois le modèle construit et validé, cela peut être utilisé à des fins différentes et, au cours de ce processus, son évolution doit être mesurée. De cette manière, il sera connu s’il doit être réévalué, réacheminé et éventuellement reconstruit complètement.

sont divers des éléments à prendre en compte pour une organisation implémenter avec succès le processus de découverte de connaissances ou de données mines. Dans les auteurs définir un ensemble d’aspects qui, plus que des éléments techniques, représentent des changements organisationnels, mentalités et culturels dans les organisations:

  • L’acceptation de la responsabilité d’éviter des problèmes de manière proactive grâce à l’adoption d’approches minières de données et des outils. C’est essentiellement une transformation culturelle de l’organisation.
  • Comprenez l’appui potentiel représenté par l’exploitation des données à l’Organisation dans la gestion quotidienne et la prise de décision stratégique.
  • Déterminez comment les connaissances résultant du Le processus d’exploration de données sera utilisé.
  • Partager des expériences et des meilleures pratiques.
  • Voir ce processus en tant que processus continu.

Les activités minières de données sont Classé dans quelques catégories qui dépendent des tâches et des objectifs de l’analyse. En fonction de l’existence d’une variable cible, le processus d’apprentissage est classé dans:

  • supervisé ou direct MD. Un attribut objectif représente la classe à laquelle chaque enregistrement appartient à ou exprime une quantité mesurable. Ils sont orientés vers la prévision et l’interprétation par rapport à un attribut objectif.
  • non supervisé ou indirect MD.Les analyses ne sont pas déterminées par un attribut objectif. Son but est de découvrir des motifs et des affinités récurrents dans les ensembles de données.

Sur la base de l’extraction des données indirectes, son application est pratique dans des organisations qui ne possèdent pas une histoire d’utilisation précédente du même .

Une société cubaine créée en 1991 qui se distingue en étant un fournisseur de solutions complet, propose des ingénieurs de produits et de services dans une gamme variée de sphères, avec un personnel hautement qualifié.

beaucoup de la gestion de la société est appuyée sur les technologies de l’information et de la communication. Il existe un ensemble d’applications informatiques prenant en charge les processus clés, le support et la gestion, par lesquels les données primaires sont enregistrées dans chaque unité organisationnelle. Ces données sont reproduites aux serveurs centraux dans lesquels il est disponible de gros volumes datant de l’année 2001 .Les candidatures sont surlignées, ce qui nous permet d’exécuter automatiquement le processus de clôture mensuel de la comptabilité et de la création d’indicateurs économiques et de règles qui valident les informations comptables à partir des indicateurs calculés. Cependant, les connaissances cachées dans ces données ne sont pas utilisées, ce qui peut maintenir certaines actions et décisions de la part des gestionnaires de la société.

du problème précédent tire l’objectif de ce travail: Découvrez des modèles, des tendances et des écarts dans l’entrepôt de données de l’entreprise de la société appliquant non Techniques d’extraction de données supervisées en vue de l’amélioration Le processus de prise de décision. Les données sélectionnées pour explorer et rechercher initialement des modèles et des comportements cachés sont les comptables, en particulier les indicateurs économiques calculés à partir de l’application qui porte le même nom.

de cette manière. Vise à déterminer les relations qui existent entre les différents indicateurs économiques qui reflètent des schémas et / ou des comportements et regroupent les unités organisationnelles participant au comportement de ces indicateurs.

méthodes

Suivant, décrivez le Tâches d’extraction de données, méthodologie et outil d’analyse de données, ainsi que des techniques d’association et de regroupement utilisés.

Règles de l’association

La première tâche minière des données menées était l’obtention de règles d’association qui consiste d’identifier des modèles réguliers et récurrents dans un grand groupe de transactions. Les règles apparaissent à plusieurs égards, mais la formulation la plus habituelle est sous style « si l’attribut x prend la valeur d, alors l’attribut et prend la valeur B ». Ils sont évalués à l’aide de deux paramètres: la confiance et le support qui sont également nommés de précision et de couverture respectivement.

regroupement

La deuxième tâche était le groupement qui vise à subdiviser les enregistrements d’un groupe de données dans des groupes d’observations homogènes, appelés clusters. Les données sont regroupées en fonction du principe de maximiser la similitude entre les éléments d’un groupe en minimisant la similitude entre les différents groupes.

Méthodologie et outil d’analyse de données

a été décidé à employer La méthodologie CRISP-DM pour l’élaboration de cette enquête conserve une perspective plus large en ce qui concerne les objectifs commerciaux et conçoit le projet KDD au niveau mondial. En outre, il s’agit d’une méthodologie neutre concernant l’outil utilisé pour le développement du travail et sa distribution est gratuite et gratuite. Dans la phase minière de données, il a été utilisé comme méthode pour trouver des associations l’algorithme a priori et trouver les groupes l’algorithme K-signifie, tous deux développé dans l’outil d’analyse de données R ,.

résultats et discussion

phase de la préparation des données

Les données utilisées dans la présente enquête proviennent de la table H_ Indicateurs dans laquelle ils sont stockés, après calcul des informations de comptabilité, répondent aux serveurs centraux. de chacune des unités organisationnelles de la société, les indicateurs économiques résultant de son fonctionnement et de son gestion. Il a été modifié, par requête SQL, la structure d’origine de l’ensemble de données afin que chacun des indicateurs constitue une variable et facilite ainsi son analyse. Les enregistrements avec les valeurs nuls ont été supprimés. La structure résultante est indiquée dans le tableau 1:

La sélection des fonctionnalités réduit la taille des données en choisissant les variables les plus influentes du problème. L’examen détaillé de chaque indicateur reflète qu’il y a des indicateurs au total, c’est-à-dire qu’ils sont le résultat d’opérations arithmétiques entre autres indicateurs, ou certains contiennent d’autres. De plus, tous les indicateurs sont des variables comptables de la société.Pour cette raison, il est décidé de calculer de nouveaux indicateurs d’efficacité permettant une analyse et des comparaisons à partir des variables d’origine.

construction de fonctionnalités

La création ou la construction de caractéristiques consiste à créer de nouveaux attributs Améliorer la qualité, la visualisation et la compréhensibilité des connaissances extraites.

Le tableau 2 montre les nouveaux indicateurs calculés à partir des originaux, avec une brève description et une formule de calcul de la description et de calcul.

dans le but d’obtenir Données avec une qualité supérieure et répondre aux exigences des techniques sélectionnées, de nouvelles transformations sont effectuées sur les variables. Pour cela, la technique de discrétisation est utilisée. Chacun des indicateurs a été mélangé dans 6 groupes en fonction des exigences et des valeurs attendues de chacun. En outre, les variables ont été discrectées, selon le type d’unité organisationnelle (division commerciale, division de soutien, services techniques ou division territoriale) et mois selon les quartiers de l’année. Le tableau 3 montre les variables résultantes et la méthode de segmentation utilisée.

Mining de données: Règles d’association des tâches descriptives

L’algorithme A a priori a été utilisé. Des valeurs de confiance et de soutien très élevées ont été obtenues. Des règles ont été trouvées avec des valeurs de soutien et de confiance autour de 0,80 et de 0,90sepective.

Suivant, les règles de la plus grande intérêt:

  • couverture de stock dans la gamme, le bénéfice d’exploitation La marge de la gamme% et la rotation du capital de roulement dans la gamme impliquent que la rotation des stocks est comprise dans la gamme.
  • La rotation des stocks dans la gamme implique que la marge d’exploitation est dans le%. Gamme, et vice versa.
  • Le rapport de l’endettement dans la gamme% implique que la rotation du stock est dans la plage.
  • la raison de l’endettement dans la gamme% et la rotation Des stocks dans la gamme impliquent que la marge bénéficiaire d’exploitation est dans la gamme%.
  • La raison actuelle de la plage et le rapport de rapport dans la gamme% impliquent que la marge bénéficiaire de fonctionnement se trouve dans le%.
  • couverture stock dans la gamme IMPLI Ca que la rotation des stocks se trouve dans la plage.
  • couverture de stock dans la gamme implique que la marge bénéficiaire d’exploitation est dans la gamme% de la gamme.
  • la marge utilisant des opérations dans la gamme% et Le rapport de l’endettement dans la gamme% implique que la rotation des stocks est comprise dans la plage.
  • La rotation du capital de travail dans la gamme implique que la rotation du stock figure dans la plage.
  • Si la division est commerciale implique que la rotation du stock est comprise dans la plage.

Tous les indicateurs ont été utilisés dans l’algorithme appliqué, mais certains n’étaient pas intéressants: marge d’utilité brute, Marge nette, rentabilité sur les actifs, la manœuvre, la rotation des actifs et la rotation de l’actif fixe, entre autres. D’autre part, comme on peut le voir dans les règles précédemment exposées, les caractéristiques qui décrivent le mieux les relations, sont les suivantes: la matière de stockovernance, la marge bénéficiaire d’exploitation, le fonds de roulement, la rotation des stocks, le ratio ratio et la raison actuelle. Les résultats obtenus montrent les relations entre les indicateurs, certains logiques et évidents, mais qui offrent une autre perspective pour l’analyse de l’activité de la société. Ils représentent une connaissance précieuse pour l’organisation en présentant des indicateurs récurrents, les associations entre eux et dans quelle gamme de valeurs sont.

à cet égard, soulignez que le ratio d’endettement dans tous les cas est présenté. dans le périmètre %. La valeur recommandée est comprise entre 40 et 60%, cependant, lorsque cela a tendance à zéro, la société est plus solide, car elle est financée par ses propres ressources. Dans notre cas, la valeur est exécutée au-dessus de la limite supérieure recommandée.

Phase d’extraction de données: cluster descriptif

Dans cette section, les expériences effectuées avec l’objectif sont montrées pour trouver possible regroupements entre les instances selon leurs caractéristiques, appliquant l’algorithme K-signifie en r.

pour obtenir une plus grande précision dans l’exécution de l’algorithme sont éliminés de la vue minière initiale des observations avec des valeurs NA dans Aucun de ses attributs. Pour cette raison, le nombre d’instances à utiliser est réduit 5453.

Pour déterminer le nombre de groupes idéaux, la technique des carrés d’erreur ou de l’ESS (Somme des carrés) a été exécutée. Des analyses d’annulation ont été effectuées en éliminant les groupes à faible représentativité (moins de 1%).

Groupement Description

La conformation de 4 groupes pourrait être observée avec les distributions suivantes:

  • groupe 1 (499 observations représentant 9,29%)
  • groupe 2 (1260 observations représentant 23,45%)
  • groupe 3 (400 observation représentant 7,44%).
  • groupe 4 (3214 observations représentant 59,82%)

groupe 1 est caractérisé par:

  • de grandes valeurs du fonds de manœuvre, ce qui signifie que des actifs circulants suffisants sont disponibles pour couvrir les dettes à court terme.
  • Valeurs d’actifs mineurs des actifs, qui signifie pourcentage de mineurs de capitaux immobilisés.
  • valeurs seniors d’utilité brute. La valeur souhaitée de cet indicateur est autant que possible et indique la proportion du revenu qui vous permet de couvrir les dépenses autres que le coût de la vente.
  • Marge nette Les valeurs plus élevées, ce qui signifie des avantages plus importants et une plus grande rentabilité.
  • Les valeurs mineures de la rotation des actifs, qui peuvent indiquer une capacité de surveillance ou de ralenti des investissements. La valeur souhaitée pour cet indicateur est le plus grand possible. Plus sa valeur est grande, dans une plus grande mesure, la société utilise ses ressources pour générer des affaires.

groupe 2 est caractérisé par:

  • de grandes valeurs de Raison Current Ce qui pourrait signifier qu’il existe des ressources inactives.
  • valeurs majeures de la rotation du fonds de roulement. Cela signifie une meilleure productivité du fonds de roulement, ce qui se traduit par une meilleure rentabilité. Il convient de signaler qu’un indice élevé peut révéler une insuffisance du fonds de manœuvre.
  • Valeurs de relation avec les ventes dans la plus grande gamme, ce qui signifie que, dans ce groupe, les observations dans lesquelles les ventes correspondent à Le fonds de manœuvre est plus grand. La valeur appropriée de cet indicateur est comprise entre 15 et 20%.

groupe 3 est caractérisé par:

  • valeurs senior des actifs d’actifs, qu’il contient signifie un pourcentage plus élevé de capital immobilisé.
  • Stocks négatifs de couverture de stock, ce qui signifie que le fonds de manœuvre ne couvre pas les stocks.
  • valeurs négatives du financement de manœuvre qui indique qu’il y a Pas assez d’actifs actifs pour traiter des dettes à court terme.
  • Valeurs négatives de marge nettes, rotation du capital de travail et relation de vente. Les valeurs de ces trois indicateurs doivent être supérieures à zéro. Dans le cas de la relation avec les ventes, la juste valeur de l’indicateur est comprise entre 15 et 20%. Il convient de prendre en compte que ces valeurs négatives peuvent correspondre à des affichages ou enregistrements incorrects.
  • Valeurs principales de rentabilité sur les actifs. La valeur souhaitée de cet indicateur est autant que possible et mesure les services publics générant la totalité des ressources avec lesquelles l’entreprise a.
  • valeurs majeures de l’endettement. La valeur recommandée pour cet indicateur est comprise entre 40 et 60%.

groupe 4 est caractérisé par:

  • Valeurs négatives de marge nettes. La valeur de cet indicateur doit être supérieure à zéro.
  • Valeurs de valeur senior des opérations. La valeur souhaitée pour cet indicateur est autant que possible indique que l’utilisation suffisante est générée pour couvrir les besoins de financement.
  • Valeurs négatives de la rotation du capital de roulement. La valeur de cet indicateur doit être supérieure à zéro.

dans les groupes 1, 2 et 3 Les valeurs de l’indicateur de raison endetté présentent un comportement similaire, mais il est nécessaire de souligner qu’ils sont dans un rang supérieur au souhaitable de cet indicateur entre 40 et 60%. Les valeurs des indicateurs Importance de l’actif actuel, de la rotation des immobilisations et de la rotation des stocks présentent un comportement similaire dans tous les groupes et sont dans des plages raisonnables pour ces indicateurs.

Les valeurs des indicateurs de couverture des stocks et de la rotation des immobilisations présentent un comportement similaire dans les groupes 1, 2 et 4 et sont dans des plages raisonnables pour ces indicateurs. De même, les valeurs de l’indicateur de marge d’utilité des opérations ont un comportement similaire dans les groupes 1, 2 et 3, et se situe dans une plage raisonnable pour cet indicateur.

de ce qui précède est conclu que dans le groupe 1 Les observations résultant de l’activité de chacune des unités organisationnelles avec de meilleures performances sont concentrées, assistent aux valeurs moyennes de chacun des indicateurs. Les années les plus représentatives sont entre 2009 et 2013 et les unités organisationnelles correspondent à des divisions commerciales qui sont répétées dans ces années.

D’autre part, les observations avec des valeurs indicatrices se sont concentrées à distance des valeurs souhaitables ou recommandées. Les années les plus représentatives sont les années 2005, 2008 et 2012. Les unités organisationnelles comprennent des divisions territoriales, de soutien et commerciales et sont également répétées dans ces années.

sur la figure 1, ils sont montrés (à titre d’illustration) Distributions de la observations de chaque groupe au fil du temps. Sur l’axe de l’Abscissa, le temps est présenté pour chacun des mois (de janvier à décembre) des années représentées et dans le nombre d’observations correspondant à chaque mois et chaque année.

comme peut être Vu sur la figure 1, le groupe 4 contient la plus grande quantité d’observations et la présence des observations correspondant au groupe 3 avec une plus grande incidence en 2005, 2008 et 2012 est évidente.

Conclusions

L’exploitation minière des données dans le cadre du processus de KDD constitue un outil stratégique pour les entreprises et le soutien à l’appui. Pour sa part, l’extraction des données indirectes vous permet de découvrir des motifs récurrents et des relations cachées dans des ensembles de données. Il est donc pratique pour son application dans des organisations qui n’ont pas d’antécédents d’utilisation de l’exploitation des données. Il est considéré que les objectifs proposés étaient satisfaits, les règles ont été obtenues par des paramètres acceptés à être considérées comme utiles lors de la prise de décision par la direction de la société. De même, les groupes obtenus (motifs) décrivent le comportement associé aux valeurs de chacun des indicateurs et représentent le support pour le travail des fonctionnaires et des gestionnaires.

références

1 . Timaran Pereira R. Architectures d’intégration du processus de découverte des connaissances avec systèmes de gestion de base de données: état d’art. Concurrence. 2001; 3 (2): 45-55.

2. Rygielski C, Wang JC, Yen DC. Techniques d’exploration de données pour la gestion de la relation client. Technol Soc. 2002; 24 (4): 483-502.

3. Vercellis C. Business Intelligence: Mining et optimisation des données pour la prise de décision: John Wiley & fils; 2009.

4. Berry MJA, Linoff G. Techniques d’extraction de données: pour la gestion de la commercialisation, des ventes et de la relation client. 2ème éd. Indianapolis: pub de Wiley; 2004.

5. Fayyad U, Piratetsky Shapiro g, Smyth P. de l’extraction de données à la découverte de la connaissance dans des bases de données. Ai Mag. 1996; 17 (3): 37.

6. Steinhoff JC, Carnahan TL. L’utilisation intelligente de l’exploitation minière des données est une bonne affaire et un bon gouvernement. J GLOV FINANDITE DU GOV. 2012: 17-22.

7. Vimal Kumar D, Tamillarasi A. Exploitation d’association optimisée d’algorithme génétique pour les données multi-relation. Données d’intelligence anal. 2013; 17: 965-80.

8. Lee BJ, Kim Jy. Identification du facteur de risque de diabète de type 2 à l’aide de phénotypes constitués d’anthropométrie et de triglycérides basés sur l’apprentissage de la machine. IEEE J Biomed Health Informez-vous. 2015: 1.

9. Ting ih, lin yc, et al. Que manque-t-il? Utilisation de techniques d’exploration de données avec des phases de cycle économique pour prédire les crises financières de la société. Asie Pac Gestion Rev. 2011; 16 (4): 535-49.

10. Cao L, Yu PS, Zhang C, et al. Mining de données axé sur le domaine. Boston, US: Springer; 2010.

11. Hernández Olalo J, Ramírez Quintana MJ, Ferri Ramírez C. Introduction à l’exploitation des données: Pearson Prentice Hall; 2004.

12. Copextel. CopExtel la solution intégrale. . Disponible à l’adresse suivante: www.copextel.com.cu

13. Witten Ih, Frank E, hall ma. Mining de données: Outils et techniques d’apprentissage pratique de la machine. 3ème éd. Burlington: Morgan Kaufmann; 2011.

14. Chapman P, Clinton J, Kerber R, et al. Guide d’exploration de données CRISP-DM 1.0; 2000.

15. HAHSLER M, BUCHTA C, Grenen B, et al. Arues: Règles d’association minière et des itemsets fréquents. R Package version 1.1-6. 2014.

16. Équipe principale R. Une langue et un environnement pour l’informatique statistique. Vienna, Autriche: R Fonds pour l’informatique statistique; 2014.

17. Venable WN, Smith R. Équipe de base du développement, et d’autres. FR: une introduction à la version de réseau RS 312 Ltd; 2002.

Leave a Comment

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *