Descobriment de coneixement en bases de dades històriques d’una empresa comercialitzadora

ARTICLE ORIGINAL

Descoberta de coneixement en bases de dades històriques d’una empresa comercialitzadora

Knowledge discovery in databases historical of a trading company

Tania Morgado-GarcíaI, Daniel Antonio Ponce-de-Lleó-LimaII, Alejandro Rosete-SuárezIII

I Corporació Copextel SA, l’Havana, Cuba Saragossa II Universitat Estatal Península de Santa Elena, Santa Elena, Equador Saragossa III Universitat Tecnològica de l’Havana José Antonio Echeverría, l’Havana, Cuba

RESUM

Amb l’ desenvolupament de les tecnologies, el volum ingent de les bases de dades i la necessitat d’obtenir coneixement útil d’elles, la mineria de dades es converteix en una eina estratègica per a les empreses, com a suport a la presa de decisions. Una empresa cubana creada l’any 1991, el nom no s’esmenta per raons de confidencialitat, la qual es distingeix per ser un proveïdor de solucions integrals, ofereix productes i serveis enginyers en una variada gamma d’esferes comptant amb un personal altament capacitat. Posseeix grans volums de dades resultants de la gestió de cadascuna de les seves unitats organitzatives, però no es realitzen anàlisis per identificar patrons i comportaments ocults en les dades. En aquest treball es va desenvolupar un procés de Descobriment de Coneixement en Bases de Dades en l’esmentada empresa com ajuda a la presa de decisions. En aquest sentit, es van detallar aspectes relacionats amb la Mineria de Dades i la seva aplicació en l’entorn dels indicadors econòmics-financers i de gestió, es van obtenir models d’associació i agrupament que permetran donar suport al treball dels directius en els diferents nivells de l’ organització.

Paraules clau: mineria de dades, agrupament, coneixement, empresa.

ABSTRACT

With the development of technologies, the big volume of databases and the need to obtain useful knowledge of them, data mining becomes a strategic tool for companies, which support the decision making. A cuban company, created in 1991, whose name is not mentioned for reasons of confidentiality, which is distinguished es a provider of comprehensive solutions, offers products and engineering services in a wide range of àrees with a highly Trained staff. It has large volumes of data resulting from the management of each of its organizational units, but no analysis are done to identify hidden patterns and Behaviors in data. This paper present a process of Knowledge Discovery in Databases in the aforementioned company es an aid to decision making. In this regard, aspects related to mineria de dades and its application in the environment of economic-financial indicators and management were detailed, association and clustering models that will support the work of mànagers at different levels of the organization were Obtained.

Key words: data Minig, grouping, knowledge, company.

INTRODUCCIÓ

en els últims anys, el desenvolupament tecnològic tant en l’àrea de còmput com en la de transmissió de dades , ha fet possible que es gestionin d’una millor manera l’emmagatzematge i maneig de grans volums de dades.Les empreses d’avui es mouen en entorns altament competitius i de canvi continu. La dinàmica de l’mercat condueix a la necessitat de comptar amb la informació adequada en el moment indicat perquè els directius puguin prendre les decisions de negoci apropiades. Per això, han comprès que els grans volums de dades que resideixen en els seus sistemes poden, i deuen, ser analitzats i explotats per obtenir nou coneixement,.

La Mineria de Dades o Explotació d’Informació, és el procés d’extreure coneixement útil, comprensible i nou de grans volums de dades, sent el seu principal objectiu trobar informació oculta o implícita, que no és possible obtenir mitjançant mètodes estadístics convencionals. L’entrada a l’procés de mineria està formada per contenidors d’informació diversos, això inclou bases de dades relacionals, magatzems de dades (Datawarehouse), documents en text lliure, dades de la web, entre d’altres,.

Una definició tradicional la defineixen en, com a un pas de l’procés de KDD (Knowledge Discovery in Databases) que consisteix a aplicar anàlisi a les dades i descobrir algoritmes que, sota limitacions d’eficiència computacional acceptables, produeixen un grup particular de patrons o models sobre les dades .

la mineria de dades ofereix l’oportunitat a les organitzacions de detectar problemes potencials i prendre les accions per evitar-los o mitigar l’impacte.Aplicada apropiadament, la Mineria de Dades li reporta a les organitzacions nombrosos beneficis entre els quals es troben: major eficiència a partir que es consumeix menys temps a corregir errors ia recuperar pagaments; informació anticipada que permet reduir les sorpreses i analitzar les causes dels problemes, i millors controls a través de la prevenció i detecció d’activitats possibilitant el monitoratge de buits de control intern.

El seu camp d’aplicació és ampli i divers, de fet, en totes les activitats on es generen dades. En, i s’exposen diversos exemples de la seva aplicació.

Amb un enfocament no tradicional, en els autors presenten la mineria de dades com un procés sistemàtic i social que involucra els diferents sistemes i fases de la mineria així com seus respectius entorns. A la mineria de dades, els problemes i aplicacions estan normalment envoltats de factors organitzacionals i socials en les diferents empreses. Tals factors conformen l’entorn de mineria de el món real i es fa necessària la seva atenció, ja que reflecteixen les necessitats reals de l’empresa i els usuaris, i constitueixen l’entorn dels coneixements identificats. La intel·ligència que sorgeix de la participació de factors i recursos de l’organització en els patrons de mineria constitueix la intel·ligència organitzacional. Consta de molts aspectes entre els quals es troben:

  • Les estructures organitzatives relacionades amb aspectes claus, com d’on provenen les dades.
  • El comportament organitzacional, pel que fa a la comprensió de l’negoci i les dades, com els individus i grups actuen en l’organització.
  • Les regulacions de l’negoci que inclouen regles, polítiques, protocols, normes.
  • els processos de negoci i els fluxos de treball.
  • els actors de l’organització i les funcions.

el procés de KDD

Fayyad et al. en defineixen el procés de KDD com: “Un procés no trivial d’identificació vàlida, nova, potencialment útil i comprensible de patrons comprensibles que es troben ocults en les dades”. Està compost per cinc fases, les quals es descriuen a continuació:

1. Integració i recopilació de dades: En aquesta fase es determinen les fonts d’informació que poden ser útils i on aconseguir-les.

2. Selecció, neteja i transformació: Inclou detectar els outliers, les dades que faltaven o perduts, construir nous atributs i numerizar o discretitzar els atributs.

3. Mineria de dades: L’objectiu d’aquesta fase és produir nou coneixement. Per a això es construeix un model que no és més que una descripció dels patrons i relacions entre les dades que poden usar-se per fer prediccions, per entendre millor les dades o per explicar situacions passades. Inclou:

  • Escollir el tipus de model.
  • Determinar quin tipus de tasca de Mineria és el més apropiat.
  • Escollir l’algoritme de Mineria que resolgui la tasca i obtingui el tipus de model que s’està buscant.

4. Avaluació i interpretació: Hi ha diferents mesures d’avaluació dels models: precisos, comprensibles (intel·ligibles) i interessants (útils i innovadors).

5. Difusió: Després que el model és construït i validat, aquest pot utilitzar-se en dissemblants finalitats, i durant aquest procés s’han de mesurar la seva evolució. D’aquesta manera se sabrà si ha de ser reavaluat, re-entrenat i possiblement reconstruït completament.

Són diversos els elements a tenir en compte perquè una organització implementi amb èxit el procés de descobriment de coneixement o mineria de dades . En els autors defineixen un conjunt d’aspectes que, més que elements tècnics, representen canvis organitzatius, de mentalitat i culturals a les organitzacions:

  • L’acceptació de la responsabilitat per evitar els problemes de forma proactiva mitjançant l’adopció d’enfocaments i eines de mineria de dades. Això és essencialment una transformació cultural de l’organització.
  • Comprendre el potencial suport que representa la mineria de dades a l’organització tant en la gestió diària com en la presa de decisions estratègiques.
  • determinar com es va a utilitzar el coneixement resultant de l’procés de mineria de dades.
  • Compartir experiències i millors pràctiques.
  • Veure aquest procés com un procés continu.

les activitats de mineria de dades es classifiquen en unes poques categories que depenen de les tasques i els objectius de l’anàlisi. Depenent de l’existència d’una variable objectiu, el procés d’aprenentatge es classifica en:

  • Supervisat o MD directa. Un atribut objectiu representa la classe a la qual cada registre pertany o expressa una quantitat mesurable. S’orienten a la predicció i interpretació respecte a un atribut objectiu.
  • No supervisat o MD Indirecta.Les anàlisis no estan determinats per un atribut objectiu. El seu propòsit és descobrir patrons recurrents i afinitats en conjunts de dades.

A partir d’el propòsit de la mineria de dades indirecta, resulta convenient la seva aplicació a les organitzacions que no posseeixen una història prèvia d’ús de la mateixa.

Una empresa cubana creada l’any 1991 que es distingeix per ser un proveïdor de solucions integrals, ofereix productes i serveis enginyers en una variada gamma d’esferes, comptant amb un personal altament capacitat.

Gran part de la gestió de l’empresa es troba suportada sobre les tecnologies d’informació i les comunicacions. Hi ha un conjunt d’aplicacions informàtiques que suporten els processos claus, de suport i de direcció, a través de les quals es registren en cada unitat organitzativa les dades primàries resulti de la vostra actividad.Estos dades es repliquen als servidors centrals en els quals es disposa de grans volums que daten de l’any 2001.Entre les aplicacions es destaquen les que permeten realitzar de forma automatitza el procés de tancament mensual de la comptabilitat, i la creació d’indicadors econòmics i regles que validen la informació comptable a partir dels indicadors calculats. no obstant això, no s’aprofita el coneixement ocult en aquestes dades, que pugui sustentar determinades accions i decisions per part dels directius de l’empresa.

de el problema anterior es deriva l’objectiu de aquest treball: descobrir patrons, tendències i desviacions en el magatzem de dades corporatiu de l’empresa aplicant tècniques no supervisades de mineria de dades amb vista a millorar el procés de presa de decisiones.Los dades seleccionades per inicialment explorar i buscar patrons i comportaments ocults són els comptables, específicament els indicadors econòmics calculats a partir de l’aplicació que porta el mateix nom.

D’aquesta manera es pretén determinar les relacions que existeixen entre els diferents indicadors econòmics que reflecteixin patrons i / o comportaments, i agrupar les unitats organitzatives atenent el comportament d’aquests indicadors.

MÈTODES

a continuació, es descriuen les tasques de mineria de datosrealizadas, metodologia i eina d’anàlisi de datosusadas, així com les tècniques yalgoritmos d’associació i agrupament utilitzats.

Regles d’Associació

La primera tasca de mineria de dades realitzada va ser l’obtenció de regles d’associació la qual consisteix a identificar patrons regulars i recurrents dins d’un gran grup de transaccions. Les regles apareixen de moltes formes però la formulació més usual és de l’estil “si l’atribut X pren el valor d llavors l’atribut I pren el valor b”. S’avaluen usant dos paràmetres: confiança i suport que també es nomenen precisió i cobertura respectivament.

Agrupament

La segona tasca va ser l’agrupament la qual té com a objectiu subdividir els registres d’un grup de dades en grups homogenis d’observacions, anomenats Clústers. Les dades s’agrupen basant-se en el principi de maximitzar la similitud entre els elements d’un grup minimitzant la similitud entre els diferents grups.

Metodologia i eina d’anàlisi de dades

Es va decidir emprar la metodologia CRISP-DM per al desenvolupament d’aquesta investigaciónporque manté una perspectiva més àmplia pel que fa als objectius empresarials i concep el projecte de KDD de forma global. A més, és una metodologia neutra respecte a l’eina que s’utilitzi per al desenvolupament de la feina i la seva distribució és lliure i gratuïta. En la fase de mineria de dades es va utilitzar com a mètode per trobar les associacions l’algorisme A priori,, i per trobar els grups l’algoritme K-Mitjans,, tots dos desenvolupats en l’eina d’anàlisi de dades R,.

RESULTATS I DISCUSSIÓ

Fase de preparació de les dades

les dades utilitzades en la present investigació procedeixen de la taula H_ Indicadors en què s’emmagatzemen, després d’calculats a partir de la informació comptable que es replica als servidors centrals de cadascuna de les unitats organitzatives de l’empresa, els indicadors econòmics resultants de la seva operació i gestió. Es va modificar, mitjançant consulta SQL, l’estructura original del conjunt de dades de forma tal que cada un dels indicadors constitueixi una variable, i d’aquesta manera facilitar la seva anàlisi. Es van eliminar registres amb valors nuls. L’estructura resultant es mostra a la Taula 1:

La selecció de característiques redueix la mida de les dades triant les variables més influents en el problema. La revisió detallada de cada indicador reflecteix que hi ha indicadors que totalitzen, és a dir que són el resultat d’operacions aritmètiques entre d’altres indicadors, o uns contenen als altres. A més, tots els indicadors són variables comptables de l’empresa.Per aquest motiu es decideix calcular nous indicadors d’eficiència que permetin realitzar anàlisis i comparacions a partir de les variables originals.

Construcció de característiques

La creació o construcció de característiques consisteix a crear nous atributs per millorar la qualitat, visualització i comprensibilitat de el coneixement extret.

a la Taula 2 es mostren els nous indicadors calculats a partir dels originals, amb una breu descripció i fórmula de càlcul.

amb l’objectiu d’obtenir dades amb més qualitat i complir els requeriments de les tècniques seleccionades es realitzen noves transformacions sobre les variables. Per a això s’utilitza la tècnica de discretització. Es segmentaron cadascun dels indicadors en 6 grups atenent els requeriments i valors esperats de cada un. A més, es discretizaron les variables IdGerencia segons el tipus d’unitat organitzativa (Divisió Comercial, Divisió de Suport, Serveis Tècnics o Divisió Territorial), i mes segons els trimestres de l’any. A la Taula 3 es mostren les variables resultants i el mètode de segmentació utilitzat.

Fase de Mineria de dades: Tasca descriptiva Regles d’associació

Es va utilitzar l’algoritme A priori. Es van obtenir valors de confiança i suport molt elevats. Es van trobar regles amb valors de suport i confiança al voltant de 0.80 i 0.90respectivamente.

A continuació, les regles de més interès:

  • La cobertura d’estoc en el rang, el marge d’utilitat d’operacions en el rang% i la rotació de l’capital de treball en el rang impliquen que la rotació d’existències es troba en el rang.
  • la rotació d’existències en el rang implica que el marge d’utilitat d’operacions es troba en el rang%, i viceversa.
  • la raó d’endeutament en el rang% implica que la rotació d’existències es troba en el rang.
  • la raó d’endeutament en el rang% i la rotació d’existències en el rang impliquen que el marge d’utilitat d’operacions es troba en el rang%.
  • la raó corrent en el rang i la raó d’endeutament en el rang % impliquen que el marge d’utilitat d’operacions es troba en el rang%.
  • La cobertura d’estocs en el rang implica ca que la rotació d’existències es troba en el rang.
  • La cobertura d’estocs en el rang implica que el marge d’utilitat d’operacions es troba en el rang%.
  • El marge d’utilitat d’operacions en el rang% i la raó d’endeutament en el rang% impliquen que la rotació d’existències es troba en el rang.
  • la rotació de l’capital de treball en el rang implica que la rotació de existències es troba en el rang.
  • Si la divisió és comercial (a) implica que la rotació d’existències es troba en el rang.

Tots els indicadors es van utilitzar en l’algoritme aplicat, però alguns no van resultar interessants: marge d’utilitat bruta, marge net, rendibilitat sobre actius, fons de maniobra, rotació d’actius i rotació d’actius fixos, entre d’altres. D’altra banda, com s’aprecia en les regles anteriorment exposades, les característiques que millor descriuen les relacions, són: cobertura d’estoc, marge d’utilitat d’operacions, rotació de l’capital de treball, rotació d’existències, raó d’endeutament i raó corrent. Els resultats obtinguts mostren les relacions entre els indicadors, algunes lògiques i evidents però que ofereixen una altra perspectiva per a l’anàlisi de l’activitat a l’empresa. Representen un coneixement valuós per a l’organització a l’disposar dels indicadors recurrents, les associacions entre ells i en què rang de valors es troben.

En aquest sentit, cal destacar que la raó d’endeutament en tots els casos es presenta en el rang%. El valor recomanat se situa entre 40 i 60%, no obstant això, quan tendeix a zero l’empresa té més solidesa perquè es finança amb recursos propis. En el nostre cas, es troba corregut el valor per sobre de el límit superior recomanat.

Fase de Mineria de dades: Tasca descriptiva Agrupament

En aquesta secció es mostren els experiments realitzats amb l’objectiu de trobar possibles agrupacions entre les instàncies d’acord a les seves característiques, aplicant l’algoritme K-mitjanes en R.

Per aconseguir més precisió en l’execució de l’algoritme s’eliminen de la vista minable inicial les observacions amb valors NA a qualsevol dels seus atributs. Per aquest motiu la quantitat d’instàncies a utilitzar es redueix 5453.

Per a determinar la quantitat de grups ideal es va executar la tècnica Suma de Quadrats d’Error o SSE (Sum of Squares Error en anglès). Es van realitzar anàlisi de grups imbricats rebutjant els grups amb baixa representativitat (inferior a 1%).

Descripció de l’agrupament

Es va poder observar la conformació de 4 grups amb les següents distribucions:

  • Grup 1 (499 observacions que representen el 9.29% )
  • Grup 2 (1260 observacions que representen el 23.45%)
  • Grup 3 (400 observació que representa el 7.44%).
  • Grup 4 (3214 observacions que representen el 59.82%)

el Grup 1 es caracteritza per:

  • Valors més grans de el fons de maniobra el que significa que es disposa d’actius circulants suficients per cobrir els deutes a curt termini.
  • Valors menors d’immobilització d’actius, que significa porcientos menors de capital immobilitzat.
  • Valors majors de marge d’utilitat bruta. El valor desitjat per a aquest indicador és el major possible i indica la proporció de l’ingrés que permet cobrir les despeses diferents a el cost de venda.
  • Valors majors de marge net del que significa més beneficis i major rendibilitat.
  • Valors menors de rotació d’actius del que pogués indicar sobredimensionament o capacitat ociosa en les inversions. El valor desitjat per a aquest indicador és el major possible. Com més gran és el seu valor, en major mesura l’empresa utilitza els seus recursos per generar negoci.

El Grup 2 es caracteritza per:

  • Valors majors de raó corrent el que pogués significar que hi ha recursos ociosos.
  • Valors majors de rotació de l’capital de treball. Això vol dir millor productivitat de l’capital de treball, la qual cosa es tradueix en una millor rendibilitat. S’ha de tenir present que un índex elevat pot revelar insuficiència de el fons de maniobra.
  • Valors de relació amb les vendes en el major rang, el que significa que en aquest grup es troben les observacions en què el per cent de les vendes que correspon a el fons de maniobra és més gran. El valor adequat per a aquest indicador és entre el 15 i 20%.

El Grup 3 es caracteritza per:

  • Valors majors d’immobilització d’actius, que significa majors porcientos de capital immobilitzat.
  • Valors negatius de cobertura d’estocs el que significa que el fons de maniobra no cobreix els inventaris.
  • Valors negatius de fons de maniobra el que indica que no es compta amb suficients actius per fer front als deutes a curt termini.
  • Valors negatius de marge net, rotació de capital de treball i relació amb les vendes. Els valors d’aquests tres indicadors han de ser més grans que zero. En el cas de la relació amb les vendes el valor raonable de l’indicador és entre el 15 i el 20%. S’ha de tenir en compte que aquests valors negatius poden correspondre a comptabilitzacions o registres incorrectes.
  • Valors majors de rendibilitat sobre actius. El valor desitjat per a aquest indicador és el més gran possible i mesura les utilitats que generen els recursos totals amb què compta el negoci.
  • Valors majors de raó d’endeutament. El valor recomanat per aquest indicador és entre el 40 i 60%.

El Grup 4 es caracteritza per:

  • Valors negatius de marge net. El valor d’aquest indicador ha de ser més gran que zero.
  • Valors majors de marge d’utilitat d’operacions. El valor desitjat per a aquest indicador és el major possible i indica que s’està generant suficient utilitat per cobrir les necessitats de finançament.
  • Valors negatius de rotació de capital de treball. El valor d’aquest indicador ha de ser més gran que zero.

En els grups 1, 2 i 3 els valors de l’indicador Raó d’Endeutament presenten un comportament similar, però cal destacar que es troben en un rang superior a l’desitjable per aquest indicador que és entre el 40 i 60%. Els valors dels indicadors importància de l’actiu corrent, rotació d’actius fixos i rotació d’existències presenten un comportament similar en tots els grups, i es troben en rangs raonables per a aquests indicadors.

Els valors dels indicadors cobertura d’estocs i rotació d’actius fixos presenten un comportament similar en els grups 1, 2 i 4, i es troben en rangs raonables per a aquests indicadors. De manera similar, els valors de l’indicador marge d’utilitat d’operacions presenten un comportament similar en els grups 1, 2 i 3, i es troba en un rang raonable per a aquest indicador.

De l’anterior es conclou que en el Grup 1 es concentren les observacions resultants de l’activitat de cadascuna de les unitats organitzatives amb millor acompliment, atenent els valors mitjans de cada un dels indicadors. Els anys més representatius es troben entre el 2009 i 2013 i les unitats organitzatives es corresponen amb divisions comercials que es repeteixen en aquests anys.

Per la seva banda, en el Grup 3 es concentren les observacions amb valors d’indicadors allunyats dels valors desitjables o recomanats. Els anys més representatius són 2005, 2008 i 2012. Les unitats organitzatives comprenen divisions territorials, de suport i comercials i igualment es repeteixen en aquests anys.

A la Figura 1 es mostren (a manera d’il·lustració) les distribucions de les observacions de cada grup en el temps. A l’eix de les abscisses es presenta el temps per cada d’un dels mesos (de gener a desembre) dels anys representats, i en el de les ordenades la quantitat d’observacions corresponents a cada mes i any.

Com s’aprecia a la Figura 1, el Grup 4 conté la major quantitat d’observacions i s’evidencia la presència de les observacions corresponents a el Grup 3 amb major incidència en els anys 2005, 2008 i 2012.

CONCLUSIONS

la mineria de dades com a part de el procés de KDD constitueix una eina estratègica per a les empreses i de suport en la presa de decisions. Per la seva banda, la mineria de dades indirecta permet descobrir patrons recurrents i relacions ocultes en conjunts de dades, pel que resulta convenient la seva aplicació a les organitzacions que no posseeixen una història prèvia d’ús de la mineria de dades. Es considera que es van complir els objectius proposats, es van obtenir regles que presenten paràmetres acceptats per a ser considerades útils durant la presa de decisions per la direcció de l’empresa. Igualment, els grups obtinguts (patrons) descriuen el comportament associat als valors de cada un dels indicadors, i representen un suport a la feina de funcionaris i directius.

REFERÈNCIES

1. Timarán Pereira R. Arquitectures d’integració de l’procés de descobriment de coneixement amb sistemes de gestió de bases de dades: un estat de l’art. Ing Compet. 2001; 3 (2): 45-55.

2. Rygielski C, Wang JC, ien DC. Data mining techniques for customer relationship management. Technol Soc. 2002; 24 (4): 483-502.

3. Vercellis C. Business Intelligence: Data Mining and Optimization for Decision Making: John Wiley & Sons; 2009.

4. Berry MJA, Linoff G. Data mining techniques: for màrqueting, sals, and customer relationship management. 2nd ed. Indianapolis: Wiley Pub; 2004.

5. Fayyad O, Piatetsky Shapiro G, Smyth P. From data mining to knowledge discovery in databases. AI Mag. 1996; 17 (3): 37.

6. Steinhoff JC, Carnahan TL. Smart Use of Data Mining is Good Business and Good Government. J Gov Financ Manag. 2012: 17-22.

7. Vimal Kumar D, Tamilarasi A. Genetic algorithm-based optimized association rule mining for multi-relational data. Intell Data Anal. 2013; 17: 965-80.

8. Llegeix BJ, Kim JI. Identification of Type 2 Diabetes Risk Factor using Phenotypes consisting of Anthropometry and triglicèrids based on Machine Learning. IEEE J Biomed Health Inform. 2015: 1.

9. Ting IH, Lin IC, et al. What is Missing? Using Data Mining Techniques with Business Cycle Fases for Predicting Company Financial Crises. Àsia Pac Manag Rev. 2011; 16 (4): 535-49.

10. Cao L, Yu PS, Zhang C, et al. Domain Driven Data Mining. Boston, US: Springer; 2010.

11. Hernández Orallo J, Ramírez Quintana MJ, Ferri Ramírez C. Introducció a la Mineria de Dades: Pearson Prentice Hall; 2004.

12. Copextel. Copextel La Solució Integral. . Disponible a: www.copextel.com.cu

13. Witten IH, Frank E, Hall MA. Data mining: practical machine learning tools and techniques. 3rd ed. Burlington: Morgan Kaufmann; 2011.

14. Chapman P, Clinton J, Kerber R, et al. CRISP-DM 1.0 Step-by-step data mining guide; 2000.

15. Hahsler M, Buchta C, Gruen B, et al. Arules: Mining Association Rules and Frequent Itemsets. R package version 1.1-6. 2014.

16. Core Team R. A Language and Environment for Statistical Computing. Vienna, Àustria: R Foundation for Statistical Computing; 2014.

17. Venables WN, Smith R. Development Core Team, i others. En: An introduction to R versió 312 Network Theory Ltd; 2002.

Leave a Comment

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *