Scoperta della conoscenza nei database storici di una società di marketing

Articolo originale

Scoperta della conoscenza nei database storici di una società di marketer

Scoperta della conoscenza nei database Storico di una società commerciale

Tania Morgado-Garcíai, Daniel Antonio Ponce-de-León-Limaii, Alejandro Rosete-Suáreziii

I Corporation Copextel SA, L’Avana, Cuba
II Università Statale di Santa Elena, Santa Elena, Ecuador
III Università Tecnologica dell’Avana José Antonio Echeverría, L’Avana, Cuba

Riepilogo

Con lo sviluppo delle tecnologie, il volume enorme di I database e la necessità di ottenere una conoscenza utile di loro, il data mining diventa uno strumento strategico per le aziende, come supporto per il processo decisionale. Una società cubana creata nel 1991, il cui nome non è menzionato per motivi di riservatezza, che si distingue per essere un fornitore di soluzioni integrali, offre prodotti e servizi ingegneri in una vasta gamma di sfere con uno staff altamente qualificato. Ha grandi volumi di dati derivanti dalla gestione di ciascuna delle sue unità organizzative, ma non vengono eseguite analisi per identificare modelli e comportamenti nascosti nei dati. In questo lavoro, è stato sviluppato un processo di scoperta della conoscenza dei database nella società di cui sopra come aiuto per il processo decisionale. A tale riguardo, gli aspetti relativi al data mining e la sua applicazione nell’ambiente degli indicatori economico-finanziari e di gestione sono stati predisposti, è stato ottenuto modelli di associazione e raggruppamento che supporterà il lavoro dei gestori ai diversi livelli dell’organizzazione.

Parole chiave: data mining, raggruppamento, conoscenza, azienda.

Astratto

Con lo sviluppo di tecnologie, il grande volume di database e la necessità di ottenere una conoscenza utile di loro, Il data mining diventa uno strumento strategico per le aziende, che supportano il processo decisionale. Una società cubana, creata nel 1991, il nome di Whoe non è menzionato per motivi di riservatezza, perché si distingue come fornitore di componenti di soluzioni Compinisce, offre prodotti e servizi di ingegneria in una vasta gamma di aree con uno staff altamente qualificato. Ha grandi volumi di dati risultanti dalla gestione di ciascuna delle unità organizzative dei siti, ma non vengono eseguite analisi per identificare modelli e comportamenti nascosti nei dati. Questo documento presenta un processo di rilevamento della conoscenza nei database nella suddetta società come aiuto per il processo decisionale. A tale riguardo, gli aspetti relativi al data mining e si siedono l’applicazione nell’ambiente degli indicatori e di gestione economico-finanziari sono stati dettagliati, è stato ottenuto i modelli di associazione e clustering che supportano il lavoro dei dirigenti a diversi livelli dell’organizzazione.

parole chiave: dati minig, raggruppamento, conoscenza, società.

Introduzione

Negli ultimi anni, lo sviluppo tecnologico sia nell’area di trasmissione informatica che di trasmissione dati, ha reso possibile Lo stoccaggio e la gestione di grandi volumi di dati. Oggi le aziende si spostano in ambienti altamente competitivi e un cambiamento continuo. La dinamica del mercato porta alla necessità di avere informazioni adeguate al momento indicato in modo che i manager possano prendere decisioni aziendali appropriate. Pertanto, hanno capito che i grandi volumi di dati che risiedono sui loro sistemi possono essere analizzati e sfruttati per ottenere nuove conoscenze,.

Data mining o sfruttamento delle informazioni è il processo per estrarre utile, comprensibile e innovativo Conoscenza di grandi volumi di dati, il suo obiettivo principale è quello di trovare informazioni nascoste o implicite, che non è possibile ottenere attraverso metodi statistici convenzionali. L’ingresso del processo di mineralizzazione è formato da vari contenitori di informazioni, questo include database relazionali, negozi di dati (Datawarehouse), documenti nel testo gratuito, dati web, tra gli altri,.

una definizione tradizionale definiscila, come gradino del processo KDD (scoperta della conoscenza nei database) che consiste nell’applicare l’analisi dei dati e la scoperta di algoritmi che, in termini di limitazioni di efficienza computazionale accettabili, producono un particolare gruppo di modelli o modelli sui dati.

Data Mining Offre l’opportunità di organizzazioni per rilevare potenziali problemi e prendere le azioni per evitarle o mitigare l’impatto.Applicato in modo appropriato, i dati minerari dei dati relativi alle organizzazioni numerose vantaggi tra: maggiore efficienza da cui viene consumata meno tempo per correggere gli errori e recuperare i pagamenti; Informazioni anticipate che ti permette di ridurre le sorprese e analizzare le cause dei problemi e i migliori controlli attraverso la prevenzione e il rilevamento delle attività che consentono il monitoraggio dei fori di controllo interno.

Il campo dell’applicazione è ampio e diverso, infatti, in Tutte le attività in cui vengono generati i dati. In, e diversi esempi della sua applicazione sono esposti.

Con un approccio non tradizionale, gli autori presentano il data mining come un processo sistematico e sociale che coinvolge i diversi sistemi e fasi di minerario e dei loro rispettivi ambienti. Nel data mining, i problemi e le applicazioni sono normalmente circondati da fattori organizzativi e sociali in diverse società. Tali fattori costituiscono l’ambiente minerario del mondo reale e la loro attenzione è necessaria, in quanto riflettono le reali esigenze dell’azienda e degli utenti e costituiscono l’ambiente della conoscenza identificata. L’intelligenza che nasce dalla partecipazione di fattori e risorse dell’organizzazione nei modelli minerari costituisce un’intelligenza organizzativa. Consiste di molti aspetti tra cui:

  • le strutture organizzative relative a aspetti chiave, come laddove i dati provengono da.
  • comportamento organizzativo, come per la comprensione di Il business e i dati, come gli individui e i gruppi agiscono nell’organizzazione.
  • Regolamenti aziendali che includono regole, politiche, protocolli, standard.
  • Processi aziendali e i flussi di lavoro.
  • Gli attori dell’organizzazione e delle sue funzioni.

Il processo KDD

Fayyad et al. Nel definire il processo di KDD come: “un processo non banale di schemi validi, nuovi, potenzialmente utili e comprensibili che sono nascosti nei dati”. È composto da cinque fasi, che sono descritte di seguito:

1. Integrazione e raccolta dei dati: in questa fase, le fonti di informazione sono determinate che possono essere utili e dove prenderli.

2. Selezione, pulizia e trasformazione: include rilevamento dei valori anomali, dati mancanti o persi, costruendo nuovi attributi e numeri o discretizza gli attributi.

3. Data Mining: l’obiettivo di questa fase è quello di produrre nuove conoscenze. Per questo, è costruito un modello che non è altro che una descrizione dei modelli e delle relazioni tra i dati che possono essere utilizzati per effettuare previsioni, per comprendere meglio i dati o per spiegare situazioni passate. Include:

  • Scegli il tipo di modello.
  • Determina che tipo di attività mineraria è il più appropriato.
  • Scegli l’algoritmo minerario che risolve il Attività e ottieni il tipo di modello che stai cercando.

4. Valutazione e interpretazione: ci sono diverse misure di valutazione dei modelli: accurati, comprensibili (intelligibili) e interessanti (utili e romanzi).

5. Diffusione: dopo che il modello è stato costruito e convalidato, questo può essere utilizzato in scopi dissimili, e durante questo processo dovrebbe essere misurata la sua evoluzione. In questo modo sarà conosciuto se deve essere rivalutato, ri-addestrato e possibilmente ricostruito completamente.

sono diversi gli elementi da prendere in considerazione per un’organizzazione attuata con successo il processo di scoperta di conoscenze o dati minerario. Negli autori definiscono un insieme di aspetti che, più degli elementi tecnici, rappresentino organizzativi, mentalità e cambiamenti culturali nelle organizzazioni:

  • l’accettazione della responsabilità per evitare problemi in modo proattivo attraverso l’adozione di approcci di data mining e strumenti. Questa è essenzialmente una trasformazione culturale dell’organizzazione.
  • Comprendi il potenziale supporto rappresentato dal data mining all’organizzazione sia nella gestione quotidiana che nel processo decisionale strategico.
  • Determina come conoscenza derivante dal verrà utilizzato il processo di data mining.
  • Condividi esperienze e best practice.
  • Vedi questo processo come processo continuo.

Le attività di data mining sono classificato in alcune categorie che dipendono dai compiti e dagli obiettivi dell’analisi. A seconda dell’esistenza di una variabile target, il processo di apprendimento è classificato in:

  • supervisionato o diretto MD. Un attributo obiettivo rappresenta la classe in cui ogni record appartiene o esprime una quantità misurabile. Sono orientati alla previsione e all’interpretazione rispetto ad un attributo obiettivo.
  • non supervisionato o md indiretto o indiretto.Le analisi non sono determinate da un attributo obiettivo. Il suo scopo è quello di scoprire motivi ricorrenti e affinità nei set di dati.

Sulla base dello scopo del data mining indiretto, la sua applicazione è conveniente nelle organizzazioni che non possiedono una storia d’uso precedente della stessa .

un’azienda cubana creata nel 1991 che si distingue per essere un fornitore di soluzioni completo, offre prodotti e servizi di prodotti in una vasta gamma di sfere, con uno staff altamente qualificato.

Molto della gestione della società è supportata sulle tecnologie dell’informazione e delle comunicazioni. Esiste una serie di applicazioni informatiche che supportano i processi chiave, il supporto e la gestione, attraverso i quali i dati primari sono registrati in ciascuna unità organizzativa. Questi dati vengono replicati ai server centrali in cui è disponibile dei grandi volumi risalenti all’anno 2001 . Le applicazioni sono evidenziate, che ci consentono di eseguire automaticamente il processo di chiusura mensile della contabilità e la creazione di indicatori economici e le regole che convalidano le informazioni contabili dagli indicatori calcolati. Tuttavia, la conoscenza nascosta in questi dati non è utilizzata, che può Sostenere determinate azioni e decisioni da parte dei dirigenti della Società.

del precedente problema deriva dall’obiettivo di questo lavoro: scoprire modelli, tendenze e deviazioni nel magazzino dei dati aziendali della società applicando Tecniche di data mining supervisionate al fine di migliorare Il processo decisionale. I dati selezionati per esplorare inizialmente e cercare modelli e comportamenti nascosti sono i ragionieri, in particolare gli indicatori economici calcolati dall’applicazione che porta lo stesso nome.

In questo modo. Mira a determinare le relazioni che esistono tra i diversi indicatori economici che riflettono modelli e / o comportamenti e raggruppano le unità organizzative che frequentano il comportamento di questi indicatori.

Metodi

Avanti, Descrivi il Attività di mineralizzazione dei dati, metodologia e strumento di analisi dei dati, nonché tecniche di associazione e raggruppamento utilizzate.

Regole di associazione

Il primo compito minerario dei dati condotti è stato l’ottenimento delle regole di associazione che consiste siano state l’ottenimento delle regole di associazione di identificare i modelli regolari e ricorrenti all’interno di un grande gruppo di transazioni. Le regole appaiono in molti modi, ma la formulazione più abituale è in stile “Se l’attributo X prende il valore D quindi l’attributo e prende il valore B”. Vengono valutati utilizzando due parametri: fiducia e supporto che sono anche nominati con precisione e copertura rispettivamente.

Raggruppamento

Il secondo compito è stato il raggruppamento che mira a suddividere i record di un gruppo di Dati in gruppi omogenei di osservazioni, chiamati cluster. I dati sono raggruppati in base al principio di massimizzare la somiglianza tra gli elementi di un gruppo riducendo al minimo la somiglianza tra i diversi gruppi.

Metodologia e strumento di analisi dei dati

è stato deciso di impiegare La metodologia Crisp-DM per lo sviluppo di questa inchiesta mantiene una prospettiva più ampia rispetto agli obiettivi aziendali e concepisce il progetto KDD a livello globale. Inoltre, è una metodologia neutrale per quanto riguarda lo strumento utilizzato per lo sviluppo del lavoro e la sua distribuzione è gratuita e gratuita. Nella fase di data mining, è stato utilizzato come metodo per trovare associazioni l’algoritmo a priori, e per trovare i gruppi l’algoritmo K-significa che entrambi sviluppati nello strumento di analisi dei dati r,.

Risultati e Discussione

Fase della preparazione dei dati

I dati utilizzati nell’attuale indagine provengono dalla tabella H_ Indicatori in cui sono memorizzati, dopo aver calcolato dalle informazioni contabili hanno risposto ai server centrali Di ciascuna delle unità organizzative della Società, gli indicatori economici derivanti dal suo funzionamento e gestione. È stato modificato, dalla query SQL, la struttura originale del set di dati in modo che ciascuno degli indicatori costituisca una variabile, e in questo modo facilitano la sua analisi. I record con valori nullo sono stati rimossi. La struttura risultante è mostrata nella tabella 1:

La selezione delle funzionalità riduce la dimensione dei dati scegliendo le variabili più influenti nel problema. La revisione dettagliata di ciascun indicatore riflette che ci sono indicatori che totali, cioè, sono il risultato di operazioni aritmetiche tra gli altri indicatori, o alcuni contengono altri. Inoltre, tutti gli indicatori sono variabili contabili della società.Per questo motivo, viene deciso di calcolare nuovi indicatori di efficienza che consentono analisi e confronti dalle variabili originali.

Costruzione di funzioni

La creazione o la costruzione delle caratteristiche è creare nuovi attributi Per migliorare la qualità, la visualizzazione e la comprensibilità della conoscenza estratta.

Tabella 2 mostra i nuovi indicatori calcolati dagli originali, con una breve descrizione e formula di calcolo.

con lo scopo di ottenere Dati con una qualità superiore e soddisfano i requisiti delle tecniche selezionate, vengono eseguite nuove trasformazioni sulle variabili. Per questo, viene utilizzata la tecnica di discretizzazione. Ciascuno degli indicatori è stato smesso in 6 gruppi in base ai requisiti e ai valori attesi di ciascuno. Inoltre, le variabili sono state discreta, secondo il tipo di unità organizzativa (divisione commerciale, divisione di sostegno, servizi tecnici o divisione territoriale) e mese secondo i trimestri dell’anno. La Tabella 3 mostra le variabili risultanti e il metodo di segmentazione utilizzato.

data mining: regole di associazione attività descrittiva

è stato utilizzato l’algoritmo a priori. Sono stati ottenuti molto elevati valori di confidenza e supporto. Le regole sono state trovate con supporti e valori di confidenza intorno allo 0,80 e 0,90Sesivamente.

Avanti, le regole del maggiore interesse:

  • copertura di riserva della gamma, il profitto operativo Il margine nella gamma% e la rotazione del capitale circolante nell’intervallo comportano che la rotazione delle scorte è nell’intervallo.
  • La rotazione dello stock nella gamma implica che il margine dell’utilità operativa sia nella% intervallo e viceversa.
  • Il rapporto tra indebitamento nella gamma% implica che la rotazione del magazzino è nell’intervallo.
  • il motivo dell’indebitamento nella gamma% e della rotazione Di azioni nell’intervallo comportano che il margine di profitto operativo è nella gamma%.
  • Il motivo corrente nella gamma e il rapporto del rapporto nella gamma% comportano che il margine di profitto operativo si trova nel%.
  • Coperzione stock nella gamma IMPLIC CA che la rotazione delle scorte si trova nell’intervallo.
  • La copertura delle azioni nella gamma implica che il margine di profitto operativo è nella gamma%.
  • il margine usando le operazioni nell’intervallo% e Il rapporto tra indebitamento nella gamma% comporta la rotazione delle scorte è nell’intervallo.
  • La rotazione del capitale circolante nella gamma implica che la rotazione del magazzino è nell’intervallo.
  • Se la divisione è commerciale implica che la rotazione del magazzino è compresa nella gamma.

Tutti gli indicatori sono stati utilizzati nell’algoritmo applicato, ma alcuni non erano interessanti: margine di utilità bruta, Margine netto, redditività su beni, manovre, rotazione patrimoniale e rotazione delle risorse fisse, tra gli altri. D’altra parte, come si può vedere nelle regole precedentemente esposte, le caratteristiche che meglio descrivono le relazioni, sono: stockovernance, margine di profitto operativo, capitale circolante, rotazione delle scorte, rapporto di rapporto e ragione corrente. I risultati ottenuti mostrano le relazioni tra gli indicatori, alcuni logici ed ovvi ma che offrono un’altra prospettiva per l’analisi dell’attività in azienda. Rappresentano una preziosa conoscenza per l’organizzazione con indicatori ricorrenti, le associazioni tra loro e in quale intervallo di valori sono.

A questo proposito, sottolinea che il rapporto tra indebitamento in tutti i casi è presentato nell’intervallo %. Il valore consigliato è compreso tra il 40 e il 60%, tuttavia, quando tende a zero, la Società è più solida perché è finanziata con le proprie risorse. Nel nostro caso, il valore viene eseguito sopra il limite superiore consigliato.

Fase di data minerario: Descrittivo Task Cluster

In questa sezione, gli esperimenti eseguiti con l’obiettivo sono mostrati per trovare il possibile raggruppamenti tra i casi in base alle loro caratteristiche, applicando l’algoritmo K-significa in r.

per ottenere una maggiore precisione nell’esecuzione dell’algoritmo viene eliminato dalla vista iniziale minabile le osservazioni con valori na Uno dei suoi attributi. Per questo motivo, il numero di istanze da utilizzare è ridotto 5453.

Per determinare il numero di gruppi ideali, è stata eseguita la tecnica dei quadrati di errore o SSE (Sum of Squares Error). Le analisi annuali sono state eseguite scartando i gruppi con bassa rappresentatività (meno dell’1%).

Raggruppamento Descrizione

La conformazione di 4 gruppi potrebbe essere osservata con le seguenti distribuzioni:

  • Gruppo 1 (499 osservazioni che rappresentano il 9,29%)
  • Gruppo 2 (1260 osservazioni che rappresentano il 23,45%)
  • Group 3 (400 osservazione che rappresenta il 7,44%).
  • Gruppo 4 (3214 osservazioni che rappresentano il 59,82%)

Group 1 è caratterizzato da:

  • Valori maggiori del fondo di manovre che significa che sono disponibili attività circolanti sufficienti per coprire i debiti a breve termine.
  • Valori patrimoniali minori di attività, il che significa percentuale minori di capitale immobilizzato.
  • Valori anziani dell’utilità bruta. Il valore desiderato per questo indicatore è il più possibile e indica la proporzione del reddito che consente di coprire le spese diverse dai costi di vendita.
  • margine netto Valori superiori del margine che significano maggiori benefici e maggiore redditività.
  • Valori minori della rotazione delle attività, che possono indicare una capacità di sovradimensionamento o inattiva negli investimenti. Il valore desiderato per questo indicatore è il più grande possibile. Maggiore è il suo valore, in misura maggiore, l’azienda utilizza le sue risorse per generare business.

Group 2 è caratterizzato da:

  • I più valori di Motivo corrente Cosa potrebbe significare che ci sono risorse inattivi.
  • valori principali della rotazione del capitale circolante. Ciò significa una migliore produttività del capitale circolante, che si traduce in una migliore redditività. Dovrebbe essere riferito che un alto indice può rivelare l’insufficienza del fondo di manovra.
  • Valori di relazione con le vendite nella massima gamma, il che significa che in questo gruppo le osservazioni in cui la percentuale le vendite corrispondenti Il fondo di manovra è maggiore. Il valore appropriato per questo indicatore è compreso tra il 15 e il 20%.

Group 3 è caratterizzato da:

  • Valori anziani delle risorse patrimoniali, che è significa percentuale più alta di capitale immobilizzato.
  • scorte negative della copertura delle scorte che significa che il fondo di manovra non copre gli inventari.
  • valori negativi dei finanziamenti di manovra che indica che c’è Non è sufficiente attività attiva per affrontare i debiti a breve termine.
  • Valori negativi del margine netto, rotazione del capitale circolante e relazione di vendita. I valori di questi tre indicatori devono essere maggiori di zero. Nel caso del rapporto con le vendite, il fair value dell’indicatore è compreso tra il 15 e il 20%. Va tenuto conto del fatto che questi valori negativi possono corrispondere a registrazioni o record errati.
  • valori anziani della redditività sui beni. Il valore desiderato per questo indicatore è il più possibile e misura le utility che generano le risorse totali con cui l’azienda ha.
  • valori importanti dell’indebitamento. Il valore consigliato per questo indicatore è compreso tra il 40 e il 60%.

Group 4 è caratterizzato da:

  • Valori negativi del margine netto. Il valore di questo indicatore deve essere maggiore di zero.
  • Valore del valore senior delle operazioni. Il valore desiderato per questo indicatore è il più possibile indica che viene generato un uso sufficiente per coprire le esigenze di finanziamento.
  • Valori negativi della rotazione del capitale circolante. Il valore di questo indicatore deve essere maggiore di zero.

In gruppi 1, 2 e 3 I valori dell’indicatore motivo indebitato presentano un comportamento simile, ma è necessario sottolineare che sono in un rango sopra il desiderabile per questo indicatore compreso tra il 40 e il 60%. I valori dell’importanza degli indicatori dell’attività corrente, la rotazione delle immobilizzazioni e la rotazione delle scorte presentano un comportamento simile in tutti i gruppi e sono in gamme ragionevoli per questi indicatori.

I valori degli indicatori di copertura delle scorte e della rotazione delle immobilizzazioni presentano un comportamento simile nei gruppi 1, 2 e 4, e sono in range ragionevoli per questi indicatori. Allo stesso modo, i valori dell’indicatore del margine di utilità operative hanno un comportamento simile in gruppi 1, 2 e 3, ed è in un range ragionevole per questo indicatore.

di quanto sopra è concluso che nel Gruppo 1 Le osservazioni derivanti dall’attività di ciascuna delle unità organizzative con prestazioni migliori sono concentrate, frequentando i valori medi di ciascuno degli indicatori. Gli anni più rappresentativi sono tra il 2009 e il 2013 e le unità organizzative corrispondono a divisioni commerciali che vengono ripetute in questi anni.

D’altra parte, le osservazioni con i valori dell’indicatore si sono concentrati da remoti dai valori desiderabili o consigliati. Gli anni più rappresentativi sono il 2005, il 2008 e il 2012. Le unità organizzative comprendono divisioni territoriali, di supporto e commerciali e sono ugualmente ripetute in questi anni.

In figura 1 sono mostrati (per via di illustrazione) distribuzioni del osservazioni di ciascun gruppo nel tempo. Sull’asse dell’Ascissa, il tempo è presentato per ciascuno dei mesi (da gennaio a dicembre) degli anni rappresentati e nel numero di osservazioni corrispondenti a ogni mese e anno.

Come può essere Visto nella figura 1, il Gruppo 4 contiene la massima quantità di osservazioni e la presenza delle osservazioni corrispondenti al Gruppo 3 con una maggiore incidenza nel 2005, 2008 e 2012 è evidente.

Conclusioni

Il data mining come parte del processo KDD costituisce uno strumento strategico per le aziende e il supporto di supporto. Da parte sua, il data mining indiretto consente di scoprire motivi ricorrenti e relazioni nascoste nei set di dati, quindi è conveniente per la sua applicazione in organizzazioni che non hanno una precedente cronologia dell’uso del data mining. Si ritiene che gli obiettivi proposti siano stati soddisfatti, le regole sono state ottenute da parametri accettati da considerare utile durante il processo decisionale da parte della gestione della società. Allo stesso modo, i gruppi ottenuti (modelli) descrivono il comportamento associato ai valori di ciascuno degli indicatori e rappresentano il supporto per il lavoro di funzionari e dirigenti.

Riferimenti

1 . Tomaran Pereira R. Architettura di integrazione del processo di rilevamento della conoscenza con sistemi di gestione del database: uno stato d’arte. Compet. 2001; 3 (2): 45-55.

2. Rygielski c, Wang JC, Yen DC. Tecniche di data mining per la gestione delle relazioni con i clienti. Technol Soc. 2002; 24 (4): 483-502.

3. Vercellis C. Business Intelligence: data mining e ottimizzazione per il processo decisionale: John Wiley & figli; 2009.

4. Berry Mja, Linoff G. Tecniche di miniere di dati: per la gestione del marketing, delle vendite e della gestione delle relazioni con i clienti. 2 ° ed. Indianapolis: Wiley Pub; 2004.

5. Fayyad U, Piratetsky Shapiro G, Smyth P. Dal data mining alla scoperta della conoscenza nei database. Ai MAG. 1996; 17 (3): 37.

6. Steinhoff JC, Carnahan Tl. L’uso intelligente del data mining è un buon business e buon governo. J GOV financia la gestione. 2012: 17-22.

7. Vimal Kumar D, Tamillarasi A. Associazione ottimizzata a base di algoritmo genetico Associazione ottimizzata per dati multi-relazionali. Intelli Data Anale. 2013; 17: 965-80.

8. Lee Bj, Kim Jy. Identificazione del fattore di rischio di diabete di tipo 2 mediante fenotipi costituite da antropometria e trigliceridi basati sull’apprendimento della macchina. IEEE J Biomed Health inform. 2015: 1.

9. Ting ih, lin yc, et al. Che cosa manca? Utilizzo delle tecniche di data mining con fasi del ciclo aziendale per la previsione delle crisi finanziarie della società. Asia Pas Pac Rev. 2011; 16 (4): 535-49.

10. Cao l, Yu PS, Zhang C, et al. DOMING DOMING DOMING DOMING. Boston, Stati Uniti: Springer; 2010.

11. Hernández Orollo J, Ramírez Quintana MJ, Ferri Ramírez C. Introduzione al data mining: Pearson Prentice Hall; 2004.

12. Copextel. Copextel la soluzione integrale. . Disponibile su: www.copextel.com.cu

13. Witten Ih, Frank E, Hall Ma. Data Mining: strumenti e tecniche di apprendimento della macchina pratica. 3rd ed. Burlington: Morgan Kaufmann; 2011.

14. Chapman P, Clinton J, Kerber R, et al. GUIDA DEI DATI DETTAGLIE STEP-BY-by-Step croccante-DM; 2000.

15. Hahsler M, Buchta C, Grenen B, et al. ARLE: regole di associazione mineraria e set di articoli frequenti. R Pacchetto versione 1.1-6. 2014.

16. Core Team R. una lingua e ambiente per un computing statistico. Vienna, Austria: Fondazione R per il calcolo statistico; 2014.

17. Vena Vena, Smith R. Development Core Team, e altri. IT: un’introduzione a R versione 312 Teoria della rete LTD; 2002.

Leave a Comment

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *