Descoperirea cunoștințelor în bazele de date istorice ale unei companii de marketing

Articol original

Descoperirea cunoștințelor în bazele de date istorice ale unei companii de marketer

descoperire de cunoștințe în baze de date Istoric al unei societăți comerciale

Tania Morgado-Garcíai, Daniel Antonio Ponce-de-León-Limaii, Alejandro Rosete-Suáreziii

I Corporation Coleation Copextel SA, Havana, Cuba
II Universitatea de Stat din Santa Elena, Santa Elena, Ecuador
III Universitatea Tehnologică din Havana José Antonio Eheverría, Havana, Cuba

Rezumat

Cu dezvoltarea tehnologiilor, volumul imens de Bazele de date și necesitatea de a obține cunoștințe utile despre acestea, extracția de date devine un instrument strategic pentru companii, ca sprijin pentru luarea deciziilor. O companie cubaneză creată în 1991, a cărei nume nu este menționat din motive de confidențialitate, care se distinge prin faptul că este furnizor de soluții integrale, oferă ingineri de produse și servicii într-o gamă variată de sfere cu un personal cu un personal instruit. Are volume mari de date care rezultă din gestionarea fiecărei unități organizaționale, dar analizele nu sunt efectuate pentru a identifica modelele și comportamentele ascunse în date. În cadrul acestei lucrări, un proces de descoperire a cunoștințelor în bazele de date a fost elaborat în societatea menționată mai sus ca ajutor pentru luarea deciziilor. În acest sens, au fost detaliate aspecte legate de mineritul de date și aplicarea acestuia în mediul indicatorilor economico-financiari și de management, au fost obținute modele de asociere și grupare care vor sprijini activitatea managerilor la diferite niveluri ale organizației.

Cuvinte cheie: miniere de date, grupare, cunoștințe, companie.

Rezumat

cu dezvoltarea tehnologiilor, volumul mare de baze de date și necesitatea de a obține cunoștințe utile despre acestea, Minierea de date devine instrumentul strategic pentru companii, care sprijină luarea deciziilor. O companie cubaneză, creată în 1991, numele ONE nu este menționată din motive de confidențialitate, de ce se distinge ca furnizor de comporit de soluții compliniste, oferă produse și servicii de inginerie într-o gamă largă de zone cu un personal foarte instruit. Are volume mari de date rezultate din gestionarea fiecăruia dintre site-uri unități organizaționale, dar nu se efectuează nicio analiză pentru a identifica modelele ascunse și comportamentele în date. Această lucrare prezintă un proces de descoperire a cunoștințelor în bazele de date din cadrul societății menționate mai sus ca ajutor pentru luarea deciziilor. În această privință, aspectele legate de aplicarea datelor de date și aplicarea în mediul indicatorilor și managementului economico-financiar au fost detaliate, au fost obținute modele de asociere și grupare care vor sprijini activitatea managerilor la diferite niveluri ale organizației.

Cuvinte cheie: minig, grupare, cunoștințe, companie.

Introducere

În ultimii ani, dezvoltarea tehnologică atât în zona de calcul cât și în zona de transmisie a datelor, a făcut posibilă Depozitarea și gestionarea volumelor mari de date. Firmele de astăzi se deplasează în medii extrem de competitive și schimbări continue. Dinamica pieței duce la necesitatea de a avea informații adecvate la momentul indicat, astfel încât managerii să poată lua decizii de afaceri adecvate. Prin urmare, au înțeles că volumele mari de date care locuiesc pe sistemele lor pot și trebuie analizate și exploatate pentru a obține noi cunoștințe ,.

Exploatarea de date sau exploatarea informațiilor este procesul de extragere util, ușor de înțeles și inovator Cunoașterea volumelor mari de date, principalul său obiectiv fiind de a găsi informații ascunse sau implicite, ceea ce nu este posibil să se obțină prin metode statistice convenționale. Intrarea la procesul minier este formată din diverse containere de informații, aceasta include baze de date relaționale, magazine de date (DataWarehouse), documente în text liber, date web, printre altele ,.

O definiție tradițională, definește-o, Ca o etapă a procesului KDD (descoperirea cunoașterii în baze de date) care constă în aplicarea analizei datelor și descoperirea algoritmilor care, în conformitate cu limitări acceptabile de eficiență computațională, produc un anumit grup de modele sau modele pe date.

Mineritul de date Oferă oportunitatea organizațiilor de a detecta potențialele probleme și de a lua acțiunile pentru a le evita sau a atenua impactul.Aplicate în mod corespunzător, rapoartele miniere de date către organizații numeroase beneficii printre care sunt: o eficiență mai mare din care se consumă mai puțin timp pentru a corecta erorile și a recupera plățile; Informații avansate care vă permit să reduceți surprizele și să analizați cauzele problemelor și să controlați mai bine prin prevenirea și detectarea activităților care permit monitorizarea găurilor de control intern.

Câmpul dvs. de aplicație este larg și diferit, de fapt, în Toate activitățile în care sunt generate datele. În și mai multe exemple de aplicare a acesteia sunt expuse.

cu o abordare netradițională, autorii prezintă miniere de date ca un proces sistematic și social care implică diferitele sisteme și faze ale minelor, precum și respectivele acestora medii. În mineritul de date, problemele și aplicațiile sunt în mod normal înconjurate de factori organizaționali și sociali în diferite companii. Astfel de factori alcătuiesc mediul minier al lumii reale și atenția lor este necesară, deoarece reflectă nevoile reale ale companiei și ale utilizatorilor și constituie mediul cunoașterii identificate. Inteligența care rezultă din participarea factorilor și a resurselor organizației în modelele miniere constituie inteligență organizațională. Se compune din mai multe aspecte între care sunt:

  • Structurile organizaționale legate de aspectele cheie, cum ar fi locul în care provin datele.
  • Comportament organizațional, ca și pentru înțelegerea lui Afacerile și datele, modul în care indivizii și grupurile acționează în organizație.
  • Business Reglementări care includ reguli, politici, protocoale, standarde.
  • Procese de afaceri și fluxurile de lucru.
  • Actorii organizației și funcțiile sale.

procesul KDD

Fayyad și colab. În definirea procesului KDD ca: „un proces non-trivial de modele valide, noi, potențial utile și ușor de înțeles, care sunt ascunse în date”. Este compus din cinci faze, care sunt descrise mai jos:

1. Integrarea și colectarea datelor: În această fază sunt determinate sursele de informații care pot fi utile și unde să le primească.

2. Selecția, curățarea și transformarea: include detectarea datelor, lipsa sau pierderea datelor, construirea de atribute noi și numbery sau discretizarea atributelor.

3. Mineritul de date: Obiectivul acestei faze este de a produce noi cunoștințe. Pentru aceasta, este construit un model care nu este altceva decât o descriere a modelelor și a relațiilor dintre datele care pot fi folosite pentru a face predicții, pentru a înțelege mai bine datele sau pentru a explica situațiile anterioare. Include:

  • Alegeți tipul modelului.
  • Determinați ce fel de sarcină minieră este cea mai potrivită.
  • Alegeți algoritmul minier care rezolvă sarcină și obțineți tipul de model pe care îl căutați.

4. Evaluare și interpretare: Există diferite măsuri de evaluare a modelelor: exacte, inteligibile) și interesante (utile și noi).

5. Difuzie: După construirea și validarea modelului, acest lucru poate fi utilizat în scopuri diferite și în timpul acestui proces evoluția sa trebuie măsurată. În acest fel, acesta va fi cunoscut dacă trebuie reevaluat, re-instruit și eventual reconstruit complet.

sunt diverse elemente care trebuie luate în considerare pentru o organizație implementată cu succes procesul de descoperire a cunoștințelor sau a datelor Mining. În autorii definesc un set de aspecte care, mai mult decât elementele tehnice, reprezintă schimbări organizaționale, mentalitate și culturale în organizații:

  • acceptarea responsabilității de a evita problemele proactiv prin adoptarea abordărilor miniere de date și unelte. Aceasta este, în esență, o transformare culturală a organizației.
  • Înțelegerea potențialului sprijin reprezentat de mineritul de date către organizație atât în gestionarea zilnică, cât și în luarea deciziilor strategice.
  • Determinați modul în care cunoașterea rezultată din partea Procesul de extragere a datelor va fi utilizat.
  • Share experiențe și cele mai bune practici.
  • Vedeți acest proces ca un proces continuu.

Activitățile miniere de date sunt clasificate în câteva categorii care depind de sarcinile și obiectivele analizei. În funcție de existența unei variabile țintă, procesul de învățare este clasificat în:

  • supravegheat sau direct MD. Un atribut obiectiv reprezintă clasa la care fiecare înregistrare aparține sau exprimă o cantitate măsurabilă. Acestea sunt orientate spre predicție și interpretare cu privire la un atribut obiectiv.
  • nu este supravegheată sau indirectă MD.Analizele nu sunt determinate de un atribut obiectiv. Scopul său este de a descoperi modele și afinități recurente în seturile de date.

Pe baza scopului minierului indirect, aplicația sa este convenabilă în organizațiile care nu posedă o poveste anterioară de utilizare a acestora .

o companie cubaneză creată în 1991, care se distinge prin faptul că este un furnizor de soluții cuprinzătoare, oferă ingineri de produse și servicii într-o gamă variată de sfere, cu un personal foarte instruit.

mult a conducerii companiei este susținută pe tehnologiile informației și comunicațiilor. Există un set de aplicații informatice care susțin procesele, suport și management, prin care datele primare sunt înregistrate în fiecare unitate organizațională. Aceste date sunt reproduse la serverele centrale în care este disponibilă volume mari din anul 2001 . Aplicațiile sunt evidențiate, care ne permit să efectuăm automat procesul lunar de închidere a contabilității și crearea de indicatori și reguli economice care validează informațiile contabile de la indicatorii calculați. Cu toate acestea, cunoștințele ascunse în aceste date nu sunt utilizate, care poate să susțină anumite acțiuni și decizii din partea managerilor companiei.

al problemei anterioare derivă obiectivul acestei lucrări: Descoperiți modele, tendințe și abateri în depozitul de date corporativ al companiei care aplică non- Tehnici miniere de date supravegheate în vederea îmbunătățirii Procesul de luare a deciziilor. Datele selectate pentru a explora inițial și a căuta modele și comportamente ascunse sunt contabilii, în special indicatorii economici calculați din aplicația care poartă același nume.

în acest fel. A se urmărește acest lucru Determinați relațiile care există între diferiții indicatori economici care reflectă modelele și / sau comportamentele și gruparea unităților organizaționale care participă la comportamentul acestor indicatori.

Metode

Apoi, descrieți Sarcini miniere de date, metodologie și instrumente de analiză a datelor, precum și tehnici de asociere și grupare utilizate.

Reguli de asociere

Prima sarcină minieră a datelor efectuate a fost obținerea regulilor de asociere care constă de identificare a modelelor regulate și recurente într-un grup mare de tranzacții. Regulile apar în multe moduri, dar cea mai obișnuită formulare este în stil „dacă atributul x ia valoarea d, atunci atributul și ia valoarea B”. Acestea sunt evaluate folosind doi parametri: încredere și sprijin care sunt, de asemenea, numiți precizie și acoperire.

Gruparea

A doua sarcină a fost gruparea care urmărește să subdivizeze înregistrările unui grup de Datele în grupuri omogene de observații, numite clustere. Datele sunt grupate pe baza principiului maximizării similitudinii dintre elementele unui grup prin minimizarea similitudinii dintre diferitele grupuri.

Metodologia și instrumentul de analiză a datelor

a fost decis să se angajeze Metodologia CRISP-DM pentru dezvoltarea acestei investigații menține o perspectivă mai largă față de obiectivele de afaceri și concepe proiectul KDD la nivel global. În plus, este o metodologie neutră privind instrumentul utilizat pentru dezvoltarea muncii, iar distribuția sa este gratuită și liberă. În faza minieră a datelor, a fost utilizată ca metodă de a găsi asociații algoritmul A priori și pentru a găsi grupele algoritmul K-Mijloace, ambele dezvoltate în instrumentul de analiză a datelor r ,.

rezultate și discuția

Faza preparatului de date

Datele utilizate în prezenta anchetă provin din tabelul H_ Indicatori în care sunt stocați, după calcularea din informațiile contabile au răspuns la serverele centrale Din fiecare dintre unitățile organizaționale ale companiei, indicatorii economici care rezultă din funcționarea și gestionarea acestuia. A fost modificată, prin interogarea SQL, structura originală a setului de date astfel încât fiecare dintre indicatori să constituie o variabilă și, în acest mod, să faciliteze analiza acestuia. Înregistrările cu valori nulă au fost eliminate. Structura rezultată este prezentată în Tabelul 1:

Selecția de caracteristici reduce dimensiunea datelor prin alegerea celor mai influente variabile din problemă. Revizuirea detaliată a fiecărui indicator reflectă faptul că există indicatori că totalul, adică sunt rezultatul operațiunilor aritmetice printre alți indicatori sau unii conțin alții. În plus, toți indicatorii sunt variabilele contabile ale companiei.Din acest motiv, se decide calcularea noilor indicatori de eficiență care permit analiză și comparații din variabilele originale.

Construcția de caracteristici

Crearea sau construirea de caracteristici este de a crea noi atribute Pentru a îmbunătăți calitatea, vizualizarea și înțelegerea cunoștințelor extrase.

Tabelul 2 prezintă noii indicatori calculați de la originale, cu o scurtă descriere și o formulă de calcul.

cu scopul de a obține obținerea obținerii Date cu o calitate superioară și îndeplinesc cerințele tehnicilor selectate, se efectuează noi transformări asupra variabilelor. Pentru aceasta, se folosește tehnica de discretizare. Fiecare dintre indicatori a fost actualizat în 6 grupe în conformitate cu cerințele și valorile așteptate ale fiecăruia. În plus, variabilele au fost discrete, în funcție de tipul de unitate organizațională (diviziunea comercială, divizia de sprijin, servicii tehnice sau divizia teritorială) și luna în funcție de trimestrele anului. Tabelul 3 prezintă variabilele rezultate și metoda de segmentare utilizată.

Mineritul de date: a fost utilizată reguli de asociere descriptivă

algoritmul a priori a priori. Au fost obținute valori foarte mari de încredere și suport. Regulile au fost găsite cu suport și valori de încredere în jurul valorii de 0,80 și 0,90 securizate Marja în gama% și rotația capitalului de lucru în intervalul implică faptul că rotația stocurilor este în intervalul.

  • rotația stocului în intervalul implică faptul că marja de utilitate de operațiuni este în% Gama și viceversa.
  • Raportul de îndatorare în intervalul% implică faptul că rotația stocului este în intervalul.
  • Motivul îndatorării în gama% și rotație de stocuri în gamă implică faptul că marja de profit operațională este în gama%.
  • Motivul actual din intervalul și raportul raportului în intervalul% implică faptul că marja de profit operațională se găsește în%.
  • Acoperire stoc în intervalul IMPLI CA Această rotație a stocului se găsește în intervalul.
  • Acoperirea stocurilor în intervalul implică faptul că marja de profit operațională este în gama%.
  • marja folosind operații în gama% și Raportul de îndatorare în gama de% implică faptul că rotația stocurilor este în intervalul.
  • rotația capitalului de lucru în intervalul implică faptul că rotația stocului este în intervalul.
  • Dacă diviziunea este comercială implică faptul că rotația stocului este în intervalul.
  • Toți indicatorii au fost utilizați în algoritmul aplicat, dar unii nu au fost interesați: marja de utilitate brută, Marja netă, rentabilitatea activelor, manevrabilitatea, rotirea activelor și rotația activelor fixe, printre altele. Pe de altă parte, după cum se poate observa în regulile expuse anterior, caracteristicile care descriu cele mai bune relații sunt: actrița, marja de profit operațional, capitalul de lucru, rotirea stocurilor, raportul raportului și motivul actual. Rezultatele obținute arată relațiile dintre indicatori, unele logice și evidente, dar care oferă o altă perspectivă pentru analiza activității în cadrul companiei. Acestea reprezintă o cunoaștere valoroasă pentru organizație prin intermediul unor indicatori recurenți, asociațiile dintre ele și în care sunt prezentate o serie de valori.

    în această privință, subliniază faptul că raportul de îndatorare în toate cazurile este prezentat în intervalul %. Valoarea recomandată este între 40 și 60%, cu toate acestea, atunci când tinde la zero, compania este mai solidă deoarece este finanțată cu resurse proprii. În cazul nostru, valoarea este rulată deasupra limitei superioare recomandate.

    Faza minieră de date: Cluster de sarcini descriptive

    În această secțiune, se arată experimentele efectuate cu obiectivul Grupări între instanțe în funcție de caracteristicile lor, aplicând algoritmul K-Mijloace în R.

    Pentru a obține o mai mare precizie în execuția algoritmului sunt eliminate din vizualizarea inițială a observațiilor cu valorile NA în Oricare dintre atributele sale. Din acest motiv, numărul de instanțe care trebuie utilizate este redus. Analizele de analiză au fost efectuate prin eliminarea grupurilor cu o reprezentativă scăzută (mai mică de 1%).

    Gruparea descrierii

    Conformitatea a 4 grupe poate fi observată la următoarele distribuții:

    • Grupul 1 (499 observații reprezentând 9,29%)
    • Grupul 2 (1260 de observații care reprezintă 23,45%)
    • Grupul 3 (400 observarea reprezentând 7,44%).
    • Grupul 4 (3214 observații reprezentând 59,82%)

    Grupul 1 este caracterizat de:

    • valori mai mari ale Fondului de manevră, ceea ce înseamnă că sunt disponibile suficiente active circulante pentru a acoperi datoriile pe termen scurt.
    • valorile activelor minore ale activelor, ceea ce înseamnă procentaj minori de capital imobilizat.
    • valori superioare ale utilității brute. Valoarea dorită pentru acest indicator este cât mai mult posibil și indică proporția veniturilor care vă permite să acoperiți alte cheltuieli decât costul vânzărilor.
    • marjă netă valori mai mari, ceea ce înseamnă beneficii mai mari și o rentabilitate mai mare.
    • Valorile minore ale rotației activelor, care pot indica o capacitate de supradimensionare sau inactivă în investiții. Valoarea dorită pentru acest indicator este cea mai mare posibilă. Cu cât este mai mare valoarea sa, într-o măsură mai mare, compania își utilizează resursele pentru a genera afaceri.

    Grupul 2 este caracterizat de:

    • valori mai mari ale Expunere de motive Curentul ce ar putea însemna că există resurse inactive.
    • valori majore ale rotației capitalului de lucru. Aceasta înseamnă o mai bună productivitate a capitalului de lucru, care se traduce într-o rentabilitate mai bună. Trebuie raportat că un indice înalt poate dezvălui insuficiența fondului de manevră.
    • valorile relației cu vânzările în cea mai mare gamă, ceea ce înseamnă că, în acest grup, observațiile în care procentul de vânzări corespunzătoare Fondul de manevră este mai mare. Valoarea corespunzătoare pentru acest indicator este între 15 și 20%.

    Grupul 3 este caracterizat de:

    • valorile superioare ale activelor de active, pe care le înseamnă un procent mai mare de capital imobilizat.
    • stocuri negative de acoperire stoc care înseamnă că fondul de manevră nu acoperă stocurile.
    • valori negative ale finanțării manevre care indică faptul că există Nu sunt suficiente active active pentru a face față datoriilor pe termen scurt.
    • valori negative negative, rotație de capital de lucru și relație de vânzări. Valorile acestor trei indicatori trebuie să fie mai mari decât zero. În cazul relației cu vânzările, valoarea justă a indicatorului este între 15 și 20%. Trebuie luată în considerare faptul că aceste valori negative pot corespunde unor înregistrări sau înregistrări incorecte.
    • valori superioare ale rentabilității pe active. Valoarea dorită pentru acest indicator este cât mai mult posibil și măsoară utilitățile care generează resursele totale cu care are afaceri.
    • valori majore de îndatorare. Valoarea recomandată pentru acest indicator este între 40 și 60%.

    Grupul 4 este caracterizat de:

    • valori negative negative nete. Valoarea acestui indicator trebuie să fie mai mare decât zero.
    • valori valori ale operațiunilor. Valoarea dorită pentru acest indicator este cât mai mult posibil indică faptul că este generată utilizarea suficientă pentru a acoperi nevoile de finanțare.
    • valori negative ale rotației capitalului de lucru. Valoarea acestui indicator trebuie să fie mai mare decât zero.

    în grupurile 1, 2 și 3 Valorile indicatorului Motivului îndatorat prezintă un comportament similar, dar este necesar să se sublinieze că acestea se află într-un rang mai sus de dorit pentru acest indicator care este între 40 și 60%. Valorile indicatorilor Importanța activului curent, rotația activelor fixe și rotația stocurilor prezintă un comportament similar în toate grupurile și sunt în intervale rezonabile pentru acești indicatori.

    valorile Dintre indicatorii de acoperire a stocurilor și rotația activelor fixe prezintă un comportament similar în grupurile 1, 2 și 4 și sunt în intervale rezonabile pentru acești indicatori. În mod similar, valorile indicatorului de marjă de utilitate de operații au un comportament similar în grupurile 1, 2 și 3 și se află într-un interval rezonabil pentru acest indicator.

    din cele de mai sus se concluzionează că în grupul 1 , observațiile rezultate din activitatea fiecărei unități organizaționale cu performanțe mai bune sunt concentrate, participând la valorile medii ale fiecăruia dintre indicatori. Anii cei mai reprezentativi sunt între 2009 și 2013, iar unitățile organizaționale corespund diviziunilor comerciale repetate în acești ani.

    Pe de altă parte, observațiile cu valorile indicatoare se concentrează de la distanță față de valorile dorite sau recomandate. Anii cei mai reprezentativi sunt 2005, 2008 și 2012. Unitățile organizaționale includ diviziuni teritoriale, de susținere și comerciale și sunt la fel de repetate în acești ani.

    în figura 1 Acestea sunt prezentate (prin ilustrație) distribuții ale observațiile fiecărui grup în timp. Pe axa Abscisa, timpul este prezentat pentru fiecare dintre lunile (din ianuarie-decembrie) din anii reprezentați și în numărul de observații corespunzătoare fiecărei luni și an.

    cum ar putea fi În figura 1, Grupul 4 conține cea mai mare cantitate de observații și prezența observațiilor corespunzătoare grupei 3 cu o incidență mai mare în 2005, 2008 și 2012 este evidentă.

    Concluzii

    Minierea de date ca parte a procesului KDD constituie un instrument strategic pentru companii și sprijin susținător. La rândul său, extracția de date indirectă vă permite să descoperiți modele recurente și relații ascunse în seturi de date, deci este convenabil pentru aplicarea sa în organizații care nu au o istorie anterioară de utilizare a mineritului de date. Se consideră că obiectivele propuse au fost îndeplinite, normele au fost obținute prin parametrii acceptați care trebuie considerați utili în timpul luării deciziilor de către conducerea societății. De asemenea, grupurile obținute (modelele) descriu comportamentul asociat valorilor fiecăruia dintre indicatori și reprezintă suport pentru activitatea funcționarilor și managerilor.

    Referințe

    1 . Timaran Pereira R. Arhitecturi de integrare a procesului de descoperire a cunoștințelor cu sisteme de gestionare a bazelor de date: o stare de artă. În competiție. 2001; 3 (2): 45-55.

    2. Rygielski C, Wang JC, Yen DC. Tehnici de miniere de date pentru gestionarea relațiilor cu clienții. Technol Soc. 2002; 24 (4): 483-502.

    3. Vercellis C. Business Intelligence: Mineri de date și optimizare pentru luarea deciziilor: John Wiley & fiii; 2009.

    4. Berry Mja, Linoff G. Tehnici miniere de date: pentru gestionarea relațiilor de marketing, vânzări și relații cu clienții. A doua ed. Indianapolis: Pub Wiley; 2004.

    5. Fayyad u, Piratetsky Shapiro G, Smyth P. de la miniere de date la descoperirea cunoașterii în baze de date. AI MAG. 1996; 17 (3): 37.

    6. Steinhoff JC, Carnahan TL. Utilizarea inteligentă a mineritului de date este o afacere bună și un guvern bun. J Gov Financ Manag. 2012: 17-22.

    7. Vimal Kumar D, Tamillarasi A. Algoritmul genetic bazat pe regulile de asociere bazate pe exploatare pentru date multi-relaționale. Intel Data Anal. 2013; 17: 965-80.

    8. Lee Bj, Kim Jy. Identificarea factorului de risc de diabet de tip 2 Utilizarea fenotipurilor constând din antropometrie și trigliceride pe baza învățării mașinilor. IEEE J Biomed Informarea sănătății. 2015: 1.

    9. Ting IH, Lin YC și colab. Ce lipseste? Utilizarea tehnicilor de extracție a datelor cu faze ale ciclului de afaceri pentru prezicerea crizelor financiare ale companiei. Asia Pac Manag Rev. 2011; 16 (4): 535-49.

    10. Cao L, Yu Ps, Zhang C și colab. Mineri de date bazate pe domenii. Boston, SUA: Springer; 2010.

    11. Hernández Orallo J, Ramírez Quintana MJ, Ferri Ramírez C. Introducere în exploatarea datelor: Pason Prentice Hall; 2004.

    12. Copextel. Copextel soluția integrală. . Disponibil la: www.copextel.com.cu

    13. Witten IH, Frank E, Sala Ma. Mineri de date: Instrumente și tehnici practice de învățare a mașinilor. Ed. Burlington: Morgan Kaufmann; 2011.

    14. Chapman P, Clinton J, Kerber R și colab. CRISP-DM 1.0 Ghid de extragere a datelor pas cu pas; 2000.

    15. Hahsler M, Buchta C, Grenen B, și colab. Arus: regulile de asociere miniere și seturi frecvente. R versiunea pachetului 1.1-6. 2014.

    16. Echipa de bază R. O limbă și un mediu pentru computerele statistice. Viena, Austria: Fundația R pentru computere statistice; 2014.

    17. Venerable WN, Smith R. Echipa de bază de dezvoltare și alții. En: o introducere la teoria rețelei R versiunea 312 Ltd; 2002.

    Leave a Comment

    Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *