depozit de date (data warehouse) - baza de date RDBMS - compania dpgrup

depozit de date (Data Warehouse) - o bază de date mare de informații corporative orientate-obiect, special concepute și destinate pentru pregătirea de rapoarte, analiza proceselor de afaceri pentru a sprijini în organizarea de luare a deciziilor. Construit pe baza unei arhitecturi client-server. Sistemul de gestiune a bazelor de date și instrumente de suport de decizie. Datele furnizate la depozitul de date sunt numai în citire. Datele din sistem OLTP industriale este copiat în depozitul de date, astfel încât construcția de rapoarte și OLAP-analiză nu a utilizat resursele sistemului industrial și nu a încălcat stabilitatea acestuia. Datele sunt încărcate în seiful cu o anumită frecvență, astfel încât relevanța datelor oarecum în spatele sistemul OLTP.







Principiile de organizare a depozitării

Proiectare Data Warehouse

Există două zone arhitecturale - normalizate și dimensionale magazia depozitului de date.

Stocarea normalizat, datele se află într-o formă de masă normale a treia orientate-obiect - data warehouse. stocare standardizata sunt descrise ca fiind ușor de a crea și de a gestiona, deficiențele de stocare standardizate - redundanță mare de informații, cu integrarea acestor probleme din mai multe mese simultan.

Dimensiune depozit folosind o „stea“ sau „fulg de nea“. În centrul stelei sunt date (tabelul fapt) și dimensiunea razelor de imagine ale stelei. Diverse tabele de fapt accesul la tabele de dimensiuni, care facilitează mult operarea datelor care combină mai multe tabele subiect fapt (Exemplu - fapte de vânzare și de livrare a mărfurilor). tabele de date și dimensiunea corespunzătoare pentru a forma arhitectura „BUS“. Dimensiunile sunt adesea create în a treia formă normală (dimensiuni lent în schimbare), pentru a înregistra modificări ale dimensiunilor. Principalul avantaj al depozitării dimensionale este simplitatea și claritatea pentru dezvoltatori și utilizatori, precum și, din cauza de stocare mai eficientă a datelor și dimensiunile formalizate, accesul mai ușor și mai rapid la date, în special pentru analize complexe. Principalul dezavantaj este o procedură mai complicată pentru pregătirea și încărcarea de date precum și controlul și modificarea dimensiunilor de date.







procese de manipulare a datelor

Surse de date includ:

  1. operațiunile de sistem de înregistrare tradiționale (DB)
  2. documente individuale
  3. seturi de date

Sursele de date sunt clasificate:

  1. amenajarea teritoriului și administrativ.
  2. Gradul de fiabilitate.
  3. Frecvența regenerabilitatea.
  4. stocare și gestionare a datelor.

operațiuni de date:

  1. Extras - mutarea informației din surse de date într-o singură bază de date, aducându-le într-un format comun.
  2. Conversia - Pregătirea pentru stocarea informațiilor într-un mod optim pentru punerea în aplicare a interogare necesare pentru luarea deciziilor.
  3. Descarca - punerea datelor în magazia se face atomically, prin adăugarea de noi fapte sau ajustarea celor existente.
  4. Analiza - OLAP, Data Mining, raportare, etc.
  5. Prezentarea rezultatelor analizei.

Toate aceste informații sunt folosite în dicționar metadate. Dicționarul de metadate incluse automat de date surse de dicționare. Aici, formate de date pentru coordonarea lor ulterioară, frecvența de sincronizare a datelor reaprovizionare.

Sarcina de vocabular metadate este de a elibera dezvoltator de necesitatea de a standardiza surse de date.

de stocare a datelor nu ar trebui să intre în conflict cu sistemele existente de colectare și prelucrare a informațiilor.

componente speciale dicționare ar trebui să asigure extragerea la timp a dicționarelor și pentru a asigura conversia într-un format comun bazat pe metadate în dicționarul.

magazin de date logică diferă de o structură de date a structurii de date a surselor de date.

Pentru a dezvolta un proces eficient de transformare necesită un model de date corporative bine conceput și modelul de tehnologie de luare a deciziilor.

Datele pentru utilizator prezentate convenabil în baza de date multidimensionale, în cazul în care dimensiunile pot servi timp, preț sau locație geografică.

Mai mult prelua datele din baza de date, procesul de luare a deciziilor este importantă cunoașterea de extracție, în conformitate cu informațiile de nevoile utilizatorilor.

Din punct de vedere al utilizatorului în procesul de extragere a cunoștințelor din baza de date trebuie să fie abordată de cale. conversie: Date -> Informații -> cunoștințe -> soluțiile obținute.