Preguntes D'entrevista

Les 60 principals preguntes i respostes d'entrevistes de Data Warehouse

2 de gener de 2022

En informàtica, un magatzem de dades, també anomenat magatzem de dades empresarial, és un sistema que s'utilitza per a la generació d'informes i l'anàlisi de dades. És un component bàsic de la intel·ligència empresarial. Els magatzems de dades són repositoris centrals de les dades integrades d'una o diverses fonts diferents.

Taula de continguts

Per a què serveix el Data Warehousing?

Magatzems de dades s'utilitzen principalment amb finalitats analítiques i informes empresarials. Els magatzems de dades solen emmagatzemar les dades històriques integrant còpies de les dades de transacció de diferents fonts. Els magatzems de dades també fan ús de fonts de dades en temps real per als informes que utilitzen la informació actual integrada.

Si teniu previst assistir a una entrevista de Data Warehouse, és bo revisar algunes de les preguntes i respostes de l'entrevista de Data Warehouse abans d'assistir a l'entrevista.

Preguntes i respostes principals de l'entrevista de Data Warehouse

1. Definir BI en termes senzills?

La intel·ligència empresarial consisteix principalment en les tecnologies i estratègies que utilitzen les empreses per a l'anàlisi de dades de la informació empresarial. Les tecnologies de BI tenen com a objectiu proporcionar vistes actuals, històriques i predictives de les operacions empresarials.

2. Definir l'anàlisi de dades en termes d'un magatzem de dades?

L'anàlisi de dades es defineix com el procés d'obtenir les dades en brut i convertir-les en informació útil per a la presa de decisions. Aquí, les dades es recullen i s'analitzen per respondre preguntes, refusar teories o provar hipòtesis. Les dades inicialment obtingudes s'han de tractar o organitzar amb finalitats d'anàlisi.

3. Definiu Data Warehouse?

Els magatzems de dades s'utilitzen principalment amb finalitats analítiques i informes empresarials. Els magatzems de dades solen emmagatzemar les dades històriques integrant còpies de les dades de transacció de diferents fonts.

4. Definiu la taula de dimensions?

Preguntes d'entrevista de Data Warehouse - Taula de dimensions

Una taula de dimensions es defineix com una taula de l'esquema estrella del Data Warehouse. Els magatzems de dades es construeixen normalment mitjançant models de dades dimensionals, que contenen taules de fets i dimensions. Utilitzem les taules de dimensions per descriure dimensions; Consisteix en claus de dimensions, atributs i valors.

Vegeu també Les 100 principals preguntes i respostes de l'entrevista de JavaScript

5. Per què Data Warehouse està orientat a la matèria?

Un magatzem de dades es defineix com a orientat al tema perquè principalment proporciona informació sobre el tema en lloc de les operacions en curs d'una organització. Aquests temes poden ser el producte, proveïdors, clients, vendes, ingressos, etc.

Preguntes i respostes de l'entrevista de Data Warehouse

6. Defineix OLAP i esmenta els seus tipus?

(OLAP) El processament analític en línia es defineix com un enfocament per respondre les consultes analítiques multidimensionals (MDA) amb rapidesa en informàtica. OLAP forma part de la intel·ligència empresarial, que també inclou bases de dades relacionals, mineria de dades i redacció d'informes.

Tipus d'OLAP:

  1. OLAP híbrid
  2. OLAP relacional
  3. OLAP multidimensional
  4. Servidors SQL especialitzats

7. Podeu enumerar algunes de les aplicacions de Data Warehouse?

Aplicacions de magatzem de dades
  1. Indústria bancària.
  2. Indústria Financera.
  3. Indústria de béns de consum.
  4. Govern i Educació.
  5. Atenció sanitària.
  6. Indústria hospitalaria

8. Definiu la taula de fets?

Una taula de fets a Data Warehouse conté les mètriques, mesures o fets d'un procés empresarial. Normalment es troba al centre de l'esquema del floc de neu o d'un esquema d'estrella envoltat per les taules de dimensions. La clau primària de les taules de fets és una clau composta formada per totes les claus externes.

9. Diferenciar entre OLAP i OLTP?

OLAPOLTP
Té transaccions llargues.OLTP sol tenir transaccions curtes.
S'utilitza principalment per extreure dades per analitzar-les que al seu torn ajuden a la presa de decisions.Se centra en inserir, actualitzar i eliminar informació de la base de dades.
Té consultes complexes.Té consultes senzilles.
Les taules de la base de dades OLAP normalment no estan normalitzades.Les taules de la base de dades OLTP solen estar normalitzades (3NF)

10. Diferenciar entre Data Warehouse i bases de dades operatives?

Magatzem de dades Bases de dades operatives
Normalment es preocupen de dades històriques.Normalment es preocupen de les dades actuals.
Són no volàtils. Podem afegir noves dades regularment. Un cop s'afegeix, rarament es canvien.Les dades dins dels sistemes operatius s'actualitzen periòdicament segons el requisit.
Està dissenyat principalment per a l'anàlisi de mesures empresarials per categories, àrea temàtica i atributs.Està dissenyat principalment per a processos i negocis en temps real.

Preguntes i respostes de l'entrevista de Data Warehouse

11. Enumereu les quatre etapes de l'emmagatzematge de dades?

Les quatre etapes de Datawarehousing s'enumeren a continuació:

  1. Base de dades operativa fora de línia
  2. Magatzem de dades fora de línia
  3. Datawarehouse en temps real
  4. Datawarehouse integrat

12. Enumereu les funcions que realitza OLAP?

Les funcions OLAP s'agrupen principalment en aquestes categories:

  1. Funcions agregades
  2. Funcions analítiques
  3. Funcions jeràrquiques
  4. Funcions de retard
  5. Funcions OLAP DML
  6. Funcions de classificació
  7. Funcions de compartir
  8. Funcions de la finestra

13. Anomena els esquemes que pot implementar un sistema de magatzem de dades?

Es pot implementar un magatzem de dades

  1. horari estrella
  2. Esquema del floc de neu
  3. Esquema de constel·lació de fets

14. Definiu la mineria de dades?

Mineria de dades

La mineria de dades es pot definir com una tècnica d'anàlisi de patrons de dades desconeguts. Un magatzem de dades és un sistema de bases de dades dissenyat per a un treball analític en lloc de transaccional. La mineria de dades sol ser un mètode per comparar grans quantitats de dades per trobar els patrons adequats.

15. Definiu el diagrama ER al magatzem de dades?

El modelatge de relacions d'entitats es defineix com un procés de modelització de bases de dades que té com a objectiu establir una representació visual de les dades d'un sistema. Hi ha principalment tres elements bàsics en un diagrama ER, és a dir,

  1. Entitat
  2. Atribut
  3. Relació

Preguntes i respostes de l'entrevista de Data Warehouse

16. Definiu l'extracció de dades?

L'extracció de dades es defineix com la tècnica d'obtenir dades d'una plataforma o base de dades SaaS perquè es repliquin a una destinació com un magatzem de dades dissenyat per suportar el processament analític en línia (OLAP). L'extracció de dades sol ser el primer pas del procés d'ingestió de dades conegut com a ETL (extreure, transformar i carregar).

17. Definir ODS?

Un magatzem de dades operacionals (ODS) es defineix com una base de dades central que proporciona principalment una instantània de les noves dades de diversos sistemes transaccionals per als informes operatius. Permetrà a les organitzacions integrar dades en el seu format original de diferents fonts en una única destinació i posar-les a disposició per als informes empresarials.

18. Definiu SCD?

Dimensions que canvien lentament (SCD) és la tècnica dimensional avançada més utilitzada que s'utilitza als magatzems de dades dimensionals. Utilitzem les dimensions que canvien lentament quan voleu capturar les dades canviants dins del temps de la dimensió.

19. Definir metadades?

Les metadades a Data Warehouse es defineixen simplement com a dades sobre dades. Les dades que representen altres dades s'anomenen metadades.

20. Diferenciar entre vista i vista materialitzada?

Veure Vista materialitzada
Les visualitzacions s'utilitzen quan s'ha d'accedir a les dades amb poca freqüència i les dades de la taula s'actualitzen amb freqüència.Les vistes materialitzades s'utilitzen generalment quan s'ha d'accedir a les dades amb freqüència i les dades d'una taula no s'actualitzen amb freqüència.
Una vista és una taula virtual que pren la sortida de la consulta i s'utilitza en lloc de les taules.Una vista materialitzada és l'accés indirecte a les dades de la taula emmagatzemant els resultats de la consulta en un esquema separat.

Preguntes i respostes de l'entrevista de Data Warehouse

21. Llista els tipus de SCD?

Tenim tres tipus de SCD, són:

Vegeu també Les 100 millors preguntes i respostes d'entrevista Ansible

SCD 1: aquí, un nou registre substitueix el registre original.

SCD 2: aquí, el nou registre s'afegeix a una taula de client existent.

SCD 3: aquí, les dades originals es modifiquen per introduir les dades noves.

22. En què consisteix Metadata Respiratory?

La respiració de metadades consisteix principalment en la definició d'un magatzem de dades, metadades operacionals, metadades empresarials, dades per al mapeig des de l'entorn operatiu al magatzem de dades i els algorismes necessaris per al resum.

23. Què és ETL?

Procés ETL

Pel que fa a la computació, l'extracció, la transformació i la càrrega és un procediment de copiar les dades d'una o diverses fonts a un sistema de destinació que representa les dades de manera diferent d'una font o en un factor diferent al de la font.

24. Definiu l'esquema del floc de neu?

Pel que fa a la informàtica, un esquema de floc de neu es defineix com una disposició lògica de taules a la base de dades multidimensional de tal manera que el diagrama entitat-relació s'assemblarà a una forma de floc de neu. L'esquema del floc de neu normalment es representa amb una taula de fets centralitzada que està connectada a diverses dimensions.

25. Definir un cub de dades?

Un cub de dades permetrà modelar i visualitzar les dades en diverses dimensions. Un model de dades multidimensional s'organitza al voltant del tema central, com ara vendes i transaccions. Una taula de fets sol representar aquest tema. Els fets no són més que mesures numèriques.

Preguntes i respostes de l'entrevista de Data Warehouse

26. Definiu VLDB?

Una base de dades molt gran (VLBD) es defineix com una base de dades que consta d'un gran volum de dades, de manera que requereix metodologies especialitzades d'arquitectura, processament, gestió i manteniment.

27. Definiu l'esquema d'estrelles i l'esquema de bus?

Pel que fa a la informàtica, el Horari estrella es defineix com l'estil més senzill d'esquema de data mart, i és l'enfocament més utilitzat per desenvolupar magatzems de dades i data marts dimensionals. L'esquema estrella normalment conté una o diverses taules de fets que fan referència a qualsevol nombre de taules de dimensions.

A Horari BUS s'utilitza principalment per identificar dimensions comunes als processos empresarials, com ara identificar dimensions conformes. L'esquema BUS sol tenir una dimensió conformada i la definició estandarditzada dels fets. Aquí, tots els Data Marts utilitzen les dimensions conformades i els fets sense tenir-los localment.

28. Definiu la dimensió al Data Warehouse?

Les dimensions es defineixen com les entitats amb les quals una empresa manté els registres.

29. Definiu l'emmagatzematge de dades en temps real?

L'emmagatzematge de dades en temps real sol capturar les dades empresarials sempre que es produeixin. Quan s'hagi completat l'activitat empresarial, les dades estaran disponibles al flux i es podran utilitzar a l'instant.

Preguntes i respostes de l'entrevista de Data Warehouse

30. Quina és la dimensió central?

La dimensió bàsica de Data Warehouse no és més que una taula de dimensions que s'utilitza com a taula de fets únics o mercat de dades.

31. Definiu Data Mart?

Un data mart es defineix com una base de dades orientada a temes que sovint és el segment particionat del magatzem de dades de l'empresa. El subconjunt de dades que es conserva en un data mart normalment s'alinea amb una unitat de negoci particular, com ara vendes, finances o màrqueting.

32. Definiu taules agregades?

Les taules agregades es defineixen com les taules que agrupen o agrupen les dades a un nivell superior al d'una taula base o derivada. Les funcions com mitjana, recompte, min, max s'utilitzen amb taules agregades.

33. Explica el concepte de bucles al magatzem de dades?

Els bucles a l'emmagatzematge de dades existeixen entre les taules. Si hi ha un bucle entre les taules, la generació de la consulta trigarà més temps i crearà ambigüitat. Sempre s'aconsella evitar un bucle entre les taules.

34. Definiu Magatzem Virtual?

Podem dir que un magatzem virtual és un altre terme per al Data Warehouse. En general, recopila i mostra dades empresarials relacionades amb un moment concret en el temps, creant una instantània de l'estat d'una empresa en aquest moment. Els magatzems virtuals sovint recopilaran dades de diferents fonts.

Preguntes i respostes de l'entrevista d'emmagatzematge de dades

35. Definiu taules de fets sense fets?

Els fets sense fet es defineixen com aquelles taules de fets que no tenen mesures associades a la transacció. Són una simple col·lecció de claus dimensionals que defineixen les transaccions o descriuen una condició durant un període de temps del fet.

36. Definiu XMLA?

XML per a l'anàlisi (XMLA) es defineix com un protocol XML basat en SOAP dissenyat específicament per a l'accés universal de dades a qualsevol font de dades multidimensional estàndard a la qual s'accedeix mitjançant la connexió HTTP. Analysis Services utilitzarà l'XMLA com a únic protocol mentre es comunica amb les aplicacions client.

Vegeu també Les 100 principals preguntes i respostes de l'entrevista de JavaScript

37. Anomena les fases que intervenen en el procés de lliurament del magatzem de dades?

Les etapes que participen en el lliurament del magatzem de dades es detallen a continuació:

  1. estratègia informàtica
  2. Educació
  3. Anàlisi de Cas de Negoci
  4. Pla tècnic
  5. Construeix la versió
  6. Càrrega de l'historial
  7. Per afegir aquesta consulta
  8. Evolució dels requisits
  9. Automatització
  10. Ampliació d'abast.

38. Com carregar la dimensió temporal?

Les dimensions Temps solen carregar-se a través de totes les dates possibles en un any, i es fa mitjançant un programa. Aquí, 100 anys es representaran amb una fila per dia.

39. Diferències entre la base de dades i el magatzem de dades?

Base de dades Magatzem de dades
Són dades bidimensionals.Són dades multidimensionals.
Alt rendiment i disponibilitat.Alta flexibilitat.
La mida de les dades aquí és petita.La mida de les dades aquí és gran.
Són dades relacionals o dades orientades a objectes.Tracta principalment un gran volum de dades.

40. Explica el concepte de gestor de càrrega?

El Gestor de càrrega és un component d'un magatzem de dades que s'encarrega de la recollida de dades del sistema operatiu i les converteix en una forma utilitzable per als usuaris. Aquest component és responsable de la importació i exportació de dades dels sistemes operatius.

Preguntes i respostes de l'entrevista d'emmagatzematge de dades

41. Definiu fets no additius?

Els fets no additius es defineixen com els fets que no es poden resumir per a cap de les dimensions que estan presents a la taula de fets.

42. Pots explicar els tipus de Data Warehouses?

Magatzem de dades empresarials : En aquest tipus de Data Warehouse, les dades organitzatives de diferents àrees funcionals es combinen de manera centralitzada. Ajuda a l'extracció i transformació de les dades, que al seu torn proporciona una visió general detallada de l'objecte en el model de dades.

Magatzem de dades operatives : Aquest tipus de magatzem de dades ajudarà a accedir a les dades directament des de la base de dades i també donarà suport al processament de la transacció. Té com a objectiu integrar dades de contrast de diverses fonts que donen suport a diferents operacions empresarials posteriorment.

Data Mar t: Aquest tipus de magatzem de dades emmagatzemarà les dades d'una àrea funcional concreta. També conté dades en forma de subconjunts que s'emmagatzemen al magatzem de dades. Redueix l'enorme volum de dades perquè els usuaris puguin analitzar i obtenir informació.

43. Quina és la funció d'un gestor de càrrega?

La funció principal d'un gestor de càrrega és

  1. Extraieu dades del sistema font.
  2. A continuació, carregueu les dades extretes a un magatzem de dades temporal.
  3. Realitzar transformacions senzilles en una estructura semblant a la del magatzem de dades.

44. Què és un fet conformat?

Un fet conformat a Data Warehouse es defineix com un fet compartit dissenyat per utilitzar-se de manera similar a diversos data mart. En termes simples, els fets conformats compartits signifiquen que el mateix és a diversos esquemes estel·lars.

45. Explica qui és un responsable de magatzem en termes senzills?

Els responsables de magatzem treballen per a magatzems on la seva tasca principal és supervisar la recepció, l'emmagatzematge de la mercaderia i l'enviament de la mercaderia. Els administradors de magatzem també gestionen el personal del magatzem, els vehicles i altres equips, supervisen la seguretat, el sanejament i les funcions administratives.

Preguntes i respostes de l'entrevista d'emmagatzematge de dades

46. ​​Diferenciar entre agrupacions jeràrquiques divisives i agrupacions aglomeratives?

Agrupació jeràrquica divisoria Clúster aglomeratiu
Aquí, utilitza l'enfocament de dalt a baix on es llegeixen primer les dades a nivell principal i després a nivell secundari.Aquí, els clústers es llegiran de baix a dalt.
Aquí té lloc la divisió de clústers. El clúster pare es dividirà en grups més petits. Aquesta divisió de clústers continuarà fins que cadascun dels clústers contingui un únic objecte.Aquí, els objectes estan presents, i cada objecte construirà el seu clúster, i tots aquests grups formaran un gran clúster.

47. Definiu el magatzem de dades actiu?

L'emmagatzematge de dades actiu es pot definir com la capacitat tècnica per capturar les transaccions quan canvien i combinar-les al magatzem, i també mantenir les actualitzacions de lots o cicles programats. El magatzem de dades actiu exportarà les decisions automàticament als sistemes de processament de transaccions en línia (OLAP).

48. Definir el mètode camaleó en un magatzem de dades?

Pel que fa a Data Warehouse Chameleon, la representació permetrà crear i funcionar amb èxit un conjunt de dades enorme. El mètode trobarà els clústers que s'utilitzen al conjunt de dades mitjançant l'algorisme de dues fases.

49. Definiu la informació resumida?

La informació de resum es pot definir com una part d'un magatzem de dades que té com a objectiu emmagatzemar agregacions predefinides. Aquestes agregacions seran generades pel responsable del magatzem. Resum La informació s'ha de tractar com a transitòria. Canviarà durant la marxa per respondre al perfil de consulta canviant.

Preguntes i respostes de l'entrevista d'emmagatzematge de dades

50. Anomeneu les columnes clau a les taules de fets i dimensions?

Les claus externes de les taules de dimensions són les claus primàries de les taules d'entitats. Les claus externes de les taules de fets són les claus primàries de les taules de dimensions.

51. Enumereu les diferents eines utilitzades en ETL?

  1. Oracle
  2. Informatica
  3. Fase de dades
  4. Unió de dades
  5. Des del principi
  6. Constructor de magatzems

52. Quina és la responsabilitat d'un gestor de consultes?

El gestor de consultes n'és el principal responsable

  1. Dirigir les consultes a taules adequades.
  2. En fer l'anterior, accelerarà el procés de sol·licitud de consulta i resposta.
  3. El gestor de consultes també s'encarrega de programar l'execució de les consultes que l'usuari publica.

53. Definiu la neteja de dades?

La neteja de dades es defineix com la tècnica d'eliminar les dades que no pertanyen al conjunt de dades.

54. Quins d'aquests són més ràpids, OLAP multidimensional o OLAP relacional?

L'OLAP multidimensional és més ràpid que l'OLAP relacional.

55. La taula de dimensions pot tenir un valor numèric?

Sí, la taula de dimensions pot tenir un valor numèric ja que són els elements descriptius de l'empresa.

Preguntes i respostes de l'entrevista d'emmagatzematge de dades

56. Enumereu els enfocaments utilitzats per dissenyar el magatzem de dades?

A continuació s'enumeren els enfocaments utilitzats per dissenyar Data Warehouse:

  1. Enfocament Inmon
  2. Enfocament de Kimball

57. Quantes dimensions podem seleccionar en l'operació Slice?

Només es pot seleccionar una dimensió per a l'operació de tall.

58. Quines són les funcions que realitza l'OLAP?

L'OLAP realitza funcions com

  1. Desenvolupar
  2. Aprofundir
  3. llesca
  4. Diu
  5. Pivot.

59. Enumereu els tipus de modelatge dimensional?

Els tipus de modelatge dimensional s'enumeren a continuació:

  1. Modelització conceptual
  2. Modelatge lògic
  3. Modelatge físic

60. Enumereu els avantatges d'un magatzem de dades en temps real?

Els avantatges d'un magatzem de dades en temps real es detallen a continuació:

  1. Elimina la finestra del lot.
  2. Resol els problemes relacionats amb la càrrega de dades ideal.
  3. Ajuda a la presa de decisions fàcil.
  4. Oferirà una manera optimitzada d'executar les transformacions a la base de dades.
  5. Ofereix una ràpida recuperació de dades.

Molta sort amb la vostra entrevista de magatzem de dades, i esperem que les nostres preguntes i respostes de l'entrevista de magatzem de dades us siguin d'ajuda. També podeu consultar el nostre Preguntes i respostes de l'entrevista Agile Scrum Master .