Preguntes D'entrevista

Les 50 millors preguntes i respostes de l'entrevista ETL

2 de gener de 2022

Pel que fa a la informàtica, ETL (és a dir, extreure, transformar, carregar) és la tècnica general de copiar les dades d'una o diverses fonts en un sistema de destinació que representarà les dades de manera diferent a la font.

Taula de continguts

Per què és important ETL?

El ETL L'eina ens ajuda a trencar les sitges de dades i a facilitar als científics de dades analitzar i accedir a les dades i convertir-les en BI (Business Intelligence). En termes senzills, l'eina ETL és el pas essencial en qualsevol procés d'emmagatzematge de dades que finalment ens permeti prendre decisions més informades en un curt període de temps.

Si teniu previst assistir a una entrevista d'ETL, haureu de preparar-vos abans de l'entrevista perquè la resolgueu fàcilment. Hem enumerat les preguntes i respostes d'entrevistes ETL més freqüents. Assegureu-vos de revisar l'article sencer perquè no us perdeu cap de les preguntes.

Preguntes i respostes principals de l'entrevista ETL

1. Definiu ETL?

Preguntes d'entrevista ETL - ETL

En l'emmagatzematge de dades, ETL (ETL significa Extract, Transact, Load) té un paper important; és un component que gestiona les dades de qualsevol procés empresarial. L'extracte llegirà dades d'una base de dades. Transformar converteix les dades en un format que sigui apropiat per als informes i l'anàlisi, i la càrrega escriurà les dades a la base de dades de destinació.

2. Explica l'arquitectura de tres capes d'un cicle ETL?

Arquitectura de tres capes d'un cicle ETL

A l'arquitectura ETL, les dades s'originaran a partir de fitxers font i bases de dades, i després s'introduiran al motor de transformació ETL. A partir d'aquí, les dades es carregaran a les ubicacions següents:

Zona d'aterratge: L'àrea d'aterratge és l'àrea on les dades arriben per primera vegada després de l'extracció de la ubicació d'origen. Si n'hi ha, s'apliquen transformacions a les dades de la zona d'aterratge. Si es processa el processament per lots d'ETL, l'àrea d'aterratge emmagatzemarà diversos lots de dades abans de moure's pel canal ETL.

Vegeu també Les 100 principals preguntes i respostes de l'entrevista de JavaScript

Zona d'escena: És una ubicació intermèdia temporal on es realitzen transformacions ETL. Aquesta àrea tindrà la forma d'una base de dades relacional, o fitxers de text, o binaris.

Magatzem de dades àrea: És la destinació final de les dades en un pipeline ETL. A partir d'aquí, les dades es poden consultar i analitzar fàcilment per obtenir informació valuosa i prendre bones decisions empresarials.

3. Diferenciar entre ETL i ELT?

ETL ELT
ETL significa procés d'extracció, transformació i càrrega de dades.ELT significa procés d'extracció, càrrega i transformació de dades.
Aquí, les dades es mouen de la font de dades a la posada en escena.Aquí no hi ha posada en escena.
És adequat per tractar conjunts de dades més petits que requereixen transformacions més complexes.ELT és millor quan estem tractant amb grans quantitats de dades estructurades i no estructurades.

4. Definiu les proves ETL?

ETL (Extract/Transform/Load) és una tècnica que extreu les dades dels sistemes font, després transforma les dades en un tipus de dades coherent i després carrega les dades al dipòsit únic. Prova ETL principalment es refereix a la tècnica de validació, verificació i qualificació de les dades, així com evita la duplicació de registres i la pèrdua de dades.

Preguntes d'entrevista ETL

5. Explica les operacions de prova d'ETL?

Les operacions de prova ETL s'enumeren a continuació:

  1. Valida el moviment de dades des del sistema d'origen fins al sistema de destinació.
  2. Hi haurà una verificació del recompte de dades al sistema d'origen i de destinació.
  3. Les proves ETL verificaran la transformació, extracció segons les necessitats i expectatives.
  4. Les proves ETL verificaran si les relacions de taula, les unions i les claus es conserven durant la transformació.

6. Definir BI?

Business Intelligence, és a dir, BI, consisteix en estratègies i tecnologies que utilitzen les empreses per a l'anàlisi de dades de la informació empresarial. Les tecnologies de BI solen proporcionar vistes històriques, predictives i actuals de les operacions empresarials.

7. Definiu el procés ETL?

ETL es defineix com el procés d'extracció, transformació i càrrega.

8. Anomena la prova de fum que es realitza a la prova ETL?

  1. Comprovació de claus duplicades
  2. Clau primària
  3. comprovació de CDC
  4. Integritat referencial
  5. Completitud de la taula

9. Llista els tipus d'aplicacions de magatzem de dades?

Els tipus d'aplicacions de magatzem de dades són:

  1. Tractament de la informació
  2. Processament analític
  3. Mineria de dades

Preguntes i respostes de l'entrevista ETL

10. Diferenciar entre la mineria de dades i l'emmagatzematge de dades?

Mineria de dades i emmagatzematge de dades
Mineria de dades Emmagatzematge de dades
És el procés de determinació de patrons de dades.Un magatzem de dades es pot definir com un sistema de bases de dades dissenyat per a l'anàlisi.
Normalment, els emprenedors de negocis duen a terme la mineria de dades amb l'ajuda d'enginyers.Està realitzat íntegrament pels enginyers.
Utilitza tècniques de reconeixement de patrons per identificar patrons.Es tracta d'una tècnica d'extracció i emmagatzematge de dades que permet fer informes fàcils.
Aquestes tècniques són rendibles.La responsabilitat d'un magatzem de dades és simplificar tot tipus de dades empresarials.

11. Pots dir les diferències entre les eines ETL i BI?

Eines ETL Eines de BI
Les eines ETL extreuen les dades de diverses fonts de dades, les transformen i les carreguen en un sistema de magatzem de dades.Les eines de BI generen informes interactius i ad-hoc per als usuaris finals, visualització de dades per a reunions mensuals, trimestrals i anuals del consell.
Algunes eines ETL són Informatica, el servei de dades SAP BO, Oracle Data Integrator (ODI), Clover ETL Open Source, Microsoft SSIS, etc.Algunes eines de BI són SAP Lumira, IBM Cognos, Gràfic , Oracle Business Intelligence Enterprise Edition, plataforma Microsoft BI, etc.

12. Hi ha subpassos per a cadascun dels passos ETL?

Cadascun dels passos implicats en l'ETL té diversos subpassos. El pas de transformació té més nombre de subpassos.

13. Pots enumerar les responsabilitats d'un verificador d'ETL?

Responsabilitats:

  1. Han de dissenyar i desenvolupar ordres UNIX com a part dels processos ETL i automatitzar el procés d'extracció de dades i càrrega.
  2. Han de treballar amb consultes SQL, ANSI SQL i PL/SQL per provar la funcionalitat de la base de dades.
  3. Han de validar els fitxers PMS de mainframe que migren a DB2.
  4. Han de tenir experiència treballant amb DB2, Terada.
  5. Han de generar informes des de l'eina d'informes COGNOS i comparar-los amb la base de dades EDW.

14. Enumereu les diferents eines utilitzades en ETL?

  1. Oracle Warehouse Builder
  2. Objectes de negoci XI
  3. Seqüència de decisions de Cognos
  4. SAS magatzem comercial
  5. Servei SAS Enterprise ETL

15. Quina és la finalitat de l'àrea d'escenificació en el procés ETL?

L'àrea de posada en escena és l'àrea central que està disponible entre les fonts de dades i els sistemes de magatzem de dades o data marts. És una àrea on emmagatzemem les dades temporalment en el procés d'integració de dades. A l'àrea de posada en escena, les dades sempre es netegen i es comprova la duplicació. La zona d'escenificació està dissenyada de manera que aporti molts avantatges, però l'objectiu principal és utilitzar la zona d'escenificació. Augmenta l'eficiència, garanteix la integritat de les dades i admet operacions de qualitat de dades.

Vegeu també Les 100 millors preguntes i respostes d'entrevista Ansible

Preguntes d'entrevista ETL

16. Definiu la càrrega inicial i la càrrega completa a ETL?

Càrrega inicial : És la primera execució on processem la càrrega històrica a l'objectiu, i després d'això, hem d'incrementar la càrrega (és a dir, aportant només registres modificats i nous).

Càrrega completa: L'abocament complet de dades es produeix la primera vegada que es carrega una font de dades al magatzem.

17. Defineix fets i enumera els tipus de fets a ETL?

Un fet a ETL es defineix com una informació quantitativa com una venda o una descàrrega.

Els fets s'emmagatzemen normalment a les taules de fets i tenen una relació de clau estrangera amb el nombre de taules de dimensions.

Els tipus de fets a ETL són:

  1. Fets additius
  2. Fets semi-additius
  3. Fets no additius

18. Definiu la taula de dimensions i en què es diferencia de la taula de fets?

Una taula de dimensions a ETL es defineix com una taula en un esquema estrella d'un magatzem de dades. Les taules de dimensions descriuen principalment dimensions; consisteixen en claus de dimensions, valors i atributs.

La taula de fets consta principalment de mesures, mètriques i fets sobre un procés empresarial, mentre que la taula de dimensions és una contrapartida de la taula de fets que consta d'atributs descriptius que s'utilitzen com a restricció de consultes.

19. Definiu la càrrega incremental?

La càrrega incremental es refereix a aplicar canvis dinàmics sempre que sigui necessari en un període determinat i horaris predefinits.

20. Definiu cubs i cubs OLAP?

Cubs es defineixen com a unitats de processament de dades que es componen de taules de fets i dimensions del magatzem de dades. Tenen com a objectiu proporcionar vistes multidimensionals de dades, capacitats analítiques i consultes als clients.

An Cub OLAP es pot definir com una estructura de dades que permetrà una anàlisi ràpida de les dades segons múltiples dimensions que definiran un problema empresarial.

Preguntes d'entrevista ETL

21. Definiu Datamart?

Els datamarts es defineixen com un subconjunt del contingut d'informació d'un magatzem de dades que donarà suport a les necessitats d'un departament o funció empresarial en particular. Datamart està construït i controlat per un únic departament de l'empresa. Les dades aquí poden ser o no procedents del magatzem de dades de l'empresa.

22. Quantes capes hi ha a ETL, i quines són?

Tenim tres capes:

  1. La primera capa d'ETL s'anomena capa font , i és la capa on aterren les dades.
  2. La segona capa s'anomena capa d'integració, on emmagatzemem les dades després de la transformació.
  3. La tercera capa s'anomena capa de dimensions, on es troba la capa de presentació real.

23. Definiu el nivell de traçat, i quins són els tipus?

El nivell de traça a ETL és la quantitat de dades que es col·loquen dins dels fitxers de registre.

Els nivells de traça es classifiquen principalment en dos tipus:

    Nivell normal: Descriu el nivell de traça de manera exhaustiva.Verbosa: Explica els nivells de traça a cada fila.

24. Pots dir les diferències entre les proves manuals i les proves ETL?

Prova manual Prova ETL
Se centra en la funcionalitat del programa.Està relacionat amb la base de dades i el seu recompte.
És un procés que requereix temps.És un procés de prova automatitzat.
Requereix coneixements tècnics.No requereix coneixements tècnics ja que està automatitzat.

Preguntes d'entrevista ETL

25. Definir instantànies i les seves característiques?

Snapshot es coneix com una visualització completa de les dades en el moment de l'extracció. Normalment ocupa menys espai i s'utilitza per fer còpies de seguretat i restaurar dades ràpidament.

Característiques:

Les instantànies es troben generalment en nodes remots i s'actualitzen periòdicament perquè s'enregistrin tots els canvis de la taula mestra. També són una rèplica de taules.

Preguntes d'entrevista ETL

26. Definiu el fet de gra?

Pel que fa a l'emmagatzematge de dades, una taula de fets sol contenir mesures, mètriques o fets d'un procés empresarial determinat.

El gra d'una taula de fets normalment defineix el nivell més atòmic on es defineixen els fets. Exemple: el gra d'una taula de fets de vendes es pot indicar com a volum de vendes per dia per producte per botiga.

27. Per què necessitem les proves ETL?

  1. Les proves ETL s'utilitzen per vigilar les dades que es transfereixen d'un sistema a un altre.
  2. Necessitem proves ETL per fer un seguiment de l'eficiència i la velocitat del procés.
  3. La necessitat de proves ETL és essencial i hem d'estar familiaritzats amb el procés ETL abans d'implementar-lo a la nostra producció i negoci.
Vegeu també Les 100 principals preguntes i respostes de l'entrevista de JavaScript

28. Què són les vistes a ETL?

Una vista normalment pren la sortida de la consulta i la tracta com una taula. Per tant, una vista es pensa com una consulta emmagatzemada o una taula virtual. Podem crear una vista senzilla a partir d'una taula on es pot crear una vista complexa a partir de diferents taules.

29. Definir Transformació?

La transformació en ETL es refereix a la neteja i l'agregació que cal que passin a les dades per preparar-les per a l'anàlisi. Les dades extretes es traslladaran a una àrea de preparació on es produeixen les transformacions abans de carregar les dades al magatzem.

30. On poden els usuaris utilitzar els conceptes ETL?

  1. Fusions i adquisicions
  2. Emmagatzematge de dades
  3. Migració de dades

Preguntes de l'entrevista ETL

31. Definiu una vista materialitzada i un registre de visualització materialitzada?

Vistes materialitzades en ETL es poden definir com estructures físiques que poden millorar el temps d'accés a les dades calculant prèviament els resultats intermediaris.

El Registre de visualització materialitzat ETL suprimirà les dades del registre de visualització materialitzada un cop finalitzada la feina. Això requereix que un usuari tingui permisos DELETE, que poden posar en perill les dades d'origen.

32. Enumereu els ús de la transformació de cerca?

  1. Per actualitzar els canvis a la taula de dimensions.
  2. Per obtenir un valor relacionat de la taula utilitzant un valor de columna.
  3. Per verificar si els registres ja existeixen a la taula.

33. Enumera les característiques de Data Warehouse?

Característiques:

  1. Algunes de les dades estan desnormalitzades per simplificar-les i millorar el rendiment.
  2. S'utilitzen grans quantitats de dades històriques.
  3. Les consultes sovint recuperen grans quantitats de dades.
  4. La càrrega de dades està controlada.
  5. Tant les consultes planificades com les ad hoc són habituals.

34. Definir particions i els tipus?

Per tal de millorar el rendiment, subdividim les transaccions; aquest procés es coneix com a partició. La partició permet que l'Informatica Server creï múltiples connexions a diverses fonts.

Tipus de particions:

Particions Round-Robin : Aquí, les dades es reparteixen per igual entre totes les particions. A cada partició, el nombre de files a processar és aproximadament el mateix.

Partició hash : és un tipus de tècnica de partició on s'utilitza una clau hash per distribuir les files uniformement entre les diferents particions. La partició hash s'utilitza quan els intervals no són adequats.

Preguntes i respostes de l'entrevista ETL

35. Enumereu els tipus de sistemes de magatzem de dades?

  1. Anàlisi predictiva
  2. Processament analític en línia (OLAP)
  3. Processament transaccional en línia
  4. Data Mart

36. Diferenciar entre PowerCenter i PowerMart?

PowerCenter PowerMart
Amb PowerCenter, podeu rebre totes les funcionalitats, inclosa la possibilitat de compartir metadades, registrar diversos servidors en dipòsits i particionar dades.El PowerMart inclou totes les funcions excepte les metadades distribuïdes, la partició de dades i diversos servidors registrats. A més, les diferents opcions que estan disponibles amb PowerCenter no estan disponibles amb PowerMart com Powerconnect per a Siebel, PeopleSoft, etc.

37. Mitjançant l'ús de SSIS (Servei d'integració de SQL Server), enumereu les maneres possibles d'actualitzar la taula?

  1. Utilitzeu una taula de posada en escena
  2. Utilitzeu una ordre SQL
  3. Utilitzeu la memòria cau
  4. Utilitzeu la tasca Script
  5. Utilitzeu el nom complet de la base de dades per actualitzar si s'utilitza MSSQL.

38. Enumereu els passos seguits en el procés de prova ETL?

Els passos seguits són:

  1. Anàlisi de requisits
  2. Validació i estimació de proves
  3. Test Planificació i disseny de l'entorn de proves
  4. Preparació i execució de dades de prova
  5. Informe resum

39. Llista les aplicacions a les quals es pot connectar el PowerCenter?

PowerCenter es pot connectar amb fonts ERP com:

  1. SAP
  2. Aplicacions d'Oracle
  3. PeopleSoft, etc.

40. On utilitzeu la memòria cau dinàmica i la memòria cau estàtica en transformacions connectades i no connectades?

  1. Per als fitxers plans, s'utilitza la memòria cau estàtica.
  2. La memòria cau dinàmica s'utilitza normalment quan cal actualitzar la taula mestra i canviar lentament les dimensions (SCD) tipus 1

Preguntes i respostes de l'entrevista ETL

41. Enumereu els passos per triar el procés ETL?

  1. Connectivitat de dades
  2. Rendiment
  3. Flexibilitat de transformació
  4. Qualitat de les dades
  5. Opció d'acció de dades flexible
  6. Proveïdor ETL compromès

42. Anomeneu la partició que s'utilitza per millorar el rendiment de les transaccions ETL?

La partició de sessió s'utilitza per millorar el rendiment de les transaccions ETL.

43. Definiu la vista de font de dades a ETL?

Les vistes de font de dades (DSV) us permetran crear una visió lògica només de les taules implicades en el disseny del vostre magatzem de dades.

44. Llista els tipus d'errors ETL?

Errors ETL
  1. Errors d'origen
  2. Errors d'estat de càrrega
  3. Errors de càlcul
  4. Errors relacionats amb l'ECP
  5. Errors de la interfície d'usuari
  6. Errors de partició de classes d'equivalència
  7. Error d'anàlisi del valor límit

Preguntes de l'entrevista ETL

45. Llista els tipus de proves ETL?

Tipus:

  1. Proves de validació de producció
  2. Proves d'origen a objectiu (validació)
  3. Actualització de l'aplicació
  4. Prova de metadades
  5. Prova de precisió de dades
  6. Proves de transformació de dades
  7. Proves de migració
  8. Nova prova de magatzem de dades

Preguntes i respostes de l'entrevista ETL

46. ​​Diferenciar entre la cerca no connectada i connectada?

Cerca sense connexió Cerca connectada
Rep valors de l'expressió de cerca.Rep els valors d'entrada directament de la canalització de mapes.
Només té un port de retorn i, per tant, retorna una columna de cada fila.Retorna diverses columnes de la mateixa fila perquè tenen diversos ports de retorn.
No admet valors definits per l'usuari.Admet valors predeterminats definits per l'usuari.

47. Definir ODS en ETL?

ODS significa font de dades operacionals. Funciona entre les àrees de prova i Data Warehouse. Les dades són ODS estaran a nivell de granularitat. Quan inserim les dades a ODS, totes les dades es carregaran a l'EDW a través de l'ODS.

48. Definir l'extracció de dades i enumerar les fases en ETL?

L'extracció de dades es pot definir com l'extracció de dades de diverses fonts diferents mitjançant eines ETL.

Aquí hi ha dos tipus d'extracció de dades:

    Extracció parcial:Rebem la notificació dels sistemes font per actualitzar les dades especificades. Es coneix com a Delta Load.Extracció completa:Totes les dades extretes d'un sistema operatiu o sistema font es carreguen a l'àrea de prova.

49. Expliqueu els passos per extreure dades SAP amb Informatica?

  1. Mitjançant l'opció de connexió d'alimentació, podem extreure les dades de SAP mitjançant Informatica.
  2. Per això, cal instal·lar i configurar l'eina PowerConnect.
  3. A continuació, importeu la font a l'analitzador de fonts. Entre Informatica i SAP, el Powerconnect actua com a passarel·la.
  4. En el següent pas, generem el codi ABAP per al mapeig; aleshores, només Informatica pot extreure dades de SAP.
  5. A continuació, per connectar i importar fonts des dels sistemes externs, fem servir Power Connect.

50. Defineix els termes Worklet, Session, Mapplet i Workflow?

Worklet : Defineix un conjunt específic de tasques donades.

Mapplet : Organitza o crea conjunts de transformació.

Flux de treball : Es pot definir com un conjunt d'instruccions que indicaran al servidor com executar les tasques.

Sessió : Es defineix com un conjunt de paràmetres que indica al servidor com moure les dades d'una font a la destinació.

Molta sort amb la vostra entrevista ETL, i esperem que les nostres preguntes i respostes de l'entrevista ETL us hagin ajudat. També podeu consultar el nostre Preguntes d'entrevista d'Informatica que et pot ser d'alguna ajuda.