Preguntes D'entrevista

Les 50 millors preguntes i respostes de l'entrevista de proves ETL

2 de gener de 2022

Pel que fa a la computació, Extract, Transform, Load (ETL) es defineix com la tècnica general de copiar les dades obtingudes d'una o diverses fonts a un sistema de destinació que representarà les dades de manera diferent a la de la font.

Preguntes d'entrevista de proves ETL

Taula de continguts

Què és la prova ETL?

Fem el Prova ETL per garantir que les dades que es carreguen d'una font a la destinació després d'una transformació empresarial siguin precises. Implicarà la verificació de dades en diferents estadis intermedis que s'utilitzen entre la font i la destinació.

Si teniu programada una entrevista de prova d'ETL, haureu de revisar les nostres preguntes i respostes de l'entrevista TOP ETL. Hem observat les preguntes i respostes de l'entrevista ETL més freqüents i, si us plau, reviseu l'article sencer.

Les 50 millors preguntes i respostes de l'entrevista de proves ETL

1. Expliqueu les operacions de prova d'ETL?

Les proves ETL inclouen les operacions esmentades a continuació:

  1. Validarà el moviment de dades des del sistema d'origen fins al sistema de destinació.
  2. Fa la verificació del recompte de dades al sistema d'origen i de destinació.
  3. Verifica la transformació i extracció segons els requisits i expectatives.
  4. Verifica si les relacions de taula s'uneixen i les claus es conserven durant la transformació.

2. Diferenciar les proves ETL amb les proves manuals?

Prova ETL Prova manual
Verifica si les dades es mouen com s'esperava.És un mètode d'observació i prova.
És ràpid i sistemàtic i pretén oferir els millors resultats.Necessita temps i esforç, i és propens a més errors.
No requereix cap coneixement tècnic addicional que no sigui entendre el programari.Requereix coneixements tècnics de scripting SQL i Shell.

3. Definiu ETL?

Pel que fa a la computació, Extract, Transform, Load (ETL) es defineix com la tècnica general de copiar les dades obtingudes d'una o diverses fonts a un sistema de destinació que representarà les dades de manera diferent a la de la font.

4. Llista els tipus d'aplicacions de Data Warehouse?

  1. Tractament de la informació
  2. Processament analític
  3. Mineria de dades
Vegeu també Les 100 principals preguntes i respostes de l'entrevista de JavaScript

5. Quina és la necessitat de proves ETL?

  1. Per aconseguir els millors resultats ràpids.
  2. Per vigilar les dades que es transfereixen d'un sistema a un altre.
  3. Per fer un seguiment de la velocitat i l'eficiència del procés.

Preguntes i respostes de l'entrevista de proves ETL

6. Quina és la necessitat d'una àrea d'escenificació en el procés ETL?

Una àrea de preparació també es coneix com a zona d'aterratge, es defineix com una àrea d'emmagatzematge intermèdia que s'utilitza per al processament de dades durant el procés d'extracció, transformació i càrrega (ETL). L'àrea de preparació de dades resideix entre la font de dades i la destinació de dades, que són els magatzems de dades, els centres de dades o altres dipòsits de dades.

7. Enumereu les diferents eines utilitzades en ETL?

  1. Seqüència de decisions de Cognos
  2. SAS Servidor ETL empresarial
  3. Oracle Warehouse Builder
  4. Objectes de negoci XI
  5. Magatzem comercial SAS

8. Enumereu les responsabilitats d'un verificador d'ETL?

Les responsabilitats d'un verificador ETL s'enumeren a continuació:

  1. Haurien de validar els fitxers PMS de mainframe que migren a DB2.
  2. Han de provar l'esquema de la base de dades amb l'ajuda dels arquitectes de dades mitjançant ERWIN.
  3. Han de tenir experiència treballant amb DB2, Terada.
  4. Han de gestionar l'inventari departamental i resoldre els problemes de proves, inventaris i informes.

9. Expliqueu el procés de prova d'ETL?

    Analitzant el requisit: El verificador ha d'entendre l'estructura empresarial i els seus requisits específics.Validació i estimació de prova:En aquesta fase es fa l'estimació del temps i de l'expertesa que es requereix per dur a terme el procediment.Planificació de proves i disseny de l'entorn de proves: En aquesta fase, a partir de les aportacions d'estimacions, es planifica i es treballa l'entorn ETL d'acord amb ell.Preparació i execució de dades de prova: Aquí es prepararan les dades de la prova, i s'executarà segons el requisit.Informe resum: Aquí, un cop finalitzada la prova, el provador ha de preparar un breu informe resum per improvisar i concloure.

10. Pots esmentar alguns errors ETL?

Tipus d'errors ETL

A continuació s'enumeren alguns dels errors d'ETL:

    Error d'entrada/sortida:Aquí no s'accepten valors vàlids i s'accepten valors no vàlids.Errors de condicions de càrrega: No permetrà la càrrega esperada de múltiples usuaris i clients.Errors de condicions de carrera: Aquí, el sistema no pot executar plataformes client.Errors de control de versions: Això passarà a les proves de regressió.Errors H/W: aquí, el dispositiu no respon a l'aplicació.
  1. Ajuda Font d'errors
  2. Error relacionat amb Equivalence Class Partitioning (ECP).

Preguntes i respostes de l'entrevista de proves ETL

11. Què són els atributs de dimensions a ETL?

Els atributs de dimensions a ETL es defineixen com les diferents columnes d'una taula de dimensions.

12. Defineix Fet i enumera els tipus de Fets?

Un fet es defineix com un component central del model multidimensional que consta de les mesures que s'han d'analitzar. Els fets solen estar relacionats amb dimensions.

Els tipus de fets són:

  1. Fets semiadditius
  2. Fets no additius
  3. Fets additius

13. Definiu fulls de mapes ETL?

Els fulls de mapes ETL consten de tota la informació de les taules d'origen i de destinació que inclouen totes i cadascuna de les columnes i també la seva consulta a les taules de referència.

14. Diferenciar entre les eines OLAP i les eines ETL?

Eines OLAP Eines ETL
Les dades obtingudes del procés ETL són utilitzades per l'eina OLAP per visualitzar dades en diferents formes.Un ETL és una tècnica per extreure, carregar i transformar dades a una forma significativa.
Exemple: Business Objects, Cognos, etc.Exemple: Fase de dades, Informàtica, etc.

15. Definiu cubs i cubs OLAP?

An Cub OLAP es defineix com una base de dades multidimensional que s'optimitza principalment per als informes.

Cubs es poden definir com les unitats de processament de dades que es componen principalment de taules de fets i dimensions del magatzem de dades.

Preguntes i respostes de l'entrevista de proves ETL

16. Com extreure dades SAP amb Informatica?

  1. Mitjançant l'opció de connexió d'alimentació, podem extreure dades SAP mitjançant Informatica.
  2. A continuació, hem d'instal·lar i configurar l'eina PowerConnect.
  3. Ara, importeu la font a Source Analyzer. En el següent pas, generem el codi ABAP utilitzat per al mapeig i, a continuació, Informatica pot extreure dades de SAP.
  4. Ara, per connectar i importar les fonts de sistemes externs, fem servir Power Connect.

17. Pots enumerar alguns casos de prova i explicar-los?

    Comprovació de dades– Aquí, en aquest cas, es posen a prova tots i cadascun dels aspectes relacionats amb les dades, com ara la comprovació de dades, la comprovació nul·la, la comprovació de números.Mapping Doc Validation– Verifica si la informació ETL es proporciona al Doc de mapeig.Problemes de correcció– Aquí es comprova les dades mal escrites, les dades nul·les i les dades inexactes.

18. Com escriure casos de prova per a proves ETL?

  1. Assegureu-vos que totes les dades esperades es carreguin a la taula de destinació.
  2. Heu de comparar el recompte de registres entre la font i la destinació.
  3. Heu de comprovar si hi ha registres rebutjats.
  4. Comproveu les dades; no s'ha de truncar a la columna de taules de destinació.
  5. Comproveu l'anàlisi del valor de límit.
  6. Heu de comparar valors únics dels camps clau entre les dades carregades a WH i les dades d'origen.
Vegeu també Les 100 millors preguntes i respostes d'entrevista Ansible

19. Definiu el nivell de traça i enumereu els tipus de nivell de traça?

El nivell de traça es pot definir com la quantitat de dades que es col·loquen dins dels fitxers de registre. Un nivell de traça es pot classificar en dos tipus:

El nivell normal defineix el nivell de traça de manera integral.

Verbosa defineix els nivells de traça a cada fila.

20. Diferenciar entre Power Mart i Power Center?

Power Mart Centre d'energia
No admet cap font ERP.Admet principalment fonts ERP com SAP, gent soft, etc.
No converteix el local en el repositori global.Principalment converteix el local en el repositori global.
Tracta un volum baix de dades.Processa un gran volum de dades.

Preguntes i respostes de l'entrevista de proves ETL

21. Definiu el terme Gra de fet?

Pel que fa a l'emmagatzematge de dades, una taula de fets conté principalment mètriques, mesures o fets d'un procés empresarial. El gra d'una taula de fets definirà el nivell més atòmic en què es defineixen els fets. El gra d'una taula de fets de vendes s'indicarà com a volum de vendes per dia per producte per botiga.

22. Enumereu els passos inclosos a l'àrea de posada en escena?

Els passos inclosos a l'àrea d'escenificació són:

  1. Extracció de dades font i transformació de dades, és a dir, reestructuració
  2. Transformació de dades (és a dir, neteja de dades, transformació de valors).
  3. Assignacions de claus substitutives.

23. Definiu la depuració de dades?

La depuració es defineix com la tècnica d'alliberar espai a la base de dades o esborrar dades obsoletes que no són essencials pel sistema. El procés de purga es basa en l'antiguitat de les dades o el tipus de dades.

24. Definir mesures?

Les mesures solen ser les dades numèriques basades en les columnes d'una taula de fets.

Preguntes i respostes de l'entrevista de proves ETL

25. Definir objectes d'esquema?

Els objectes d'esquema es poden definir com l'estructura lògica que fa referència directament a les dades de la base de dades. Els objectes d'esquema inclouen vista, taules, sinònims de seqüències, clústers, índexs, paquets de funcions i enllaços de bases de dades.

26. Definir Transformació?

La transformació es pot definir com el lloc d'emmagatzematge on es produeix la modificació, generació i pas de dades.

27. Pots definir els termes Sessió, Worklet, Mapplet i Workflow?

Worklet : Defineix un conjunt específic de tasques donades

Flux de treball : Es defineix com un conjunt d'instruccions que indicaran al servidor com executar les tasques.

Sessió : Es defineix com un conjunt de paràmetres que indicaran al servidor com moure les dades de les fonts a la destinació.

Mapplet : Organitza o crea conjunts de transformació.

28. Què és un esquema de fets sense fet?

Un esquema de fets sense fet es defineix com la taula de fets sense cap mesura. S'utilitza principalment per visualitzar el nombre d'ocurrències d'esdeveniments.

29. Expliqueu el procés de proves ETL?

La prova ETL es realitza en cinc etapes, a saber,

  1. Identificació de fonts de dades i requisits
  2. Adquisició de dades
  3. Implementació de la lògica de negoci i Modelatge dimensional
  4. Creeu i ompliu les dades
  5. Crear informes

30. Llista els tipus de proves ETL?

Proves de validació de producció : Aquest tipus de proves ETL es fan normalment a partir de dades a mesura que es traslladen als sistemes de producció.

Proves d'origen a objectiu o proves de validació : Aquest tipus de proves es fa per validar si els valors de dades que es transformen són els valors de dades esperats.

Actualitzacions d'aplicacions : aquest tipus de proves es genera automàticament estalviant el temps de desenvolupament de la prova.

Prova de metadades : Aquesta prova inclourà la prova de la comprovació del tipus de dades, la comprovació de la longitud i la comprovació d'índex/restriccions.

Prova d'exhaustivitat de dades : Aquesta prova es fa per verificar que les dades esperades es carreguen a un objectiu des d'una font, es fa una prova de la integritat de les dades.

Prova de precisió de dades : aquest tipus de proves es realitza per garantir que les dades es carreguen amb precisió i es transformen com s'esperava.

Proves de transformació de dades : Aquí, es realitza la prova de transformació de dades perquè, en molts casos, no ho podem aconseguir escrivint una consulta SQL d'origen i després comparant la sortida amb l'objectiu.

Prova de qualitat de les dades: Per evitar errors a causa de la data o el número de comanda durant el procés comercial, es realitzen proves de qualitat de dades.

Proves d'ETL incrementals : Aquesta prova es realitza per comprovar la integritat de les dades de les dades antigues i noves amb l'addició de dades noves.

Proves de GUI/Navegació: Aquesta prova es realitza per comprovar els aspectes de navegació o GUI dels informes de front-end.

Preguntes i respostes de l'entrevista de proves ETL

31.Anomeneu els dos documents que fa servir el verificador d'ETL?

Quan es realitza la prova ETL, un verificador d'ETL utilitza dos documents, són:

    Fulls de mapes ETL:Els fulls de mapes ETL consten de tota la informació de les taules d'origen i de destinació que inclouen totes i cadascuna de les columnes i també la seva consulta a les taules de referència.Esquema de base de dades d'origen, objectiu:Aquests documents s'han de mantenir a mà per verificar qualsevol detall en els fulls de mapes.
Vegeu també Les 100 principals preguntes i respostes de l'entrevista de JavaScript

32. Llista les millors pràctiques per a les proves ETL?

  1. Assegureu-vos que les dades es transformen correctament.
  2. Les dades projectades s'han de carregar al magatzem de dades sense cap pèrdua ni truncament de dades.
  3. Assegureu-vos que l'aplicació ETL rebutja i substitueix adequadament els valors predeterminats i informa de les dades no vàlides.
  4. El verificador ha d'assegurar-se que les dades que es carreguen al magatzem de dades dins dels terminis prevists i previstos per confirmar l'escalabilitat i el rendiment.
  5. Tots els mètodes han de tenir proves unitàries adequades independentment de la visibilitat.
  6. Per mesurar l'eficàcia, totes les proves unitàries han d'utilitzar tècniques de cobertura adequades.
  7. Creeu proves unitàries orientades a excepcions

33. Definir les proves de rendiment a ETL?

Prova de rendiment en ETL es defineix com una tècnica de prova utilitzada per assegurar que un sistema ETL gestionarà la càrrega de diversos usuaris i transaccions. L'objectiu principal de les proves de rendiment d'ETL és optimitzar i millorar el rendiment de la sessió identificant i eliminant els colls d'ampolla de rendiment.

Les bases de dades de destinació i font, mapes, sessions i sistemes possiblement tinguin colls d'ampolla de rendiment.

34. Anomena la millor eina utilitzada per a les proves de rendiment?

La millor eina que s'utilitza per fer proves de rendiment o ajustar és Informatica.

Preguntes i respostes de l'entrevista de proves ETL

35. Què és la prova ETL automatitzada?

Una solució automatitzada de proves ETL està dissenyada per trobar els problemes de dades en els processos ETL. Els motors únics amb suport per a SQL i Groovy permetran proves i supervisió d'extrem a extrem.

36. Enumera els tipus de transformació?

Hi ha dos tipus de transformació, és a dir,

Transformació activa : S'utilitza principalment per modificar les files de dades i el nombre de files d'entrada que hi passen. Un exemple és la transformació del filtre.

Transformació passiva : S'utilitza principalment per obtenir dades d'entrada i sortida en el mateix nombre de files. Un exemple és la transformació de cerca.

37. Què és el particionament i llista els tipus de particions?

El particionament es pot definir com la divisió de l'emmagatzematge de dades per tal de millorar el rendiment. Hi ha dos tipus de particions, a saber,

Divisió circular : És un tipus de partició que es fa per distribuir les dades de manera uniforme en totes les divisions, i s'acostuma a aplicar quan el nombre de files per processar és el mateix.

Partició hash: És un tipus de particionament que es fa principalment per agrupar les dades en funció de claus i s'utilitza per garantir que els grups processats estiguin en una partició similar. El particionament Hush pretén trobar aplicacions al servidor de l'Informatica.

38. Què és Informatica?

Informatica es defineix com una empresa de desenvolupament de programari que oferirà productes relacionats amb la integració de dades. Els productes d'Informàtica són utilitzats principalment per ETL, qualitat de dades, emmascarament de dades, gestió de dades mestres, etc.

39. Hi ha algun avantatge d'utilitzar l'adaptador de destinació DataReader?

El principal avantatge d'utilitzar un adaptador de destinació DataReader és que omple un conjunt de registres ADO a la memòria i exposa les dades d'una tasca DataFlow mitjançant la implementació d'una interfície DataReader de manera que l'altra aplicació pot consumir les dades.

40. Què és SSIS?

Serveis d'integració de SQL Server es defineix com un component del programari de base de dades de Microsoft SQL Server que s'utilitza per realitzar una àmplia gamma de tasques de migració de dades. És una plataforma per a aplicacions de flux de treball i integració de dades. També inclou una eina d'emmagatzematge de dades que s'utilitza per a l'extracció, càrrega i transformació de dades.

Preguntes i respostes de l'entrevista de proves ETL

41. Definiu la transformació del filtre?

La transformació del filtre es defineix com una transformació activa que s'utilitza per filtrar els registres en funció de les condicions del filtre.

42. Quina és la necessitat d'una comprovació de dades com a cas de prova?

Amb un cas de prova de comprovació de dades, podem obtenir fàcilment la informació relacionada amb la comprovació de dades, la comprovació de números i la comprovació nul·la.

43. Diferenciar entre la cerca connectada i no connectada?

Cerca sense connexió Cerca connectada
Aquí només es pot utilitzar un port de sortida.Aquí, podem utilitzar diversos ports de sortida.
Aquí, fem ús de la memòria cau estàtica.Aquí, podem utilitzar ja sigui estàtic o dinàmic.

44. Quina és la importància del cas de prova del problema de correcció?

El cas de prova de problemes de correcció ens ajudarà a entendre les dades mal escrites, les dades nul·les i les dades inexactes.

45. Quin és el propòsit de la memòria cau dinàmica i la memòria cau estàtica en la transformació connectada i no connectada?

La memòria cau estàtica s'utilitza principalment per a fitxers plans, mentre que la memòria cau dinàmica s'utilitza principalment per actualitzar la taula mestra canviant lentament les dimensions.

Preguntes i respostes de l'entrevista de proves ETL

46. ​​Definiu la vista de la font de dades?

Una visualització de fonts de dades normalment consisteix en les metadades que defineixen els objectes seleccionats d'una o diverses fonts de dades subjacents o les metadades que s'utilitzen per generar el magatzem de dades relacional subjacent.

A part de les preguntes tècniques, l'entrevistador farà algunes preguntes generals i preguntes basades en escenaris, que haureu de respondre en funció de la vostra experiència. Prepareu-vos també per a les preguntes esmentades a continuació.

Preguntes i respostes de l'entrevista de proves ETL

47. Per què proves ETL?

48. Explica'm alguna cosa sobre la nostra empresa?

49. Per què t'hauríem de contractar?

50. Quins són els teus punts forts i febles?

Molta sort amb la vostra entrevista de proves ETL, i espero que les nostres preguntes i respostes de l'entrevista de proves ETL us siguin d'ajuda. Assegureu-vos de comprovar el nostre Preguntes d'entrevista d'Informatica i Preguntes d'entrevista ETL que et pot ser d'alguna ajuda.