Preguntes D'entrevista

Les 100 millors preguntes i respostes d'entrevistes d'aprenentatge automàtic

2 de gener de 2022

Aprenentatge automàtic és un mètode d'anàlisi de dades que automatitza la construcció de models analítics. És una branca de la intel·ligència artificial que es basa en la idea que els sistemes poden aprendre de les dades, i poden identificar patrons i prendre decisions amb menys intervenció humana.

L'aprenentatge automàtic s'utilitza àmpliament als motors de cerca d'Internet, filtres de correu electrònic per resoldre llocs web de correu brossa, programari bancari per detectar transaccions inusuals o corruptes i s'utilitza en moltes aplicacions de telèfons com el reconeixement de veu.

Taula de continguts

Una carrera en aprenentatge automàtic?

S'espera que la intel·ligència artificial creï un valor empresarial d'uns 4.000 milions de dòlars a finals de 2022. Més d'un terç de les empreses ja han començat a gastar en aprenentatge automàtic i ciència de dades, o tenen previst fer-ho en el proper temps. .

Si parlem d'oportunitats laborals per als enginyers d'aprenentatge automàtic, en el període 2015-2018 s'ha produït un augment de més d'un 330% de les ofertes de feina per a aquest lloc a tot el món.

Podeu fer una bona carrera en treballs d'aprenentatge automàtic. Hem observat les preguntes i respostes d'entrevistes d'aprenentatge automàtic més freqüents. Assegureu-vos de revisar tot el nostre bloc perquè no us perdeu cap de les preguntes i respostes de l'entrevista d'aprenentatge automàtic.

Principals preguntes i respostes de l'entrevista d'aprenentatge automàtic

1. Expliqueu l'aprenentatge automàtic, la intel·ligència artificial i l'aprenentatge profund?

aprenentatge automàtic

L'aprenentatge automàtic es defineix com un subconjunt de la intel·ligència artificial i conté les tècniques que permeten als ordinadors classificar coses a partir de les dades i oferir aplicacions d'intel·ligència artificial.

Intel · ligència artificial (AI) és una branca de la informàtica que se centra principalment en la construcció de màquines intel·ligents que poden realitzar determinades tasques que requereixen principalment intel·ligència humana. És l'empresa per replicar o simular la intel·ligència humana en màquines.

L'aprenentatge profund es pot definir com una classe d'algorismes d'aprenentatge automàtic en intel·ligència artificial que utilitza principalment diverses capes per extreure acumuladament característiques de nivell superior de l'entrada en brut donada.

2. Què tan difícil és l'aprenentatge automàtic?

L'aprenentatge automàtic és enorme i inclou moltes coses. Per tant, es necessitaran més de sis mesos per aprendre aprenentatge automàtic si dediqueu almenys 6-7 hores al dia. Si teniu bones habilitats matemàtiques i analítiques pràctiques, sis mesos us seran suficients.

3. Pots explicar Kernel Trick en un algorisme SVM?

Un truc del nucli és un mètode on les dades no lineals es projecten en un espai de dimensió més gran per tal de facilitar la classificació de les dades on es poden dividir linealment per un pla.

4. Pots enumerar algunes de les tècniques de validació creuada populars?

Algunes de les tècniques de validació creuada més populars s'enumeren a continuació:

    Mètode de retenció:Aquest tipus de tècnica funciona eliminant la part del conjunt de dades d'entrenament i enviant-la al model que es va entrenar amb el conjunt de dades restant per obtenir les prediccions necessàries.Validació creuada plegat en K:Aquí, les dades es divideixen en k subconjunts de manera que cada vegada, un dels k subconjunts es pot utilitzar com a conjunt de validació i els altres k-1 subconjunts s'utilitzen com a conjunt d'entrenament.Validació creuada de plegament en K estratificat:Funciona amb dades desequilibrades.Validació creuada d'exclusió:Aquí, deixem p punts de dades fora de les dades d'entrenament fora dels n punts de dades, després fem servir les mostres n-p per entrenar el model i p punts per al conjunt de validació.

5. Diferències entre els algorismes d'envasat i de reforç?

Embolcall Potenciant
És un mètode que fusiona el mateix tipus de prediccions.És un mètode que fusiona els diferents tipus de prediccions.
Disminueix la variància, no el biaixDisminueix el biaix, no la variància.
Tots i cadascun dels models reben el mateix pesEls models es pesen en funció del rendiment.

Preguntes i respostes de l'entrevista d'aprenentatge automàtic

6. Què són els nuclis a SVM? Podeu enumerar alguns nuclis populars utilitzats a SVM?

El nucli s'utilitza bàsicament per configurar les funcions matemàtiques que s'utilitzen a la màquina de vectors de suport proporcionant la finestra per manipular les dades. La funció del nucli s'utilitza per transformar el conjunt de dades d'entrenament de manera que una superfície de decisió no lineal es transformi en una equació lineal en un nombre més gran d'espais de dimensions.

Alguns dels nuclis populars utilitzats a SVM són:

  1. Nucli polinomial
  2. Nucli gaussià
  3. Funció de base radial gaussiana (RBF)
  4. Nucli de Laplace RBF
  5. Nucli tangent hiperbòlic
  6. Nucli sigmoide
  7. Funció de Bessel del primer tipus Kernel
  8. Nucli de base radial ANOVA

7. Pots explicar l'error OOB?

Un error fora de la bossa anomenat error OBB, també conegut com a estimació fora de la bossa, és una tècnica per mesurar l'error de predicció de boscos aleatoris, arbres de decisió potenciats. El bagging utilitza principalment el submostreig amb substitució per crear les mostres d'entrenament perquè el model aprengui d'elles.

8. Pots diferenciar entre els algorismes K-Means i KNN?

K-Mitjans Algoritmes KNN
És un aprenentatge automàtic no supervisat.És un aprenentatge automàtic supervisat.
És un algorisme d'aprenentatge automàtic de clustering.És un algorisme d'aprenentatge automàtic de classificació o regressió.
El seu rendiment és lent.Funciona molt millor.
És un aprenent amb ganes.És un aprenent mandrós.

9. Expliqueu el terme mitjana del factor d'inflació de la variància?

El factor d'inflació de la variància conegut com a VIF és una mesura de la quantitat de multicolinearitat en el conjunt donat de variables de regressió múltiple. La relació aquí es calcula per a cadascuna de les variables independents. Un VIF elevat significa que la variable independent associada és majoritàriament colineal amb les altres variables del model.

10. Expliqueu SVM (Support Vector Machines) a l'aprenentatge automàtic?

La màquina de vectors de suport, coneguda com SVM, és un dels algorismes d'aprenentatge supervisat més utilitzats que s'utilitza principalment per a problemes de classificació i regressió. S'utilitza principalment per a problemes de classificació en aprenentatge automàtic.

Vegeu també Les 100 millors preguntes i respostes d'entrevista Ansible

L'objectiu principal de l'algorisme SVM és crear el millor límit de decisió, que segrega l'espai n-dimensional en classes de manera que es pugui posar fàcilment el nou punt de dades obtingut a la categoria correcta en el futur.

Preguntes i respostes de l'entrevista d'aprenentatge automàtic

11. Diferenciar entre aprenentatge automàtic supervisat i no supervisat?

Model supervisat Model no supervisat
Aquí, l'algoritme aprèn en un conjunt de dades etiquetat,Aquí, proporciona dades sense etiquetar.
Aquí, els models han de trobar la funció de mapeig que s'utilitza per mapar la variable d'entrada (X) amb la variable de sortida (Y).L'objectiu principal de l'aprenentatge no supervisat és trobar l'estructura i els patrons a partir de les dades d'entrada donades.

12. Explica els termes Precisió i Recordació?

Precisió, també conegut com a valor predictiu positiu, es defineix com la fracció d'instàncies rellevants entre les instàncies recuperades.

Precisió = TP/TP+FP

On TP és veritable positiu

FP id Fals Positiu

recorda, també conegut com a sensibilitat, es defineix com la fracció d'instàncies rellevants que es van recuperar.

Recuperació = TP/TP+FP.

On TP és veritable positiu

FP és fals positiu.

13. Diferenciar entre L1 i L2 Regularització?

L1 Regularització L2 Regularització
Un model de regressió que fa ús del procés de regularització L1 s'anomena regressió de lazo.Un model de regressió que fa ús del procés de regularització L1 s'anomena Ridge Regression.
La regressió de lazo afegeix el valor absolut de la magnitud del coeficient com a terme de penalització a la funció de pèrdua.La regressió de cresta afegeix la magnitud al quadrat del coeficient com a terme de penalització a la funció de pèrdua.
Intenta estimar la mediana de les dades.Intenta estimar la mitjana de les dades.

14. Explica la transformada de Fourier?

La transformada de Fourier és una manera de dividir alguna cosa en un munt d'ones sinusoïdals. Pel que fa a les matemàtiques, la Transformada de Fourier és un procés que pot transformar un senyal en els seus respectius components i freqüències. La transformada de Fourier s'utilitza no només en senyal, ràdio, acústica, etc.

15. Quina és la puntuació de la F1? Com utilitzar-lo?

La puntuació F1 combina la precisió i el record d'un classificador en una única mètrica prenent la mitjana harmònica. S'utilitza per comparar el rendiment de dos classificadors. Per exemple, el classificador X té un record més alt i el classificador Y té una precisió més alta. Ara s'utilitzaran les puntuacions F1 calculades per als dos classificadors per predir quin produeix els millors resultats.

La puntuació F1 es pot calcular com

2(P*R)/(P+R)

On P és la precisió.

R és el record del model de classificació.

Preguntes i respostes de l'entrevista d'aprenentatge automàtic

16. Diferenciar entre error de tipus I i tipus II?

Error de tipus I Error de tipus II
És equivalent a un fals positiu.És equivalent a un fals negatiu
Es refereix a la no acceptació de la hipòtesiEs refereix a l'acceptació de la hipòtesi
Pot haver-hi un rebuig fins i tot amb una coincidència autoritzada.Hi pot haver una acceptació fins i tot amb una coincidència no autoritzada.

17. Pots explicar com funciona una corba ROC?

La corba ROC es representa gràficament representant la taxa de veritable positiu (TPR) contra la FPR (taxa de fals positius). On

  1. La veritable taxa positiva es pot definir com la proporció d'observacions que es preveu que siguin positives de totes les observacions positives donades.

(TP/(TP + FN))

  1. La taxa de falsos positius es defineix com la proporció d'observacions que es prediuen incorrectament com a positives de totes les observacions negatives donades.

(FP/(TN + FP))

18. Diferenciar entre aprenentatge profund i aprenentatge automàtic?

Aprenentatge profund Aprenentatge automàtic
És un subconjunt de l'aprenentatge automàticÉs un superconjunt de Deep Learning.
Soluciona problemes complexos.S'utilitza per aprendre coses noves.
És una evolució cap a l'aprenentatge automàtic.És una evolució de la IA.
Aquí, els algorismes es representen en gran mesura a si mateixos en l'anàlisi de dadesEls analistes de dades detecten algorismes.

19. Pots anomenar els diferents algorismes d'aprenentatge automàtic?

A continuació s'enumeren els diferents algorismes d'aprenentatge automàtic:

  1. arbres de decisió,
  2. Bayes ingenu,
  3. Bosc aleatori
  4. Màquina vectorial de suport
  5. K-veí més proper,
  6. K-significa agrupació,
  7. model de mescla gaussiana,
  8. Model de Markov ocult, etc.

Preguntes i respostes de l'entrevista d'aprenentatge automàtic

20. Què és la IA?

FINS AL

La IA (intel·ligència artificial) fa referència a la simulació de la intel·ligència humana en màquines programades per reflectir com els humans i imitar les seves accions.

Exemples: detecció i reconeixement de cares, Google Maps i

Aplicacions Ride-Hailing, pagaments electrònics.

Preguntes i respostes de l'entrevista d'aprenentatge automàtic

21. Com seleccionar variables importants mentre es treballa en un conjunt de dades?

  1. Heu d'eliminar les variables correlacionades abans de seleccionar variables importants.
  2. Feu ús de la regressió lineal i seleccioneu les variables en funció dels seus valors p.
  3. Utilitzeu la selecció cap endavant, la selecció pas a pas i la selecció cap enrere.
  4. Utilitzeu Random Forest, Xgboost i traça un gràfic d'importància variable
  5. Utilitzeu la regressió del lazo
  6. Heu de seleccionar les n característiques principals mesurant el guany d'informació per al conjunt de funcions disponibles.

22. Diferenciar entre causalitat i correlació?

El Causalitat s'aplica explícitament als casos en què l'acció A provoca el resultat de l'acció B.

Correlació es pot definir simplement com una relació. On les accions d'A poden relacionar-se amb les accions de B, però aquí no és necessari que un esdeveniment provoqui l'altre esdeveniment.

23. Què és el sobreajustament?

El sobreajust és un tipus d'error de modelització que fa que no es pugui predir o endevinar les observacions futures de manera eficaç o encaixar dades addicionals en el model que ja existeix.

24. Explica els termes desviació estàndard i variància?

A desviació estàndar es defineix com el nombre que especifica la distribució dels valors. Una desviació estàndard baixa representa que la majoria dels nombres s'aproximen al valor mitjà. Com més gran desviació estàndard significa que els valors s'estenen, més ampli és el rang.

Desacord a Machine Learning és un tipus d'error que es produeix a causa de la sensibilitat del model a petites fluctuacions en el conjunt d'entrenament donat.

25. Explica el Perceptró multicapa i la màquina de Boltzmann?

Un perceptró multicapa (MLP) es defineix com una classe de xarxes neuronals artificials que poden generar un conjunt de sortides a partir del conjunt d'entrades donades. Un MLP consta de diverses capes de nodes d'entrada connectades com un gràfic dirigit entre les capes d'entrada i de sortida.

L'objectiu principal de la Màquina Boltzmann és optimitzar la solució a un problema determinat. S'utilitza principalment per optimitzar els pesos i la quantitat relacionats amb aquest problema especificat.

Preguntes i respostes de l'entrevista d'aprenentatge automàtic

26. Explica el terme biaix?

El biaix de dades en l'aprenentatge automàtic es defineix com un tipus d'error en què determinats elements d'un conjunt de dades determinat tenen més ponderació que altres. Un conjunt de dades esbiaixat no representarà amb precisió el cas d'ús del model i es tradueix en nivells de precisió baixos i errors analítics.

27. Anomena els tipus d'aprenentatge automàtic?

Els tipus d'aprenentatge automàtic s'enumeren a continuació:

  1. Aprenentatge supervisat
  2. Aprenentatge no supervisat
  3. Aprenentatge de reforç

28. Diferenciar entre classificació i regressió?

Classificació Regressió
Es tracta de predir una etiquetaEs tracta de predir una quantitat
Aquí, les dades s'etiqueten en una o diverses classes.Aquí, cal predir la quantitat contínuament.
Pot predir un valor continu.Pot predir un valor discret.
Es pot avaluar amb precisió.Es pot avaluar mitjançant l'error quadrat mitjà.

29. Què és una matriu de confusió?

En l'àmbit de l'aprenentatge automàtic, a matriu de confusió també anomenada matriu d'errors, es defineix com una disposició de taula específica que permet a l'usuari visualitzar el rendiment d'un algorisme, principalment un d'aprenentatge supervisat.

Matriu de confusió

30. Quan el vostre conjunt de dades pateix una gran variància, com ho gestionaríeu?

Per als conjunts de dades amb una gran variància, podem fer ús de l'algoritme d'embolcall. L'algoritme d'embolcall divideix les dades en diferents subgrups amb un mostreig replicat a partir de dades aleatòries. Un cop dividides les dades, mitjançant un algorisme d'entrenament, les dades aleatòries es poden utilitzar per crear regles. A continuació, fem ús de la tècnica d'enquesta per reunir tots els resultats previstos del model.

Preguntes i respostes de l'entrevista d'aprenentatge automàtic

31. Diferenciar entre aprenentatge inductiu i deductiu?

Aprenentatge inductiu Aprenentatge deductiu
Té com a objectiu desenvolupar una teoria.Té com a objectiu provar una teoria existent.
Es passa de les observacions específiques a les generalitzacions àmpliesSi no hi ha teoria, no es pot fer recerca deductiva.
Consta de tres etapes,ObservacióObservació d'un patróDesenvolupar una teoriaConsta de quatre etapes: Començar amb una teoria existent Formular una hipòtesi basada en la teoria existent Recollir dades per comprovar la hipòtesi Analitzar els resultats

32. Expliqueu el maneig dels valors danyats en el conjunt de dades donat?

A continuació es mostren les maneres de gestionar les dades que falten?

  1. Elimineu les files amb valors que falten.
  2. Creeu un altre model predictiu perquè pugueu predir els valors que falten.
  3. Utilitzeu un model de manera que pugui incorporar les dades que falten.
  4. Heu de substituir les dades que falten amb els valors agregats.
  5. Podeu predir els valors que falten.
  6. crear una categoria desconeguda

33. Quin d'aquests és més important la precisió del model o el rendiment del model?

Precisió del model es considera la característica important d'un model de llenguatge màquina/IA. Sempre que parlem del rendiment del model, primer aclarim si es tracta del rendiment de la puntuació del model o del rendiment de l'entrenament del model.

Rendiment del model es millora utilitzant la informàtica distribuïda i la paral·lelització sobre els actius puntuats donats, però hem de construir acuradament la precisió durant el procés d'entrenament del model.

34. Què és una sèrie temporal?

La sèrie temporal de l'aprenentatge automàtic es defineix com un conjunt de variables aleatòries que s'ordenen en funció del temps. Les sèries temporals s'estudien per interpretar un fenomen, identificar els components d'una tendència, la ciclicitat i predir els seus valors futurs.

35. Diferenciar entre entropia i guany d'informació?

El Guany d'informació es defineix com la quantitat d'informació obtinguda sobre un senyal o variable aleatòria a partir de l'observació d'una altra variable aleatòria.

Entropia es pot definir com la velocitat mitjana a la qual la informació és produïda per la font estocàstica de dades, o es pot definir com una mesura de la incertesa associada a una variable aleatòria.

36. Diferenciar entre el descens del gradient estocàstic (SGD) i el descens del gradient (GD)?

Descens de gradient per lots participa en els càlculs del conjunt d'entrenament complet de cada pas, el que resulta en un procés molt lent amb dades d'entrenament molt grans. Per tant, es fa molt car fer Batch GD. Tanmateix, és ideal per a col·lectors d'error relativament suaus. A més, s'ajusta bé amb el nombre de funcions.

Descens del gradient estocàstic intenta resoldre el problema principal en el descens del gradient per lots que és l'ús de dades d'entrenament completes per calcular els gradients a cada pas. SGD és de naturalesa estocàstica, vol dir que recull algunes instàncies aleatòries de dades d'entrenament a cada pas i, a continuació, calcula el gradient fent-ho més ràpid, ja que hi ha molt poques dades per manipular d'un sol cop.

Descens de gradient per lots Descens del gradient estocàstic
Calcula el gradient utilitzant tota la mostra d'entrenament.Calcula el gradient mitjançant una única mostra d'entrenament.
No es pot suggerir per a grans mostres d'entrenament.Es pot suggerir per a mostres d'entrenament grans.
És de naturalesa determinista.És de naturalesa sofisticada.

37. Diferenciar entre impuresa de Gini i entropia en un arbre de decisió?

Gini Entropia
Té valors dins de l'interval [0, 0,5]Té valors dins de l'interval [0, 1]
És més complex.No és complex.
La seva mesura és la probabilitat d'una mostra aleatòria que s'està classificant correctament.És una mesura per calcular la manca d'informació,

38 . Esmenta alguns dels avantatges i desavantatges dels arbres de decisió?

avantatges i inconvenients dels arbres de decisió

Avantatges de l'arbre de decisió:

  1. Els arbres de decisió requereixen menys esforç per a la preparació de dades durant el preprocessament en comparació amb altres algorismes.
  2. Un arbre de decisió no requereix la normalització de les dades.
  3. No requereix escala de dades.
  4. Els valors que falten a les dades no afecten el procés de creació d'un arbre de decisions.
  5. Un model d'arbre de decisions és molt fàcil d'explicar als equips tècnics i a les parts interessades.
Vegeu també Les 100 principals preguntes i respostes de l'entrevista de JavaScript

39. Pots explicar la tècnica d'aprenentatge Ensemble a Machine Learning?

Els mètodes conjunts són les tècniques utilitzades per crear múltiples models i combinar-los per produir resultats millorats. Els mètodes conjunts solen produir solucions més precises que les que faria un únic model.

En Aprenentatge conjunt , dividim el conjunt de dades d'entrenament en diversos subconjunts, on cada subconjunt s'utilitza per crear un model independent. Un cop s'entrenen els models, es combinen per predir un resultat de tal manera que hi hagi una reducció de la variància de la sortida.

Preguntes i respostes de l'entrevista d'aprenentatge automàtic

40. Explica els termes Colinealitat i Multicolinealitat?

Multicolinealitat es produeix quan múltiples variables independents estan altament correlacionades entre si en un model de regressió, el que significa que una variable independent es pot predir a partir d'una altra variable independent dins d'un model de regressió.

Colinealitat es produeix principalment quan dues variables predictores en una regressió múltiple tenen alguna correlació.

Colinealitat

41. Diferenciar entre les màquines Random Forest i Gradient Boosting?

Igual que els boscos aleatoris, l'augment del gradient també és un conjunt d'arbres de decisió. Les dues diferències principals són:

    Com es construeixen els arbres:Cada arbre del bosc aleatori es construeix de manera independent, mentre que l'augment del gradient només construeix un arbre alhora.Combinant resultats: els boscos aleatoris combinen els resultats al final del procés mitjançant la mitjana. Mentre que l'augment del gradient combina els resultats al llarg del camí.

42. Explica els termes Vectors propis i valors propis?

Vectors propis són vectors unitaris, és a dir, la seva longitud o magnitud és igual a 1,0. S'anomenen vectors dretes, que significa un vector columna.

Valors propis són coeficients que s'apliquen als vectors propis que, al seu torn, donen als vectors la seva longitud o magnitud.

Vectors propis i valors propis

43. Pots explicar la mineria de regles associatives (ARM)?

Regla de l'associació mineria (ARM) té com a objectiu conèixer les regles d'associació que satisfan el suport i la confiança mínims predefinits d'una base de dades. AMO s'utilitza principalment per reduir el nombre de regles d'associació amb les noves funcions de fitness que poden incorporar regles freqüents.

44. Què és A/B Testing?

Les proves A/B es defineixen com un experiment bàsic de control aleatori. S'utilitza per comparar dues versions d'una variable per esbrinar quina d'elles funciona millor en un entorn controlat.

Les proves A/B es poden utilitzar millor per comparar dos models per comprovar quin és el producte més recomanat per a un client.

45. Explica la marginació i el seu procés?

La marginació és un mètode que requereix la suma dels valors possibles d'una variable per determinar la contribució marginal d'una altra variable.

P(X=x) = ∑YP(X=x,Y)

Preguntes i respostes de l'entrevista d'aprenentatge automàtic

46. ​​Què és el mostreig per conglomerats?

Agrupació

Mostreig per conglomerats es defineix com un tipus de mètode de mostreig. Amb el mostreig de clústers, els investigadors solen dividir la població en grups o conjunts separats, coneguts com a clústers. A continuació, s'escull una mostra aleatòria de clústers de la població. A continuació, l'investigador realitza la seva anàlisi sobre les dades dels clústers mostrejats recollits.

47. Explica el terme Maledicció de la dimensionalitat?

La maledicció de la dimensionalitat es refereix bàsicament a l'augment de l'error amb l'augment del nombre de característiques. Es pot referir al fet que els algorismes són vigorosos per dissenyar en grans dimensions, i sovint tenen un temps d'execució exponencial en les dimensions.

48. Pots anomenar algunes biblioteques en Python utilitzades per a l'anàlisi de dades i càlculs científics?

  1. NumPy
  2. SciPy
  3. Pandes
  4. SciKit
  5. Matplotlib
  6. Seaborn
  7. Bokeh

49. Què són els valors atípics? Esmenta els mètodes per fer front als valors atípics?

Un valor atípic es pot definir com un objecte que es desvia significativament d'altres objectes. Poden ser causats per errors d'execució.

Els tres mètodes principals per tractar els valors atípics són els següents:

  1. Mètode univariant
  2. Mètode multivariant
  3. Error de Minkowski

50. Enumereu algunes corbes de distribució populars juntament amb escenaris en què les utilitzareu en un algorisme?

Les corbes de distribució més populars són:

Distribució uniforme es pot definir com una distribució de probabilitat que té una probabilitat constant. Exemple: tirar un sol dau ja que té múltiples resultats.

La distribució binomial es defineix com una probabilitat amb només dos possibles resultats. Exemple: un llançament de moneda. El resultat serà cap o cua.

Distribució normal especifica com es distribueixen els valors d'una variable. Exemple: L'alçada dels alumnes en una aula.

Distribució del peix ajuda a predir la probabilitat d'esdeveniments específics que estan passant quan saps amb quina freqüència s'ha produït aquest esdeveniment.

La distribució exponencial es refereix principalment a la quantitat de temps fins que es produeix l'esdeveniment específic. Exemple: quant de temps pot durar una bateria de cotxe, en mesos.

Preguntes i respostes de l'entrevista d'aprenentatge automàtic

51. Pots enumerar els supòsits de dades que s'han de complir abans de començar amb la regressió lineal?

Els supòsits a complir són:

  1. Relació lineal
  2. Normalitat multivariant
  3. No o poca multicolinealitat
  4. Sense autocorrelació
  5. Homoscedasticitat

52. Expliqueu el terme Variància mitjana d'inflació?

El factor d'inflació de la variància que és VIF es defineix com una mesura de la quantitat de multicolinearitat en un conjunt determinat de variables de regressió múltiple.

Matemàticament, el factor d'inflació Variance per a una variable de model de regressió és igual a la proporció de la variància final del model a la variància d'un model que comprèn aquesta variable independent única.

Aquesta relació es calcula per a cadascuna de les variables independents. Un VIF elevat representa que la variable independent associada és molt colineal amb les altres variables del model.

53. Ens pots dir quan la recta de regressió lineal deixa de girar o troba un lloc òptim on s'ajusta a les dades?

El lloc on es troba el valor RSquared més alt és on la línia s'atura. RSquared normalment representa la quantitat de variància que captura la línia de regressió lineal virtual respecte a la variància total capturada pel conjunt de dades.

54. Ens pots dir quin algorisme d'aprenentatge automàtic es coneix com a aprenent gandul i per què s'anomena així?

L'algorisme d'aprenentatge automàtic de KNN s'anomena aprenent gandul. K-NN es defineix com un aprenent mandrós perquè no aprendrà cap valor o variable aprendre per màquina de les dades d'entrenament donades, però calcula dinàmicament la distància cada vegada que es vol classificar. Per tant, memoritza el conjunt de dades d'entrenament.

55. Ens pots dir quin podria ser el problema quan el valor beta d'una variable específica varia massa en cada subconjunt quan la regressió s'executa en diversos subconjunts del conjunt de dades?

Les variacions en els valors beta de cada subconjunt suggereixen que el conjunt de dades és heterogeni. Per superar aquest problema, utilitzem un model diferent per a cadascun dels subconjunts agrupats del conjunt de dades donat, o fem servir un model no paramètric com els arbres de decisió.

56. Com triar un classificador en funció de la mida de les dades d'un conjunt d'entrenament?

Si el conjunt d'entrenament és de mida petita, un alt biaix o models de variabilitat baixa, per exemple, Naive Bayes tendeix a tenir un millor rendiment, ja que és menys probable que s'ajustin més.

Si el conjunt d'entrenament és de mida gran, els models de baixa variabilitat o de variabilitat, per exemple, la regressió logística, tendeixen a tenir un millor rendiment, ja que poden reflectir relacions més complicades.

57. Diferenciar entre el conjunt d'entrenament i el conjunt de proves en un model d'aprenentatge automàtic?

Set d'entrenament Conjunt de proves
El 70% de les dades totals es prenen com a conjunt de dades d'entrenament.El 30% restant es pren com a conjunt de dades de prova.
S'implementa per construir un model.S'utilitza per validar el model construït.
És una dada etiquetada que s'utilitza per entrenar el model.Normalment provem sense dades etiquetades i després verifiquem els resultats amb etiquetes.

58. Explica un fals positiu i un fals negatiu i com són significatius?

A fals positiu és un concepte en què rebeu un resultat positiu per a una prova determinada quan realment hauríeu d'haver rebut un resultat negatiu. També s'anomena falsa alarma o error fals positiu. S'utilitza bàsicament en l'àmbit mèdic, però també es pot aplicar a les proves de programari.

Exemples de fals positius:

  1. Una prova d'embaràs és positiva, on de fet, no estàs embarassada.
  2. Una prova de detecció de càncer és positiva, però no teniu la malaltia.
  3. Les proves prenatals són positives per a la síndrome de Down quan el vostre fetus no té cap trastorn.
  4. El programari de virus del vostre sistema identifica incorrectament un programa inofensiu com a maliciós.

A fals negatiu es defineix quan un resultat negatiu de la prova és incorrecte. En paraules senzilles, obteniu un resultat negatiu de la prova, on hauríeu d'haver obtingut un resultat positiu.

Per exemple, considereu la possibilitat de fer una prova d'embaràs i la prova és negativa (no està embarassada). Però de fet, estàs embarassada.

Els resultats falsos negatius de la prova d'embaràs a causa de fer la prova massa aviat, utilitzar l'orina diluïda o comprovar els resultats molt aviat. Gairebé totes les proves mèdiques tenen el risc d'un fals negatiu.

59. Explica el terme aprenentatge automàtic semi-supervisat?

L'aprenentatge semi-supervisat es defineix com un enfocament de l'aprenentatge automàtic que combina una quantitat menor de dades etiquetades amb una gran quantitat de dades sense etiquetar durant el procés d'entrenament. Es troba entre l'aprenentatge no supervisat i l'aprenentatge supervisat.

60. Ens pots explicar les aplicacions de l'aprenentatge automàtic supervisat a les empreses modernes?

  1. Diagnòstic Assistencial
  2. Detecció de frau
  3. Detecció de correu brossa
  4. Anàlisi sentimental

61. Pots diferenciar entre l'aprenentatge automàtic inductiu i l'aprenentatge automàtic deductiu?

Aprenentatge automàtic inductiu Aprenentatge automàtic deductiu
A ⋀ B ⊢ A → B (inducció)A ⋀ (A –>B)⊢ B(Deducció)
Observa i aprèn del conjunt d'instàncies, i després en treu la conclusió.Primer treu la conclusió i després la treballa a partir de la decisió anterior.
És un aprenentatge automàtic estadístic com KNN o SVM,Algorisme d'aprenentatge automàtic al raonament deductiu mitjançant l'arbre de decisió.

62. Què és Random Forest en Machine Learning?

El bosc aleatori es pot definir com un algorisme d'aprenentatge supervisat que s'utilitza per a classificacions i regressió. De la mateixa manera, l'algorisme forestal aleatori crea arbres de decisió sobre les mostres de dades, i després obté la predicció de cadascuna de les mostres i finalment selecciona la millor mitjançant la votació.

63. Expliqueu la compensació entre el biaix i la variància?

Parcialitat es pot definir com les hipòtesis fetes pel model per facilitar l'aproximació de la funció objectiu.

Desacord es defineix com la quantitat que canviarà l'estimació de la funció objectiu donades les diferents dades d'entrenament.

El compensació es defineix com la tensió entre l'error introduït pel biaix i la variància.

64. Explica la poda als arbres de decisió i com es fa?

La poda és un procés de compressió de dades en algorismes d'aprenentatge automàtic i de cerca que pot reduir la mida dels arbres de decisió eliminant determinades seccions de l'arbre que no són crítiques i innecessàries per classificar les instàncies. Un arbre massa gran corre el risc de sobreajustar les dades d'entrenament i s'està generalitzant poc a les noves mostres.

La poda es pot fer de la següent manera.

  1. Moda de dalt a baix (viarà els nodes i retallarà els subarbres començant per l'arrel)
  2. Moda de baix a dalt (iniciarà als nodes de la fulla)

Hem reduït l'algoritme d'error per a la poda dels arbres de decisió.

65. Com funcionen els algorismes d'error reduït per a la poda en arbres de decisió?

L'algorisme d'error reduït funciona de la següent manera:

  1. Considera cada node per a la poda.
  2. Podar = eliminar el subarbre d'aquest node, després fer-ne una fulla i assignar la classe comuna principal en aquest node.
  3. S'elimina un node de l'arbre si l'arbre resultant funciona pitjor que l'original.
  4. Els nodes s'eliminen de manera iterativa escollint el node de tal manera que l'eliminació del qual augmenta majoritàriament la precisió de l'arbre de decisió del gràfic.
  5. La poda continua funcionant fins que una altra poda sigui perjudicial.
  6. Utilitza formació, conjunts de proves i validacions. És un enfocament eficaç si hi ha una gran quantitat de dades disponibles.
Vegeu també Les 100 principals preguntes i respostes de l'entrevista de JavaScript

66. Explica el terme Classificació de l'arbre de decisions?

Un arbre de decisió crea models de classificació com una estructura d'arbre, amb conjunts de dades dividits en subconjunts més petits mentre es desenvolupa l'arbre de decisió; bàsicament, és una manera d'arbre amb branques i nodes definits. Els arbres de decisió gestionen dades tant categòriques com numèriques.

67. Explica la regressió logística?

L'anàlisi de regressió logística és una tècnica utilitzada per examinar l'associació de variables independents amb una variable dependent dicotòmica. Això contrasta amb l'anàlisi de regressió lineal, on la variable dependent és una variable contínua.

Cada vegada que la sortida de la regressió logística és 0 o 1 amb un valor llindar de 0,5. Qualsevol valor superior a 0,5 es pren com a 1 i qualsevol punt inferior a 0,5 es pren com a 0.

68. Anomena alguns mètodes per reduir la dimensionalitat?

Alguns dels mètodes per reduir la dimensionalitat es donen a continuació:

  1. Combinant funcions amb enginyeria de funcions
  2. Eliminació de característiques colineals
  3. utilitzant la reducció de dimensionalitat algorítmica.

69. Què és un sistema de recomanació?

Els sistemes de recomanació recullen principalment les dades dels clients i analitzen automàticament aquestes dades per generar recomanacions personalitzades per als clients. Aquests sistemes es basen principalment en dades implícites com l'historial de navegació i compres recents i dades explícites com les puntuacions proporcionades pel client.

Preguntes d'aprenentatge automàtic - sistema de recomanació

70. Expliqueu l'algoritme K del veí més proper?

K-Nearest Neighbor és l'algoritme d'aprenentatge automàtic més senzill que es basa en la tècnica d'aprenentatge supervisat. Assumeix la similitud entre el cas o les dades noves i els casos disponibles i col·loca el cas nou en una categoria semblant a la de les categories disponibles.

Per exemple, tenim una imatge d'una criatura que s'assembla a la d'un gat i un gos, però volem saber si és un gat o un gos. Per a aquesta identificació, podem fer ús de l'algorisme KNN, ja que funciona sobre una base de similitud. El model KNN trobarà les similituds del nou conjunt de dades amb el de les imatges de gats i gossos, i això es basa en les característiques similars; el posarà en una categoria de gat o de gos.

71. Tenint en compte una llarga llista determinada d'algorismes d'aprenentatge automàtic, donat un conjunt de dades, com els filtres de correu brossa del correu electrònic s'alimentaran amb centenars de correus electrònics decideixes quin utilitzar?

L'elecció d'un algorisme depèn de les preguntes que s'esmenten a continuació:

  1. Quantes dades teniu, i són contínues o categòriques?
  2. El problema està relacionat amb la classificació, agrupació, associació o regressió?
  3. És una variable predefinida (etiquetada), sense etiquetar o una barreja d'ambdues?
  4. Quin és el propòsit principal?

A partir de les preguntes anteriors, cal triar l'algorisme adequat que s'adapti als seus requisits.

72. Ens pots explicar com dissenyem un filtre de correu brossa?

  1. El filtre de correu brossa del correu electrònic s'alimentarà amb centenars de correus electrònics.
  2. Cadascun d'aquests correus electrònics té una etiqueta: 'correu brossa' o 'no és correu brossa'.
  3. L'algoritme d'aprenentatge automàtic supervisat identificarà quin tipus de correus electrònics s'estan marcant com a correu brossa en funció de paraules clau de correu brossa com la loteria, sense diners, el reemborsament complet, etc.
  4. La propera vegada que un correu electrònic arribi a la safata d'entrada, el filtre de correu brossa utilitzarà anàlisis estadístiques i algorismes com ara Decision Trees i SVM per identificar la probabilitat que el correu electrònic sigui correu brossa.
  5. Si la probabilitat és alta, s'etiquetarà com a correu brossa i el correu electrònic no arribarà a la vostra safata d'entrada.
  6. En funció de la precisió de cadascun dels models, utilitzem l'algorisme amb la màxima fiabilitat després de provar tots els models donats.

73. Com es pot evitar el sobreajustament?

S'evita el sobreajustament seguint els passos següents:

    Validació creuada: La idea aquí és utilitzar les dades de formació inicial per generar diversos petits vessaments de proves de trens. On aquests vessaments de prova s'utilitzen per ajustar el model.Entrena amb més dades: L'entrenament amb moltes dades pot ajudar els algorismes a detectar millor els senyals.Elimina la funció: podeu eliminar manualment algunes de les funcions.Parada anticipada:Es refereix a aturar el procés d'entrenament abans que l'alumne superi el punt especificat.Regularització: Fa referència a una àmplia gamma de tècniques per forçar artificialment el model a ser simple.muntatge: són algorismes d'aprenentatge automàtic que combinen prediccions de diversos models separats.

74. Explica el terme biaix de selecció en l'aprenentatge automàtic?

El biaix de selecció es produeix si els exemples d'un conjunt de dades es trien de tal manera que no reflecteixin la seva distribució real. El biaix de selecció pot adoptar moltes formes diferents.

    Biaix de cobertura: Les dades aquí no estan seleccionades de manera representativa.

Exemple: un model s'entrena de manera que prediu les vendes futures d'un producte nou a partir de les enquestes telefòniques realitzades amb la mostra de clients que van comprar el producte. Els consumidors que van optar per comprar un producte competidor no van ser enquestats i, com a resultat, aquest conjunt de persones no estaven representats a les dades de formació.

    Biaix de no resposta: Les dades aquí acaben sent poc representatives a causa dels buits de participació en els processos de recollida de dades.

Exemple: un model s'entrena de manera que prediu les vendes futures d'un producte nou a partir de les enquestes telefòniques realitzades amb una mostra de clients que van comprar el producte i amb una mostra de clients que van comprar el producte competidor. S'esperava un 80% més que els clients que van comprar el producte competidor es neguessin a completar l'enquesta i les seves dades estaven infrarepresentades a la mostra.

    Biaix de mostreig:Aquí , no s'utilitza l'aleatorització adequada durant el procés de recollida de dades.

Exemple: un model que està entrenat per predir les vendes futures d'un producte nou a partir de les enquestes telefòniques realitzades amb una mostra de clients que van comprar el producte i amb una mostra de clients que van comprar un producte competidor. En lloc d'orientar-se a l'atzar als clients, l'enquesta va triar els primers 200 consumidors que van respondre al seu correu electrònic, que podrien haver estat més ansiosos pel producte que els compradors mitjans.

75. Explica els tipus d'aprenentatge supervisat?

L'aprenentatge supervisat és de dos tipus, a saber,

    Regressió:Això és una mena d'aprenentatge supervisat que aprèn dels conjunts de dades etiquetats donats, i després és capaç de predir la sortida de valor continu per a les dades noves que es donen a l'algorisme. S'utilitza en els casos en què un requisit de sortida és un nombre com diners o alçada, etc. Alguns algorismes populars d'aprenentatge supervisat són la regressió lineal, la regressió logística.
    Classificació:És una mena d'aprenentatge on l'algorisme s'ha de mapar a les dades noves que s'obtenen de qualsevol de les dues classes que tenim al conjunt de dades. Les classes s'han d'assignar a 1 o 0, que a la vida real es tradueix en 'Sí' o 'No'. La sortida haurà de ser qualsevol de les classes i no hauria de ser un número com era. en el cas de la regressió. Alguns dels algorismes més coneguts són els arbres de decisió, el classificador de Bayes ingenu, els algorismes de vectors de suport.

76. Quin descens de gradient desaparegut?

A l'aprenentatge automàtic, ens trobem amb el problema del gradient que es va desapareixen mentre entrenem les xarxes neuronals amb mètodes basats en gradients com la propagació posterior. Aquest problema fa que sigui difícil ajustar i aprendre els paràmetres de les capes anteriors a la xarxa determinada.

El problema dels gradients de desaparició es pot prendre com un exemple del comportament inestable que podem trobar en entrenar la xarxa neuronal profunda.

Descriu una situació en què la xarxa d'alimentació anticipada multicapa profunda o la xarxa neuronal recurrent no és capaç de propagar la informació de gradient útil des de l'extrem de sortida donat del model cap a les capes properes a l'extrem d'entrada del model.

77. Pots anomenar els mètodes proposats per superar el problema del gradient de desaparició?

Els mètodes proposats per superar els problemes de gradient desaparegut són:

  1. Jerarquia multinivell
  2. La memòria a curt termini
  3. Maquinari més ràpid
  4. Xarxes neuronals residuals (ResNets)
  5. resum

78. Diferenciar entre Mineria de dades i aprenentatge automàtic?

Mineria de dades Aprenentatge automàtic
Extreu informació útil d'una gran quantitat de dades.Introdueix algorismes a partir de dades així com de l'experiència passada.
S'utilitza per entendre el flux de dades.Ensenya als ordinadors a aprendre i entendre del flux de dades.
Té grans bases de dades amb dades no estructurades.Té dades existents així com algorismes.
Requereix la interferència humana en ell.No cal l'esforç humà necessari després del disseny
Els models es desenvolupen mitjançant la tècnica de mineria de dadesL'algoritme d'aprenentatge automàtic es pot utilitzar a l'arbre de decisió, xarxes neuronals i algunes altres parts de la intel·ligència artificial
Es tracta més d'investigació utilitzant mètodes com l'aprenentatge automàtic.S'autoaprèn i entrena el sistema per fer tasques intel·ligents.

79. Anomena les diferents tècniques d'algorisme en Machine Learning?

Les diferents tècniques d'algorisme en aprenentatge automàtic s'enumeren a continuació:

  1. Aprenentatge no supervisat
  2. Aprenentatge semitutelat
  3. Transducció
  4. Aprenentatge de reforç
  5. Aprendre a aprendre
  6. Aprenentatge supervisat

80. Expliqueu la funció d''Aprenentatge no supervisat?

  1. Ha de trobar grups de dades.
  2. Trobeu les representacions de dimensions baixes de les dades
  3. Per trobar indicacions interessants en dades
  4. Per calcular coordenades i correlacions interessants.
  5. Trobeu observacions noves o neteja de bases de dades.

81. Explica el terme classificador a Machine Learning?

Un classificador en aprenentatge automàtic es defineix com un algorisme que classifica automàticament les dades en un o més d'un grup de classes. Un dels exemples habituals és un classificador de correu electrònic que pot escanejar els correus electrònics per filtrar-los segons les etiquetes de classe donades: Correu brossa o No correu brossa.

Tenim cinc tipus d'algorismes de classificació, és a dir,

  1. Arbre de decisions
  2. Classificador de Bayes ingenu
  3. K-Veïns més propers
  4. Suport a les màquines vectorials
  5. Xarxes neuronals artificials

82. Què són els genètics algorismes ?

Els algorismes genètics es defineixen com algorismes de cerca estocàstica que poden actuar sobre una població de possibles solucions. Els algorismes genètics s'utilitzen principalment en intel·ligència artificial per buscar un espai de possibles solucions per trobar-ne qui pugui resoldre el problema.

83. Pots anomenar l'àrea on es pot utilitzar el reconeixement de patrons?

  1. Reconeixement de veu
  2. Estadístiques
  3. Recuperació informal
  4. Bioinformàtica
  5. Mineria de dades
  6. Visió per ordinador

84. Expliqueu el terme Perceptron a l'aprenentatge automàtic?

Un Perceptron es defineix com un algorisme per a l'aprenentatge supervisat de classificadors binaris. Aquest algorisme permet que les neurones aprenguin i processin els elements del conjunt d'entrenament donat d'un en un. Hi ha dos tipus de perceptrons, a saber.

  1. Una sola capa
  2. Multicapa.

85. Què és Regressió isotònica?

La regressió isotònica s'utilitza iterativament per ajustar distàncies ideals per protegir l'ordre de dissimilaritat relativa. La regressió isotònica també s'utilitza en la classificació probabilística per equilibrar les probabilitats previstes dels models d'aprenentatge automàtic supervisat.

86. Què són les xarxes bayesianes?

Una xarxa bayesiana es pot definir com un model gràfic probabilístic que presenta un conjunt de variables i les seves dependències condicionals mitjançant un DAG (gràfic acíclic dirigit).

Per exemple, una xarxa bayesiana representaria les relacions probabilístiques entre les malalties i els seus símptomes. Donats els símptomes específics, la xarxa es pot utilitzar per calcular les possibilitats de presència de diferents malalties.

87. Pots explicar els dos components del programa lògic bayesià?

El programa lògic bayesià consta principalment de dos components.

  1. El primer component és el lògic: comprèn un conjunt de clàusules bayesianes que recull l'estructura qualitativa del domini.
  2. El segon component és quantitatiu: codifica la informació quantitativa sobre el domini.

88. Què és un algorisme d'aprenentatge incremental en un conjunt?

El mètode d'aprenentatge incremental es defineix com la capacitat d'un algorisme per aprendre de dades noves que estan disponibles després que el classificador ja s'hagi generat a partir del conjunt de dades ja disponible.

89. Anomena els components de les tècniques d'avaluació relacional?

Els components de la tècnica d'avaluació relacional es detallen a continuació:

  1. Adquisició de dades
  2. Adquisició de la veritat bàsica
  3. Tècnica de validació creuada
  4. Tipus de consulta
  5. Mètrica de puntuació
  6. Prova de significació

90. Pots explicar el descomposició de biaix-variància de l'error de classificació en el mètode de conjunt?

L'error esperat de l'algoritme d'aprenentatge es pot dividir en biaix i variància. Un terme de biaix és una mesura de fins a quin punt el classificador mitjà produït per l'algoritme d'aprenentatge coincideix amb la funció objectiu. El terme de variància és una mesura de quant fluctua la predicció de l'algoritme d'aprenentatge per a diversos conjunts d'entrenament.

91. Anomena els diferents mètodes per a l'aprenentatge supervisat seqüencial?

A continuació es presenten els diferents mètodes per a l'aprenentatge supervisat seqüencial:

  1. Finestres corredisses recurrents
  2. Models ocults de Markow
  3. Models de Markow d'entropia màxima
  4. Camps aleatoris condicionals
  5. Xarxes de transformadors gràfics
  6. Mètodes de finestres corredisses

92. Què és l'aprenentatge estadístic per lots?

Un conjunt de dades d'entrenament es divideix en un o més lots. Quan s'utilitzen totes les mostres d'entrenament en la creació d'un lot, aquest algorisme d'aprenentatge es coneix com a descens de gradient per lots. Quan el lot donat té la mida d'una mostra, l'algoritme d'aprenentatge s'anomena descens de gradient estocàstic.

93. Pots anomenar les àrees en robòtica i processament de la informació on sorgeix un problema de predicció seqüencial?

A continuació es detallen les àrees de robòtica i processament de la informació on sorgeixen problemes de predicció seqüencial

  1. Predicció estructurada
  2. Aprenentatge de reforç basat en models
  3. Aprenentatge d'imitació

94. Anomena les diferents categories que pots categoritzar el procés d'aprenentatge de la seqüència?

Les diferents categories on podeu categoritzar el procés d'aprenentatge de seqüències s'enumeren a continuació:

  1. Generació de seqüències
  2. Reconeixement de seqüències
  3. Decisió seqüencial
  4. Predicció de seqüències

95. Què és la predicció de seqüències?

La predicció de seqüències té com a objectiu predir elements de la seqüència a partir dels elements anteriors.

S'entrena un model de predicció amb el conjunt de seqüències d'entrenament. Durant l'entrenament, el model s'utilitza per realitzar prediccions de seqüències. Una predicció consisteix a predir els següents elements d'una seqüència. Aquesta tasca té diverses aplicacions com ara la recuperació prèvia de pàgines web, la previsió meteorològica, la recomanació de productes de consum i la predicció de la borsa.

Alguns exemples de problemes de predicció de seqüències inclouen:

    Previsió meteorològica. Donada una seqüència d'observacions sobre el temps en particular durant un període de temps, prediu el temps previst per demà.Predicció de borsa. Donada una seqüència de moviments de la seguretat durant un període de temps, prediu el següent moviment de la seguretat.Recomanació de producte. Donada una seqüència de les darreres compres d'un client, prediu la propera compra d'un client.

96. Explica l'aprenentatge de PAC?

Probablement aproximadament correcte, és a dir, l'aprenentatge PAC es defineix com un marc teòric utilitzat per analitzar l'error de generalització de l'algorisme d'aprenentatge en termes del seu error en un conjunt d'entrenament determinat i algunes mesures de la complexitat. L'objectiu principal aquí és mostrar normalment que un algorisme pot aconseguir un error de generalització baix amb una alta probabilitat.

97. Què són PCA, KPCA i ICA, i per a què serveixen?

Anàlisi de components principals (PCA): Transforma linealment les entrades originals en les noves característiques no correlacionades.

Anàlisi de components principals basada en nucli (KCPA) : És un PCA no lineal desenvolupat mitjançant el mètode del nucli.

Anàlisi de components independents (ICA): A ICA, les entrades originals es transformen linealment en determinades característiques que són mútuament independents estadísticament.

98. Expliqueu les tres etapes de la construcció d'un model a l'aprenentatge automàtic?

Les tres etapes són:

  1. Construcció de maquetes
  2. Prova de models
  3. Aplicació del model

99. Explica el terme hipòtesi en ML?

L'aprenentatge automàtic, especialment l'aprenentatge supervisat, es pot especificar com el desig d'utilitzar les dades disponibles per aprendre una funció que millor mapeï les entrades a les sortides.

Tècnicament, aquest problema s'anomena aproximació de funció, on estem aproximant una funció objectiu desconeguda que assumim tal com existeix que pot mapar millor les entrades donades a les sortides en totes les consideracions possibles del domini del problema.

Un exemple del model que s'aproxima a la funció objectiu i realitza els mapes de les entrades a les sortides es coneix com a hipòtesi en l'aprenentatge automàtic.

L'elecció de l'algorisme i la configuració de l'algoritme defineixen l'espai de possibles hipòtesis que pot constituir el model.

100. Explica els termes Eepoch, Eentropy, Bbias i Vvariance en l'aprenentatge automàtic?

Època és un terme molt utilitzat en aprenentatge automàtic que indica el nombre de passades de tot el conjunt de dades d'entrenament que ha completat l'algorisme d'aprenentatge automàtic. Si la mida del lot és el conjunt de dades d'entrenament sencer, el nombre d'èpoques es defineix com el nombre d'iteracions.

Entropia a l'aprenentatge automàtic es pot definir com la mesura del desordre o la incertesa. L'objectiu principal dels models d'aprenentatge automàtic i dels científics de dades, en general, és disminuir la incertesa.

Dades parcialitat és un tipus d'error en què determinats elements d'un conjunt de dades tenen més ponderació que altres.

Desacord es defineix com la quantitat que canviarà l'estimació de la funció objectiu si s'utilitza un conjunt de dades d'entrenament diferent. La funció objectiu s'estima normalment a partir de les dades d'entrenament mitjançant l'algorisme d'aprenentatge automàtic.

Molta sort amb la teva entrevista d'aprenentatge automàtic. Esperem que les nostres preguntes i respostes de l'entrevista d'aprenentatge automàtic us siguin d'ajuda. També podeu consultar el nostre Preguntes i respostes de l'entrevista de ciberseguretat que et pot ser d'alguna ajuda.