Taula de continguts
- Introducció a l'aprenentatge automàtic
- Aprenentatge automàtic
- Aprenentatge supervisat
- Regressió
- Algorisme de regressió lineal
- Classificació
- Màquina vectorial de suport
- Aprenentatge no supervisat
- K significa agrupació
- Algoritme semi-supervisat
- Aprenentatge de reforç
- Aprenentatge profund
- Xarxa neuronal profunda
- Aplicacions de la intel·ligència artificial
- Articles recomanats
Introducció a l'aprenentatge automàtic
Els investigadors han somiat durant molt de temps amb construir màquines imaginatives. Quan es van inventar els ordinadors programables, la gent es va preguntar si aquestes màquines algun dia es tornaran intel·ligents com els humans i podran fer tasques com els humans. Avui dia, la Intel·ligència Artificial és una tecnologia emergent amb una gran varietat d'aplicacions en diferents camps. El concepte d'IA és simular la intel·ligència humana en màquines artificials de manera que les màquines siguin capaços de pensar i realitzar tasques com els humans.
Per què necessitem una tecnologia que funcioni com els humans en tots els aspectes?
Els humans tenen molt bona precisió per fer el treball, però l'eficiència en el treball no és satisfactòria i sempre hi ha un límit per accelerar el treball dels humans, però aquest no és el cas de les màquines i també el treball realitzat per les màquines és molt precís, uniforme i escalable.
Al segle XIX, la revolució del programari va tenir lloc per superar aquests problemes, però no n'hi ha prou per fer front a aquests problemes. El programari és capaç de realitzar la tasca que es defineix formalment en un conjunt de regles de manera que el programador pot escriure un programa tenint en compte aquestes regles.
Per exemple, calcular la suma de dos nombres donats. En el món actual, en termes de velocitat i precisió, els ordinadors poden vèncer qualsevol humà en aquesta tasca. Però els problemes que no tenen un conjunt de regles formals i requereixen intel·ligència humana, aquest problema és molt difícil de resoldre per ordinadors.
Per exemple, per reconèixer cares, els humans són capaços de reconèixer cares amb molta facilitat, però els ordinadors els costa molt reconèixer perquè és molt complex escriure regles formals de cares. Així, doncs, el veritable repte de la intel·ligència artificial és resoldre les tasques que són fàcils de realitzar pels humans però difícils de descriure formalment per als humans.
Prenguem un exemple del sistema de joc d'escacs Deep Blue desenvolupat per IBM. Les regles dels escacs es poden definir completament mitjançant un conjunt de regles formals. Així, aquestes regles van ser convertides fàcilment al programa pel programador i proporcionades per endavant pel programador.
La intel·ligència artificial intenta fer front a aquest repte transferint la intel·ligència humana a màquines amb capacitats computacionals incomparables.
A la vida quotidiana, un ésser humà necessita el coneixement del món per resoldre la seva tasca i aquest coneixement és subjectiu i intuïtiu, per la qual cosa és difícil per al programador articular-se en un conjunt de regles.
Així que a partir d'aquí podem entendre que, per comportar-se com els humans o, en altres paraules, comportar-se d'una manera intel·ligent, els ordinadors requereixen coneixements similars. Per tant, el repte clau de la IA és posar aquesta informació informal o subjectiva a l'ordinador i als investigadors de l'Artificial. El camp de la intel·ligència, bàsicament intenta aconseguir aquest objectiu.
Els investigadors havien descobert la manera molt bàsica d'aconseguir aquest objectiu. Han utilitzat un enfocament basat en el coneixement. En aquest enfocament, els investigadors codifiquen el coneixement sobre el món en llenguatges formals.
Els ordinadors poden raonar automàticament sobre les declaracions en aquests llenguatges formals mitjançant regles d'inferència lògica. Com que aquest és l'enfocament molt bàsic, senzill i ingenu, el projecte utilitza aquest enfocament no té èxit perquè els investigadors lluiten per idear regles formals amb prou complexitats per idear el món amb precisió. Un exemple d'aquest projecte és Cyc. Cyc és un motor d'inferència.
La dificultat que s'enfronten els projectes anteriors (basats en l'enfocament basat en el coneixement) és confiar en un coneixement codificat. Per tant, per superar aquesta dificultat, els sistemes d'IA necessiten la capacitat d'adquirir el seu propi coneixement del món, extreint patrons de dades en brut. Aquesta capacitat es coneix com a aprenentatge automàtic.
Aprenentatge automàtic
La introducció de l'aprenentatge automàtic ofereix als ordinadors la capacitat d'adquirir el coneixement del món real i prendre decisions que semblen subjectives. D'aquesta manera, l'aprenentatge automàtic és capaç de superar les limitacions de l'enfocament basat en el coneixement.
Segons la Viquipèdia
L'aprenentatge automàtic és l'estudi d'algoritmes informàtics que millora automàticament mitjançant l'experiència.
Segons Mitchell
Es diu que un programa informàtic aprèn de l'experiència E pel que fa a alguna classe de tasques T i mesura de rendiment P, si el seu rendiment a la tasca en T, mesurat per P, millora amb l'experiència E
Hi ha molts tipus d'algoritmes d'aprenentatge automàtic que existeixen a la literatura. Aquí l'agrupació dels algorismes es fa en funció de l'estil d'aprenentatge. L'ampli agrupament d'algorismes dels algorismes d'aprenentatge automàtic es mostra a la figura 1. Vegem-ho en detall un per un.

Agrupació de l'algoritme d'aprenentatge automàtic en funció de l'estil d'aprenentatge
Aprenentatge supervisat
L'aprenentatge supervisat com el seu nom indica és la presència d'un supervisor com a professor. A l'aprenentatge supervisat entrenem la nostra màquina utilitzant dades etiquetades. Les dades etiquetades significa que per a cada entrada hi ha una sortida ben etiquetada.
En el procés de formació, les màquines adquireixen Coneixement del món a partir de dades etiquetades. Després de l'entrenament, la màquina rep un nou conjunt de dades per predir el resultat. L'objectiu és fer que les màquines aprenguin a partir d'algun tipus similar de patrons obtinguts del conjunt de dades d'entrenament i apliquen els coneixements apresos al conjunt de dades provat per predir la sortida de valor real.
Prenguem un exemple d'un conjunt de dades Iris per entendre millor. El conjunt de dades d'iris és una col·lecció de mesures de diferents parts de 150 plantes d'iris. Cada exemple d'un conjunt de dades consisteix en la mesura de cada part de la planta com la longitud del sèpal, l'amplada del sèpal, la longitud del pètal i l'amplada del pètal. El conjunt de dades també registra a quina espècie pertany cada planta. Hi ha tres espècies diferents presents al conjunt de dades. Així, com veiem aquí al conjunt de dades d'Iris, cada planta d'iris està etiquetada amb la seva espècie.
Vegeu també Els 15 millors programes de gestió de vendesEls algorismes d'aprenentatge supervisat poden estudiar aquest conjunt de dades i aprendre a classificar la planta d'iris en tres espècies diferents en funció de les seves mesures.
El terme aprenentatge supervisat significa bàsicament que l'objectiu és proporcionat per un professor que mostra a la màquina què ha de fer.
Aprenentatge supervisat classificat en dues categories d'algorisme tal com es mostra a la figura:2.

Regressió
Els algorismes de regressió prediuen el resultat continu (objectiu) en funció d'un o més valors d'entrada o de predicció. En paraules simples, el valor de sortida és un valor real com els pesos.
Hi ha diversos tipus d'algorismes de regressió. Els tipus de diferents algorismes de regressió depenen del nombre de variables independents, de la forma de la línia de regressió i del tipus de variable dependent. Vegem alguns tipus de tècniques de regressió.
La regressió lineal és un dels algorismes de regressió més bàsics i populars per predir el valor continu. Aquí assumeix la relació lineal entre l'entrada (predictor) i la sortida.
Algorisme de regressió lineal
Els noms de regressió lineal suggereixen que és capaç de resoldre problemes de regressió. L'objectiu d'aquests algorismes és construir un sistema que pugui prendre un vector x i predir el valor escalar y com a sortida. En paraules senzilles, aquest algorisme estableix la relació entre l'entrada i la sortida mitjançant una línia recta que millor s'ajusta.
y=wTx
Aquí w és el vector dels paràmetres. Els paràmetres són els valors que controlen el comportament del sistema.
Podem pensar en 'w' com un conjunt de pesos que determinen com cada característica afecta la sortida. La característica no és més que característica de l'entrada.
Per exemple
Suposem que volem tenir un sistema que sigui capaç de predir el preu dels cotxes usats. Aquí les característiques són atributs del cotxe que creiem que afecten el valor d'un cotxe, com ara la marca, l'any, l'eficiència del motor, la capacitat, el quilometratge i moltes altres dades.
y=w0 * capacitat+w1 * quilometratge +w3 * eficiència del motor
si aquestes característiques reben pesos positius wi aleshores augmenta en aquests pesos augmenta el valor de la nostra predicció augmenta i viceversa. Si els pesos 'wi' són de gran magnitud, té un gran efecte en la predicció. Si un pes 'wi' és 0, no té cap efecte en la predicció.
Classificació
La classificació és un concepte d'aprenentatge supervisat que intenta predir les categories a les quals pertany l'entrada. Per resoldre el problema de classificació, els algorismes d'aprenentatge intentaran produir la funció alguna cosa com f:R-{1,2,...k}. En paraules simples, quan la sortida és variable és una categoria com una malaltia o no malaltia, és a dir, en aquest problema la sortida és discreta. Per exemple, al conjunt de dades Iris, hem de predir tres classes d'espècies donades tres característiques (longitud del sèpal (sl), amplada del sèpal (sw), longitud del pètal (pl), amplada del pètal (pw)) en una entrada.
Prenguem un altre exemple de reconeixement d'objectes per entendre-ho clarament
Aquí l'entrada és una imatge i la sortida és un codi numèric que identifica l'objecte de la imatge.
Hi ha diversos algorismes de classificació. Els algorismes de classificació inclouen regressió logística de màquina vector de suport, arbre de decisió, bosc aleatori, etc. Vegem alguns algorismes en detall.
Màquina vectorial de suport
Una màquina de vectors de suport és un algorisme d'aprenentatge supervisat que es pot utilitzar tant per a problemes de classificació com de regressió, però principalment s'utilitza per a problemes de classificació.
Donat un conjunt de dades d'entrenament, cadascun etiquetat com una o l'altra de les dues classes, un algorisme d'entrenament SVM crea un model que assigna nous exemples a una categoria o a l'altra, convertint-lo en un classificador lineal binari no probabilístic.
Bàsicament, aquest algorisme intenta trobar l'hiperpla òptim en un lloc n-dimensional que classifica nous exemples. En l'espai bidimensional (quan el nombre d'elements d'entrada és dos) aquest hiperpla no és més que la línia que divideix el pla en dues parts tal com es mostra a la figura 3.
D'acord amb wikipedia
Un model SVM és una representació dels exemples com a punts a l'espai, mapejats de manera que els exemples de les categories separades es divideixin per un buit clar que sigui el més ampli possible. A continuació, es mapegen nous exemples al mateix espai i es preveu que pertanyin a una categoria en funció del costat de la bretxa en què cauen.
Figura 3
SVM intenta maximitzar el marge entre les dues classes. El marge màxim l'aconsegueix l'hiperplà que té la distància més gran al punt de dades d'entrenament més proper de qualsevol classe.
Això és molt intuïtiu d'entendre. Podem veure a la figura, tots els punts de dades que cauen al costat de la línia s'etiquetaran com una classe, i els punts que cauen a l'altre costat de la línia s'etiquetaran com a segona classe. Ara, com veiem a la figura 3, hi ha una quantitat infinita de línies que passen entre elles.
Llavors, com sabem quina línia funciona millor? Aquest algorisme intenta seleccionar una línia que no només separi les dues classes, sinó que es mantingui tan lluny com sigui possible de les mostres més properes com es mostra a la figura 3.
Aprenentatge no supervisat
En l'aprenentatge supervisat, l'objectiu és aprendre el mapeig de l'entrada a la sortida els valors correctes dels quals són proporcionats pel supervisor. En l'aprenentatge no supervisat, només es donen dades d'entrada i no hi ha cap supervisor. L'objectiu és trobar les regularitats de l'entrada.
Hi ha una estructura a l'espai d'entrada de manera que alguns dels patrons es produeixen més que altres.
Vegeu també 9 solucions per a diversos processos de Google Chrome en execucióHi ha dos mètodes principals utilitzats en l'aprenentatge no supervisat són l'anàlisi de clústers i el component principal.
En l'anàlisi de clústers, l'objectiu és trobar l'agrupació de l'entrada.
Posem un exemple per entendre-ho clarament
Totes les empreses tenen moltes dades de clients. Les dades del client contenen informació demogràfica així com la transacció passada amb l'empresa. L'empresa pot estar interessada per veure la distribució del perfil de la seva empresa, per veure quin tipus de client es produeix amb freqüència. En aquests escenaris, el clustering assigna clients similars en els seus atributs al mateix grup. Aquests grups agrupats poden ajudar a decidir les estratègies de l'empresa, per exemple serveis i productes, específics per a diferents grups.
Un algorisme popular per fer aquesta anàlisi d'agrupació és l'agrupament de K-means. Parlem dels K-means amb més detall.
K significa agrupació
La agrupació de K-means és un dels algorismes d'aprenentatge no supervisat més populars i més senzills.
K-means és un algorisme basat en el centroide, on calculem les distàncies de punts donats des del centroide per assignar un punt a un clúster. A K-Means, cada clúster s'associa amb un centroide.
Aquest algorisme funciona de la següent manera:
- En primer lloc, inicialitzeu k punts anomenats aleatòriament mitjans
- Després d'això, categoritzeu cada element a la seva mitjana més propera i actualitzeu les coordenades de la mitjana, que són les mitjanes dels elements classificats en aquesta mitjana fins ara.
- Repetiu aquests passos per a un nombre determinat d'iteracions i després del nombre d'iteracions donat, tenim els nostres clústers.

Algoritme semisupervisat
En l'aprenentatge supervisat, hem vist que els humans han d'etiquetar manualment el conjunt de dades. Aquest procés és molt costós perquè el volum del conjunt de dades és molt gran. En l'aprenentatge no supervisat, no cal un conjunt de dades etiquetat, però el seu espectre d'aplicació és limitat.
Per fer front a aquestes limitacions, s'introdueix el concepte d'aprenentatge semitutelat. En aquest estil d'aprenentatge, l'algorisme s'entrena amb una combinació d'una petita quantitat de dades etiquetades i una gran quantitat de dades sense etiquetar. L'aprenentatge semisupervisat es troba entre l'aprenentatge supervisat i l'aprenentatge no supervisat.
Per fer qualsevol ús de dades sense etiqueta, l'algoritme semi-supervisat assumeix la següent relació sobre les dades:
- Cotxe autònom
- Control de motors robòtics
- Control d'aire condicionat
- Optimització de la ubicació d'anuncis
- Estratègies de negociació en borsa
- Joc jugant
-
Què és Unsecapp.exe i és segur?
-
15 millors eines i programari de diagrames UML
-
[FIXAT] Windows no pot accedir al dispositiu especificat, a la ruta o a l'error del fitxer
-
16 correccions per a Windows Update que no funciona a Windows
-
4 solucions per a la configuració d'AMD Radeon no s'obrirà
-
Zoom Eina de captura de pantalla: consells i trucs
Podem entendre aquests tres tipus d'estils d'aprenentatge, a saber, l'aprenentatge supervisat, l'aprenentatge no supervisat i l'aprenentatge semi-supervisat relacionant-nos amb el món real.
Aprenentatge supervisat on l'alumne està sota la supervisió del professor. En l'aprenentatge no supervisat on l'estudiant ha d'esbrinar ell mateix un concepte. Aprenentatge semi-supervisat on un professor ensenya alguns conceptes a classe i fa preguntes com a deures que es basen en conceptes similars.
Aprenentatge de reforç
L'aprenentatge per reforç és l'aprenentatge mitjançant la interacció amb un entorn. El procés d'aprenentatge implica un actor, un entorn i un senyal de recompensa. L'actor tria actuar en un entorn pel qual l'actor és recompensat en conseqüència. Aquí la sortida del sistema és una seqüència d'accions.
En aquest cas, una única acció no és important, aquí és important una seqüència d'accions correctives per assolir l'objectiu. Això també s'anomena política. L'actor vol augmentar la recompensa que rep i, per tant, ha d'aprendre una òptima i bona política d'interacció amb l'entorn. Un bon exemple són els jocs. En el joc, un sol moviment per si mateix no és important, requereix una seqüència de moviments correctes que sigui bona (és a dir, els moviments condueixen a la victòria)

Figura 5: Configuració d'aprenentatge de reforç
`L'aprenentatge de reforç és molt diferent d'altres tipus d'aprenentatge que hem tractat fins ara. Com hem vist en l'aprenentatge supervisat, se'ns donen dades i etiquetes i tenim l'encàrrec de predir les dades de sortida. En l'aprenentatge no supervisat, només ens donen dades i ens encarreguen de trobar l'estructura subjacent a les dades. En reforç, no ens donen dades ni etiquetes.
Les aplicacions de l'aprenentatge per reforç són
Aprenentatge profund
Quan analitzem la imatge d'un cotxe, aleshores el píxel individual de la imatge del cotxe vermell està molt a prop del negre a la nit. Aquest exemple us pot donar una idea de la dificultat a què s'enfronten moltes aplicacions d'intel·ligència artificial. És molt difícil extreure característiques tan abstractes i d'alt nivell perquè requereix una comprensió a nivell humà.
Deep Learning aborda aquest problema fent funcions complexes a partir d'una de simple. L'exemple més bàsic d'un model d'aprenentatge profund és el Perceptró multicapa. Perceptron multicapa és només una funció matemàtica que mapeja els valors d'entrada als valors de sortida. Aquesta funció es compon de moltes funcions més senzilles.
L'aprenentatge profund és un tipus particular d'aprenentatge automàtic que aconsegueix un gran poder i flexibilitat en representar el món com una jerarquia de conceptes imbricada. Cada concepte es defineix en relació amb conceptes més simples, i representacions més abstractes calculades en termes d'altres menys abstractes.
Els algorismes d'aprenentatge profund com la xarxa neuronal profunda, la xarxa de creences profundes, la xarxa neuronal convolucional i la xarxa neuronal recurrent s'han aplicat a camps com ara la visió per ordinador, el reconeixement de la parla, el processament del llenguatge natural i molts més.
Xarxa neuronal profunda
La xarxa neuronal profunda s'inspira en la funció del cervell humà i la seva manera de funcionar. El bloc bàsic de les xarxes neuronals profundes són els nodes. Els nodes són com les neurones del cervell humà. Quan l'estímul els colpeja, té lloc un procés al node. En general, els nodes s'agrupen en capes tal com es mostra a la figura 6.

Figura 6: Xarxa neuronal profunda
Hi ha diferents tipus de xarxes neuronals profundes i les diferències entre elles rau en els seus principis de funcionament, l'esquema d'accions i les àrees d'aplicació.

Vegem la relació entre la IA, l'aprenentatge automàtic i l'aprenentatge profund mitjançant el diagrama de Venn

Figura 7: Aquesta figura mostra la relació entre l'aprenentatge profund, l'aprenentatge automàtic i la intel·ligència artificial.
Aplicacions de la intel·ligència artificial
Hi ha molts camps diferents on s'utilitza la IA. Els camps inclouen màrqueting, banca, finances, agricultura, sanitat, jocs, exploració espacial, vehicles autònoms, chatbots, creativitat artificial, etc.
Explorem el camp del màrqueting i la banca.
Màrqueting
En els primers dies (quan la IA no està en aplicació. Només existeix als llibres), si volem comprar algun producte a la botiga en línia, hem de buscar el producte amb el seu nom exacte. Per tant, és molt difícil trobar un producte si no coneixem el nom exacte del producte.
Però avui dia, quan cerquem qualsevol article a qualsevol botiga de comerç electrònic, obtenim tots els resultats possibles relacionats amb l'article. No ens hem de preocupar per l'ortografia exacta o el nom del producte per trobar el producte. Un altre exemple és trobar les pel·lícules adequades a Netflix.
L'aplicació no es limita a trobar el producte adequat. L'avenç de la IA és capaç de recomanar el producte en funció del vostre interès mitjançant l'anàlisi de la vostra transacció passada i el gust de comprar coses. D'acord amb aquestes dades, AI és capaç de saber quin tipus de producte és rellevant per a vostè i en funció d'això filtrarà el producte i us el recomanarà.
D'aquesta manera, la IA està jugant un paper important en el màrqueting i augmentant la venda en línia de productes i, per tant, empreses de comerç electrònic com Flipkart, Amazon , o empreses com Netflix estan aprofitant el poder de la IA per vendre els seus productes amb molta facilitat i obtenir beneficis.
Banca
En l'àmbit bancari, el sistema d'IA creix més ràpidament. Molts bancs ja han adoptat el sistema d'IA per oferir diversos serveis com ara assistència al client, detecció d'anomalies, fraus de targetes de crèdit.
Prenguem un exemple del banc HDFC. Han desenvolupat un chatbot basat en IA anomenat Electronic Virtual Assistant (EVA). Aquest bot de xat ja ha atès més de 3 milions de consultes dels clients. Eva pot donar respostes senzilles en menys de 0,4 segons. Bank of America té el seu nom de chatbot Erica. American Express utilitza els seus chatbots AmEX per beneficiar els seus clients.
MasterCard i RBS WorldPay han utilitzat la intel·ligència artificial i l'aprenentatge profund per detectar transaccions fraudulentes i prevenir el frau amb targeta. Aquest sistema d'IA va estalviar milions de dòlars. Els algorismes de detecció de fraus basats en IA són més precisos per detectar fraus amb una precisió de més del 95%. Tenen la capacitat d'adaptar-se ràpidament per detectar nous intents de frau en temps real.
L'aplicació més important de la IA a la banca és la gestió del risc perquè les estimacions mostren que, de mitjana, la pèrdua de comerciants per atacs de frau és de l'1,5% dels seus ingressos anuals. JPMorgan també va començar a utilitzar tècniques d'IA per desenvolupar un sistema d'alerta primerenca que detecti programari maliciós, troians i virus. Aquest sistema de detecció suposadament identifica comportaments sospitosos molt abans que els correus electrònics de frau s'enviïn realment als empleats.