Què és Amazon EMR?
L'usuari pot posar totes les dades en un magatzem de dades per processar-les amb la seva elecció de marcs de processament distribuïts com Hadoop, Hive, etc. Amazon S3 és, amb diferència, el millor emmagatzematge de dades, però, les organitzacions han trobat Spark i Hadoop difícils i cars. configurar. Amazon EMR es pot utilitzar per crear clústers mitjançant aplicacions com Spark o Hadoop i analitzar grans dades al núvol:
Característiques
A continuació s'esmenten algunes de les característiques clau de l'EMR:
Elàstic : L'usuari pot crear múltiples clústers en EMR i també el servei permet redimensionar aquests clústers perquè la seva elasticitat sigui la seva característica important:
Magatzems de dades flexibles : el clúster d'Amazon EMR és molt flexible quan es tracta d'instal·lacions d'emmagatzematge de dades i s'integra bé amb altres serveis d'AWS:
Eines : EMR ofereix múltiples eines perquè els usuaris creïn i facin servir els seus clústers al núvol:
Com utilitzar l'EMR?
Per utilitzar el servei EMR d'AWS, només cal que aneu al tauler d'EMR i seleccioneu ' Clústers ” al tauler esquerre i feu clic a “ Crea un clúster botó ”:
Escriviu el nom del clúster i seleccioneu ' Aplicacions ” per al clúster:
Desplaceu-vos cap avall per la pàgina i seleccioneu el tipus d'instància i el fitxer de parell de claus per configurar el maquinari i la configuració de seguretat. Reviseu les configuracions i feu clic a ' Crea un clúster 'botó per completar el procés:
El clúster EMR es mostrarà a la seva pàgina:
Heu creat correctament un clúster EMR a AWS.
Conclusió
Amazon EMR s'utilitza per crear clústers mitjançant aplicacions com Hadoop, Spark, etc., i crear instàncies EC2 a través d'ell. EMR té les característiques d'elasticitat i flexibilitat d'escalabilitat del clúster amb emmagatzematge segur de dades al núvol. L'usuari pot crear un clúster EMR des de la plataforma AWS i connectar-s'hi mitjançant l'aplicació PuTTY.