Què són els tipus de dades d'Amazon Redshift?

Que Son Els Tipus De Dades D Amazon Redshift



Amazon Redshift és una solució al núvol que ofereix AWS que compleix la finalitat d'un magatzem de dades. Un magatzem de dades és un gran espai al núvol que emmagatzema enormes quantitats de dades. La diferència entre un magatzem de dades i una base de dades és que el primer no només emmagatzema les dades actuals, sinó també l'historial complet de les dades.

Aquest article coneixerà Amazon Redshift d'AWS i els tipus de dades que admet aquest servei.







Què és Amazon RedShift?

És una solució al núvol per a l'emmagatzematge de dades que es basa 'PostgreSQL' . Utilitza una tecnologia anomenada 'Processament massiu en paral·lel (MPP)' per processar petabytes de dades a la velocitat del llamp. Això proporciona una solució fàcil per a la predicció en temps real basada en dades històriques i solucions de streaming.



La figura següent mostra el mecanisme de funcionament d'Amazon Redshift:







Aquesta explicació gràfica de com funciona Amazon Redshift és molt senzilla i clara. Ens dóna informació sobre com es recuperen i es processen les dades per generar resultats i crear aplicacions basades en dades.

L'arquitectura del magatzem de dades d'Amazon Redshift també es pot veure a la figura que es mostra a continuació:



Ara, ens dirigirem als usos i característiques d'aquest servei.

Característiques

Com ja s'ha esmentat, Amazon Redshift es basa en PostgreSQL i utilitza una tecnologia anomenada Massively Parallel Processing que li permet processar petabytes de dades en molt poc temps. Per tant, Redshift ofereix un bon nombre de funcions i usos. Algunes d'aquestes característiques es mostren a continuació:

  • Seguretat de dades i xifratge.
  • Analítica empresarial.
  • Suport d'aplicacions basat en dades.
  • Anàlisi predictiva.
  • Repetició automatitzada de tasques.
  • Escalat de dades simultània.
  • Emmagatzematge de dades.

Algunes característiques addicionals d'aquest servei es poden veure a la figura que es mostra a continuació:

Aquestes eren la majoria de les funcions que ofereix Redshift i ara passarem als tipus de dades compatibles amb aquest servei.

Tipus de dades

Amazon Redshift és una solució d'emmagatzematge de dades amb un gran nombre de funcions. Admet tant tipus de dades estructurades com no estructurades. Com que es basa en PostgreSQL, les dades es poden manipular mitjançant consultes SQL senzilles.

Ara sorgeix una altra pregunta, és a dir, en què es diferencien aquests formats de dades entre si? Parlem d'aquests dos formats de dades.

Dades estructurades

Un tipus de dades amb un gran format que es tradueix fàcilment mitjançant algorismes d'aprenentatge automàtic s'anomena dades estructurades. Una base de dades SQL funciona amb dades estructurades. Les dades estructurades estan en forma tabular, com ara les dades utilitzades per les bases de dades relacionals

Un dels sistemes de gestió de bases de dades SQL àmpliament utilitzats és MYSQL. La seva arquitectura es pot veure a continuació a la figura donada:

Dades no estructurades

Les dades no estructurades són dades sense patró i menys format, com ara les dades utilitzades en bases de dades no relacionals. MongoDB és una famosa base de dades no relacional. Les consultes SQL no funcionen en bases de dades no relacionals, de manera que aquestes bases de dades també s'anomenen bases de dades NoSQL.

Com ja s'ha esmentat, MongoDB és un sistema de gestió de bases de dades no estructurat i la seva arquitectura es pot veure a continuació a la figura donada:

Hem analitzat els dos tipus de dades fonamentals utilitzats a les bases de dades i ara ens dirigirem als tipus de dades reals que admet Amazon Redshift. Aquests tipus de dades són:

  • Dades numèriques
  • Dades de caràcter
  • Dades de data i hora
  • Dades booleanes
  • Dades HLLSKETCH
  • SUPER dades
  • Dades de substitució

Parlem d'aquests tipus de dades:

Dades numèriques

Aquest tipus de dades s'explica per si mateix. Admet dades en forma de nombres enters, decimals, coma flotant i altres tipus de dades numèriques.

Les característiques del tipus de dades enter es poden veure a la figura següent:

El tipus de dades decimal emmagatzema les dades en funció de la precisió de l'usuari. Les seves característiques són les següents:

Dades de caràcter

Els tipus de dades CHAR i VARCHAR pertanyen a la categoria de tipus de dades basats en caràcters. NCHAR i NVARCHAR també són tipus de dades de tipus de caràcter. A diferència de CHAR i VARCHAR, aquests dos tipus de dades emmagatzemen caràcters Unicode de longitud fixa. Vegem les propietats d'aquests tipus de dades, com ara:

  • CHAR, CHARACTER i NCHAR tenen un rang de 4KB.
  • VARCHAR, NVARCHAR té un rang de 64 KB.
  • BPCHAR té un rang de 256 bytes.
  • TEXT té un rang de 260 bytes.

Dades de data i hora

Els tipus de dades de data i hora són DATE, TIME, TIMETZ,TIMESTAMP i TIMESTAMPTZ. Les capacitats funcionals d'aquests tipus de dades són les següents:

  • DATE només emmagatzema les dates del calendari.
  • TIME emmagatzema l'hora sense fer referència a cap zona horària. És UTC, per defecte.
  • TIMETZ emmagatzema l'hora en referència a la zona horària. És UTC tant a les taules d'usuari com a les taules del sistema, per defecte.
  • TIMESTAMP no només inclou l'hora sinó també les dates. És UTC tant a les taules d'usuari com a les del sistema, per defecte.
  • TIMESTAMPTZ no només inclou l'hora sinó també les dates. És UTC només a les taules d'usuari, per defecte.

Dades booleanes

El tipus de dades booleà és un tipus de dades binari, el que significa que només hi ha dos valors. La taula de característiques del tipus de dades booleà es mostra a continuació a la figura:

Dades HLLSKETCH

Aquest tipus de dades s'utilitza per emmagatzemar esbossos. Redshift pot representar els esbossos en forma escassa o densa. Els esbossos comencen com escassos i es tornen densos gradualment quan un format dens proporciona més eficiència seguint l'enllaç.

SUPER dades

Aquest tipus de dades tracta dades no estructurades que poden tenir forma de matrius, estructures imbricades o JSON. No hi ha cap model ni format de les dades. Els usuaris poden explorar més informació navegant per l'enllaç.

Dades de substitució

Aquest tipus de dades també emmagatzema caràcters. No obstant això, la longitud és limitada. Amazon Redshift permet emetre dades VARBYTE a qualsevol tipus d'enter o tipus de caràcter. Per obtenir més informació sobre aquest tipus de dades, seguiu l'enllaç següent.

Això és tot el que hi ha per Amazon Redshift i els tipus de dades que admet.

Conclusió

Amazon Redshift és un servei d'AWS que en la seva forma bàsica serveix per a un magatzem de dades, però és una solució molt potent i funcional per a l'anàlisi i la predicció. En aquest article s'ha parlat de Redshift i els tipus de dades que admet. Aquests tipus de dades es van explicar breument juntament amb les seves característiques.