Llista dels 10 millors llibres i descripcions de ciència de dades per al generalista

Llista Dels 10 Millors Llibres I Descripcions De Ciencia De Dades Per Al Generalista



La ciència de dades és el camp d'estudi que maneja grans quantitats de dades utilitzant mètodes, processos, algorismes i sistemes científics per trobar patrons invisibles, obtenir informació significativa, prendre decisions empresarials a les empreses i també utilitzar-les en institucions no empresarials. Les institucions no empresarials inclouen indústries de salut, jocs, reconeixement d'imatges, sistemes de recomanació, logística, detecció de fraus (institucions bancàries i financeres), cerca a Internet, reconeixement de veu, publicitat dirigida, planificació de rutes aèries i realitat augmentada. La ciència de dades és un subconjunt de la intel·ligència artificial. Les dades que s'utilitzen per a l'anàlisi poden provenir de moltes fonts diferents i es presenten en diferents formats. Algunes de les dades font poden estar estandarditzades; altres poden no estar estandarditzats.

Per dir-ho d'una altra manera, s'utilitzen diferents metodologies per recollir les dades (plural de datum). A continuació, s'extreuen coneixements (conclusions valuoses) de les dades reunides. En el procés, després de recollir les dades, es fa la recerca sobre elles (dades) per obtenir noves dades (resultats) a partir de les quals es resolen els problemes.







La ciència de dades com a disciplina (principal) existeix a nivell de grau i màster a la universitat. No obstant això, només poques universitats del món ofereixen la ciència de dades al grau o al màster. A nivell de Grau, l'estudiant es gradua amb un grau en Ciència de Dades. Això és com un grau de propòsit general. A nivell de màster, l'estudiant surt amb un Postgrau en Data Science, especialitat en Data Analytics, Data Engineering, o com a Data Scientist.



Pot sorprendre el lector i, possiblement, per desgràcia, que l'aprenentatge automàtic, el modelatge, l'estadística, la programació i les bases de dades siguin coneixements previs per estudiar Ciència de Dades a nivell de Grau, malgrat que són ensenyaments universitaris respectats per dret propi, cursats a altres disciplines a nivell de Grau o Màster. No obstant això, quan un estudiant va a una universitat per estudiar Ciència de Dades a nivell de grau, tots aquests cursos es seguiran cursant, al costat o abans dels cursos corresponents, de Ciència de Dades.



La ciència de dades per al grau o les seves especialitzacions com ara Data Analytics, Data Engineering o com a Data Scientist encara s'estan desenvolupant; tot i que van arribar a una fase que s'apliquen a les indústries després d'haver estudiat (a la universitat). La ciència de dades és una disciplina relativament molt nova, en general.





Recorda que primer has de ser generalista abans de convertir-te en especialista. Les distincions entre els programes d'especialistes encara no estan clares. Les distincions entre els programes generalistes i els especialitzats encara no estan clares.

Com que la ciència de dades és una disciplina relativament nova, els llibres prescrits en aquest document es basen en la cobertura de continguts i no en la pedagogia (que tan bé ensenya el llibre). I són per al programa de Grau (generalista). Hi ha diferents cursos generalistes.



La llista

Per a més detalls i possible compra amb targeta de crèdit, es dóna un hiperenllaç per a cadascun dels llibres. Cap dels llibres cobreix tots els cursos generalistes.

Matemàtiques essencials per a la ciència de dades: càlcul, estadística, teoria de probabilitats i àlgebra lineal

Escrit per: Hadrien Jean

  • Editorial: Hadrian Jean
  • Data de publicació: després del 30 de setembre de 2020
  • Idioma: anglès
  • Nombre de pàgines: més de 400

El contingut d'aquest llibre es pot veure com el curs de matemàtiques per a Data Science. Tot i que no es recomana aprendre ciència de dades per un mateix, un graduat de secundària que vulgui aprendre ciència de dades per si mateix hauria de començar amb aquest llibre.

Contingut: Càlcul; Estadística i probabilitat; Àlgebra linial; Escalars i Vectors; Matrius i tensors; Espai, dependència lineal i transformació espacial; Sistemes d'equacions lineals; Vectors propis i valors propis; Descomposició de valors singulars.

https://www.essentialmathfordatascience.com/

Una guia de sentit comú sobre estructures i algorismes de dades: millora les teves habilitats bàsiques de programació / 2a edició

Escrit per: Jay Wengrow

  • Editorial: Pragmatic Bookshelf
  • Data de publicació: 15 de setembre de 2020
  • Idioma: anglès
  • Mides: 7,5 x 1,25 x 9,25 polzades
  • Nº de pàgines: 508

Aquest llibre tracta sobre algorismes i estructures de dades que s'utilitzen en Data Science. Suposant que algú està aprenent Ciència de Dades per si mateix després de graduar-se a l'escola secundària, aquest és el següent llibre a llegir després de llegir el llibre de matemàtiques anterior. Els programes d'exemple es donen en JavaScript, Python i Ruby.

Contingut: Per què són importants les estructures de dades; Per què importen els algorismes; O sí! Notació O gran; Accelereu el vostre codi amb Big O; Optimització del codi amb i sense Big O; Optimització per a escenaris optimistes; Big O a Everyday Code; Cerca ràpida amb taules hash; Elaboració de codi elegant amb piles i cues; Recurs recursivament amb recursivitat; Aprendre a escriure en recursiu; Programació Dinàmica; Algorismes recursius per a la velocitat; Estructures de dades basades en nodes; Accelerar totes les coses amb arbres de cerca binaris; Manteniu les vostres prioritats rectes amb munts; No fa mal intentar-ho; Connectant-ho tot amb gràfics; Tractament de les limitacions d'espai; Tècniques d'optimització de codi

Ciència de dades més intel·ligent: tenir èxit amb projectes d'IA i dades de grau empresarial / 1 st Edició

Escrit per: Neal Fishman, Cole Stryker i Grady Booch

  • Editorial: Wiley
  • Data de publicació: 14 d'abril de 2020
  • Idioma: anglès
  • Nº de pàgines: 286

Contingut: Pujar l'escala de l'IA; Framing Part I: Consideracions per a les organitzacions que utilitzen IA; Framing Part II: Consideracions per treballar amb dades i IA; Una mirada enrere a Analytics: més d'un martell; Una mirada endavant en analítica: no tot pot ser un clau; Abordar les disciplines operatives a l'escala de l'IA; Maximitzar l'ús de les vostres dades: impulsar el valor; Valorar les dades amb anàlisi estadística i permetre un accés significatiu; Construir a llarg termini; A Journey's End: una IA per a la IA.

Machine Learning: A Probabilistic Perspective (sèrie Adaptive Computation and Machine Learning) Edició il·lustrada

Escrit per: Kevin P. Murphy

  • Editorial: The MIT Press
  • Data de publicació: 24 d'agost de 2012
  • Idioma: anglès
  • Mides: 8,25 x 1,79 x 9,27 polzades
  • Nº de pàgines: 1104

Aquest llibre és bo per a principiants. De nou, com la resta de llibres que es prescriuen en aquest document, aquest llibre no cobreix tot el necessari per al programa generalista que, malauradament, encara no està finalitzat (tampoc els programes especialitzats encara no estan acabats). El típic principiant aquí és un graduat de secundària amb un aprovat en matemàtiques i informàtica.

Continguts: Introducció (Aprenentatge automàtic: què i per què?, Aprenentatge no supervisat, Alguns conceptes bàsics en aprenentatge automàtic); probabilitat; Models generatius per a dades discretes; models gaussians; estadística bayesiana; estadístiques freqüentistes; regressió lineal; Regressió logística; Els models lineals generalitzats i la família exponencial; Models gràfics dirigits (xarxes de Bayes); Models de mescles i algorisme EM; Models lineals latents; Models lineals escassos; nuclis; processos gaussians; Models de funció de base adaptativa; Markov i models ocults de Markov; Models espacials estatals; Models gràfics no dirigits (camps aleatoris de Markov); Inferència exacta per a models gràfics; inferència variacional; Inferència més variacional; inferència de Montecarlo; inferència de la cadena de Markov Montecarlo (MCMC); agrupació; Aprenentatge de l'estructura del model gràfic; Models de variables latents per a dades discretes; Aprenentatge profund.

Ciència de dades per a empreses: el que necessiteu saber sobre la mineria de dades i el pensament analític de dades / 1a edició

Escrit per: Tom Fawcett i Foster Provost

  • Editorial: O'Reilly Media
  • Data de publicació: 17 de setembre de 2013
  • Idioma: anglès
  • Mides: 7 x 0,9 x 9,19 polzades
  • Nº de pàgines: 413

Contingut: Pensament analític de dades; Problemes empresarials i solucions de ciència de dades; Introducció al modelatge predictiu: de la correlació a la segmentació supervisada; Adaptació d'un model a les dades; El sobreajust i la seva evitació; Similitud, Veïns i Clústers; Pensament analític de decisions I: Què és un bon model?; Visualització del rendiment del model; Evidències i probabilitats; Text de representació i mineria; Pensament analític de decisions II: cap a l'enginyeria analítica; Altres tasques i tècniques de ciència de dades; Ciència de dades i estratègia empresarial; Conclusió.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Estadístiques pràctiques per a científics de dades: més de 50 conceptes essencials amb R i Python / 2a edició

Escrit per: Peter Bruce, Andrew Bruce i Peter Gedeck

  • Editorial: O'Reilly Media
  • Data de publicació: 2 de juny de 2020
  • Idioma: anglès
  • Mides: 7 x 0,9 x 9,1 polzades
  • Nº de pàgines: 368

Continguts: anàlisi exploratòria de dades, distribucions de dades i mostreig, experiments estadístics i proves de significació, regressió i predicció, classificació, aprenentatge automàtic estadístic, aprenentatge no supervisat.

El llibre del perquè: la nova ciència de causa i efecte

Escrit per: Judea Pearl, Dana Mackenzie

  • Editorial: Basic Book
  • Data de publicació: 15 de maig de 2018
  • Idioma: anglès
  • Mides: 6,3 x 1,4 x 9,4 polzades
  • Nº de pàgines: 432

Tot i que molts llibres de Data Science utilitzen la indústria empresarial pura per a la il·lustració, aquest llibre utilitza la indústria mèdica i altres disciplines per a la il·lustració.

Contingut: Introducció: Mind over Data; L'escala de la causalitat; De bucaners als conillets d'índies: la gènesi de la inferència causal; De l'evidència a les causes: el reverend Bayes coneix el senyor Holmes; Confondre i desconfondre: o, matant la variable a l'aguait; El debat ple de fum: netejar l'aire; Paradoxes a munt!; Més enllà de l'ajustament: la intervenció de la conquesta de la muntanya; Contrafactuals: mons miners que podrien haver estat; Mediació: la recerca d'un mecanisme; Big Data, intel·ligència artificial i grans preguntes.

Construeix una carrera en ciència de dades

Escrit per: Emily Robinson i Jacqueline Nolis

  • Editorial: Manning
  • Data de publicació: 24 de març de 2020
  • Idioma: anglès
  • Mides: 7,38 x 0,8 x 9,25 polzades
  • Nº de pàgines: 354

Contingut: Introducció a la ciència de dades; Trobar la teva feina de ciència de dades; Instal·lació a la ciència de dades; Creixent en el teu paper de Data Science.

https://www.manning.com/books/build-a-career-in-data-science

Data Science for Dummies / 2a edició

Escrit per: Lillian Pierson

  • Editorial: For Dummies
  • Data de publicació: 6 de març de 2017
  • Idioma: anglès
  • Mides: 7,3 x 1 x 9 polzades
  • Nº de pàgines: 384

Aquest llibre suposa que el lector ja té els coneixements previs de matemàtiques i programació.

Contingut:  embolicar el cap amb la ciència de dades; Exploració de canonades i infraestructures d'enginyeria de dades; Aplicar coneixements basats en dades a les empreses i la indústria; Aprenentatge automàtic: aprendre de dades amb la vostra màquina; Matemàtiques, probabilitat i modelització estadística; Ús de l'agrupació per subdividir dades; Modelatge amb instàncies; Construcció de models que operen dispositius d'Internet de les coses; Seguint els principis del disseny de visualització de dades; Ús de D3.js per a la visualització de dades; Aplicacions web per al disseny de visualització; Explorant les millors pràctiques en disseny de taulers; Elaboració de mapes a partir de dades espacials; Ús de Python per a la ciència de dades; Ús de codi obert R per a la ciència de dades; Ús d'SQL a la ciència de dades; Fer ciència de dades amb Excel i Knime; Data Science in Journalism: Nailing Down the Five Ws (i una H); Aprofundir en la ciència de dades ambientals; Data Science per impulsar el creixement del comerç electrònic; Ús de la ciència de dades per descriure i predir l'activitat criminal; Deu recursos fenomenals per a dades obertes; Deu eines i aplicacions gratuïtes de ciència de dades.

Mineria de conjunts de dades massius / 3 rd Edició

Escrit per: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Editorial: Cambridge University Press
  • Data de publicació: 13 de febrer de 2020
  • Idioma: anglès
  • Mides: 7 x 1 x 9,75 polzades
  • Nº de pàgines: 565

Aquest llibre també suposa que el lector ja té els coneixements previs de matemàtiques i programació.

Contingut: Mineria de Dades; MapReduce i la nova pila de programari; Algorismes que utilitzen MapReduce; Trobar articles similars; Fluxs de dades de mineria; Anàlisi d'enllaços; Conjunts d'elements freqüents; agrupació; Publicitat a la web; Sistemes de recomanació; Gràfics de xarxes socials mineres; Reducció de la dimensionalitat; Aprenentatge automàtic a gran escala.

Conclusió

Les distincions entre els programes d'especialistes encara no estan clares. Les distincions entre els programes generalistes i especialitzats tampoc no estan clares. Tanmateix, després de llegir la llista de llibres donada, el lector estarà en condicions d'apreciar millor els rols especials de l'analista de dades, l'enginyeria de dades i el científic de dades, i després avançar.