Einführung in data science

Dieses Buch führt Sie in Data Science ein, indem es grundlegende Prinzipien der Datenanalyse erläutert und Ihnen geeignete Techniken und Werkzeuge vorstellt. Sie lernen nicht nur, wie Sie Bibliotheken, Frameworks, Module und Toolkits konkret einsetzen, sondern implementieren sie auch selbst. Dadurch...

Descripción completa

Detalles Bibliográficos
Otros Autores: Grus, Joel, author (author), Rother, Kristian, translator (translator)
Formato: Libro electrónico
Idioma:Alemán
Publicado: Heidelberg, [Germany] : O'Reilly 2016.
Edición:1. Auflage
Materias:
Ver en Biblioteca Universitat Ramon Llull:https://discovery.url.edu/permalink/34CSUC_URL/1im36ta/alma991009630224006719
Tabla de Contenidos:
  • Inhalt; Vorwort; Data Science; Bei Null starten; In diesem Buch verwendete Konventionen; Verwenden von Codebeispielen; Danksagungen; Kapitel 1 - Einführung; Der Aufstieg der Daten; Was ist Data Science?; Ein motivierendes Szenario: DataSciencester; Finden von Schlüsselpersonen; Data Scientists, die Sie kennen könnten; Gehälter und Erfahrung; Bezahlte Nutzerkonten; Interessante Themen; Weiter geht's!; Kapitel 2 - Ein Crashkurs in Python; Grundlagen; Python installieren; Zen und Python; Formatieren durch Leerzeichen; Module; Arithmetik; Funktionen; Strings; Exceptions; Listen; Tupel
  • Dictionariesdefaultdict; Counter; Sets; Kontrollfluss; Wahrheitswerte; Über die Grundlagen hinaus; Sortieren; List Comprehensions; Generatoren und Iteratoren; Zufall; Reguläre Ausdrücke; Objektorientierte Programmierung; Funktionale Hilfsmittel; enumerate; zip und Entpacken von Argumenten; args und kwargs; Willkommen bei DataSciencester!; Weiterführendes Material; Kapitel 3 - Daten visualisieren; matplotlib; Balkendiagramme; Liniendiagramme; Scatterplots; Weiterführendes Material; Kapitel 4 - Lineare Algebra; Vektoren; Matrizen; Weiterführendes Material; Kapitel 5 - Statistik
  • Einen einzelnen Datensatz beschreibenLagemaße; Streuung; Korrelation; Das Simpson-Paradoxon; Weitere Fallstricke von Korrelationen; Korrelation und Kausalität; Weiterführendes Material; Kapitel 6 - Wahrscheinlichkeit; Abhängigkeit und Unabhängigkeit; Bedingte Wahrscheinlichkeit; Der Satz von Bayes; Zufallsvariablen; Kontinuierliche Wahrscheinlichkeitsverteilungen; Die Normalverteilung; Der zentrale Grenzwertsatz; Weiterführendes Material; Kapitel 7 - Hypothesen und Schlussfolgerungen; Testen statistischer Hypothesen; Beispiel: Münzwürfe; p-Werte; Konfidenzintervalle; P-Hacking
  • Beispiel: Durchführen eines A/B-TestsBayessche Inferenz; Weiterführendes Material; Kapitel 8 - Die Gradientenmethode; Die Idee hinter der Gradientenmethode; Abschätzen des Gradienten; Den Gradienten verwenden; Auswahl der richtigen Schrittweite; Anwendungsbeispiel; Stochastische Gradientenmethode; Weiterführendes Material; Kapitel 9 - Daten sammeln; stdin und stdout; Einlesen von Dateien; Grundlagen von Textdateien; Dateien mit Feldtrennern; Auslesen von Webseiten; Parsen von HTML-Dokumenten; Beispiel: O'Reilly-Bücher über Daten; Verwenden von APIs; JSON (und XML)
  • Eine nicht authentifizierte API verwendenAPIs finden; Beispiel: Verwenden der Twitter-APIs; Zugriff auf die APIs erhalten; Twython verwenden; Weiterführendes Material; Kapitel 10 - Arbeiten mit Daten; Erkunden Ihrer Daten; Erkunden eindimensionaler Daten; Zwei Dimensionen; Mehrere Dimensionen; Bereinigen und Umformen; Manipulieren von Daten; Umskalieren; Hauptkomponentenanalyse; Weiterführendes Material; Kapitel 11 - Maschinelles Lernen; Modellieren; Was ist maschinelles Lernen?; Overfitting und Underfitting; Genauigkeit; Der Kompromiss zwischen Bias und Varianz
  • Extraktion und Auswahl von Eigenschaften