Învață Analiza datelor cu Python în acest tutorial cuprinzător pentru începători, cu exerciții incluse!
NOTĂ: Verificați descrierea pentru link-uri pentru notebook-uri actualizate.
Analiza datelor există de mult timp, dar până în urmă cu câțiva ani, se practica folosind instrumente închise, costisitoare și limitate precum Excel sau Tableau. Python, SQL și alte biblioteci deschise au schimbat pentru totdeauna analiza datelor.
În acest tutorial veți învăța întregul proces de analiză a datelor: citirea datelor din mai multe surse (CSV-uri, SQL, Excel etc.), procesarea acestora folosind NumPy și Pandas, vizualizarea lor folosind Matplotlib și Seaborn și curățarea și procesarea acestora pentru a crea rapoarte. .
În plus, am inclus un tutorial complet Jupyter Notebook și o referință rapidă Python pentru a vă reîmprospăta abilitățile de programare.
💻 Curs creat de Santiago Basulto de la RMOTR
🔗 Consultați toate cursurile Data Science de la RMOTR: https://rmotr.com
⚠️ Notă: în loc să încărcați caietele pe notebooks.ai, ar trebui să utilizați Google Colab. Iată instrucțiuni despre încărcarea unui blocnotes direct din GitHub în Google Colab: https://colab.research.google.com/github/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb#scrollTo=K-NVg7RjyeTk
⭐️ Conținutul cursului ⭐️
⌨️ Partea 1: Introducere
Ce este analiza datelor, de ce Python?, ce alte opțiuni există? care este ciclul unui proiect de analiză a datelor? Care este diferența dintre analiza datelor și știința datelor?
🔗 Slide-uri pentru această secțiune:
https://docs.google.com/presentation/d/1fDpjlyMiOMJyuc7_jMekcYLPP2XlSl1eWw9F7yE7byk/edit?usp=sharing/>
⌨️ Partea 2: Exemplu de viață reală a unui proiect de analiză a datelor Python/Pandas (00:11:11)
O demonstrație a unui proiect de analiză a datelor din viața reală folosind Python, Pandas, SQL și Seaborn. Nu vă faceți griji, vom săpă mai adânc în secțiunile următoare
🔗 Caiete: https://github.com/ine-rmotr-curriculum/FreeCodeCamp-Pandas-Real-Life-Example
⌨️ Partea 3: Tutorial Jupyter Notebooks (00:30:50)
Un tutorial pas cu pas pentru a învăța cum să folosești Juptyer Notebooks
🔗 Cheat Sheet Twitter: https://twitter.com/rmotr_com/status/1122176794696847361
🔗 Caiete: https://github.com/ine-rmotr-curriculum/ds-content-interactive-jupyterlab-tutorial
⌨️ Partea 4: Introducere în NumPy (01:04:58)
Aflați de ce NumPy a fost o bibliotecă atât de importantă pentru lumea de prelucrare a datelor în Python. Aflați despre detaliile de nivel scăzut ale calculelor și stocării în memorie și de ce instrumente precum Excel vor fi întotdeauna limitate atunci când procesează volume mari de date.
🔗 Caiete: https://github.com/ine-rmotr-curriculum/freecodecamp-intro-to-numpy
⌨️ Partea 5: Introducere în Panda (01:57:08)
Pandas este probabil cea mai importantă bibliotecă pentru procesarea datelor din lumea Python. Aflați cum funcționează și cum se compară structura sa principală de date, Cadrul de date, cu alte instrumente, cum ar fi foile de calcul sau DF-urile utilizate pentru Big Data
🔗 Caiete: https://github.com/ine-rmotr-curriculum/freecodecamp-intro-to-pandas
⌨️ Partea 6: Curățarea datelor (02:47:18)
Aflați diferitele tipuri de probleme cu care ne vom confrunta cu datele noastre: valori nule, valori nevalide, valori aberante statistice etc. și cum să le curățați.
🔗 Caiete: https://github.com/ine-rmotr-curriculum/data-cleaning-rmotr-freecodecamp
⌨️ Partea 7: Citirea datelor din alte surse (03:25:15)
🔗 Caiete: https://github.com/ine-rmotr-curriculum/RDP-Reading-Data-with-Python-and-Pandas
⌨️ Partea 8: Python Recap (03:55:19)
Dacă abilitățile dvs. Python sau de codare sunt ruginite, consultați această secțiune pentru o recapitulare rapidă a caracteristicilor principale Python și a structurilor fluxului de control.
🔗 Caiete: https://github.com/ine-rmotr-curriculum/ds-content-python-under-10-minutes
—
Învățați să codificați gratuit și obțineți un job de dezvoltator: https://www.freecodecamp.org
Citiți sute de articole despre programare: https://freecodecamp.org/news