First steps with Excel & Python [PL] PART1

Pierwszy maja jest chyba dobrym dniem!

Jak to śpiewał kiedyś Rychu Peja: “Czas leci, a my jak małe dzieci-czy pamiętasz te czasy? Szalony dziewięćdziesiąty trzeci”. Z perspektywy czasu myślę, że było fajnie: mało obowiązków, dużo wolnego czasu. Ale nie czas marzyć i odpoczywać, czas wrócić na właściwą ścieżkę, w końcu dziś święto pracy!

Dlaczego cała strona jest po angielsku a teraz czytasz w swoim pięknym języku ojczystym? Cóż, tak po prostu jest. Chcę trochę poćwiczyć swój angielski, może to będzie dobra do tego okazja, więc zapraszam Cię dziś do mojego pierwszego posta w języku polskim na blogu skillbrix.com

PS. Dla aktywnych czytających: łapcie mnie w przyszłości w postach po angielsku na błędach ortograficznych- pewnie będzie ich mnóstwo- z góry dziękuję, gdyż będzie to bardzo przydatne w mojej blogowej drodze.

Pewnie zastanowiłeś się, dlaczego motywem przewodnim dziś jest butelka z wodą? Cały blog Excel & Python jest o tym jak umilić sobie nudną, nikomu nie potrzebną robotę klepacza w Excelu, a przy okazji złapać skilla w bardzo uproszczonym języku programowania, jakim jest Python. W dzisiejszym poście powiem Ci jak “przelać” dane ze wszystkim nam znanego pliku .csv do narzędzia Jupyter Notebook. Opróżnimy zatem wspólnie pierwszą naszą butelkę!

Czego potrzebujesz?

1. Dane testowe w .csv. Zachęcam Cię do skorzystania z super narzędzia Mockaroo, choć aby najlepiej podążać za dzisiejszym postem pobierz dane stąd: MOCK_DATA,

2. Zainstalowanego programu Jupyter Notebook. Uważam, że jeden z lepszych materiałów o tym, co zrobić, aby pojawił się na Twoim komputerze dobrze zainstalowany Jupyter napisał Ben Pryke na blogu dataquest.io,

3. Otwartego umysłu i 3 minut wspólnego kodowania.

Zaczynamy!

 1. Po otwarciu notebooka musimy importować dodatek pandas i numpy. Zrobimy to za pomocą poniższego kodu:

import pandas as pd
import numpy as np
import os

2. Przypisujemy do zmiennej ‘dane’ plik MOCK_DATA.csv tak jak poniżej:

dane = pd.read_csv(‘C://Users/micha/Dropbox/skillbrix/First_steps_in_Excel/MOCK_DATA.csv’, delimiter=’,’, encoding=’utf-8′)

po tym zabiegu powinniśmy widzieć teraz mniej więcej takie cudo

Jedna linijka kodu i mamy już w pamięci nasze dane.

W naszej funkcji pd.read_csv użyliśmy 3 argumentów:

1. nazwy naszego pliku. W moim przypadku podałem dokładną lokalizację ze ścieżką,

2. typu rozdzielacza kolumn w pliku csv. W moim przypadku był to przecinek- u Ciebie może to być również średnik,

3. typu kodowania ‘utf-8’. Zazwyczaj podaję to z definicji, ponieważ chodzi o szyfrowanie plików i rozróżnianie przez program, lub też nie, polskich znaków.

Jupyter pokazał Ci pierwsze 30 oraz ostatnie 30 wierszy Twojego pliku.

Co zrobić żeby upewnić się, że plik dobrze się zaczytał ale jednak żeby nie zajmował nam tyle miejsca na ekranie? 

Spróbuj wszystkich poniższych komend:

dane.sample(5)

dane.tail()

dane.head()

To wszystko!

Po zaczytaniu pliku do Jupyter Notebook możemy je teraz analizować pod każdym możliwym kątem. W następnym poście zaproszę Cię do grupowania danych i podstawowych funkcji, za pomocą których będziesz w stanie sprawdzić ile Zosiek czai się w Twoim zbiorze danych.

Leave a Reply

Your email address will not be published. Required fields are marked *