Podatkovna znanost

Vadnica za Pythona Seaborna

Vadnica za Pythona Seaborna
V tej lekciji o knjižnici Python Seaborn si bomo ogledali različne vidike te knjižnice za vizualizacijo podatkov, ki jo lahko uporabljamo s Pythonom za ustvarjanje čudovitih in intuitivnih grafov, ki lahko vizualizirajo podatke v obliki, ki jo podjetje želi od platforme. Da bo ta lekcija popolna, bomo zajeli naslednje razdelke:

To se zdi veliko za pokriti. Začnimo zdaj.

Kaj je knjižnica Python Seaborn?

Knjižnica Seaborn je paket Python, ki nam omogoča izdelavo infografik na podlagi statističnih podatkov. Ker je narejen na vrhu matplotliba, je tudi sam po sebi združljiv z njim. Poleg tega podpira podatkovno strukturo NumPy in Pandas, tako da je načrtovanje mogoče izvesti neposredno iz teh zbirk.

Vizualizacija zapletenih podatkov je ena najpomembnejših stvari, za katere Seaborn skrbi. Če bi primerjali Matplotlib z Seabornom, lahko Seaborn olajša tiste stvari, ki jih je z Matplotlibom težko doseči. Vendar je pomembno omeniti, da Seaborn ni alternativa Matplotlibu, temveč njegov dodatek. V tej lekciji bomo uporabili tudi funkcije Matplotlib v delčkih kode. Za sodelovanje z Seabornom se boste odločili v naslednjih primerih uporabe:

Samo opozorilo pred začetkom je, da za to lekcijo uporabljamo navidezno okolje, ki smo ga naredili z naslednjim ukazom:

python -m virtualenv seaborn
vir seaborn / bin / aktiviraj

Ko je navidezno okolje aktivno, lahko v navidezno env namestimo knjižnico Seaborn, tako da lahko izvajamo primere, ki jih ustvarimo naslednjič:

pip namestite seaborn

Anakondo lahko uporabite tudi za zagon teh primerov, kar je lažje. Če ga želite namestiti na svoj računalnik, si oglejte lekcijo, ki opisuje »Kako namestiti Anaconda Python na Ubuntu 18.04 LTS «in delite svoje povratne informacije. Zdaj pa pojdimo naprej k različnim vrstam zapletov, ki jih je mogoče zgraditi s Pythonom Seabornom.

Uporaba Pokemon Dataset

Da bo ta lekcija praktična, bomo uporabili nabor podatkov Pokemon, ki ga lahko prenesete iz Kaggle. Za uvoz tega nabora podatkov v naš program bomo uporabili knjižnico Pandas. Tu so vsi uvozi, ki jih izvajamo v našem programu:

uvozi pande kot pd
iz matplotlib import pyplot kot plt
uvozi seaborn kot sns

Zdaj lahko nabor podatkov uvozimo v naš program in nekaj vzorčnih podatkov prikažemo skupaj s Pandas kot:

df = pd.read_csv ('Pokemon.csv ', index_col = 0)
df.glava ()

Za zagon zgornjega delčka kode mora biti nabor podatkov CSV prisoten v istem imeniku kot sam program. Ko zaženemo zgornji delček kode, bomo videli naslednji izhod (v zvezku Anaconde Jupyter):

Izris krivulje linearne regresije

Ena najboljših stvari pri Seabornu so inteligentne funkcije risanja, ki jih zagotavlja, ki ne samo vizualizira nabor podatkov, ki mu jih zagotavljamo, ampak tudi gradi regresijske modele okoli njega. Na primer, mogoče je z eno vrstico kode izdelati linearno regresijsko ploskev. To naredite tako:

sns.lmplot (x = 'Napad', y = 'Obramba', podatki = df)

Ko zaženemo zgornji delček kode, bomo videli naslednji izhod:

V zgornjem delčku kode smo opazili nekaj pomembnih stvari:

Ne bojte se, če ste mislili, da brez te regresijske črte ne moremo imeti zapleta. Mi lahko ! Preizkusimo zdaj nov delček kode, podoben prejšnjemu:

sns.lmplot (x = 'Attack', y = 'Defense', data = df, fit_reg = False)

Tokrat v naši ploskvi ne bomo videli regresijske črte:

Zdaj je to veliko bolj jasno (če ne potrebujemo linearne regresijske črte). A to še ni končano. Seaborn nam omogoča, da naredimo drugačen ta zaplet in to bomo tudi počeli.

Gradnja parcel zabojnikov

Ena največjih lastnosti Seaborna je, kako zlahka sprejme strukturo Pandas Dataframes za načrtovanje podatkov. Preprosto lahko podatkovni okvir prenesemo v knjižnico Seaborn, da lahko iz njega zgradi okvir:

sns.boxplot (podatki = df)

Ko zaženemo zgornji delček kode, bomo videli naslednji izhod:

Prvo branje seštevka lahko odstranimo, saj je to videti nekoliko nerodno, ko tukaj dejansko načrtujemo posamezne stolpce:

stats_df = df.padec (['Skupaj'], os = 1)
# Nov boxplot z uporabo stats_df
sns.boxplot (podatki = stats_df)

Ko zaženemo zgornji delček kode, bomo videli naslednji izhod:

Parcela roja z Seabornom

Z Seabornom lahko sestavimo intuitivno zasnovo Swarm plot. Ponovno bomo uporabili podatkovni okvir iz Pandas, ki smo ga naložili prej, tokrat pa bomo poklicali Matplotlibovo funkcijo show, da prikažemo ploskev, ki smo jo naredili. Tu je delček kode:

sns.set_context ("papir")
sns.swarmplot (x = "Attack", y = "Defense", data = df)
plt.pokaži ()

Ko zaženemo zgornji delček kode, bomo videli naslednji izhod:

Z uporabo Seaborn konteksta dovolimo Seabornu, da doda osebni pridih in tekoč dizajn ploskve. To ploskev je mogoče še bolj prilagoditi z velikostjo pisave po meri, ki se uporablja za nalepke na ploskvi, da olajša branje. Da bi to naredili, bomo posredovali več parametrov funkciji set_context, ki deluje tako, kot se sliši. Na primer, da spremenimo velikost pisave nalepk, bomo uporabili pisavo.parameter velikosti. Tu je delček kode za izvedbo spremembe:

sns.set_context ("paper", font_scale = 3, rc = "font.velikost ": 8," osi.velikost nalepke ": 5)
sns.swarmplot (x = "Attack", y = "Defense", data = df)
plt.pokaži ()

Ko zaženemo zgornji delček kode, bomo videli naslednji izhod:

Velikost pisave za nalepko je bila spremenjena glede na parametre, ki smo jih navedli, in vrednost, povezano s pisavo.parameter velikosti. Ena stvar, pri kateri je Seaborn strokovnjak, je narediti zaplet zelo intuitiven za praktično uporabo, kar pomeni, da Seaborn ni le praktični paket Python, ampak dejansko nekaj, kar lahko uporabimo v svojih proizvodnih postavitvah.

Dodajanje naslova ploskvam

Našim zapletom je enostavno dodati naslove. Upoštevati moramo le preprost postopek uporabe funkcij na ravni osi, kjer bomo poklicali set_title () funkcija, kot jo prikazujemo v delčku kode tukaj:

sns.set_context ("paper", font_scale = 3, rc = "font.velikost ": 8," osi.velikost nalepke ": 5)
my_plot = sns.swarmplot (x = "Attack", y = "Defense", data = df)
my_plot.set_title ("LH Swarm Plot")
plt.pokaži ()

Ko zaženemo zgornji delček kode, bomo videli naslednji izhod:

Tako lahko svojim parcelam dodamo veliko več informacij.

Seaborn proti Matplotlibu

Ko smo si ogledali primere v tej lekciji, lahko ugotovimo, da Matplotliba in Seaborna ni mogoče neposredno primerjati, vendar se lahko vidi, da se dopolnjujeta. Ena od lastnosti, ki pelje Seaborn 1 korak naprej, je način, kako lahko Seaborn statistično vizualizira podatke.

Da bi kar najbolje izkoristili parametre Seaborna, toplo priporočamo, da si ogledate dokumentacijo Seaborna in ugotovite, katere parametre uporabite, da bo vaša parcela čim bližje poslovnim potrebam.

Zaključek

V tej lekciji smo preučili različne vidike te knjižnice za vizualizacijo podatkov, ki jo lahko uporabljamo s Pythonom za ustvarjanje čudovitih in intuitivnih grafov, ki lahko vizualizirajo podatke v obliki, ki jo podjetje želi od platforme. Seaborm je ena najpomembnejših knjižnic za vizualizacijo, ko gre za podatkovni inženiring in predstavitev podatkov v večini vizualnih oblik, kar je vsekakor veščina, ki jo moramo imeti pod pasom, saj nam omogoča izdelavo linearnih regresijskih modelov.

Prosimo, delite svoje povratne informacije o lekciji na Twitterju z @sbmaggarwal in @LinuxHint.

Srednji gumb miške ne deluje v sistemu Windows 10
The srednji gumb miške vam pomaga, da se pomikate po dolgih spletnih straneh in zaslonih z veliko podatkov. Če se to ustavi, boste na koncu uporabili ...
Kako spremeniti levi in ​​desni gumb miške na računalniku z operacijskim sistemom Windows 10
Povsem normalno je, da so vse naprave računalniške miške ergonomsko zasnovane za desničarje. Na voljo pa so miške, ki so posebej zasnovane za levičarj...
Posnemajte klike miške tako, da v Windows 10 lebdite z miško Clickless Mouse
Uporaba miške ali tipkovnice v napačni drži čezmerne uporabe lahko povzroči veliko zdravstvenih težav, vključno s sevom, sindromom karpalnega kanala i...