- Kaj je Python Seaborn?
- Vrste parcel, ki jih lahko zgradimo z Seabornom
- Delo z več ploskvami
- Nekaj alternativ za Python Seaborn
To se zdi veliko za pokriti. Začnimo zdaj.
Kaj je knjižnica Python Seaborn?
Knjižnica Seaborn je paket Python, ki nam omogoča izdelavo infografik na podlagi statističnih podatkov. Ker je narejen na vrhu matplotliba, je tudi sam po sebi združljiv z njim. Poleg tega podpira podatkovno strukturo NumPy in Pandas, tako da je načrtovanje mogoče izvesti neposredno iz teh zbirk.
Vizualizacija zapletenih podatkov je ena najpomembnejših stvari, za katere Seaborn skrbi. Če bi primerjali Matplotlib z Seabornom, lahko Seaborn olajša tiste stvari, ki jih je z Matplotlibom težko doseči. Vendar je pomembno omeniti, da Seaborn ni alternativa Matplotlibu, temveč njegov dodatek. V tej lekciji bomo uporabili tudi funkcije Matplotlib v delčkih kode. Za sodelovanje z Seabornom se boste odločili v naslednjih primerih uporabe:
- Na voljo imate statistične podatke o časovnih vrstah, ki bodo prikazani z negotovostjo okoli ocen
- Vizualno ugotoviti razliko med dvema podskupinama podatkov
- Vizualizirati univariatno in bivariatno porazdelitev
- Dodajanje veliko več vizualne naklonjenosti matplotlib ploskvam s številnimi vgrajenimi temami
- Prilagajanje in vizualizacija modelov strojnega učenja z linearno regresijo z neodvisnimi in odvisnimi spremenljivkami
Samo opozorilo pred začetkom je, da za to lekcijo uporabljamo navidezno okolje, ki smo ga naredili z naslednjim ukazom:
python -m virtualenv seabornvir seaborn / bin / aktiviraj
Ko je navidezno okolje aktivno, lahko v navidezno env namestimo knjižnico Seaborn, tako da lahko izvajamo primere, ki jih ustvarimo naslednjič:
pip namestite seabornAnakondo lahko uporabite tudi za zagon teh primerov, kar je lažje. Če ga želite namestiti na svoj računalnik, si oglejte lekcijo, ki opisuje »Kako namestiti Anaconda Python na Ubuntu 18.04 LTS «in delite svoje povratne informacije. Zdaj pa pojdimo naprej k različnim vrstam zapletov, ki jih je mogoče zgraditi s Pythonom Seabornom.
Uporaba Pokemon Dataset
Da bo ta lekcija praktična, bomo uporabili nabor podatkov Pokemon, ki ga lahko prenesete iz Kaggle. Za uvoz tega nabora podatkov v naš program bomo uporabili knjižnico Pandas. Tu so vsi uvozi, ki jih izvajamo v našem programu:
uvozi pande kot pdiz matplotlib import pyplot kot plt
uvozi seaborn kot sns
Zdaj lahko nabor podatkov uvozimo v naš program in nekaj vzorčnih podatkov prikažemo skupaj s Pandas kot:
df = pd.read_csv ('Pokemon.csv ', index_col = 0)df.glava ()
Za zagon zgornjega delčka kode mora biti nabor podatkov CSV prisoten v istem imeniku kot sam program. Ko zaženemo zgornji delček kode, bomo videli naslednji izhod (v zvezku Anaconde Jupyter):
Izris krivulje linearne regresije
Ena najboljših stvari pri Seabornu so inteligentne funkcije risanja, ki jih zagotavlja, ki ne samo vizualizira nabor podatkov, ki mu jih zagotavljamo, ampak tudi gradi regresijske modele okoli njega. Na primer, mogoče je z eno vrstico kode izdelati linearno regresijsko ploskev. To naredite tako:
sns.lmplot (x = 'Napad', y = 'Obramba', podatki = df)Ko zaženemo zgornji delček kode, bomo videli naslednji izhod:
V zgornjem delčku kode smo opazili nekaj pomembnih stvari:
- V Seabornu je na voljo posebna funkcija risanja
- Uporabili smo Seabornovo funkcijo vgradnje in risanja, ki nam je zagotovila linearno regresijsko črto, ki jo je sam oblikoval
Ne bojte se, če ste mislili, da brez te regresijske črte ne moremo imeti zapleta. Mi lahko ! Preizkusimo zdaj nov delček kode, podoben prejšnjemu:
sns.lmplot (x = 'Attack', y = 'Defense', data = df, fit_reg = False)Tokrat v naši ploskvi ne bomo videli regresijske črte:
Zdaj je to veliko bolj jasno (če ne potrebujemo linearne regresijske črte). A to še ni končano. Seaborn nam omogoča, da naredimo drugačen ta zaplet in to bomo tudi počeli.
Gradnja parcel zabojnikov
Ena največjih lastnosti Seaborna je, kako zlahka sprejme strukturo Pandas Dataframes za načrtovanje podatkov. Preprosto lahko podatkovni okvir prenesemo v knjižnico Seaborn, da lahko iz njega zgradi okvir:
sns.boxplot (podatki = df)Ko zaženemo zgornji delček kode, bomo videli naslednji izhod:
Prvo branje seštevka lahko odstranimo, saj je to videti nekoliko nerodno, ko tukaj dejansko načrtujemo posamezne stolpce:
# Nov boxplot z uporabo stats_df
sns.boxplot (podatki = stats_df)
Ko zaženemo zgornji delček kode, bomo videli naslednji izhod:
Parcela roja z Seabornom
Z Seabornom lahko sestavimo intuitivno zasnovo Swarm plot. Ponovno bomo uporabili podatkovni okvir iz Pandas, ki smo ga naložili prej, tokrat pa bomo poklicali Matplotlibovo funkcijo show, da prikažemo ploskev, ki smo jo naredili. Tu je delček kode:
sns.set_context ("papir")sns.swarmplot (x = "Attack", y = "Defense", data = df)
plt.pokaži ()
Ko zaženemo zgornji delček kode, bomo videli naslednji izhod:
Z uporabo Seaborn konteksta dovolimo Seabornu, da doda osebni pridih in tekoč dizajn ploskve. To ploskev je mogoče še bolj prilagoditi z velikostjo pisave po meri, ki se uporablja za nalepke na ploskvi, da olajša branje. Da bi to naredili, bomo posredovali več parametrov funkciji set_context, ki deluje tako, kot se sliši. Na primer, da spremenimo velikost pisave nalepk, bomo uporabili pisavo.parameter velikosti. Tu je delček kode za izvedbo spremembe:
sns.swarmplot (x = "Attack", y = "Defense", data = df)
plt.pokaži ()
Ko zaženemo zgornji delček kode, bomo videli naslednji izhod:
Velikost pisave za nalepko je bila spremenjena glede na parametre, ki smo jih navedli, in vrednost, povezano s pisavo.parameter velikosti. Ena stvar, pri kateri je Seaborn strokovnjak, je narediti zaplet zelo intuitiven za praktično uporabo, kar pomeni, da Seaborn ni le praktični paket Python, ampak dejansko nekaj, kar lahko uporabimo v svojih proizvodnih postavitvah.
Dodajanje naslova ploskvam
Našim zapletom je enostavno dodati naslove. Upoštevati moramo le preprost postopek uporabe funkcij na ravni osi, kjer bomo poklicali set_title () funkcija, kot jo prikazujemo v delčku kode tukaj:
sns.set_context ("paper", font_scale = 3, rc = "font.velikost ": 8," osi.velikost nalepke ": 5)my_plot = sns.swarmplot (x = "Attack", y = "Defense", data = df)
my_plot.set_title ("LH Swarm Plot")
plt.pokaži ()
Ko zaženemo zgornji delček kode, bomo videli naslednji izhod:
Tako lahko svojim parcelam dodamo veliko več informacij.
Seaborn proti Matplotlibu
Ko smo si ogledali primere v tej lekciji, lahko ugotovimo, da Matplotliba in Seaborna ni mogoče neposredno primerjati, vendar se lahko vidi, da se dopolnjujeta. Ena od lastnosti, ki pelje Seaborn 1 korak naprej, je način, kako lahko Seaborn statistično vizualizira podatke.
Da bi kar najbolje izkoristili parametre Seaborna, toplo priporočamo, da si ogledate dokumentacijo Seaborna in ugotovite, katere parametre uporabite, da bo vaša parcela čim bližje poslovnim potrebam.
Zaključek
V tej lekciji smo preučili različne vidike te knjižnice za vizualizacijo podatkov, ki jo lahko uporabljamo s Pythonom za ustvarjanje čudovitih in intuitivnih grafov, ki lahko vizualizirajo podatke v obliki, ki jo podjetje želi od platforme. Seaborm je ena najpomembnejših knjižnic za vizualizacijo, ko gre za podatkovni inženiring in predstavitev podatkov v večini vizualnih oblik, kar je vsekakor veščina, ki jo moramo imeti pod pasom, saj nam omogoča izdelavo linearnih regresijskih modelov.
Prosimo, delite svoje povratne informacije o lekciji na Twitterju z @sbmaggarwal in @LinuxHint.