pande

Kako uporabljati Boxplot v Pythonu

Kako uporabljati Boxplot v Pythonu
Ploščica polja se uporablja za povzetek naborov podatkov z uporabo metode zaboj in brki. Ta funkcija uporabnikom pomaga, da pravilno razumejo povzetek podatkov. Grafični prikazi so lahko zelo koristni, če želimo vedeti, kako se podatki širijo in širijo. Za risanje podatkov se v okvirčku polja uporabljajo tri vrste kvartilov. Te vrednosti vključujejo srednjo, maksimalno, minimalno, zgornjo in spodnjo četrtino statističnih vrednosti. Okvir ploskev povzema te podatke v 25th, 50th, in 75th percentili. Ta vadnica vam bo pokazala, kako ustvariti grafične okvire na podlagi določenega nabora podatkov z uporabo pande in morski rojen knjižnice Pythona.

Predpogoj

Če ste novi uporabnik Pythona, boste morali najprej nastaviti okolje, ki bo prikazovalo izhodne podatke ploskve. Za izvajanje kode lahko uporabite kateri koli tolmač Python. V tej vadnici bom uporabil spyder3 za izvedbo kode. Če še niste namestili pande in morski rojen knjižnic prej, potem morate iz terminala zagnati naslednji ukaz za namestitev teh knjižnic:

$ pip3 namesti pande seaborn

Parcele zabojev s pandami

The boxplot () metoda pande se uporablja za ustvarjanje številk ploskev polja na podlagi podatkovnega okvira. Ta metoda vsebuje veliko argumentov; nekateri od teh argumentov so uporabljeni v spodnjih primerih. Ta del vadnice bo vseboval dva primera, ki vam bosta pokazala, kako ustvariti ploskve v polju pande. Za ustvarjanje polja polja lahko uporabite naključno generirane podatke v knjižnici NumPy ali podatke iz datoteke CSV pande.

Primer 1: Škatle na podlagi naključnih vrednosti

Diagrami polja v naslednjem primeru so bili ustvarjeni z uporabo NumPy in pande. Knjižnica NumPy se v skriptu uporablja za ustvarjanje predmeta podatkovnega okvira z ustvarjanjem dvodimenzionalne matrike naključnih vrednosti, ki vsebujejo 5 vrstic in 5 stolpcev. Vsebina podatkovnega okvira bo natisnjena z uporabo glava() metoda. Nato, boxplot () metoda se uporablja za ustvarjanje grafikonov polja z modro barvo, velikostjo pisave 10 in 30-stopinjskim vrtljivim kotom za prikaz vrednosti stolpcev.

#!/ usr / bin / env python3
# Uvozi knjižnico pand
uvozi pande kot pd
# Uvozi knjižnico NumPy, da ustvariš naključne številke za polje
uvozi numpy kot np
"
Ustvari nabor podatkov na podlagi naključno ustvarjenega polja NumPy
in pet stolpcev
"
podatkovni okvir = pd.DataFrame (np.naključen.randn (5,5), stolpci = ['2016', '2017', '2018',
'2019', '2020'])
 
# Natisnite vrednosti podatkovnega okvira
tiskanje (podatkovni okvir.glava ())
# Prikažite ploskev polja na podlagi vrednosti podatkovnega okvira
podatkovni okvir.boxplot (grid = 'false', color = 'blue', fontsize = 10, rot = 30)

Izhod

Po izvedbi kode se prikaže naslednji izhod.

Primer 2: Polje grafikonov na podlagi podatkov CSV

Grafikoni v naslednjem primeru so bili ustvarjeni iz podatkov CSV. Ustvarite datoteko CSV z imenom banka.csv z uporabo naslednjih podatkov.

banka.csv

SL, ime stranke, vrsta računa, spol, stanje
1, Maria Hernandez, varčevanje, ženska, 120000
2, Mary Smith, Current, ženska, 40000
3, David Smith, Current, moški, 379000
4, Maria Rodriguez, Shranjevanje, ženska, 56000
5, Mark Lee, Shranjevanje, moški, 93500
6, Jonathan Bing, Current, moški, 5900
7, Daniel Williams, Saving, Male, 2300
8, Mike Brown, Current, moški, 124888
9, Paul Smith, Current, Male, 59450
10, Maria Lopez, Shranjevanje, Ženska, 487600

V naslednjem skriptu je matplotlib knjižnica je bila uporabljena za nastavitev velikosti slike ploskve polja in za prikaz izpisa v vrstici. Vsi zapisi o banka.csv datoteka je bila naložena z read_csv () metoda pande. Prvih 8 zapisov podatkovnega okvira je bilo nato natisnjenih z uporabo glava () metoda. The boxplot () metoda je bila uporabljena v naslednji izjavi za risanje slike polja z rdečo barvo glede na 'Vrsta računa' s stolpcem z imenom 'Ravnovesje."

#!/ usr / bin / env python3
# Uvozi pande za ustvarjanje zabojnega polja
uvozi pande kot pd
# Uvozite matplotlib, da nastavite velikost slike ploskve polja
uvozi matplotlib.pyplot kot plt
# Uvozite get_ipython za oblikovanje izhodnega besedila v vrstici
iz IPython import get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Nastavite velikost slike
plt.rcParams ['slika.figsize '] = (8,4)
# Naložite nabor podatkov iz datoteke CSV
df = pd.read_csv ("banka.csv ")
# Natisnite prvih 8 vrstic naloženih podatkov
tiskanje (df.glava (8))
# Prikažite polja polja na podlagi uporabljenega parametra
df.boxplot (by = 'Account_Type', grid = 'True', column = ['Stanje'], barva = 'rdeča')

Izhod

Po izvedbi kode se prikaže naslednji izhod.

Parcele z morskim rojstvom

Druga knjižnica Pythona, ki se pogosto uporablja za risanje zabojnih plošč, je knjižnica morski rojen.  Ena od pomembnih lastnosti te knjižnice je, da ima vgrajene številne vzorčne nabore podatkov za preizkušanje različnih nalog. Naslednja dva primera bosta zajemala uporabo dveh različnih vzorčnih naborov podatkov za risanje okvirjev s pomočjo morski rojen knjižnica.

Primer 3: Načrt polja na podlagi parametra x

Naslednji primer uporablja vzorčni nabor podatkov z imenom 'diamanti, ' iz morski rojeni knjižnico za generiranje škatle. Tu je slog mreže definiran s pomočjo set_style () metoda. The load_dataset () metoda se uporablja za nalaganje podatkovdiamanti ' nabora podatkov. Prvih pet zapisov je natisnjenih iz nabora podatkov in boxplot () metoda se nato uporabi za risanje polja polja na podlagi stolpca z imenom 'globino,'z modro barvo.

# Uvozite knjižnico Seaborn, da ustvarite zaboj
uvozi seaborn kot sns
# Uvozite matplotlib, da nastavite velikost slike ploskve polja
uvozi matplotlib.pyplot kot plt
# Uvozite get_ipython za oblikovanje izhodnega besedila v vrstici
iz uvoza IPython get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Nastavite slog mreže
sns.set_style ("bela mreža")
# Nastavite velikost slike
plt.rcParams ['slika.figsize '] = (8,4)
# Naložite vzorec nabora podatkov
diamond_dataset = sns.load_dataset ('diamanti')
# Prikažite prvih 5 zapisov nabora podatkov
tiskanje (diamond_dataset.glava ())
# Narišite sliko risb polja
sns.boxplot (x = diamond_dataset ['globina'], barva = 'modra')

Izhod

Po izvedbi kode se prikaže naslednji izhod.

Primer 4: Grafični prikaz na podlagi parametrov x in y

Naslednji primer uporablja vzorčni nabor podatkov z imenom 'leti', da narišem škatlo. Tu sta parametra x in y parametra boxplot () metode se uporabljajo za risanje slike. Druge izjave so podobne prejšnjemu primeru.

# Uvozi knjižnico Seaborn, da ustvariš zaboj
uvozi seaborn kot sns
# Uvozite matplotlib, da nastavite velikost slike ploskve polja
uvozi matplotlib.pyplot kot plt
# Uvozite get_ipython za oblikovanje izhodnega besedila v vrstici
iz uvoza IPython get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
 
# Nastavite slog mreže
sns.set_style ("darkgrid")
# Nastavite velikost slike
plt.rcParams ['slika.figsize '] = (12,4)
 
# Naložite vzorec nabora podatkov
flight_dataset = sns.load_dataset ('leti')
# Prikažite prvih 5 zapisov nabora podatkov
natis (flight_dataset.glava ())
 
# Narišite sliko risb polja
sns.boxplot (x = 'mesec', y = 'potniki', podatki = let_podatkovnih podatkov, barva = 'modra')

Izhod

Po izvedbi kode se prikaže naslednji izhod.

Zaključek

Pri delu z veliko količino podatkov boste morda želeli povzeti podatke z uporabo diagrama, na primer okvirja. Ta vadnica je uporabila več primerov, da vam pokaže, kako ustvariti grafične škatle z dvema knjižnicama Python.

Kako razviti igro na Linuxu
Pred desetletjem le malo uporabnikov Linuxa napoveduje, da bo njihov najljubši operacijski sistem nekoč priljubljena igralna platforma za komercialne ...
Odprtokodna vrata komercialnih igralnih sistemov
Brezplačne, odprtokodne in medplatformacijske igre, ki jih lahko uporabite za igranje starih, pa tudi nekaterih dokaj nedavnih naslovov iger. V tem čl...
Najboljše igre ukazne vrstice za Linux
Ukazna vrstica ni le vaš največji zaveznik pri uporabi Linuxa - lahko je tudi vir zabave, saj jo lahko uporabljate za igranje številnih zabavnih iger,...