Podatkovna znanost

Python Plotly Vadnica

Python Plotly Vadnica
Plotly je analitično podjetje, ki je znano po razvoju analitičnih, statističnih in grafičnih orodij za spletne aplikacije in samostojne skripte Python v realnem času. V tej lekciji si bomo s Plotly ogledali osnovne primere in zgradili preproste in intuitivne grafikone časovnih vrst, ki bodo v 100-odstotni interaktivni naravi in ​​hkrati enostavni za oblikovanje. Te grafe je mogoče uporabiti v predstavitvah, saj so popolnoma interaktivni in pripravljeni na igro.

Obstaja tudi možnost, da grafični dizajn shranite brez povezave, tako da ga je mogoče enostavno izvoziti. Obstaja veliko drugih funkcij, ki zelo olajšajo uporabo knjižnice:

Za začetek uporabe paketa Plotly se moramo registrirati za račun na prej omenjenem spletnem mestu, da dobimo veljavno uporabniško ime in ključ API, s katerim lahko začnemo uporabljati njegove funkcije. Na srečo je za Plotly na voljo načrt brezplačnih cen, s katerim dobimo dovolj funkcij za izdelavo grafikonov proizvodnega razreda.

Namestitev Plotly

Samo opomba pred začetkom, za to lekcijo lahko uporabite navidezno okolje, ki ga lahko naredimo z naslednjim ukazom:

python -m navidezno virtualenv
vir numpy / bin / activate

Ko je navidezno okolje aktivno, lahko v virtualno env namestite knjižnico Plotly, tako da lahko izvajamo primere, ki jih ustvarimo naslednji:

pip namestite načrtno

V tej lekciji bomo uporabili Anacondo in Jupyter. Če ga želite namestiti na svoj računalnik, si oglejte lekcijo, ki opisuje »Kako namestiti Anaconda Python na Ubuntu 18.04 LTS «in delite svoje povratne informacije, če imate kakršne koli težave. Če želite Plotly namestiti z Anacondo, v terminalu iz Anaconde uporabite naslednji ukaz:

conda install -c načrtno namerno

Nekaj ​​takega vidimo, ko izvršimo zgornji ukaz:

Ko so vsi potrebni paketi nameščeni in končani, lahko začnemo z uporabo knjižnice Plotly z naslednjo izjavo o uvozu:

uvozite načrtno

Ko ustvarite račun na Plotly, boste potrebovali dve stvari - uporabniško ime računa in ključ API. Vsakemu računu lahko pripada samo en ključ API. Torej naj bo na varnem, saj ga boste izgubili, ključ boste morali regenerirati in vse stare aplikacije, ki uporabljajo stari ključ, bodo prenehale delovati.

V vseh programih Python, ki jih pišete, navedite poverilnice, da začnete sodelovati s Plotly:

načrtno.orodja.datoteka_datoteke_posrednikov (uporabniško ime = 'uporabniško ime', api_key = 'vaš-api-ključ')

Začnimo s to knjižnico zdaj.

Uvod v Plotly

V našem programu bomo uporabili naslednji uvoz:

uvozi pande kot pd
uvozi numpy kot np
uvozi scipy kot sp
uvozite načrtno.namerno kot py

Uporabljamo:

Za nekatere primere bomo uporabili lastne podatkovne nize Plotly, ki so na voljo na Githubu. Na koncu upoštevajte, da lahko način Plotly omogočite tudi brez povezave, kadar morate zagnati skripte Plotly brez omrežne povezave:

uvozi pande kot pd
uvozi numpy kot np
uvozi scipy kot sp
uvozite načrtno
načrtno.brez povezave.init_notebook_mode (povezan = True)
uvozite načrtno.brez povezave kot py

Za preizkus namestitve Plotly lahko zaženete naslednjo izjavo:

tisk (namerno.__verzija__)

Nekaj ​​takega vidimo, ko izvršimo zgornji ukaz:

Končno bomo naložili nabor podatkov s Pandami in si ga ponazorili kot tabelo:

uvozite načrtno.figure_factory kot ff
df = pd.read_csv ("https: // raw.githubusercontent.com / plotly / datasets / master / school_
zaslužki.csv ")
tabela = ff.create_table (df)
py.iplot (tabela, ime datoteke = 'tabela')

Nekaj ​​takega vidimo, ko izvršimo zgornji ukaz:

Zdaj pa sestavimo a Črtkasti grafikon za vizualizacijo podatkov:

uvozite načrtno.graph_objs kot go
podatki = [go.Vrstica (x = df.Šola, y = df.Ženske)]
py.iplot (podatki, ime datoteke = 'women-bar')

Nekaj ​​takega vidimo, ko zaženemo zgornji delček kode:

Ko vidite zgornji grafikon z zvezkom Jupyter, se vam prikažejo različne možnosti Povečava / pomanjšava nad določenim odsekom grafikona, izbira Box & Lasso in še veliko več.

Združene palične karte

Več primerjalnih grafikonov lahko za primerjavo z Plotly zelo enostavno združimo skupaj. Za to uporabimo isti nabor podatkov in pokažimo razlike v prisotnosti moških in žensk na univerzah:

ženske = pojdi.Vrstica (x = df.Šola, y = df.Ženske)
moški = pojdi.Vrstica (x = df.Šola, y = df.Moški)
podatki = [moški, ženske]
postavitev = go.Postavitev (barmode = "group")
fig = go.Slika (podatki = podatki, postavitev = postavitev)
py.iplot (slika)

Nekaj ​​takega vidimo, ko zaženemo zgornji delček kode:

Čeprav se to zdi dobro, nalepke v zgornjem desnem kotu niso, pravilno! Popravimo jih:

ženske = pojdi.Vrstica (x = df.Šola, y = df.Ženske, ime = "Ženske")
moški = pojdi.Vrstica (x = df.Šola, y = df.Moški, ime = "Moški")

Graf je zdaj videti veliko bolj opisno:

Poskusimo spremeniti barmode:

postavitev = go.Postavitev (barmode = "relativno")
fig = go.Slika (podatki = podatki, postavitev = postavitev)
py.iplot (slika)

Nekaj ​​takega vidimo, ko zaženemo zgornji delček kode:

Tortne lestvice z zapleti

Zdaj bomo poskušali zgraditi tortni grafikon z načrtom, ki določa osnovno razliko med odstotkom žensk na vseh univerzah. Imena univerz bodo oznake, dejanske številke pa se bodo uporabile za izračun odstotka celote. Tu je delček kode za isto:

sled = iti.Pita (oznake = df.Šola, vrednote = df.Ženske)
py.iplot ([sled], ime datoteke = 'pita')

Nekaj ​​takega vidimo, ko zaženemo zgornji delček kode:

Dobra stvar je, da ima Plotly veliko funkcij povečevanja in pomanjševanja ter številna druga orodja za interakcijo z izdelanim grafikonom.

Vizualizacija podatkov časovne vrste s Plotly

Vizualizacija podatkov o časovnih vrstah je ena najpomembnejših nalog, s katero se srečujete, ko ste podatkovni analitik ali podatkovni inženir.

V tem primeru bomo uporabili ločen nabor podatkov v istem skladišču GitHub, saj prejšnji podatki niso vključevali nobenih časovno žigosanih podatkov. Tako kot tukaj bomo tudi sčasoma začrtali spremembe zalog Appleovega trga:

finančna = pd.read_csv ("https: // raw.githubusercontent.com / plotly / datasets / master /
finance-karte-jabolko.csv ")
podatki = [go.Razpršeno (x = finančno.Datum, y = finančni ['AAPL.Zapri '])]
py.iplot (podatki)

Nekaj ​​takega vidimo, ko zaženemo zgornji delček kode:

Ko miškin kazalec premaknete nad črto variacije grafa, lahko določite podrobnosti točke:

Z gumbi za povečavo in pomanjšanje lahko vidimo tudi podatke, značilne za vsak teden.

Grafikon OHLC

Grafikon OHLC (Open High Low close) se uporablja za prikaz sprememb entitete v časovnem obdobju. To je enostavno zgraditi s PyPlot:

od datetime uvoz datumtime
odprti_podatki = [33.0, 35.3, 33.5, 33.0, 34.1]
visoki_podatki = [33.1, 36.3, 33.6, 33.2, 34.8]
nizki_podatki = [32.7, 32.7, 32.8, 32.6, 32.8]
close_data = [33.0, 32.9, 33.3, 33.1, 33.1]
datumi = [datum-čas (leto = 2013, mesec = 10, dan = 10),
datum in čas (leto = 2013, mesec = 11, dan = 10),
datum in čas (leto = 2013, mesec = 12, dan = 10),
datum in čas (leto = 2014, mesec = 1, dan = 10),
datum in čas (leto = 2014, mesec = 2, dan = 10)]
sled = iti.Ohlc (x = datumi,
odprta = odprti_podatki,
visoka = visoki_podatki,
nizko = nizki_podatki,
close = close_data)
podatki = [sled]
py.iplot (podatki)

Tukaj smo navedli nekaj vzorčnih podatkovnih točk, na katere lahko sklepamo na naslednji način:

Zdaj pa zaženimo delček kode, ki smo ga navedli zgoraj. Nekaj ​​takega vidimo, ko zaženemo zgornji delček kode:

To je odlična primerjava, kako vzpostaviti časovne primerjave entitete s svojo in jo primerjati z njenimi visokimi in nizkimi dosežki.

Zaključek

V tej lekciji smo si ogledali še eno knjižnico vizualizacije, Plotly, ki je odlična alternativa Matplotlibu v aplikacijah razreda produkcije, ki so izpostavljene kot spletne aplikacije, Plotly je zelo dinamična in s funkcijami bogata knjižnica za uporabo v produkcijske namene, zato je to vsekakor veščina, ki jo moramo imeti pod pasom.

Poiščite vso izvorno kodo, uporabljeno v tej lekciji, na Githubu. Prosimo, delite svoje povratne informacije o lekciji na Twitterju z @sbmaggarwal in @LinuxHint.

S pomočjo gumba X-Mouse Button Control različno prilagodite gumbe miške za različno programsko opremo
Mogoče potrebujete orodje, ki bi lahko spremenilo nadzor miške z vsako aplikacijo, ki jo uporabljate. V tem primeru lahko preizkusite aplikacijo z ime...
Microsoft Sculpt Touch Wireless Mouse Review
Pred kratkim sem prebral o Microsoftov kiparski dotik brezžično miško in se odločil za nakup. Potem ko sem ga nekaj časa uporabljal, sem se odločil, d...
Zaslonska sledilna ploščica in kazalec miške AppyMouse za tablične računalnike Windows
Uporabniki tabličnih računalnikov pogosto zgrešijo miškin kazalec, še posebej kadar običajno uporabljajo prenosne računalnike. Pametni telefoni in tab...