Podatkovna znanost

Kako ustvariti Pandas DataFrame v Pythonu?

Kako ustvariti Pandas DataFrame v Pythonu?

Pandas DataFrame je 2D (dvodimenzionalna) označena podatkovna struktura, pri kateri so podatki poravnani v obliki tabele z različnimi vrsticami in stolpci. Za lažje razumevanje se DataFrame obnaša kot preglednica, ki vsebuje tri različne komponente: indeks, stolpce in podatke. Pandas DataFrames so najpogostejši način uporabe predmetov pande.

Pandas DataFrames je mogoče ustvariti z različnimi metodami. Ta članek bo razložil vse možne metode, s pomočjo katerih lahko ustvarite Pandas DataFrame v pythonu. Vse primere smo izvedli na orodju pycharm. Začnimo z izvajanjem vsake metode posebej.

Osnovna sintaksa

Pri ustvarjanju DataFrames v Pandas python upoštevajte naslednjo sintakso:

pd.DataFrame (Df_data)

Primer: Pojasnimo na primeru. V tem primeru smo podatke o imenih in odstotkih študentov shranili v spremenljivko 'Students_Data'. Nadalje, z uporabo pd.DataFrame (), ustvarili smo DataFrames za prikaz rezultatov študenta.

uvozi pande kot pd
Študentski podatki =
'Ime': ['Samreena', 'Asif', 'Mahwish', 'Raees'],
„Odstotek“: [90,80,70,85]
rezultat = pd.DataFrame (Študentski podatki)
natisni (rezultat)

Metode za ustvarjanje podatkovnih okvirov Pandas

Pandas DataFrames lahko ustvarite na različne načine, o katerih bomo razpravljali v nadaljevanju članka. Rezultate študentskih tečajev bomo natisnili v obliki podatkovnih okvirjev. Torej lahko z eno od naslednjih metod ustvarite podobne okvire podatkov, ki so predstavljeni na naslednji sliki:

Metoda # 01: Ustvarjanje Pandas DataFrame iz slovarja seznamov

V naslednjem primeru so DataFrames ustvarjeni iz slovarjev seznamov, povezanih z rezultati študentskega tečaja. Najprej uvozite knjižnico pande in nato ustvarite slovar seznamov. Tipke dict predstavljajo imena stolpcev, kot so "Student_Name", "Course_Title" in "GPA". Seznami predstavljajo podatke ali vsebino stolpca. Spremenljivka 'dictionary_lists' vsebuje podatke študentov, ki so nadalje dodeljeni spremenljivki 'df1'. Z izjavo za tiskanje natisnite vso vsebino okvirjev podatkov.

Primer:

# Uvozite knjižnice za pande in numpy
uvozi pande kot pd
# Uvozi knjižnico pande
uvozi pande kot pd
# Ustvari slovar seznama
dictionary_lists =
'Student_Name': ['Samreena', 'Raees', 'Sara', 'Sana'],
'Course_Title': ['SQA', 'SRE', 'IT Osnove', 'Umetna inteligenca'],
„GPA“: [3.1, 3.3, 2.8, 4.0]
# Ustvari DataFrame
dframe = pd.DataFrame (seznami_ slovarjev)
natisni (dframe)

Po izvedbi zgornje kode se prikaže naslednji izhod:

Metoda # 02: Ustvarite Pandas DataFrame iz slovarja polja NumPy

DataFrame lahko ustvarite iz diktata polja / seznama. V ta namen mora biti dolžina enaka kot vsa matrika. Če je posredovano nekaj indeksa, mora biti dolžina indeksa enaka dolžini polja. Če ni poslan noben indeks, je v tem primeru privzeti indeks obseg (n). Tu n predstavlja dolžino polja.

Primer:

uvozi numpy kot np
# Ustvari numpy matriko
nparray = np.matrika (
[['Samreena', 'Raees', 'Sara', 'Sana'],
['SQA', 'SRE', 'Osnove IT', 'Umetna inteligenca'],
[3.1, 3.3, 2.8, 4.0]])
# Ustvari slovar nparray
dictionary_of_nparray =
'Študentsko ime': nparray [0],
'Course_Title': nparray [1],
'GPA': nparray [2]
# Ustvari DataFrame
dframe = pd.DataFrame (dictionary_of_nparray)
natisni (dframe)

Metoda # 03: Ustvarjanje pandas DataFrame s pomočjo seznama seznamov

V naslednji kodi vsaka vrstica predstavlja eno vrstico.

Primer:

# Uvozi knjižnico Pandas pd
uvozi pande kot pd
# Ustvarite seznam seznamov
seznami skupin = [
['Samreena', 'SQA', 3.1],
['Raees', 'SRE', 3.3],
['Sara', 'Osnove IT', 2.8],
['Sana', 'Umetna inteligenca', 4.0]]
# Ustvari DataFrame
dframe = pd.DataFrame (group_lists, columns = ['Student_Name', 'Course_Title', 'GPA'])
natisni (dframe)

Metoda # 04: Ustvarjanje pandas DataFrame s pomočjo seznama slovarjev

V naslednji kodi predstavlja vsak slovar eno vrstico in tipke, ki predstavljajo imena stolpcev.

Primer:

# Uvozi pande knjižnice
uvozi pande kot pd
# Ustvarite seznam slovarjev
dict_list = [
'Student_Name': 'Samreena', 'Course_Title': 'SQA', 'GPA': 3.1,
'Student_Name': 'Raees', 'Course_Title': 'SRE', 'GPA': 3.3,
'Student_Name': 'Sara', 'Course_Title': 'Osnove IT', 'GPA': 2.8,
'Student_Name': 'Sana', 'Course_Title': 'Umetna inteligenca', 'GPA': 4.0]
# Ustvari DataFrame
dframe = pd.DataFrame (dict_list)
natisni (dframe)

Metoda # 05: Ustvarjanje podatkovnega okvira pand iz dict of pandas Series

Tipke dict predstavljajo imena stolpcev, vsaka serija pa vsebino stolpcev. V naslednjih vrsticah kode smo vzeli tri vrste serij: Ime_serije, Course_series in GPA_series.

Primer:

# Uvozi pande knjižnice
uvozi pande kot pd
# Ustvari serijo imen študentov
Ime_serije = pd.Serije (['Samreena', 'Raees', 'Sara', 'Sana'])
Serija_tečaja = pd.Serije (['SQA', 'SRE', 'Osnove IT', 'Umetna inteligenca]])
GPA_series = pd.Serija ([3.1, 3.3, 2.8, 4.0])
# Ustvari serijski slovar
Dictionary_of_nparray
\
'] = ' Ime ': Imena_serij,' Starost ': Serija_tečajev,' Oddelek ': GPA_series
# Ustvarjanje podatkovnega okvira
dframe = pd.DataFrame (dictionary_of_nparray)
natisni (dframe)

Metoda # 06: Ustvarite Pandas DataFrame s funkcijo zip ().

S funkcijo seznama (zip ()) je mogoče združiti različne sezname. V naslednjem primeru se pande DataFrame ustvarijo s klicem pd.Funkcija DataFrame (). Ustvarjajo se trije različni seznami, ki so združeni v obliki nabora.

Primer:

uvozi pande kot pd
# Seznam1
Študentsko ime = ['Samreena', 'Raees', 'Sara', 'Sana']
# Seznam2
Course_Title = ['SQA', 'SRE', 'Osnove IT', 'Umetna inteligenca']
# Seznam3
GPA = [3.1, 3.3, 2.8, 4.0]
# V nadaljevanju vzemite seznam nabora s treh seznamov in jih združite z zip ().
tuples = seznam (zip (Študentsko ime, Naslov_tečaja, GPA))
# Dodeli vrednosti podatkov naborom.
torti
# Pretvorba seznama tuplev v pandas Dataframe.
dframe = pd.DataFrame (nabori, stolpci = ['Student_Name', 'Course_Title', 'GPA'])
# Natisnite podatke.
natisni (dframe)

Zaključek

Z uporabo zgornjih metod lahko v Pythonu ustvarite Pandas DataFrames. Z izdelavo Pandas DataFrames smo natisnili GPA za študentski tečaj. Upamo, da boste po zagonu zgoraj omenjenih primerov dobili koristne rezultate. Vsi programi so dobro komentirani za boljše razumevanje. Če imate več načinov za ustvarjanje Pandas DataFrames, jih ne oklevajte deliti z nami. Hvala, ker ste prebrali to vadnico.

Kako prenesti in igrati Sid Meier's Civilization VI v Linuxu
Uvod v igro Civilization 6 je sodoben pogled na klasični koncept, uveden v seriji iger Age of Empires. Ideja je bila dokaj preprosta; začeli bi v zelo...
Kako namestiti in igrati Doom v Linuxu
Uvod v Doom Serija Doom je nastala v devetdesetih letih po izidu prvotnega Dooma. Bil je takojšen hit in od takrat naprej je serija iger prejela števi...
Vulkan za uporabnike Linuxa
Z vsako novo generacijo grafičnih kart vidimo, da razvijalci iger premikajo meje grafične zvestobe in se približujejo fotorealizmu. A kljub vsem kredi...