Daugiau

„ArcGIS Python“ sintaksės klaida naudojant įdėtą, jei ne

„ArcGIS Python“ sintaksės klaida naudojant įdėtą, jei ne


Bandau naudoti „ArcMap 10.2“ lauko skaičiuoklę, kad užpildytumėte tuščią lauką, atsižvelgdamas į dviejų išeinančių laukų turinį, naudodamas šį „Python“ scenarijų Pre-Logic Script Code.

def myfunc (legenda, biltype): if (legenda == '0000 Manmade surface or step'): grąžinti 'Manmade surface or step' elif (legenda == '0000 Multiple surface (garden)'): grąžinti 'Garden' elif ( užrašas == '0000 Natūralus paviršius'): grįžti 'Natūralus paviršius' elifas (užrašas == '0000 kelias'): grąžinti 'Kelias' elifas (užrašas == '0000 Geležinkelis'): grąžinti 'Geležinkelis' elifas (užrašas == „0000 kelias“): grįžimas „kelio“ elifas (užrašas == „0000 kelių eismas ramina“): grįžimas „kelio eismo raminimas“ elifas (užrašas == „0000 struktūra“): grįžimas „struktūra“ elifas (užrašas == ') 0000 Track '): grąžinti „Track“ elif (užrašas ==' 0000 Unclassified (arba sugadintas) '): grąžinti' Unclassified (arba sugedęs) 'elif (legend ==' 0000 Unknown paviršius '): grąžinti' Unknown Surface 'elif (legenda == '0321 Archway'): grįžti 'Archway' elif (legenda == '0323 Glasshouse'): grįžti 'Glasshouse' elif (legenda == '0377 Boulders'): grįžti 'Boulders' elif (legenda == ') 0379 spygliuočių medžiai '): grąžinkite' spygliuočių medžių 'elifą (užrašas ==' 0380 spygliuočiai - išsibarstę '): grąžinkite' spygliuočių - išsklaidyti 'elifą ( užrašas == '0382 Pelkinės nendrės arba sūrumas'): grąžinkite 'Pelkinės nendrės arba sūrus' elifas (užrašas == '0384 Ne spygliuočiai medžiai'): grąžinkite 'Ne spygliuočių medžiai' elifą (legenda == '0385 Ne spygliuočiai - išsklaidyti'): grįžkite 'Spygliuočių - išsibarstęs' elifas (užrašas == '0386 Orchard'): grąžinti 'Sodo' elifas (užrašas == '0390 Nelygus žolynas'): grąžinti 'Nelygus žolynas' elifas (užrašas == '0392 Scrub'): grįžti ' „Scrub“ elif (užrašas == '0395 Aukštesnio lygio ryšys'): grįžkite „Aukštojo lygio ryšys“ elif (užrašas == '0400 Vidaus vandenys'): grįžkite „Vidaus vandens“ elifas (užrašas == '0321 Pastatas'): jei (biltype.startswith („Commercial, Education“): grąžinti „Education“ elif (biltype.startswith („Commercial, Emergency and Rescue Service“): grąžinti „Emergency Services“ elif (biltype.startswith („Commercial, Retail“): grąžinti „Retail“ elif („biltype.startswith“ („Residential“): grąžinti „Residential“ elif („biltype.startswith“ („Commercial, Industrial“): grąžinti „Industrial“ elif (biltype.startswith („Commercial, Hotels“): grįžti „Hotels“ elifas (gim iltype.startswith („Komercinės, bendruomenės paslaugos“): grįžti „Bendruomenės paslaugos“ elif (biltype.startswith („Komercinis, medicininis“): grąžinti „Medicinos“ elifas (biltype.startswith („Komercinis, laisvalaikis“): grąžinti „Laisvalaikis“ 'elif (biltype.startswith (' Commercial, Offices '): grąžinti' Office 'elif (biltype.startswith (' Commercial, Utilities '): return' Utilities 'else: return' Building - Other 'else: return' error '

o tada lauką nustatyti lygią

myfunc (! LEGEND !,! blpu_class!)

Kur „LEGEND“, o „blpu_class“ kaip du laukai su šaltinio duomenimis.

Paleidus lauko skaičiuoklę gaunu 000989 „Python“ sintaksės klaidą: analizavimo klaida „SyntaxError“: neteisinga sintaksė (51 eilutė)

Tai yra įdėtojo „if“ pradžia, bet aš negaliu išsiaiškinti, kokia yra problema.


Jūsų kodas yra tinkamas, bet kiekvienoje įdėtoje kodo eilutėje trūksta dešiniojo skliausto, jei dalis:

if (biltype.startswith ('Commercial, Education')): grąžinti 'Education' elif (biltype.startswith ('Commercial, Emergency and Rescue Service')): grąžinti 'Emergency Services' elif (biltype.startswith ('Commercial, Retail) „)): grąžinti„ Retail “elif (biltype.startswith ('Residential')): grąžinti 'Residential' elif (biltype.startswith ('Commercial, Industrial')): grąžinti 'Industrial' elif (biltype.startswith ('Commercial , Viešbučiai ')): grįžti „Hotels“ elif (biltype.startswith („Commercial, Community Services“)): grąžinti „Community Services“ elif (biltype.startswith („Commercial, Medical“)): grįžti „Medical“ elif ( biltype.startswith ('Commercial, Leisure')): grąžinti 'Laisvalaikis' elif (biltype.startswith ('Commercial, Offices')): grąžinti 'Office' elif (biltype.startswith ('Commercial, Utilities')): return ' Komunalinės paslaugos'

Raiškos kūrimas rastro skaičiuoklėje

Kuriant išraiškas rastro skaičiuoklės įrankyje, spustelėjus ir dukart spustelėjus įvairius dialogo lange esančius sluoksnius, kintamuosius, mygtukus ir įrankių pavadinimus, bus išvengta sintaksės klaidų, kurios gali būti daromos rašant.

Kadangi į rastrinės skaičiuoklės įrankį įvesta išraiška bus vykdoma „Python“, o „Python“ yra didžiosios ir mažosios raidės, svarbu naudoti teisingą įrankio pavadinimo didžiųjų raidžių rašymą. Pavyzdžiui, norėdami naudoti „IsNull“ įrankį, būtinai įveskite jį kaip „IsNull“, o ne „Isnull“ arba „isnull“.

Kai nuosekliai naudojami keli „Relational“ arba „Boolean“ operatoriai, išraiškai reikia skliaustų. Norėdami gauti daugiau informacijos, žiūrėkite naudojimo patarimus, pateiktus rastro skaičiuoklės įrankio žinyne.


Išvalę skirtukus ir tarpus (turėtumėte turėti tik skirtukus arba tik tarpus), turėsite pataisyti kilpas:

Kitu atveju turėtumėte „IndexError“.

„SilentGhost“ yra teisingas - skirtingai nuo tokių kalbų kaip „Javascript“, kai rašote

Tada j nepriskiriami 0, 1 ir 2 - jam priskiriamos faktinės vertės 30, 40 ir 50. Taigi nereikia sakyti kitoje eilutėje:

Tiesą sakant, jei tai padarysite pirmą kartą per ciklą, tai bus įvertinta kaip

Tai yra trijų elementų sąrašo išeitis iš ribų, ir gausite „IndexError“.

Jei tikrai norėjai tai padaryti kitaip - jei tu tikrai reikalingos rodyklės, taip pat reikšmės, galite padaryti maždaug taip:

len (s) nurodo s ilgį (šiuo atveju 3), o diapazono funkcija sukuria jums naują sąrašą, diapazone (n) yra skaičiai nuo 0 iki n-1. Tokiu atveju diapazonas (3) grąžina [0, 1, 2]

Kaip „SilentGhost“ pažymi komentaruose, tai yra kur kas labiau pitoniškas:

išvardyti (-ai) pateikia tris poras (0, 30), (1, 40) ir (2, 50) ta tvarka. Tuo pačiu metu turite indeksus į s ir faktinį elementą.


10 paplitusių pradinių „ArcGIS“ programuotojų „Python“ klaidų

Per daugelį metų aš išmokau šimtus pradinio lygio „Python“ programuotojų, kaip automatizuoti savo „ArcGIS“ geoprocesoriaus užduotis. Nereikia nė sakyti, kad mačiau įvairiausių klaidų. Tačiau yra keletas dažniausiai pasitaikančių klaidų, kurias matau vėl ir vėl. Taigi, jei esate pradedančiųjų lygio „Python“ programuotojas, dirbantis su „ArcGIS“, tikimės, kad tai padės jums peržengti kuprą. Žemiau rasite mano 10 dažniausiai pasitaikančių klaidų sąrašą ne tam tikra tvarka.

1. Klaidos - Tai turbūt nereikėtų net nesakyti, tačiau klaidos yra dažniausia ir nuosekliausia klaida. Kai pastebite kodo klaidą, tikriausiai tai turėtų būti pirmas dalykas, kurį patikrinsite. Įsitikinkite, kad nurodydami kintamąjį kur nors savo kodo kintamojo pavadinime parašėte tiksliai taip, kaip anksčiau apibrėžėte kintamojo pavadinimą. Štai pavyzdys:

layerParcel = „Gatvės“
... .. # kodas
... .. # kodas
... .. # kodas
if lyerParcel == „Gatvės“: #pastebėkite, kad „layerParcel“ praleidau „a“

2. „Python“ skiria didžiosios ir mažosios raidės - Tai turbūt dažniausiai pasitaikanti klaida be klaidų, su kuria susiduriu mokydamas „Python“ pradinio lygio programuotojams. Tai reiškia, kad, pavyzdžiui, „Python“ vertėjas matys šiuos dalykus kaip visiškai skirtingus kintamuosius.

Neretai matyti, kad nauji programuotojai apibrėžia kintamąjį su alternatyviu korpuso deriniu (MapSize), bet vėliau bando nurodyti kintamąjį naudodami kitą didžiųjų raidžių (mapsize) mišinį, dėl kurio atsiranda klaida.

3. Įtrauka - „Python“ plačiai naudoja įtraukas. „Python“ funkcijos neturi aiškaus pradžios ar pabaigos ir nėra garbanotųjų petnešų, žyminčių, kur prasideda ir sustoja funkcijos kodas. Vienintelis atribiklis yra dvitaškis (:) ir paties kodo įtrauka. Žr. Toliau pateiktą pavyzdį:

importuoti arcpy.mapping kaip atvaizdavimą
mxd = kartografavimas. „MapDocument“ („CURRENT“)
df atvaizdavimui. ListDataFrames (mxd):
už lyr žemėlapiuose. ListLayers (mxd, “”, df)
jei lyr.name == „Mokyklos rajonai“:
susiejimas. RemoveLayer (df, lyr)

Kodo blokus apibrėžia jų įtrauka. Turėdamas galvoje „kodo bloką“, turiu omenyje funkcijas, jei sakiniai, kilpoms, o kilpoms ir pan. Įvedus bloką, jis panaikinamas. Nėra aiškių petnešų, skliaustų ar raktinių žodžių. Tai reiškia, kad tarpai šiuo atveju yra reikšmingi (paprastai tai nėra „Python“, bet kalbant apie kodų blokų įtraukas) ir turi būti nuoseklūs. Jums nereikia įtraukti jokio konkretaus tarpų skaičiaus, jis tiesiog turi būti nuoseklus.

Taip pat turėtumėte vengti skirtukų ir tarpų maišymo tam tikro bloko įtraukoje. Priešingu atveju tai, ką matote redaktoriuje, gali būti ne tai, ką mato „Python“, skaičiuodamas skirtukus kaip tarpų skaičių. Kiekvienam blokui saugiau naudoti visus skirtukus arba visas tarpus. Tarpų skaičius priklauso nuo jūsų.

4. Nepamirškite įtraukti dvitaškių į sudėtinius teiginius - Tai labai dažna pradedančiųjų kodavimo klaida: nepamirškite įvesti a: sudėtinių sakinių antraščių pabaigoje (pirmoji „if“, o „for“, „try“, su) eilutė. Sakyčiau, kad dauguma mano studentų daro šią klaidą bent kartą ir paprastai daug kartų per treniruotes. Manau, kad taip yra iš dalies dėl to, kad jie paprasčiausiai nesupranta, ką ta dvitaškis reiškia, tai yra tai, kad ji apibrėžia kodo bloko pradžią.

5. Kintamųjų pavadinimai turėtų prasidėti raide arba pabraukimu - Kintamieji turėtų prasidėti raide arba pabraukimu. Nepradėkite kintamojo pavadinimo skaičiumi ar kitu specialiuoju ženklu. Be to, yra tam tikrų rezervuotų žodžių, kurių negalima naudoti kaip kintamųjų pavadinimų, įskaitant:

ir, teigti, pertrauka, klasė, tęsti, def, del, elif, else, išskyrus, exec, galiausiai, for, from, global, if, import, in, is, lambda, not, arba, pass, print, raise, grįžk, pabandyk, kol pasiduosi

6. Inicializuokite savo kintamuosius - „Python“ negalima naudoti kintamojo pavadinimo išraiškoje, kol jam nėra priskirta reikšmė. Tai yra tyčia: tai padeda išvengti įprastų klaidų ir išvengti dviprasmiško klausimo, koks turėtų būti automatinis numatytasis nustatymas (0, Nėra, „“, [],?). Nepamirškite inicializuoti skaitiklių į 0, surašyti akumuliatorių į [] ir pan.

7. Automatiniai plėtiniai languose - Jei koduojate tikrai paprastą dalyką, pvz., „Notepad“, išsaugodami būtinai aiškiai nurodykite failui .py priesagą. Priešingu atveju jūsų failas bus išsaugotas su plėtiniu .txt, todėl bus sunku paleisti kai kurias paleidimo schemas. „MS Word“ ir „Wordpad“ taip pat pagal numatytuosius nustatymus prideda formatavimo simbolius, kurie nėra teisėta „Python“ sintaksė. Visada turėtumėte pasirinkti „Visi failai“, kai išsaugosite ir išsaugosite paprastą tekstą „Windows“ sistemoje, arba naudokite programuotojams patogesnius redaktorius, tokius kaip IDLE. Tačiau, jei naudojate „IDLE“, yra ir „Redcha“ su šiuo redaktoriumi. Įrašydami turite nepamiršti įvesti .py failo plėtinio. Dėl kažkokių priežasčių jis automatiškai nepridės .py plėtinio.

8. Daugiau įtraukos taisyklių - Būtinai pradėkite aukščiausio lygio, neįdėtą kodą iki pat kairės. Kairėje nuo pirmosios kodo eilutės neturėtų būti tarpo. Net ne viena erdvė. Kaip jau minėjau aukščiau, „Python“ naudoja įtrauką, kad atribotų įdėto kodo blokus, todėl tarpas jūsų kodo kairėje reiškia įdėtą bloką. Baltoji erdvė paprastai ignoruojama visur, išskyrus įtraukas. Mačiau, kad studentai pridėjo vieną erdvę prie aukščiausiojo lygio lizdo, kuriame nėra lizdų, daugiau kartų, nei galiu suskaičiuoti. Nesu tikras, kodėl taip yra, bet taip būna.

9. Funkcijai iškviesti naudokite skliaustus - Norėdami paskambinti, po funkcijos pavadinimo turite pridėti skliaustus, nesvarbu, ar reikia argumentų, ar ne. Tinkamas funkcijos iškvietimas būtų pridėti (), o ne pridėti. Net jei „append“ () šiuo atveju atlikti nereikia jokių parametrų, funkcijai vykdyti reikia įtraukti skliaustus.

10. Nenaudokite vieno atbulinio brūkšnio, kai nurodote kelius į duomenų rinkinius - Vienas atlošas „Python“ yra pabėgimo simbolis. Pavyzdžiui, „Python“ mato n kaip eilučių kanalą ir t kaip skirtuką. Todėl pateikiant kelią į duomenų rinkinį kaip c: data myshapefile.shp, bus klaida. Norėdami tai išspręsti, turite keletą pasirinkimų. Lengviausias būdas išspręsti šią problemą yra įtraukti mažąsias raides „r“ prieš kelią, kaip nurodyta r “c: data myshapefile.shp”. Taip pat galite naudoti du atgalinius brūkšnius „c: data myshapefile.shp“ arba vieną priekinį pasvirąjį brūkšnį „c: /data/myshapefile.shp“.

Norite sužinoti daugiau apie tai, kaip naudoti „Python“, norint automatizuoti geoprocesoriaus užduotis? Peržiūrėkite mūsų [Geospatial Training Services & # 39] būsimą „ArcGIS“ programavimą su „Python“ dirbtuvėmis.

Perspausdinta leidus „GeoChalkboard“, „GeoSpatial Training Services Blog“.


Vietos techninės pagalbos (LTA) projektai

Kurso tikslai
1. Rodykite geografinius duomenis „ArcMap“
2. Naudokite analizės įrankius, kad sukurtumėte naujus duomenis
3. Taikykite standartinį požiūrį į geografinių problemų sprendimą
4. Supraskite įvairių tipų erdvinius santykius tarp realaus pasaulio ypatybių.
5. Užklauskite GIS duomenų bazę, kad gautumėte informacijos ir rastumėte funkcijas.

Darbo su GIS pradžia („ArcGIS 9.2-9.3“)

Šis kursas suteikia pagrindą suprasti, kas yra geografinė informacinė sistema, ir jos siūlomas galimybes atrasti modelius, santykius ir tendencijas. Sužinojau, kuo GIS žemėlapiai skiriasi nuo kitų tipų popierinių ir skaitmeninių žemėlapių, kuo GIS naudojami duomenys yra unikalūs ir kaip naudotis GIS programine įranga informacijai gauti ir prasmingiems žemėlapiams kurti.

Kurso tikslai
1. Parodykite duomenis GIS žemėlapyje
2. Užklauskite GIS duomenų bazę, kad gautumėte informacijos ir rastumėte žemėlapio ypatybes
3. Supraskite įvairių tipų erdvinius santykius tarp realaus pasaulio ypatybių
4. Norėdami sukurti naujus duomenis, naudokite analizės įrankius
5. Taikykite standartinį požiūrį į geografinių problemų sprendimą

Darbo su GIS pradžia („ArcGIS 10.1“)

Šis kursas man padėjo suprasti, kas yra geografinė informacinė sistema ir kodėl organizacijos visame pasaulyje remiasi GIS technologija. Kurso pratybose ir veiklose dirbau su „ArcGIS“ programine įranga ir pamačiau, kaip GIS palaiko problemų sprendimą daugelyje skirtingų kontekstų.

Kurso tikslai
1. Padidinkite produktyvumą naudodami naujas „ArcMap“ funkcijas, įskaitant įterptąjį katalogo langą, simbolių paiešką ir pagrindinės žemėlapio sluoksnius
2. Įtraukite į savo žemėlapius patobulintas kartografijos galimybes, pvz., Dinaminio išdėstymo tekstą, duomenimis pagrįstus puslapius žemėlapių serijoms kurti ir prieigą prie profesionaliai sukurtų žemėlapių.

„ArcMap“ naudojimas „ArcGIS Desktop 10“

„ArcGIS 10“ suteikia daug „ArcMap“ patobulinimų, kurie padeda greičiau kurti ir dalytis geresniais žemėlapiais. Šiame kurse sužinojau apie pagrindines naujas funkcijas, skirtas sumažinti laiką, praleistą atliekant bendras kartografavimo užduotis, ir pagerinti žemėlapių produktų kokybę. Pristatyme sužinojau, kaip galiu pasinaudoti šiomis naujomis funkcijomis, norėdamas pagerinti savo kasdienę darbo eigą.

Kurso tikslai
1. Redaguokite naudodami funkcijų šablonus
2. Dirbkite naujoje fiksavimo aplinkoje
3. Vykdykite naujas redagavimo darbo eigas

Redagavimas „ArcGIS Desktop“

Patobulinta „ArcGIS Desktop 10“ redagavimo aplinka turi pertvarkytą redagavimo sąsają, kuri suteikia lengvesnę prieigą prie įrankių. Šiame kurse pristatomos naujos supaprastintos redagavimo darbo eigos, kurios suteikia intuityvesnę patirtį ir leidžia greičiau atlikti duomenų redagavimo užduotis.

Kurso tikslai
1. Apibūdinkite, kodėl žemei modeliuoti naudojama forma yra svarbi GIS kartografavimui ir analizei
2. Supraskite, kaip platumos ir ilgumos sistema nustato žemės paviršiaus ypatybes
3. Konvertuokite platumos ir ilgumos vienetus dešimtainiais laipsniais
4. Pažiūrėkite, kaip geografinių koordinačių sistemos pasirinkimas turi įtakos objektų vietoms ir matavimams GIS žemėlapyje

Geografinių koordinačių sistemų pagrindai

Kaip tiksliai pavaizduoti žemės ir erdvinio paviršiaus ypatybių vietą ant dvimatio popieriaus ar kompiuterio ekrano? GIS atsakymas prasideda nuo geografinių koordinačių sistemos. Šiame kurse sužinojau pagrindines geografinių koordinačių sistemų sąvokas ir dalį jų raidos istorijos. Taip pat matau, kaip technologijos patobulinimai paveikė GIS žemėlapių ir iš jų atliktų matavimų tikslumą.

Kurso tikslai
1. Paskelbkite priglobtų funkcijų ir išklotų žemėlapių paslaugas „ArcGIS Online“
2. Greitai sukurkite ir sukonfigūruokite interneto žemėlapį naudodami „ArcGIS Online“ žemėlapių peržiūros priemonę
3. Norėdami lengvai bendrinti interneto žemėlapį kaip žiniatinklio programą, naudokite „ArcGIS Online“ šabloną
4. Pasirinkite tinkamus bendrinimo lygius, kad pritaikytumėte numatomus interneto žemėlapio ar žiniatinklio programos vartotojus

Žiniatinklio žemėlapių kūrimas naudojant „ArcGIS Online“

Organizacijos naudoja „ArcGIS Online“, kad palengvintų bendradarbiavimą ir veiksmingą prieigą prie žemėlapių ir kitų GIS šaltinių. Šis kursas parodo, kaip skelbti duomenis ir žemėlapių sluoksnius tiesiai į „ArcGIS Online“ kaip paslaugas, tada naudokitės tomis paslaugomis, kad greitai sukurtumėte interneto žemėlapį. Aš taip pat sužinojau, kaip paversti žiniatinklio žemėlapį žiniatinklio programa, kad galėtume teikti tikslinę auditorijos patirtį.

Kurso tikslai
1. Norėdami suprasti parametrus, įvesties reikšmes ir sintaksę, reikalingus operacijoms atlikti, naudokite REST API nuorodą
2. Testavimo paslaugos, siekiant patikrinti, ar jos veikia taip, kaip tikėtasi
3. Taikykite standartinį procesą, kad pašalintumėte netikėtas paslaugos klaidas

„ArcGIS for Server REST“ API įvadas

Šis kursas man padėjo suprasti, kas yra „ArcGIS for Server REST“ API ir kaip tai padeda man rasti GIS išteklius, atrasti jų galimybes ir panaudoti juos savo žemėlapiuose ir programose. Jūs sužinojote, kaip REST API iš pažiūros sudėtingą kliento ir serverio ryšį paverčia draugišku formatu, kurį galiu lengvai interpretuoti ir panaudoti dirbdamas su kitais „Esri“ produktais ir programomis.

Kurso tikslai
1. Pasirinkite „Python“ scenarijų aplinką, atitinkančią jūsų poreikius
2. Rašydami scenarijų, pasirinkite tinkamus duomenų tipus ir pritaikykite „Python“ sintaksės taisykles
3. Etiketės žemėlapio funkcijos, naudojant „Python“ išraišką
4. Supraskite įprastus klaidų tipus ir kaip jas ištaisyti.

„Python“ yra pasirinkta „ArcGIS“ platformos scenarijų kalba. Šis kursas pristatė pagrindines „Python“ sąvokas ir „Python“ scenarijų aplinką „ArcGIS“. Buvo pateikti patarimai ir metodai, kurie padės mano valdytojui tinkamai pritaikyti „Python“ sintaksę, scenarijų srautą ir klaidų tvarkymą.

Kurso tikslai
1. Sukurkite pagrindinius „Python“ scenarijus naudodami teisingą sintaksę
2. Parašykite ir paleiskite scenarijus „ArcMap“ naudodami „Python“ langą
3. Lauko skaičiuoklėje naudokite „Python“
4. Sukurkite scenarijų įrankius, kad automatizuotumėte geoprocesoriaus operacijas

„Python“ naudojimas „ArcGIS Desktop 10“

„ArcGIS Desktop 10“ programoje „Python“ scenarijai yra glaudžiai integruoti į „ArcMap“ ir „ArcCatalog“, leidžiančius greitai ir lengvai kurti ir automatizuoti GIS darbo eigas. Šis kursas supažindina su „Python“ scenarijais „ArcGIS Desktop“ ir parodo, kaip galiu naudoti scenarijus norėdamas padidinti savo žemėlapių ir duomenų našumą bei kokybę. Aš taip pat sužinojau, kaip naudotis naujuoju „ArcPy“ žemėlapių sudarymo moduliu manipuliuoti žemėlapių dokumentais ir sluoksniais.

Kurso tikslai
1. Prisijunkite prie interneto žemėlapių, bendrinamų naudojant „ArcGIS for iOS“ programą
2. Ieškokite žemėlapio funkcijų ir pasiekite informaciją apie jas
3. Išmatuokite atstumus ir sritis internetiniame žemėlapyje
4. Surinkite ir redaguokite duomenis lauke naudodami „ArcGIS for iOS“ programą
5. Pridėkite nuotrauką prie žemėlapio funkcijos

Mobili GIS: „ArcGIS for iOS“ programos naudojimas

Sužinojau, kaip pasiekti ir dirbti su žiniatinklio žemėlapiais, bendrinamais naudojant nemokamą „ArcGIS for iOS“ programą. Suteikdami prieigą prie GIS turinčių interneto žemėlapių, „iPhone“, „iPad“ ir „iPod touch“ vartotojai gali naršyti jūsų serveryje ar „ArcGIS Online“ talpinamus duomenis, rasti informaciją interaktyviuose, vizualiai turtinguose žemėlapiuose ir rinkti bei atnaujinti GIS duomenis lauke - o tai savo ruožtu gali supaprastinkite duomenų rinkimo darbo eigą, skatinkite piliečių įsitraukimą ir padėkite padidinti savo GIS duomenų bazės valiutą.


Arcgis.features.FeatureLayerCollection¶

„FeatureLayerCollection“ yra elementų sluoksnių ir lentelių rinkinys su susijusiais subjektų ryšiais.

Žiniatinklio GIS funkcijų sluoksnių kolekcija yra rodoma kaip funkcijų paslauga su keliais elementų sluoksniais.

„FeatureDatasets“ egzempliorių galima gauti iš funkcijų paslaugų elementų GIS naudojant FeatureLayerCollection.fromitem (elementą), iš funkcijų paslaugų galinių taškų, naudojant konstruktorių, arba pasiekiant objektų sluoksnio objektų duomenų rinkinio atributą.

„FeatureDatasets“ galima sukonfigūruoti ir valdyti naudojant valdytojo pagalbininko objektą.

Jei duomenų rinkinys palaiko sinchronizavimo operaciją, kopijų pagalbinis objektas leidžia valdyti ir sinchronizuoti kopijas atjungus redaguoti funkcijų sluoksnio rinkinį.

Pastaba: sluoksnių ir lentelių ypatybę galite naudoti norėdami patekti į atskirus šios funkcijų sluoksnių kolekcijos sluoksnius ir lenteles.

pagalbinis objektas valdyti funkcijų sluoksnio rinkinį, atnaujinti jo apibrėžimą ir kt

Šio objekto savybės

užklausa ( layer_defs_filter = Nėra, geometry_filter = Nėra, time_filter = Nėra, return_geometry = Tiesa, return_ids_only = Klaidinga, return_count_only = Netiesa, return_z = Klaidinga, return_m = klaidingas, out_sr = Nėra ) ¶

klausia funkcijų sluoksnio kolekcijos

query_related_records ( object_ids, santykių_id, out_fields = ’*’, definition_expression = Nėra, return_geometry = Tiesa, max_allowable_offset = Nėra, geometry_precision = Nėra, out_wkid = Nėra, gdb_version = Nėra, return_z = Klaidinga, return_m = klaidingas ) ¶

Užklausos operacija atliekama funkcijos paslaugų sluoksnio šaltinyje. Šios operacijos rezultatas yra funkcijų rinkiniai, sugrupuoti pagal šaltinio sluoksnio / lentelės objekto ID. Kiekviename funkcijų rinkinyje yra objektų objektai, įskaitant laukų, kurių reikalauja vartotojas, vertes. Susijusiems sluoksniams, jei prašote geometrijos informacijos, kiekvieno objekto geometrija taip pat pateikiama funkcijų rinkinyje. Susijusių lentelių funkcijų rinkinyje nėra geometrijos. Įėjimai:

objectIds - lentelės / sluoksnio, dėl kurio reikia pateikti užklausą, objekto ID relationshipId - užklausiamo ryšio ID. outFields - laukų sąrašas iš susijusios lentelės / sluoksnio

outWKID - grąžintos geometrijos erdvinė nuoroda. gdbVersion - geoduomenų bazės versija, į kurią reikia pateikti užklausą. Šis parametras

Įkelia naują elementą į serverį. Kai operacija bus sėkmingai baigta, grąžinama įkelto elemento JSON struktūra.

Parametrai:

kelias:įkelto failo kelias
apibūdinimas:neprivalomas įkeliamo elemento aprašomasis tekstas


2 atsakymai 2

Pagrindinis „Go“ dizaino tikslas yra būti lengvai išmokstama ir lengvai naudojama net ir vidutinio lygio programuotojams, taigi, jei norite parašyti idiomatinį „Go Go“, „anti-modelio“, kurio turėtumėte vengti labiausiai, yra & quot; sumanus kodas & quot;

Dėl rimtos priežasties neleisti įdėtų funkcijų, net jei leidžiate anonimines funkcijas - vienas iš „Python“ ir „Go“ skirtumų yra tas, kad „Python“ nereikia pagrindinės funkcijos. Galite tiesiog parašyti:

ir „Python“ vertėjas pradėtų skaityti iš viršaus į apačią. Kai pasieks def foo (): jis sukurs funkciją, o kai pasieks foo (), paleis tą funkciją. Vertėjas visada naudojasi tuo pačiu režimu (bent jau tai yra abstrakcija) - skaitymo ir vertinimo režimu. Jis veikia vienodai, nesvarbu, ar jis yra funkcijos viduje, ar už jos ribų, todėl jai lengva palaikyti viso to kodo kopijavimą į funkcijos vidų - jis tiesiog pridės kitą rėmelį prie savo skambučio ir, išskyrus tai, kas daro tą patį.

„Eiti“ yra kita istorija. Kai rašai

Kompiliatorius nuskaito aukščiausią lygį deklaratyvus režimą ir sukuria funkcijas, bet funkcijų, kurias jis perskaito, korpusą imperatyvus režimas. Į deklaratyvus režimu jis gali sukurti funkcijas ir imperatyvus režimu jis gali vykdyti teiginius. Jei norite leisti įdėtas funkcijas, reikės pridėti funkcijų deklaravimo funkciją prie imperatyvus režimas.

Taigi kodėl, galima paklausti, nepridėti šios funkcijos imperatyvus režimas? Pagrindinė priežastis yra uždarymų tvarkymas:

Kažko panašaus rašymas reiškia, kad foo nėra įprasta funkcija - jam reikia prieigos prie txt, kuris yra pagrindinio rietuvės rėmelyje, todėl jam reikia konteksto rodyklė tai parodys tą kadrą. Jei pagrindinis bus vėl vadinamas, bus sukurtas kitas foo su kitu konteksto žymekliu.

Dėl to įdėtos funkcijos iš esmės skiriasi nuo įprastų funkcijų, o tai yra priežastis, kodėl lizdinės funkcijos neturimos. „Python“ neturi šių problemų, nes visos jo funkcijos yra uždarymai - jie visi yra & quot; sukomponuoti & quot;


6.2 - Z balo metodas

Naudodamiesi „Z Score“, galime rasti išorinius rodiklius

6.2.1 - Kokie yra kriterijai, leidžiantys nustatyti neįvykusius reikalavimus?

Duomenų taškas, kuris nepatenka į 3 standartinius nuokrypius. galime naudoti z balą ir jei z balas nepatenka į 2 standartinį nuokrypį.

6.2.2 - Toliau pateikiami tolesnių veiksmų pašalinimo veiksmai

1 žingsnis: - Surinkite duomenis ir skaitykite failą

2 žingsnis: - Patikrinkite duomenų formą

3 žingsnis: - Gaukite „Z“ balų lentelę.

Kiekvienam duomenų rinkiniui nustatome z balą duomenų rinkinyje ir, jei z balas yra didesnis nei 3, tą tašką galime klasifikuoti kaip pašalinį. Bet kuris taškas, esantis už 3 standartinių nuokrypių, būtų išorinis.


Arcgis.features.SpatialDataFrame¶

„Spatial Dataframe“ yra objektas, skirtas manipuliuoti, valdyti ir paversti duomenimis vartotojams skirtomis naujomis informacijos formomis.

Reikalingi parametrai: Nėra Pasirenkama:

param duomenys:„pandos“ duomenų kadrą, kuriame yra informacija apie atributus
param geometrija:arcgis.geometry objektų sąrašas / masyvas / geoseries
param sr:erdvinė duomenų kadro nuoroda. Tai gali būti gamyklos kodas, WKT eilutė, arcpy.SpatialReference objektas arba arcgis.SpatailReference objektas.
param gis:perduodant „gis“. „GIS“ objektas, nustatytas kaip „Pro“, užtikrins, kad yra įdiegtas „arcpy“ ir galutinis vartotojas gali naudotis visa funkcionalumu.
JSON ¶

Pateikia Esri JSON geometrijos kaip eilutės vaizdą.

Perkelti rodyklę ir stulpelius

Pateikia gerai žinomą dvejetainį (WKB) OGC geometrijos vaizdą. Tai pateikia nešiojamą geometrijos vertės vaizdą kaip gretimą baitų srautą.

Grąžina gerai žinomą OGC geometrijos teksto (WKT) vaizdą. Jis pateikia nešiojamą geometrinės vertės vaizdą kaip teksto eilutę.

Grąžinti objektą, kurio absoliuti reikšmė paimta - taikoma tik objektams, kurie visi yra skaitiniai.

Duomenų rėmo ir kitų elementų pridėjimas (pridėti dvejetainį operatorių).

Atitinka „dataframe + other“, bet palaiko užpildymo reikšmę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

Sujunkite priešdėlio eilutę su skydelio elementų pavadinimais.

with_prefix: skambinančiojo tipas

Sujunkite priesagos eilutę su skydelio elementų pavadinimais.

with_suffix: skambinančiojo tipas

Apibendrinkite naudodami skambinamąjį, eilutę, diktantą arba eilučių / skambinamųjų sąrašą

Funkcija, naudojama duomenims kaupti. Jei funkcija, ji turi veikti arba perdavus „DataFrame“, arba perduodant „DataFrame.apply“. „DataFrame“ gali perduoti diktatą, jei raktai yra „DataFrame“ stulpelių pavadinimai.

Priimtini deriniai yra:

  • eilutės funkcijos pavadinimas
  • funkcija
  • funkcijų sąrašas
  • stulpelių pavadinimų diktatas - & gt funkcijos (arba funkcijų sąrašas)

„Numpy“ funkcijų vidurkis / mediana / prod / suma / std / var yra specialios, todėl numatytoji elgsena taikoma funkcijai išilgai ašies = 0 (pvz., Np.mean (arr_2d, ašis = 0)), o ne imituojant numatytąjį „Numpy“ elgesį (pvz., np.mean (arr_2d)).

agg yra bendrojo vardo slapyvardis. Naudokite alternatyvųjį vardą.

Apibendrinkite šias funkcijas visuose stulpeliuose

Skirtingi stulpelių agregatai

pandos.DataFrame.apply pandas.DataFrame.transform pandas.DataFrame.groupby.aggregate pandas.DataFrame.resample.aggregate pandas.DataFrame.rolling.aggregate

Apibendrinkite naudodami skambinamąjį, eilutę, diktantą arba eilučių / skambinamųjų sąrašą

Funkcija, naudojama duomenims kaupti. Jei funkcija, ji turi veikti arba perdavus „DataFrame“, arba perduodant „DataFrame.apply“. „DataFrame“ gali perduoti diktatą, jei raktai yra „DataFrame“ stulpelių pavadinimai.

Priimtini deriniai yra:

  • eilutės funkcijos pavadinimas
  • funkcija
  • funkcijų sąrašas
  • stulpelių pavadinimų diktatas - & gt funkcijos (arba funkcijų sąrašas)

„Numpy“ funkcijų vidurkis / mediana / prod / suma / std / var yra specialios, todėl numatytoji elgsena taikoma funkcijai išilgai ašies = 0 (pvz., Np.mean (arr_2d, ašis = 0)), o ne imituojant numatytąjį „Numpy“ elgesį (pvz., np.mean (arr_2d)).

agg yra bendrojo vardo slapyvardis. Naudokite alternatyvųjį vardą.

Apibendrinkite šias funkcijas visuose stulpeliuose

Skirtingi agregatai viename stulpelyje

pandos.DataFrame.apply pandas.DataFrame.transform pandas.DataFrame.groupby.aggregate pandas.DataFrame.resample.aggregate pandas.DataFrame.rolling.aggregate

sulyginti ( kita, prisijungti = 'išorinis', ašis = nėra, lygis = Nėra, kopija = Tiesa, fill_value = Nėra, metodas = Nėra, riba = Nėra, užpildymo ašis = 0, broadcast_axis = Nėra ) ¶

Sulygiuokite du jų ašių objektus pagal nurodytą kiekvienos ašies indekso sujungimo metodą

kita: „DataFrame“ arba „Series“ sujungimas: <’išorinė’, ‘vidinė’, ‘kairė’, ‘dešinė’>, numatytoji ‘išorinė’ ašis: leidžiama kito objekto ašis, numatytoji Nėra

metodas: str, numatytasis Nėra apribojimų: int, numatytasis Nėra užpildymo_ašis: <0 arba „rodyklė“, 1 arba „stulpeliai“>, numatytasis 0

Transliuoti vertes išilgai šios ašies, jei sulygiuojami du skirtingų matmenų objektai

Grąžinkite, ar visi elementai yra teisingi už prašomą ašį

ašis: skipna: loginė, numatytoji tiesa

visi: serija arba „DataFrame“ (jei nurodytas lygis)

kampo atstumas iki ( antroji_geometrija, metodas = 'GEODESIC' ) ¶

Naudojant matavimo tipą, grąžina kampą ir atstumą į kitą tašką.

duomenis į 2D paviršių (kitaip tariant, jie neatsižvelgs į žemės kreivumą). Jei pageidaujama, matavimo tipus GEODESIC, GREAT_ELLIPTIC, LOXODROME ir PRESERVE_SHAPE galima pasirinkti kaip alternatyvą.

Grąžinkite, ar koks nors elementas yra teisingas virš prašomos ašies

ašis: skipna: loginė reikšmė, numatytoji tiesa

bet kuri: serija arba „DataFrame“ (jei nurodytas lygis)

pridėti ( kita, ignore_index = Klaidinga, patikrinti_integritumas = klaidinga ) ¶

Šio kadro pabaigoje pridėkite kitų eilučių, grąžindami naują objektą. Šiame rėme esantys stulpeliai pridedami kaip nauji stulpeliai.

kita: „DataFrame“ arba „Series / dict“ tipo objektas arba jų sąrašas Duomenys, kuriuos norite pridėti. ignore_index: loginė reikšmė, numatytoji klaidinga Jei klaidinga tiesa, nenaudokite rodyklės etikečių. check_integrity: loginė reikšmė, numatytoji klaidinga Jei klaidinga tiesa, padidinkite „ValueError“ kurdami indeksą su dublikatais.

Jei bus perduotas „dict / series“ sąrašas ir visi raktai yra „DataFrame“ rodyklėje, gautų „DataFrame“ stulpelių tvarka nebus pakeista.

Pakartotinai eilučių pridėjimas prie „DataFrame“ gali būti intensyvesnis skaičiavimais nei vienas konkatenatas. Geresnis sprendimas yra pridėti tas eilutes prie sąrašo ir tada susieti sąrašą su originaliu „DataFrame“ vienu metu.

pandas.concat: bendroji „DataFrame“, „Series“ ar „Panel“ objektų sujungimo funkcija

Kai „ignore_index“ nustatyta į „True“:

Toliau, nors ir nerekomenduojami „DataFrame“ generavimo metodai, parodomi du būdai, kaip sukurti „DataFrame“ iš kelių duomenų šaltinių.

Taikoma funkcija išilgai „DataFrame“ įvesties ašies.

Objektai, perduoti funkcijoms, yra „Series“ objektai, turintys indeksą „DataFrame“ rodyklėje (ašis = 0) arba stulpeliuose (ašis = 1). Grąžinimo tipas priklauso nuo to, ar perduodama funkcija kaupiama, ar sumažinimo argumentą, jei „DataFrame“ yra tuščias.

Papildomi raktinių žodžių argumentai bus perduodami kaip raktiniai žodžiai funkcijai

Pagal dabartinį diegimą du kartus skambinkite func pirmame stulpelyje / eilutėje, kad nuspręstumėte, ar jis gali eiti greitai, ar lėtai. Tai gali sukelti netikėtą elgesį, jei „func“ turi šalutinį poveikį, nes jie pirmąjį stulpelį / eilutę veiks du kartus.

„DataFrame.applymap“: „elementwise“ operacijoms „DataFrame.aggregate“: atlikti tik kaupimo tipo operacijas „DataFrame.transform“: atlikti tik transformavimo tipo operacijas

taikoma: serija arba „DataFrame“

Taikykite funkciją „DataFrame“, kuri skirta veikti elementariai, t. Y. Kaip žemėlapį („func“, „series“) kiekvienai „DataFrame“ serijai.

func: function Python funkcija, grąžina vieną vertę iš vienos vertės

DataFrame.apply: operacijoms eilutėse / stulpeliuose

Daugiakampio požymio plotas. Tuščia visų kitų tipų funkcijoms.

Pateikia Esri JSON geometrijos vaizdą kaip eilutę.

Konvertuokite kadrą į „dtype - & gt konstruktoriaus tipų“ diktantą, kad kiekvienas iš jų turėtų homogenišką dtype.

Nebenaudojama nuo 0.21.0 versijos.

kopija: loginė, numatytoji tiesa

reikšmės: „dtype“ - & gt konstruktoriaus tipų diktatas

Konvertuokite rėmelį į jo „Numpy“ masyvo vaizdą.

stulpeliai: sąrašas, pasirinktinis, numatytasis: Nėra. Jei nėra, grąžinkite visus stulpelius, priešingu atveju grąžinami nurodyti stulpeliai. reikšmės: ndarray Jei skambinantysis yra nevienalytis ir jame yra loginiai elementai ar objektai, rezultatas bus dtype = object. Žr. Pastabas.

Grąžinimas NĖRA „Numpy“ matrica, veikiau „Numpy“ masyvas.

Dypis bus žemesnio bendro vardiklio tipo tipas (implicit upcasting), ty jei tipų tipai (net skaitinių tipų) yra sumaišyti, bus pasirinktas tas, kuris talpins visus. Naudokite tai atsargiai, jei nesusitvarkote su blokais.

pvz. Jei dtypes yra „float16“ ir „float32“, „dtype“ bus „upat32“. Jei dtypes yra int32 ir uint8, dtype bus pakeistas į int32. Pagal numpy.find_common_type susitarimą, sumaišius int64 ir uint64, bus gautas flot64 dtype.

Šis metodas yra skirtas atgaliniam suderinamumui užtikrinti. Paprastai rekomenduojama naudoti „.values“.

asfreq ( dažnis, metodas = Nėra, kaip = nėra, normalizuoti = klaidinga, fill_value = Nėra ) ¶

Konvertuoti „TimeSeries“ į nurodytą dažnį.

Pasirinktinai pateikite užpildymo metodą trūkstamoms vertėms užpildyti / užpildyti.

Grąžina pradinius duomenis, atitinkančius naują indeksą nurodytu dažniu. resample yra tinkamesnis, jei norint parodyti duomenis nauju dažniu, būtina atlikti operaciją, pvz., apibendrinimą.

dažnis: objektas „DateOffset“ arba eilutės metodas: <’backfill’ / ’bfill’, ‘pad’ / ’ffill’>, numatytasis Nėra

  • „Padas“ / „užpildymas“: paskleiskite paskutinį galiojantį stebėjimą į kitą galiojantį
  • „Backfill“ / „bfill“: užpildykite NEXT galiojantį stebėjimą

Reikšmė, naudojama trūkstamoms vertėms, taikoma atliekant atranką (atkreipkite dėmesį, kad tai neužpildo jau buvusių NaN).

konvertuotas: skambinančiojo tipas

Pradėkite kurdami seriją su 4 vienos minutės laiko žymėmis.

Peržiūrėkite seriją į 30 sekundžių šiukšliadėžes.

Vėl imkite pavyzdį, pateikdami užpildymo vertę.

Vėl imkite pavyzdį, pateikdami metodą.

Norėdami sužinoti daugiau apie dažnio eilutes, žr. Šią nuorodą.

Paimama paskutinė eilutė be NaN (arba paskutinė eilutė be NaN, atsižvelgiant tik į stulpelių pogrupį „DataFrame“ atveju)

Naujas 0.19.0 versijoje: „DataFrame“

Jei nėra geros vertės, NaN grąžinamas, jei serija yra „DataFrame“ NaN reikšmių serija

kur: data arba datų masyvo pogrupis: eilutė arba eilučių sąrašas, numatytasis Nėra

Laikoma, kad datos yra rūšiuojamos Pakėlimai, jei taip nėra

kur yra indeksas: tos pačios formos objektas, kaip ir įvestis

Priskirkite naujus stulpelius „DataFrame“, grąžinant naują objektą (kopiją) su visais pradiniais stulpeliais, be naujų.

kwargs: raktiniai žodžiai, reikšmių porų raktiniai žodžiai yra stulpelių pavadinimai. Jei reikšmes galima iškviesti, jos apskaičiuojamos „DataFrame“ ir priskiriamos naujiems stulpeliams. Skambintinas negali pakeisti įvesties „DataFrame“ (nors pandos to netikrina). Jei reikšmės negalima iškviesti (pvz., Serija, skaliaras ar masyvas), jos tiesiog priskiriamos. df: DataFrame Naujas „DataFrame“ su naujais stulpeliais be visų esamų stulpelių.

„Python 3.6“ ir naujesnių versijų stulpeliai įterpiami ** kwargs tvarka. 3.5 python ir senesnėms versijoms, nes ** kwargs nėra sutvarkyta, stulpeliai įterpiami abėcėlės tvarka jūsų „DataFrame“ pabaigoje. Galima priskirti kelis stulpelius to paties priskyrimo metu, tačiau negalite nurodyti kitų stulpelių, sukurtų to paties priskyrimo skambučio metu.

Kai vertė yra iškviečiama, įvertinama df:

Kur vertė jau egzistuoja ir įterpiama:

Meskite pandos objektą į nurodytą dtype dtype.

dtype: duomenų tipas arba stulpelio pavadinimo diktatas - & gt duomenų tipas Jei norite perduoti visus pandos objektus į tą patį tipą, naudokite numpy.dtype arba Python tipą. Arba naudokite , kur col yra stulpelio etiketė, o dtype yra numpy.dtype arba Python tipas, jei norite perduoti vieną ar daugiau „DataFrame“ stulpelių į konkrečių stulpelių tipus. copy: „Bool“, numatytoji „True“. Grąžinkite kopiją, kai copy = True (būkite labai atsargūs nustatydami copy = False, nes reikšmių pakeitimai gali išplisti į kitus pandos objektus). klaidos: <’pakelti’, ‘nepaisyti’>, numatytasis ‘pakelti’.

Valdykite neteisingų duomenų, pateiktų dtype, išimčių didinimą.

  • pakelti: leisti kelti išimtis
  • ignoruoti: slopinti išimtis. Įvykus klaidai, grąžinkite originalų objektą

Nebenaudojama nuo 0.20.0 versijos: vietoj to naudokite klaidas

kwargs: raktinių žodžių argumentai, kuriuos reikia perduoti konstruktoriui

Konvertuoti į kategorinį tipą:

Konvertuoti į užsakytą kategorinį tipą su pasirinktiniu užsakymu:

Atminkite, kad naudojant „copy = False“ ir keičiant naujo pandos objekto duomenis gali atsirasti pokyčių:

pandas.to_datetime: konvertuoti argumentą į datetime. pandas.to_timedelta: konvertuoti argumentą į timedelta. pandas.to_numeric: konvertuoti argumentą į skaitinį tipą. numpy.ndarray.astype: perduokite numpy masyvą į nurodytą tipą.

Greitas etikete pagrįstas skaliarinis prieigos įrankis

Panašiai kaip loc, at teikia etiketė pagrįstos skaliarinės paieškos. Taip pat galite nustatyti naudodami šiuos indeksuotojus.

Pasirinkite vertes tam tikru dienos metu (pvz., 9:30).

laikas: datetime.time arba eilutė

values_at_time: skambinančiojo tipas

Grąžinkite sąrašą su eilutės ašių etiketėmis ir stulpelių ašių etiketėmis kaip vieninteliais nariais. Jie grąžinami tokia tvarka.

tarp_ laiko ( pradžios laikas, pabaigos_ laikas, include_start = Tiesa, include_end = Tiesa ) ¶

Pasirinkite vertes tam tikru dienos laiku (pvz., 9: 00–9: 30).

pradžios laikas: datetime.time arba eilutė end_time: datetime.time arba eilutė include_start: Boolean, numatytasis True include_end: Boolean, numatytasis True

values_between_time: skambinančiojo tipas

bfill ( ašis = nėra, vietoje = klaidinga, riba = Nėra, nusileidęs = Nėra ) ¶

DataFrame.fillna sinonimas (metodas = 'bfill')

Vidinė nuosavybė, „as_blocks“ () nuosavybės sinonimas

Nebenaudojama nuo 0.21.0 versijos.

Grąžinkite vieno elemento „PandasObject“ talpą.

Tai turi būti loginė skaliarinė vertė, teisinga arba klaidinga. Pakelkite „ValueError“, jei „PandasObject“ nėra tiksliai 1 elementas arba tas elementas nėra loginis

Sukonstruoja geometrijos ribą.

Grąžinti geometrinių objektų minx, miny, maxx, maxy reikšmių DataFrame

Padarykite langelio diagramą iš stulpelio „DataFrame“, pasirinktinai sugrupuotą pagal kai kuriuos stulpelius ar kitas įvestis

duomenys: pandų objektas, kuriame yra duomenų stulpelis: stulpelio pavadinimas arba vardų sąrašas arba vektorius

kirvis: „Matplotlib axes“ objektas, pasirenkamas šrifto dydis: int arba eilutės puvimas: etiketės pasukimo kampo figūros dydis: Auksas (plotis, aukštis) coliais tinklelis: Nustačius tai į True, bus rodomas tinklelio išdėstymas: tuple (neprivaloma)

Grįžtamo objekto rūšis. Pagal numatytuosius nustatymus ašys ‘ašys’ grąžina matplotlib ašis, ant kurių dėklas braižomas „dict“, pateikia žodyną, kurio reikšmės yra matplotlib. Boxplot linijos „abi“ grąžina pavadintą dvipusį su ašimis ir diktantu.

Grupuojant pagal, grąžinami serijos susiejimo stulpeliai su return_type, nebent return_type yra None, tokiu atveju grąžinamas ašių masyvas NumPy su tokia pačia forma kaip ir maketas. Norėdami sužinoti daugiau, žiūrėkite prozos dokumentus.

kwds: kiti raktinių žodžių argumentai, perduodami matplotlib boxplot funkcijai

linijos: diktuotas kirvis: matplotlib Ašys (kirvis, linijos): pavadintapora

Naudokite return_type = 'dict', kai po braižymo norite pakoreguoti linijų išvaizdą. Šiuo atveju grąžinamas diktas, kuriame yra dėžės, dangteliai, skrajutės, viduriai ir ūsai.

Sukuria daugiakampį nurodytu atstumu nuo geometrijos.

Tikrasis centroidas, jei jis yra objekto viduje ar kitu atveju, grąžinamas etiketės taškas. Grąžina taškinį objektą.

Sukonstruoja geometrijos ir nurodytos apimties sankirtą.

Grąžinti įvesties kopiją, kai vertės yra mažesnės už nurodytą (-as) vertę (-es).

slenkstis: plūdinė arba masyvo_ašė: int arba eilutės ašies pavadinimas, neprivaloma

apkarpytas: tas pats tipas kaip įvestis

clip_upper ( slenkstis, ašis = nėra, vietoje = Klaidinga ) ¶

Grąžinti įvesties kopiją, kurios vertės viršija nurodytą (-as) vertę (-es), sutrumpintos.

slenkstis: plūdinė arba masyvo_ašė: int arba eilutės ašies pavadinimas, neprivaloma

apkarpytas: tas pats tipas kaip įvestis

sujungti ( kita, func, fill_value = Nėra, perrašyti = Tiesa ) ¶

Pridėkite du „DataFrame“ objektus ir neplatinkite NaN reikšmių, taigi, jei (stulpeliui, laikui) viename kadre trūksta vertės, pagal numatytuosius nustatymus bus nustatyta kito kadro vertė (kuri gali būti ir NaN)

kita: „DataFrame“ funkcija: funkcijos užpildymo vertė: skaliarinės vertės perrašymas: loginė reikšmė, numatytoji teisinga

Sujunkite du „DataFrame“ objektus ir numatytąsias reikšmes, kad reikšmės nebūtų nulinės, kai iškviečiate metodą. Rezultatų indekso stulpeliai bus atitinkamų indeksų ir stulpelių sujungimas

a reikšmės prioritetinės, naudokite reikšmes nuo b, kad užpildytumėte skyles:

junginys ( ašis = nėra, skipna = Nėra, lygis = Nėra ) ¶

Grąžinkite prašomos ašies reikšmių procentinį procentą

ašis: skipna: loginė reikšmė, numatytoji tiesa

sudėtas: serija arba „DataFrame“ (jei nurodytas lygis)

NEPAKARTOTAS: konsolidavimas bus tik vidinis įgyvendinimas.

yra ( antroji_geometrija, santykis = Nėra ) ¶

Nurodo, ar pagrindo geometrijoje yra palyginimo geometrija.

Nebenaudojamas. Pabandykite padaryti geresnį objekto stulpelių dtype

convert_dates: loginė reikšmė, numatytoji True True, jei įmanoma, konvertuokite į datą. Jei „priversti“, priversti konvertuoti, nekonvertuojamos vertės tampa NaT. convert_numeric: loginė reikšmė, numatytoji klaidinga Jei klaidinga tiesa, pabandykite priversti naudoti skaičius (įskaitant eilutes), nekonvertuojamos reikšmės taps NaN. convert_timedeltas: loginė reikšmė, numatytoji „True If True“, jei įmanoma, konvertuokite į „timedelta“. Jei „priversti“, priversti konvertuoti, nekonvertuojamos vertės tampa NaT. copy: loginė reikšmė, numatytoji reikšmė True If True, grąžinkite kopiją, net jei kopija nėra reikalinga (pvz., konversija nebuvo atlikta). Pastaba: tai skirta vidiniam naudojimui ir neturėtų būti painiojama su vietoje.

pandas.to_datetime: konvertuoti argumentą į datetime. pandas.to_timedelta: konvertuoti argumentą į timedelta. pandas.to_numeric: grąžinti fiksuoto dažnio laiko juostos indeksą,

konvertuotas: tas pats kaip įvesties objektas

Sukuria geometriją, kuri yra minimalus ribojantis daugiakampis, kad visi išoriniai kampai būtų išgaubti.

grąžina geometrijos taško koordinates kaip np.dėlelio objektą

Padarykite šio „SpatialDataFrame“ objekto parametrų kopiją:

Giliai:Boolean, numatytasis „True“ Padarykite gilią kopiją, t. y. taip pat nukopijuokite duomenis
Grąžina:
kopija:„SpatialDataFrame“
taisyti ( metodas = 'pearson', min_periods = 1 ) ¶

Apskaičiuokite porų stulpelių koreliaciją, išskyrus NA / null reikšmes

  • Pearson: standartinis koreliacijos koeficientas
  • kendall: Kendall Tau koreliacijos koeficientas
  • ietininkas: Spearmano rango koreliacija

Apskaičiuokite porų koreliaciją tarp dviejų „DataFrame“ objektų eilučių ar stulpelių.

kita: „DataFrame“ ašis: <0 arba „indeksas“, 1 arba „stulpeliai“>, numatytasis 0

suskaičiuoti ( ašis = 0, lygis = Nėra, numeric_only = False ) ¶

Grąžinti seriją su ne NA / null stebėjimų skaičiumi per prašomą ašį. Veikia ir su slankiojo kablelio duomenimis (aptinka NaN ir None)

ašis: <0 arba „indeksas“, 1 arba „stulpeliai“>, numatytasis 0 0 arba „rodyklė“ eilutėms, 1 arba „stulpeliai“ stulpelio lygiui: int arba lygio pavadinimas, numatytasis Nėra Jei ašis yra „MultiIndex“ (hierarchinis), skaičiuojamas pagal tam tikrą lygį, sutelkiamas į „DataFrame“ numeric_only: boolean, numatytasis False Įtraukite tik „float“, „int“, „Boolean“ duomenis

skaičius: serija (arba „DataFrame“, jei nurodytas lygis)

Apskaičiuokite porų stulpelių kovariaciją, išskyrus NA / null reikšmes

min_periods: int, pasirenkamas Mažiausias stebėjimų skaičius, reikalingas vienai stulpelių porai, kad rezultatas būtų tinkamas.

y yra „DataFrame“ laiko eilučių kovariacijos matrica. Kovaranciją normalizuoja N-1 (nešališkas vertintojas).

Nurodo, ar abi geometrijos susikerta mažesnės formos geometrijoje.

Grąžinti reikalaujamos ašies kaupiamąjį maks.

ašis: skipna: loginė reikšmė, numatytoji tiesa

pandas.core.window.Expanding.max: Panašus funkcionalumas, bet nepaisoma NaN reikšmių. kuminas ( ašis = nėra, skipna = Tiesa, * argumentuoja, ** kwargs ) ¶

Grąžinti sukauptą minimumą virš prašomos ašies.

ašis: skipna: loginė reikšmė, numatytoji tiesa

pandas.core.window.Expanding.min: Panašus funkcionalumas, bet nepaisoma NaN reikšmių. cumprod ( ašis = nėra, skipna = Tiesa, * argumentuoja, ** kwargs ) ¶

Grąžinkite sukauptą produktą virš prašomos ašies.

ašis: skipna: loginė reikšmė, numatytoji tiesa

pandas.core.window.Expanding.prod: Panašus funkcionalumas, bet nepaisoma NaN reikšmių. cumsum ( ašis = nėra, skipna = Tiesa, * argumentuoja, ** kwargs ) ¶

Pateikti prašomos ašies suminę sumą.

ašis: skipna: loginė reikšmė, numatytoji tiesa

pandas.core.window.Expanding.sum: Panašus funkcionalumas, bet nepaisoma NaN reikšmių. supjaustyti ( kateris ) ¶

Padalija šią geometriją į kairę pjovimo linijos dalį ir į dešinę jos dalį.

Sukuria naują geometriją su pridėtomis viršūnėmis

  • Sutankinimo tipas, DISTANCE, ANGLE arba GEODESIC
  • Didžiausias atstumas tarp viršūnių. Aktualus

atstumas tarp viršūnių paprastai bus mažesnis nei didžiausias atstumas, nes naujos viršūnės bus tolygiai paskirstytos išilgai pradinio segmento. Naudojant DISTANCE arba ANGLE tipą, atstumas matuojamas geometrijos erdvinės atskaitos vienetais. Jei naudojamas geodezinis tipas, atstumas matuojamas metrais.

Norint kontroliuoti šio aproksimavimo tikslumą, naudojate nuokrypį. Nuokrypis yra didžiausias atstumas tarp naujo segmento ir pradinės kreivės. Kuo mažesnė jo vertė, tuo daugiau segmentų reikės kreivei apytiksliai nustatyti.

Generuoja aprašomąją statistiką, apibendrinančią duomenų rinkinio pasiskirstymo centrinę tendenciją, sklaidą ir formą, išskyrus NaN reikšmes.

Analizuoja tiek skaitines, tiek objektų eilutes, tiek mišrių duomenų tipų stulpelių rinkinius „DataFrame“. Produkcija skirsis priklausomai nuo to, kas yra pateikta. Išsamesnės informacijos ieškokite toliau pateiktose pastabose.

procentiliai: skaičių panašūs į sąrašus, neprivalomi procentiliai, kuriuos reikia įtraukti į išvestį. Visi turėtų patekti tarp 0 ir 1. Numatytasis nustatymas yra [.25, .5, .75], kuris pateikia 25, 50 ir 75 procentilius. įtraukti: „visi“, panašūs į tipus į sąrašą arba Nėra (numatytasis nustatymas), neprivaloma

Baltas duomenų tipų sąrašas, kurį reikia įtraukti į rezultatą. Nepaisoma serijos. Čia pateikiamos parinktys:

  • ‘Visi’: visi įvesties stulpeliai bus įtraukti į išvestį.
  • Dtypes, panašūs į sąrašą: Apriboja rezultatus tik pateiktais duomenų tipais. Norėdami apriboti rezultatą iki skaitinių tipų, pateikite numpy.number. Norėdami apriboti objektų stulpelius, pateikite duomenų tipą numpy.object. Stygos taip pat gali būti naudojamos „select_dtypes“ stiliumi (pvz., Df.describe (include = ['O'])). Norėdami pasirinkti kategorinius pandų stulpelius, naudokite „category“
  • Nėra (numatytasis nustatymas): į rezultatą bus įtraukti visi skaitiniai stulpeliai.

Juodas duomenų tipų sąrašas, kurį reikia praleisti iš rezultato. Nepaisoma serijos. Čia pateikiamos parinktys:

  • Dtypes, panašūs į sąrašą: iš rezultato neįtraukiami pateikti duomenų tipai. Norėdami neįtraukti skaitinių tipų, pateikite numpy.number. Norėdami išskirti objekto stulpelius, pateikite duomenų tipą numpy.object. Stygos taip pat gali būti naudojamos „select_dtypes“ stiliumi (pvz., Df.describe (include = ['O'])). Norėdami neįtraukti kategorinių pandų stulpelių, naudokite „category“
  • Nėra (numatytasis nustatymas): Rezultatas nieko neišskirs.

santrauka: suvestinės statistikos serija / duomenų rėmelis

Skaičiuojant duomenis, rezultato indeksas apims skaičių, vidurkį, standartinį, min., Maks., Taip pat apatinį, 50 ir viršutinį procentilius. Pagal numatytuosius nustatymus apatinė procentilė yra 25, o viršutinė procentilė yra 75. 50 procentilis yra toks pat kaip mediana.

Objekto duomenims (pvz., Eilutėms ar laiko žymėms) rezultato rodyklėje bus nurodytas skaičius, unikalus, viršus ir dažnis. Viršuje yra labiausiai paplitusi vertybė. Dažnis yra dažniausias vertės dažnis. Laiko žymos taip pat apima pirmuosius ir paskutinius elementus.

Jei daugelio objektų reikšmių skaičius yra didžiausias, skaičius ir geriausi rezultatai bus savavališkai pasirinkti iš tų, kurių skaičius yra didžiausias.

Mišriems duomenų tipams, teikiamiems per „DataFrame“, numatytasis parametras yra grąžinti tik skaitinių stulpelių analizę. Jei duomenų kadrą sudaro tik objekto ir kategoriniai duomenys be jokių skaitinių stulpelių, numatytasis parametras yra pateikti objekto ir kategorinių stulpelių analizę. Jei įtraukiama = „viskas“ kaip parinktis, į rezultatą bus įtraukta kiekvieno tipo atributų sąjunga.

Įtraukimo ir neįtraukimo parametrus galima naudoti norint apriboti, kurie „DataFrame“ stulpeliai analizuojami išvesties atžvilgiu. Analizuojant seriją, parametrai nepaisomi.

Apibūdinant skaitinę seriją.

Apibūdinant kategorišką seriją.

Laiko žymos serijos apibūdinimas.

„DataFrame“ aprašymas. Pagal numatytuosius nustatymus grąžinami tik skaitiniai laukai.

Aprašomi visi „DataFrame“ stulpeliai, neatsižvelgiant į duomenų tipą.

Stulpelio apibūdinimas iš „DataFrame“, pasiekiant jį kaip atributą.

Į „DataFrame“ aprašą įtraukite tik skaitinius stulpelius.

Į „DataFrame“ aprašą įtraukite tik eilutės stulpelius.

Įtraukiami tik kategoriški stulpeliai iš „DataFrame“ aprašo.

Skaitinių stulpelių išskyrimas iš „DataFrame“ aprašo.

Objektų stulpelių išskyrimas iš „DataFrame“ aprašo.

DataFrame.count DataFrame.max DataFrame.min DataFrame.mean DataFrame.std DataFrame.select_dtypes

1-asis diskretus objekto skirtumas

periodai: int, numatytasis 1 Laikotarpiai, kuriuos reikia perkelti formuojant skirtumo ašį: <0 arba „indeksas“, 1 arba „stulpeliai“>, numatytasis 0 Paimkite skirtumą tarp eilučių (0) arba stulpelių (1).

Konstruoja geometriją, sudarytą tik iš pagrindinei geometrijai būdingo regiono, bet ne iš kitos geometrijos. Šioje iliustracijoje parodyti rezultatai, kai raudonasis daugiakampis yra šaltinio geometrija.

Nurodo, ar bazinė ir palyginamoji geometrija neturi bendrų taškų.

Grąžina mažiausią atstumą tarp dviejų geometrijų. Jei geometrijos susikerta, mažiausias atstumas yra 0. Abiejų geometrijų projekcijos turi būti vienodos.

Plaukiojantis duomenų kadrų ir kitų elementų padalijimas (dvejetainis operatorius).

Lygiavertis duomenų rėmui / kitam, bet palaikant užpildymo vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

padalinti ( kita, ašis = 'stulpeliai', lygis = Nėra, fill_value = Nėra ) ¶

Plaukiojantis duomenų kadrų ir kitų elementų padalijimas (dvejetainis operatorius).

Lygiavertis duomenų rėmui / kitam, bet palaikant užpildymo vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

Matricos dauginimas naudojant „DataFrame“ arba „Series“ objektus

kita: „DataFrame“ arba „Series“

dot_product: „DataFrame“ arba „Series“

Grąžinti naują objektą, pašalinus prašomos ašies etiketes.

etiketės: vienos etiketės arba į sąrašą panašių rodyklių ar stulpelių etiketės, kurias reikia mesti. Ašis: int arba ašies pavadinimas Ar numesti etiketes iš indekso (0 / ‘rodyklė’) ar stulpelių (1 / ‘stulpeliai’). rodyklė, stulpeliai: viena etiketė arba panaši į sąrašą

Alternatyva nurodant ašį (etiketės, ašis = 1 atitinka stulpelius = etiketes).

Nurodžius etiketes ir indeksą ar stulpelius, iškils „ValueError“.

drop_duplicates ( pogrupis = Nėra, laikyti = 'pirmas', vietoje = klaidinga ) ¶

Grąžinkite „DataFrame“ su pašalintomis pasikartojančiomis eilėmis, pasirinktinai atsižvelgdami tik į tam tikrus stulpelius

  • pirmas: numeskite dublikatus, išskyrus pirmą atvejį.
  • paskutinis: meskite dublikatus, išskyrus paskutinį atvejį.
  • Klaidinga: meskite visus dublikatus.

Grąžinti objektą su etiketėmis ant nurodytos ašies praleista, jei pakaitomis trūksta visų arba visų duomenų

  • bet koks: jei yra kokių nors NA reikšmių, meskite tą etiketę
  • visi: jei visos reikšmės yra NA, meskite tą etiketę

Nuleiskite stulpelius, kur visi elementai yra nan:

Nuleiskite stulpelius ten, kur kuris nors iš elementų yra nan

Nuleiskite eilutes, kuriose visi elementai yra nanometriniai (nėra eilės numesti, todėl df lieka tas pats):

Laikykite tik tas eilutes, kuriose yra bent 2 ne na reikšmės:

Grąžinkite šio objekto dtypes.

dublikatas ( pogrupis = Nėra, laikyti = 'pirmas' ) ¶

Grąžinti loginę seriją, žyminčią pasikartojančias eilutes, pasirinktinai atsižvelgiant tik į tam tikrus stulpelius

  • pirmasis: pažymėkite kopijas kaip teisingas, išskyrus pirmą atvejį.
  • paskutinis: pažymėti kopijas kaip teisingas, išskyrus paskutinį atvejį.
  • Neteisinga: pažymėkite visus dublikatus kaip tikrus.

Tiesa, jei NDFrame yra visiškai tuščias [nėra elementų], o tai reiškia, kad bet kuri ašis yra 0 ilgio.

Jei NDFrame yra tik NaN, jis vis tiek nelaikomas tuščiu. Žr. Toliau pateiktą pavyzdį.

Faktinio tuščio „DataFrame“ pavyzdys. Atkreipkite dėmesį, kad rodyklė tuščia:

Jei „DataFrame“ turime tik NaN, tai nelaikoma tuščia! Mums reikės atsisakyti NaN, kad „DataFrame“ būtų tuščia:

Lankstaus palyginimo metodų vyniotuvas t

Nurodo, ar pagrindo ir palyginimo geometrija yra to paties formos tipo ir apibrėžia tą patį taškų rinkinį plokštumoje. Tai yra 2D palyginimas, tik M ir Z reikšmės nepaisomos. Parametrai:

Įvertinkite išraišką skambinančio „DataFrame“ egzemplioriaus kontekste.

expr: string Išraiškos eilutė, skirta įvertinti. vietoje: „Bool“, numatytasis „False“

Jei išraiškoje yra priskyrimas, ar atlikti operaciją vietoje ir pakeisti esamą „DataFrame“. Kitu atveju grąžinamas naujas „DataFrame“.

ret: ndarray, skaliarinis ar pandos objektas

pandas.DataFrame.query pandas.DataFrame.assign pandas.eval

Norėdami gauti daugiau informacijos, žr. „Eval“ () API dokumentaciją. Išsamių pavyzdžių ieškokite, kaip pagerinti našumą naudojant „eval“.

Pateikia eksponentines svertines funkcijas

Tiesiogiai nurodykite išlyginimo koeficientą,

Nebenaudojamas nuo 0.18.0 versijos: dažnis, kurio reikia laikytis prieš skaičiuojant statistiką

langas, priskirtas konkrečiai operacijai

Turi būti numatytas tiksliai vienas iš masės centro, tarpatramio, pusinės eliminacijos periodo ir alfa. Leistinos vertės ir santykis tarp parametrų yra nurodytas aukščiau aprašytuose parametrų aprašymuose. Išsamų paaiškinimą rasite šio skyriaus pabaigoje esančioje nuorodoje.

Raktinis raktinis žodis naudojamas tam, kad laiko eilutės duomenys atitiktų nurodytą dažnumą, iš naujo imant duomenis. Tai daroma naudojant numatytuosius resample () parametrus (t. Y. Naudojant vidurkį).

Kai koregavimas yra teisingas (numatytasis), svertiniai vidurkiai apskaičiuojami naudojant svorius (1-alfa) ** (n-1), (1-alfa) ** (n-2),…, 1-alfa, 1.

Kai koregavimas yra klaidingas, svertiniai vidurkiai apskaičiuojami rekursyviai taip: svertinis vidurkis [0] = arg [0] svertinis vidurkis [i] = (1-alfa) * svertinis vidurkis [i-1] + alfa * arg [i].

Kai ignore_na yra klaidinga (numatytasis nustatymas), svoriai yra pagrįsti absoliučiomis pozicijomis. Pavyzdžiui, x ir y svoriai, naudojami apskaičiuojant galutinį [x, None, y] svertinį vidurkį, yra (1-alfa) ** 2 ir 1 (jei koregavimas yra teisingas) ir (1-alfa) ** 2 ir alfa (jei koreguoti yra klaidinga).

Kai „ignore_na“ yra teisinga (atkartoja elgesį iki 0.15.0), svoriai nustatomi pagal santykinę padėtį. Pavyzdžiui, x ir y svoriai, naudojami apskaičiuojant galutinį [x, None, y] svertinį vidurkį, yra 1-alfa ir 1 (jei koregavimas yra teisingas), ir 1-alfa ir alfa (jei koregavimas yra klaidingas).

plečia ( min_periods = 1, dažnis = Nėra, centras = klaidingas, ašis = 0 ) ¶

Pateikia besiplečiančias transformacijas.

Nebenaudojama nuo 0.18.0 versijos: dažnis, pagal kurį duomenys turi atitikti prieš skaičiuojant statistiką. Nurodoma kaip dažnio eilutė arba DateOffset objektas.

ašis: int arba eilutė, numatytasis 0

langas, priskirtas konkrečiai operacijai

Pagal numatytuosius nustatymus rezultatas nustatomas dešiniajame lango krašte. Tai galima pakeisti į lango centrą nustatant centras = True.

Raktinis raktinis žodis naudojamas tam, kad laiko eilutės duomenys atitiktų nurodytą dažnumą, iš naujo imant duomenis. Tai daroma naudojant numatytuosius resample () parametrus (t. Y. Naudojant vidurkį).

geometrijos mastas

užpildyti ( ašis = nėra, vietoje = Klaidinga, riba = Nėra, nusileidęs = Nėra ) ¶

DataFrame.fillna sinonimas (metodas = 'užpildyti')

fillna ( reikšmė = Nėra, metodas = Nėra, ašis = nėra, vietoje = klaidinga, riba = Nėra, nusileidęs = Nėra, ** kwargs ) ¶

Užpildykite NA / NaN reikšmes nurodytu metodu

reikšmė: skaliarinė, „dict“, „Series“ arba „DataFrame“ reikšmė, naudojama užpildyti skyles (pvz., 0), pakaitomis reikšmių „dict / Series / DataFrame“, nurodanti, kurią vertę naudoti kiekvienam indeksui (serijai) ar stulpeliui („DataFrame“) . („dict / Series / DataFrame“ vertės nėra užpildytos). Ši vertė negali būti sąrašas. metodas: <'backfill', 'bfill', 'pad', 'ffill', None>, numatytasis Nėra metodas, naudojamas užpildant skyles reindexed serijos padėkliuke / užpildant: paskleiskite paskutinį galiojantį stebėjimą į kitą galiojantį užpildymą / užpildymą: naudokite KITAS galiojantis stebėjimas užpildyti spragą

ašis: <0 arba „rodyklė“, 1 arba „stulpeliai“> vietoje: loginė reikšmė, numatytoji klaidinga

Visus NaN elementus pakeiskite 0.

Mes taip pat galime skleisti nulio vertes į priekį arba atgal.

Pakeiskite visus NaN elementus stulpeliuose „A“, „B“, „C“ ir „D“ atitinkamai 0, 1, 2 ir 3.

Pakeiskite tik pirmąjį NaN elementą.

Duomenų rėmo eilutės arba stulpeliai pogrupiai pagal etiketes nurodytame rodyklėje.

Atminkite, kad ši tvarka nefiltruoja duomenų rėmelio turinio. Filtras taikomas indekso etiketėms.

elementai: į sąrašą panašūs Informacijos ašies sąrašas, kurį reikia apriboti (turi būti ne visi), pvz .: eilutė Laikyti informacijos ašį, kur „arg in col == True“ regex: eilutė (reguliarioji išraiška) Laikyti informacijos ašį su re.search (regex , col) == Tikroji ašis: int arba eilutės ašies pavadinimas Ašis, kurią reikia filtruoti. Pagal numatytuosius nustatymus tai yra informacijos ašis, „indeksas“ serijai, „stulpeliai“ - „DataFrame“

to paties tipo kaip įvesties objektas

Elementai, pavyzdžiui, ir regex parametrai yra priversti vienas kitą išskirti.

ašis pagal nutylėjimą yra informacijos ašis, kuri naudojama indeksuojant su [].

Pradinių laiko eilučių duomenų laikotarpių nustatymo patogumo metodas, pagrįstas datos poslinkiu.

kompensuoti: eilutė, DateOffset, dateutil.relativedelta

ts.pirmas (‘10D’) - & gt Pirmos 10 dienų

Pirmasis geometrijos koordinačių taškas.

Pirmosios ne NA / null vertės grąžos indeksas.

Jei visi elementai yra ne NA / null, grąžina None. Taip pat pateikia tuščią „DataFrame“ - Nėra.

floordiv ( kita, ašis = 'stulpeliai', lygis = Nėra, fill_value = Nėra ) ¶

Duomenų rėmo ir kitų elementų dalijimasis sveiku skaičiumi (dvejetainis operatorius floordiv).

Atitinka „dataframe“ // kita, bet palaikant trūkumų viename iš įvesties duomenų pakeitimą užpildymo verte.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

from_csv ( kelias, antraštė = 0, sep = ', ', indeksas_kol = 0, parse_dates = Tiesa, kodavimas = Nėra, tupleize_cols = Nėra, infer_datetime_format = Netiesa ) ¶

Perskaitykite CSV failą (ATŠAUKTAS, vietoj to naudokite pandas.read_csv ()).

Visiems bendriesiems tikslams pageidautina naudoti galingesnį pandas.read_csv (), tačiau iš__csv leidžia lengvai pereiti į failą ir atgal iš failo (tikslus to_csv atitikmuo), ypač naudojant laiko eilutės duomenų „DataFrame“.

Šis metodas skiriasi nuo pageidaujamo pandas.read_csv () tik kai kuriais numatytais atvejais:

  • index_col yra 0, o ne None (pagal numatytuosius nustatymus indeksą imkite kaip pirmąjį stulpelį)
  • „parse_dates“ yra „True“, o ne „False“ (pagal numatytuosius nustatymus pabandykite analizuoti indeksą kaip datos laiką)

Taigi pd.DataFrame.from_csv (kelias) galima pakeisti pd.read_csv (kelias, index_col = 0, parse_dates = True).

kelias: eilutės failo kelias arba failo rankena / StringIO antraštė: int, numatytasis 0

statinis from_df ( df, address_column = 'adresas', geocoder = Nėra ) ¶

Pateikia „SpatialDataFrame“ iš duomenų rėmelio su adreso stulpeliu. Įėjimai:

PASTABA: Kreditai bus sunaudoti „batch_geocoding“ iš GIS, kuriai priklauso geokoderis.

from_dict ( duomenis, orient = 'stulpeliai', dtype = Nėra ) ¶

Sukurkite „DataFrame“ iš panašių į masyvą ar diktatų

duomenys: diktuoti arba orientuoti: <’stulpeliai’, ‘rodyklė’>, numatytieji ‘stulpeliai’ Duomenų „orientacija“. Jei perduoto diktanto raktai turėtų būti gauto „DataFrame“ stulpeliai, perduokite „stulpelius“ (numatytasis nustatymas). Priešingu atveju, jei raktai turėtų būti eilutės, perduokite „indeksą“. dtype: dtype, default Nėra Duomenų tipas priverstinis, kitaip numanoma

statinis from_featureclass ( failo pavadinimas, ** kwargs ) ¶

Pateikia „SpatialDataFrame“ iš funkcijų klasės. Įėjimai:

skaitykite iš parduotuvės, uždarykite, jei atidarėme

Gauti faile saugomą pandos objektą, pasirinktinai atsižvelgiant į kriterijus

arba_buf: kelias (eilutė), buferis arba kelio objektas (pathlib.Path arba

py._path.local.LocalPath) skaityti

Nauja versija 0.19.0 versijoje: „pathlib“, „py.path“ palaikymas.

kur: terminų (arba konvertuojamų) objektų sąrašas, pasirenkamas pradžia: pasirinktinis, sveikas skaičius (pagal numatytuosius nustatymus nėra Nėra), eilutės numeris pradėti

iteratorius: pasirinktinai, loginė reikšmė, grąžinti iteratorių, numatytasis „False chunksize“: pasirenkamas, Nrers įtraukti į iteraciją, grąžinti iteratorių

from_items ( daiktų, stulpeliai = Nėra, orient = 'stulpeliai' ) ¶

Konvertuokite (raktas, reikšmė) poras į „DataFrame“. Raktai bus ašies indeksas (dažniausiai stulpeliai, bet priklauso nuo nurodytos orientacijos). Reikšmės turėtų būti masyvai arba serija.

elementai: (rakto, vertės) porų seka. Reikšmės turėtų būti masyvai arba serija. stulpeliai: stulpelių etikečių seka, neprivaloma. Turi būti perduota, jei orient = ’index’. orientuoti: <’stulpeliai’, ‘rodyklė’>, numatytieji ‘stulpeliai’ Duomenų „orientacija“. Jei įvesties raktai atitinka stulpelių etiketes, perduokite „stulpelius“ (numatytasis nustatymas). Kitu atveju, jei raktai atitinka rodyklę, perduokite „indeksą“.

Pateikia „SpatialDataFrame“ iš objekto „FeatureLayer“ arba „Table“. Įėjimai:

Pateikia „SpatialDataFrame“ už paslaugas su geometrija ir „Panda's Dataframe“ už lentelių paslaugas.

from_records ( duomenis, indeksas = Nėra, išskirti = Nėra, stulpeliai = Nėra, coerce_float = Klaidinga, nrows = Nėra ) ¶

Konvertuokite struktūrizuotą arba įrašykite „ndarray“ į „DataFrame“

duomenys: „ndarray“ (struktūrinis dipas), rinkinių sąrašas, „dict“ arba „DataFrame“ indeksas: eilutė, laukų sąrašas, panašūs į masyvą

Grąžinkite šio objekto ftypes (retų / tankių ir dtype nurodymą).

Lankstaus palyginimo metodų vyniotuvas ge

Sukuriama nauja supaprastinta geometrija, naudojant nurodytą maksimalų poslinkio toleranciją.

pateikia erdvinių duomenų kadro mastą

Gauti / nustatyti „SpatialDataFrame“ geometrijos duomenis

Geometrijos tipas: daugiakampis, linija, taškas, daugtaškis, daugialypis elementas, matmuo arba anotacija

Gauti elementą iš objekto pagal nurodytą raktą (stulpelis „DataFrame“, skydelio dalis ir kt.). Grąžina numatytąją vertę, jei nerasta.

vertė: daiktų, esančių objekte, tipas

Grąžina objekto plotą naudodamas matavimo tipą.

geografinius duomenis į 2D paviršių (kitaip tariant, jie neatsižvelgs į žemės kreivumą). Jei pageidaujama, matavimo tipus GEODESIC, GREAT_ELLIPTIC, LOXODROME ir PRESERVE_SHAPE galima pasirinkti kaip alternatyvą.

Grąžinkite šio objekto dtypes skaičių.

Grąžinkite šio objekto ftypes skaičių.

Grąžina objekto ilgį naudodamas matavimo tipą.

geografinius duomenis į 2D paviršių (kitaip tariant, jie neatsižvelgs į žemės kreivumą). Jei pageidaujama, matavimo tipus GEODESIC, GREAT_ELLIPTIC, LOXODROME ir PRESERVE_SHAPE galima pasirinkti kaip alternatyvą.

DEKIMETRAI | PĖDOS | INCHES | KILOMETRAI Skaitikliai | MILES | MILIMETRAI NAUTICALMILES | KIEMAI

Pateikia tam tikros geometrijos dalies taškinių objektų masyvą arba masyvą, kuriame yra daugybė masyvų, po vieną kiekvienai daliai.

Greitai gaukite vieną vertę perduodamame stulpelyje ir rodyklėje

Nebenaudojama nuo versijos 0.21.0.

Prašome naudoti .at [] arba .iat [] prieigą.

rodyklė: eilutės etiketė col: stulpelio etiketė pasirenkama: interpretuokite indeksą / koloną kaip indeksuotojus, numatytoji klaidinga

tas pats, kas vertės (bet tvarko retumo konversijas)

Grupuokite serijas naudodami žemėlapį („dict“ arba „key“ funkcija, pritaikykite nurodytą funkciją grupei, grąžinkite rezultatą kaip seriją) arba pagal stulpelių seriją.

pagal: kartografavimas, funkcija, str arba iterable Naudojamas grupių grupėms nustatyti. Jei funkcija yra funkcija, ji iškviečiama kiekvienoje objekto indekso reikšmėje. Jei bus priimtas diktas ar serija, grupėms nustatyti bus naudojamos serijos arba dikto VALUES (serijos reikšmės pirmiausia sulyginamos, žr. Metodą .align ()). Jei perduodamas ndarray, reikšmės naudojamos kaip - tai nustato grupes. Str. Arba jų sąrašas gali būti perduotas grupei pagal stulpelius

ašis: int, numatytasis 0 lygis: int, lygio pavadinimas arba jų seka, numatytasis Nėra

„DataFrame“ su hierarchiniu indeksu

Lanksčių palyginimo metodų vyniotuvas gt

n: int, numatytasis 5 Eilučių, kurias reikia pasirinkti, skaičius. obj_head: skambinančiojo tipas Pirmosios n skambintojo objekto eilutės. hist ( duomenis, stulpelis = Nėra, pagal = Nėra, tinklelis = Tiesa, xlabelsize = Nėra, xrot = Nėra, ylabelsize = Nėra, yrot = Nėra, kirvis = nėra, sharex = klaidinga, sharey = Klaidinga, figsize = Nėra, maketas = Nėra, šiukšliadėžės = 10, ** kwds ) ¶

Nubraukite „DataFrame“ serijos histogramą naudodami matplotlib / pylab.

duomenys: stulpelis „DataFrame“: eilutė arba seka

ax: matplotlib axes objektas, numatytasis Nėra sharex: loginis, numatytasis True, jei kirvis yra None else False

Erdvėje atskirta išgaubto korpuso stačiakampio koordinačių porų eilutė.

Greitas sveikojo skaičiaus vietos skaliarinis prieigos elementas.

Panašiai kaip iloc, iat numato sveikasis skaičius pagrįstos peržiūros. Taip pat galite nustatyti naudodami šiuos indeksuotojus.

Pirmo maksimalaus įvykio per prašomą ašį grąžos indeksas. NA / null vertės neįtraukiamos.

ašis: <0 arba „indeksas“, 1 arba „stulpeliai“>, numatytasis 0 0 arba „rodyklė“ eilutėms, 1 arba „stulpeliai“ stulpeliams skipna: loginė reikšmė, numatytoji tiesa Neįtraukti NA / nulinės vertės. Jei visa eilutė / stulpelis yra NA, rezultatas bus pirmasis indeksas.

Šis metodas yra „ndarray.argmax“ „DataFrame“ versija.

Pirmo minimumo virš prašomos ašies grąžos indeksas. NA / null vertės neįtraukiamos.

ašis: <0 arba „indeksas“, 1 arba „stulpeliai“>, numatytasis 0 0 arba „rodyklė“ eilutėms, 1 arba „stulpeliai“ stulpeliams skipna: loginė reikšmė, numatytoji tiesa Neįtraukti NA / nulinės vertės. Jei visa eilutė / stulpelis yra NA, rezultatas bus NA

Šis metodas yra „ndarray.argmin“ „DataFrame“ versija.

Vien tik sveikojo skaičiaus ir vietos indeksavimas, norint pasirinkti vietą.

.iloc [] pirmiausia pagrįstas sveikojo skaičiaus padėtimi (nuo 0 iki ašies ilgio-1), bet taip pat gali būti naudojamas su būlio masyvu.

  • Sveikasis skaičius, pvz. 5.
  • Sveikųjų skaičių sąrašas arba masyvas, pvz. [4, 3, 0].
  • Pjūvio objektas su intais, pvz. 1: 7.
  • Būlio masyvas.
  • Iškviečiamoji funkcija su vienu argumentu (iškviečiamoji serija, „DataFrame“ arba „Panel“), kuri grąžina galiojantį išvestį indeksavimui (vienas iš aukščiau pateiktų)

.iloc pakels „IndexError“, jei prašomas indeksuotojas neturi ribų, išskyrus griežinėlis indeksuotojai, kurie leidžia indeksuoti už ribų (tai atitinka python / numpy griežinėlis semantika).

Žr. Daugiau „Pasirinkimas pagal poziciją“

Pabandykite padaryti geresnius objektų stulpelių tipus.

Mėgina švelniai konvertuoti objekto tipus turinčius stulpelius, o ne objektiniai ir nekonvertuojami stulpeliai lieka nepakitę. Išvadų taisyklės yra tokios pačios kaip ir įprastos „Series / DataFrame“ konstrukcijos metu.

pandas.to_datetime: konvertuoti argumentą į datetime. pandas.to_timedelta: konvertuoti argumentą į timedelta. pandas.to_numeric: konvertuoti argumentą į skaitinį typeR

konvertuotas: tas pats tipas kaip įvesties objektas

Glausta „DataFrame“ santrauka.

daugžodis: , neprivaloma, ar spausdinti visą santrauką. Niekas nesilaiko display.max_info_columns nustatymo. Tiesa ar netiesa pakeičia display.max_info_columns nustatymą.

buf: rašomas buferis, pagal nutylėjimą yra sys.stdout max_cols: int, numatytasis Nėra

Ar rodyti nulio skaičių

  • Jei Nėra, tada parodykite tik tada, jei rėmelis yra mažesnis nei max_info_rows ir max_info_columns.
  • Jei tiesa, visada parodykite skaičių.
  • Jei klaidinga, niekada nerodykite.

Įterpkite stulpelį į „DataFrame“ nurodytoje vietoje.

Pakelia „ValueError“, jei stulpelis jau yra „DataFrame“, nebent „allow_duplicates“ nustatyta kaip „True“.

loc: int Įterpimo rodyklė. Turi patikrinti 0 stulpelį & lt = loc & lt = len (stulpeliai): įterpto stulpelio eilutė, skaičius arba maišos objekto etiketė

reikšmė: int, serija arba į masyvą panašūs allow_duplicates: bool, neprivaloma

interpoluoti ( metodas = 'tiesinis', ašis = 0, riba = Nėra, vietoje = Klaidinga, limit_direction = 'pirmyn', nusileidęs = Nėra, ** kwargs ) ¶

Interpoliuokite vertes pagal skirtingus metodus.

Atminkite, kad „DataFrames“ / „Series“ su „MultiIndex“ palaikomas tik metodas = 'tiesinis'.

  • „Tiesinis“: nepaisykite indekso ir vertes vertinkite kaip vienodai išdėstytas. Tai vienintelis „MultiIndexes“ palaikomas metodas. numatytas
  • „Laikas“: interpoliacija veikia dienos ir didesnės skiriamosios gebos duomenis interpoliuojant nurodytą intervalo ilgį
  • „Indeksas“, „vertės“: naudokite faktines indekso reikšmes
  • „Artimiausias“, „nulis“, „šlaitinis“, „kvadratinis“, „kubinis“, „baricentrinis“, „daugianaris“ perduodamas scipy.interpolate.interp1d. Tiek „polinomas“, tiek „spline“ reikalauja, kad nurodytumėte ir tvarką (int), pvz. df.interpoluoti (metodas = ’daugianaris’, tvarka = 4). Jie naudoja faktines skaitines indekso reikšmes.
  • „Krogh“, „piecewise_polynomial“, „spline“, „pchip“ ir „akima“ yra apvynioti panašių pavadinimų scipy interpoliacijos metodus. Jie naudoja faktines skaitines indekso reikšmes. Norėdami gauti daugiau informacijos apie jų elgesį, žr. „Scipy“ dokumentaciją ir mokymo programos dokumentaciją
  • „Iš_vediniai“ reiškia BPoly.from_vediniai, kurie pakeičia interpoliacijos metodą „piecewise_polynomial“ scipy 0.18

Naujas 0.18.1 versijoje: pridėtas „akima“ metodo palaikymas Pridėtas interpolato metodas „iš_vediniai“, kuris pakeičia žodį „piecewise_polynomial“ scipy 0.18 atgal, suderinamas su scipy & lt 0.18

Jei bus nurodyta riba, iš eilės einantys NaN bus užpildyti šia kryptimi.

kwargs: raktinių žodžių argumentai, perduodami interpoliavimo funkcijai.

Tos pačios formos serija arba „DataFrame“ interpoliuojama NaN

Sukuria geometriją, kuri yra dviejų įvesties geometrijų geometrinė sankirta. Skirtingų formų tipams sukurti gali būti naudojamos skirtingos matmenų vertės. Dviejų to paties formos tipo geometrijų sankirta yra geometrija, apimanti tik pradinių geometrijų sutapimo regionus.

1 - nulio matmenų geometrija (taškas arba daugtaškis). 2 - Vienmatė geometrija (linijinė linija). 4 - Dvimatė geometrija (daugiakampis).

Kiekvienos tuščios geometrijos atveju grąžinkite „True“, ne tuščią - „False“

Tiesa, jei geometrijos dalių skaičius yra didesnis nei 1

Grąžinkite loginį „DataFrame“, rodantį, ar kiekvienas „DataFrame“ elementas yra vertėse.

reikšmės: „iterable“, „Series“, „DataFrame“ arba žodynas Rezultatas bus teisingas tik vietoje, jei sutampa visos etiketės. Jei reikšmės yra serija, tai yra indeksas. Jei reikšmės yra žodynas, raktai turi būti stulpelių pavadinimai, kurie turi sutapti. Jei reikšmės yra „DataFrame“, indekso ir stulpelio etiketės turi sutapti.

Kai reikšmės yra „Series“ arba „DataFrame“:

Grąžinkite loginį vienodo dydžio objektą, nurodydami, ar reikšmės yra NA.

DataFrame.notna: loginė atvirkštinė isna DataFrame.isnull: isna isna pseudonimas: aukščiausio lygio isna

Grąžinkite loginį vienodo dydžio objektą, nurodydami, ar reikšmės yra NA.

DataFrame.notna: loginė atvirkštinė isna DataFrame.isnull: isna isna pseudonimas: aukščiausio lygio isna

Iterator over (stulpelio pavadinimas, serija) poros.

iterrows: kartokite „DataFrame“ eilutes kaip (indeksas, serija) poras. itertuples: kartojasi per „DataFrame“ eilutes kaip reikšmių pavadinimai.

Iterator over (stulpelio pavadinimas, serija) poros.

iterrows: kartokite „DataFrame“ eilutes kaip (indeksas, serija) poras. itertuples: kartojasi per „DataFrame“ eilutes kaip reikšmių pavadinimai.

Kartoti per „DataFrame“ eilutes kaip (indeksas, serija) poras.

Kadangi iterrows kiekvienai eilutei pateikia seriją, ji taip ir daro ne išsaugoti dtypes visose eilutėse (dtypes išsaugomi visuose DataFrames stulpeliuose). Pavyzdžiui,

Norint išsaugoti dtypes, kartojant eilutes, geriau naudoti itertuples (), kuris grąžina reikšmių įvardijimus ir paprastai yra greitesnis nei iterrows.

Tu turėtum niekada nekeiskite ką jūs kartojate. Tai garantuojama ne visais atvejais. Priklausomai nuo duomenų tipų, iteratorius grąžina kopiją, o ne rodinį, o rašymas į ją neturės jokios įtakos.

itertuples: kartojasi per „DataFrame“ eilutes kaip reikšmių pavadinimai. iteritemai: kartokite poras (stulpelio pavadinimas, serija).

itertuples ( indeksas = Tiesa, vardas = 'Pandas' ) ¶

Kartoti per „DataFrame“ eilutes kaip pavadinimų rinkinius, o indekso reikšmė yra pirmasis atkarpos elementas.

index: loginė reikšmė, numatytasis True If True, grąžinkite indeksą kaip pirmąjį atkarpos elementą.vardas: eilutė, numatytasis „Pandas“ Grąžintų vardinių elementų pavadinimas arba Nėra, jei norite pateikti įprastus rinkinius.

Stulpelių pavadinimai bus pervardyti į pozicijų pavadinimus, jei jie yra neteisingi „Python“ identifikatoriai, kartojami arba prasideda pabraukimu. Turint daug stulpelių (& gt255), grąžinami įprasti rinkiniai.

iterrows: kartokite „DataFrame“ eilutes kaip (indeksas, serija) poras. iteritemai: kartokite poras (stulpelio pavadinimas, serija).

Visų pirma indeksuotojas, pažymėtas pagal etiketę, su atsarginiu sveikojo skaičiaus pozicija.

.ix [] palaiko mišrią skaičių ir etikete pagrįstą prieigą. Tai visų pirma grindžiama etiketėmis, tačiau bus grįžta prie sveikojo skaičiaus padėties, nebent atitinkama ašis yra sveiko skaičiaus tipo.

.ix yra pats bendriausias indeksavimo įrankis ir palaikys bet kurį įvestį .loc ir .iloc. .ix taip pat palaiko slankiojo kablelio etikečių schemas. .ix yra išskirtinai naudinga, kai sprendžiami mišri padėties ir etikečių hierarchiniai rodikliai.

Tačiau kai ašis yra sveikasis skaičius, palaikoma TIK etiketėmis pagrįsta prieiga, o ne padėtis. Taigi tokiais atvejais paprastai geriau būti aiškiam ir naudoti .iloc arba .loc.

Daugiau informacijos rasite išplėstiniame indeksavime.

Sujunkite stulpelius su kitais „DataFrame“ rodyklėse arba raktų stulpeliuose. Efektyviai sujunkite kelis „DataFrame“ objektus pagal indeksą vienu metu, perduodami sąrašą.

kita: „DataFrame“, „Series with name field set“ arba „DataFrame Index“ sąrašas turėtų būti panašus į vieną iš šio stulpelio. Jei serija yra perduodama, turi būti nustatytas jos pavadinimo atributas ir jis bus naudojamas kaip stulpelio pavadinimas sujungtame „DataFrame“: stulpelio pavadinime, stulpelio pavadinimo eilutėje / sąraše arba skambinančiojo stulpelyje (-iuose). prisijungti prie kito indekso, kitaip prisijungia prie indekso. Jei pateikiami keli stulpeliai, perduotame „DataFrame“ turi būti „MultiIndex“. Gali perduoti masyvą kaip prisijungimo raktą, jei jo dar nėra skambinančiame „DataFrame“. Kaip „Excel VLOOKUP“ operacija, kaip: „kairė“, „dešinė“, „išorinė“, „vidinė“>, numatytoji reikšmė: „kairė“

Kaip elgtis su dviem objektais.

  • kairė: naudokite skambinimo rėmelio indeksą (arba stulpelį, jei nurodytas)
  • dešinėje: naudokite kito kadro indeksą
  • išorinis: suformuokite skambinančio rėmelio indekso (arba stulpelio, jei jis nurodytas, susiejimą) su kito rėmelio indeksu ir rūšiuokite jį leksikografiškai
  • vidinis: formuoja skambinančiojo rėmelio indekso (arba stulpelio, jei jis nurodytas, susikirtimą) su kito rėmelio indeksu, išlaikant skambinančiojo eiliškumą

„on“, „lsuffix“ ir „rsuffix“ parinktys nepalaikomos perduodant „DataFrame“ objektų sąrašą

Prisijunkite prie „DataFrames“ naudodami jų indeksus.

Jei norime prisijungti naudodamiesi raktų stulpeliais, turime nustatyti, kad raktas būtų indeksas tiek skambinančiojo, tiek kituose. Sujungto „DataFrame“ indeksas bus raktas.

Kita galimybė prisijungti naudojant pagrindinius stulpelius yra naudoti parametras on. „DataFrame.join“ visada naudoja kito indeksą, tačiau mes galime naudoti bet kurį skambinančiojo stulpelį. Šis metodas išsaugo pirminį skambinančiojo indeksą rezultate.

„DataFrame.merge“: operacijoms, atliekamoms stulpeliuose

Gaukite „informacijos ašį“ (daugiau žr. Indeksavimas)

Tai yra „Series“ rodyklė, „DataFrame“ stulpeliai ir skydelio „major_axis“.

kurt ( ašis = nėra, skipna = Nėra, lygis = Nėra, numeric_only = Nėra, ** kwargs ) ¶

Grąžinkite objektyvią kurtozę virš prašomos ašies, naudodamiesi Fišerio kurtoso apibrėžimu (normali kurtozė == 0,0). Normalizuojamas N-1

ašis: skipna: loginė reikšmė, numatytoji tiesa

kurt: serija arba „DataFrame“ (jei nurodytas lygis)

kurtosis ( ašis = nėra, skipna = Nėra, lygis = Nėra, numeric_only = Nėra, ** kwargs ) ¶

Grąžinkite objektyvią kurtozę virš prašomos ašies, naudodamiesi Fišerio kurtoso apibrėžimu (normali kurtozė == 0,0). Normalizuojamas N-1

ašis: skipna: loginė reikšmė, numatytoji tiesa

kurt: serija arba „DataFrame“ (jei nurodytas lygis)

Vieta, kurioje yra etiketė. Etiketė „PointPoint“ visada yra objekte arba objekte.

Patogumo metodas nustatant galutinių laiko eilučių duomenų laikotarpius pagal datos poslinkį.

kompensuoti: eilutė, DateOffset, dateutil.relativedelta

Paskutinė funkcijos koordinatė.

Pirmosios ne NA / null vertės grąžos indeksas.

Jei visi elementai yra ne NA / null, grąžina None. Taip pat pateikia tuščią „DataFrame“ - Nėra.

Lankstaus palyginimo metodų pakuotė le

Linijinio požymio ilgis. Nulis taškų ir daugiataškių funkcijų tipams.

3D linijinės funkcijos ilgis. Nulis taškų ir daugiataškių funkcijų tipams.

Vien tik pagal etiketę pažymėtas indeksuotojas, kurį galima pasirinkti pagal etiketę.

.loc [] pirmiausia grindžiamas etiketėmis, tačiau taip pat gali būti naudojamas su loginės struktūros masyvu.

  • Viena etiketė, pvz. 5 arba „a“, (atkreipkite dėmesį, kad 5 aiškinamas kaip a etiketė indekso ir niekada kaip sveiko skaičiaus pozicija palei indeksą).
  • Etikečių sąrašas ar masyvas, pvz. ['a', 'b', 'c'].
  • Pjūvio objektas su etiketėmis, pvz. „a“: „f“ (atkreipkite dėmesį, kad priešingai nei įprasti pitono tiek startas ir sustojimas yra įtraukti!).
  • Būlio masyvas.
  • Iškviečiama funkcija su vienu argumentu (iškviečiamoji serija, „DataFrame“ arba „Panel“), kuri grąžina galiojantį išvestį indeksavimui (vienas iš aukščiau pateiktų)

.loc iškels „KeyError“, kai elementai nebus rasti.

Žiūrėkite daugiau „Selection by Label“

ieškoti ( eilutės_ženklai, col_labels ) ¶

„DataFrame“ funkcija pagal etiketes „išgalvotas indeksavimas“. Atsižvelgdami į vienodo ilgio eilučių ir stulpelių etikečių masyvus, pateikite kiekvienos (eilutės, stulpelio) poros reikšmių masyvą.

row_labels: seka Eilių etiketės, naudojamos ieškant col_labels: sequence Stulpelių etiketės, kurias reikia naudoti ieškant

Vyniotuvas lankstiems palyginimo metodams lt

Pateikite prašomos ašies verčių vidutinį absoliutų nuokrypį

ašis: skipna: loginė reikšmė, numatytoji tiesa

mad: serija arba „DataFrame“ (jei nurodytas lygis)

kaukė ( kond, kita = nan, vietoje = klaidinga, ašis = nėra, lygis = Nėra, klaidos = 'pakelti', try_cast = Klaidinga, raise_on_error = Nėra ) ¶

Grąžinkite tokios pat formos objektą kaip aš ir kurio atitinkami įrašai yra iš savęs, kur kondicija yra klaidinga, o kitu atveju - iš kitų.

cond: loginis NDFrame, panašus į masyvą arba iškviečiamas

Jei kondas klaidingas, palikite pradinę vertę. Kur „Tiesa“, pakeiskite atitinkama kitų reikšme. Jei „cond“ galima iškviesti, jis apskaičiuojamas NDFrame ir turėtų grąžinti loginį NDFrame arba masyvą. Skambinamasis negali pakeisti įvesties NDFrame (nors pandos to netikrina).

Naujas 0.18.1 versijoje: skambintinis gali būti naudojamas kaip sąlyga.

Įrašai, kurių sąlyga yra tiesa, pakeičiami atitinkama kitų reikšme. Jei kitas yra iškviečiamas, jis apskaičiuojamas NDFrame ir turėtų grąžinti skaliarą arba NDFrame. Skambinamasis negali pakeisti įvesties NDFrame (nors pandos to netikrina).

Naujas 0.18.1 versijoje: skambintinas gali būti naudojamas kaip kitas.

ašis: lygiavimo ašis, jei reikia, numatytoji Nėra lygio: lygiavimo lygis, jei reikia, numatytasis Nėra klaidų: str, <'pakelti', 'ignoruoti'>, numatytasis 'pakelti'

  • pakelti: leisti kelti išimtis
  • ignoruoti: slopinti išimtis. Įvykus klaidai, grąžinkite originalų objektą

Ar didinti netinkamų duomenų tipus (pvz., Bandyti, kur yra eilutės)

Nebenaudojama nuo 0.21.0 versijos.

Kaukės metodas yra „jei-tada“ idiomos taikymas. Kiekvienam iškvietimo „DataFrame“ elementui, jei „cond“ yra „False“, naudojamas elementas, kitaip naudojamas atitinkamas „DataFrame“ elemento elementas.

DataFrame.where () parašas skiriasi nuo numpy.where (). Apytiksliai df1.where (m, df2) yra lygiavertis np.where (m, df1, df2).

Norėdami gauti daugiau informacijos ir pavyzdžių, žr. Kaukės dokumentaciją indeksuojant.

maks. ( ašis = nėra, skipna = Nėra, lygis = Nėra, numeric_only = Nėra, ** kwargs ) ¶ Šis metodas pateikia maksimalias objekto reikšmes. Jei norite indeksas nuo didžiausio, naudokite „idxmax“. Tai yra numpy.ndarray metodo argmax atitikmuo.

ašis: skipna: loginė reikšmė, numatytoji tiesa

max: serija arba „DataFrame“ (jei nurodytas lygis)

reiškia ( ašis = nėra, skipna = Nėra, lygis = Nėra, numeric_only = Nėra, ** kwargs ) ¶

Grąžinkite prašomos ašies reikšmių vidurkį

ašis: skipna: loginė reikšmė, numatytoji tiesa

reiškia: serija arba „DataFrame“ (jei nurodytas lygis)

Meas_on_line ( antroji_geometrija, as_percentage = Klaidinga ) ¶

Grąžina matą iš šios eilutės pradžios taško į in_point.

atstumas, jei tiesa, matas bus grąžintas procentais.

Grąžinkite prašomos ašies reikšmių medianą

ašis: skipna: loginė reikšmė, numatytoji tiesa

mediana: serija arba „DataFrame“ (jei nurodytas lygis)

ištirpti ( id_vars = Nėra, value_vars = Nėra, var_name = Nėra, value_name = 'vertė', col_level = Nėra ) ¶

„Atsijungia“ „DataFrame“ nuo plataus iki ilgo, pasirinktinai palikdami nustatytus identifikatorių kintamuosius.

Ši funkcija yra naudinga masažuojant „DataFrame“ į formatą, kuriame vienas ar daugiau stulpelių yra identifikaciniai kintamieji (id_vars), o visi kiti stulpeliai, laikomi išmatuotais kintamaisiais (value_vars), yra „nesukami“ eilutės ašiai, paliekant tik du neidentifikatorius. stulpeliai, „kintamasis“ ir „vertė“.

frame: DataFrame id_vars: tuple, list arba ndarray, neprivaloma

išlydyti „pivot_table“ „DataFrame.pivot“

Stulpelių „kintamasis“ ir „vertė“ pavadinimus galima pritaikyti:

Jei turite kelių indeksų stulpelius:

„DataFrame“ stulpelių naudojimas atmintyje.

index: bool Nurodo, ar į „DataFrame“ indekso atminties naudojimą reikia įtraukti grąžintas serijas. Jei indeksas = Tiesa (numatytasis nustatymas yra klaidingas), pirmasis serijos indeksas yra indeksas. giliai: „Bool“ Giliai apžiūrėkite duomenis, paklauskite objekto tipų, jei norite sužinoti sistemos lygio atminties suvartojimo dydžius: A serija su stulpelių pavadinimais kaip indeksas ir stulpelių su baitų vienetais naudojimas atmintyje.

Į atminties naudojimą neįeina atmintis, kurią sunaudoja elementai, kurie nėra masyvo komponentai, jei giliai = klaidinga

sujungti ( teisingai, kaip = „vidinis“, on = Nėra, left_on = Nėra, right_on = Nėra, left_index = Klaidinga, right_index = Klaidinga, rūšiuoti = klaidinga, galūnės = ('_ x', „_y“), kopija = Tiesa, indikatorius = klaidingas, patvirtinti = Nėra ) ¶

Sujunkite „DataFrame“ objektus atlikdami duomenų bazės stiliaus sujungimo operaciją stulpeliais arba rodyklėmis.

Jei stulpeliai jungiami prie stulpelių, „DataFrame“ indeksuoja bus ignoruojamas. Kitu atveju, jei sujungsite indeksų indeksus arba stulpelio ar stulpelių indeksus, indeksas bus perduotas.

  • kairė: naudokite tik raktus iš kairio rėmelio, panašiai kaip SQL kairio išorinio sujungimo išsaugojimo raktų tvarka
  • teisė: naudokite tik raktus iš dešiniojo rėmo, panašų į SQL dešiniojo išorinio sujungimo išsaugojimo raktų tvarką
  • išorinis: naudokite abiejų rėmelių raktų sąjungą, panašią į SQL išorinius sujungimo rūšiavimo raktus leksikografiškai
  • vidinis: naudokite abiejų kadrų raktų susikirtimą, panašų į SQL vidinį sujungimą, kad būtų išsaugota kairiųjų raktų tvarka

Jei „True“, duomenų iš „DataFrame“ išvesties prideda stulpelį pavadinimu „_merge“ su informacija apie kiekvienos eilutės šaltinį. Jei eilutė, stulpelis su informacija apie kiekvienos eilutės šaltinį bus pridėtas prie išvesties „DataFrame“, o stulpelis bus pavadintas eilutės verte. Informacijos stulpelis yra kategorinio tipo ir stebėjimų, kurių sujungimo raktas rodomas tik „kairiajame“ „DataFrame“, „tik dešinėje_ tik“ stebėjimuose, kurių sujungimo raktas rodomas tik „dešinėje“ „DataFrame“, ir „abu“, jei stebėjimo sujungimo raktas yra abiejuose.

Jei nurodyta, patikrina, ar sujungimas yra nurodyto tipo.

  • „One_to_one“ arba „1: 1“: patikrinkite, ar suliejimo raktai unikalūs tiek kairiajame, tiek dešiniajame rinkiniuose.
  • „One_to_many“ arba „1: m“: patikrinkite, ar kairiame duomenų rinkinyje sujungimo raktai yra unikalūs.
  • „Many_to_one“ arba „m: 1“: patikrinkite, ar sujungimo raktai yra unikalūs dešiniajame duomenų rinkinyje.
  • „Many_to_many“ arba „m: m“: leidžiama, tačiau netikrinama.

Ši operacija sujungia du duomenų kadrus į vieną naują „DataFrame“. Jei operacija sujungia du „SpatialDataFrame“, „geometry_type“ turi sutapti.

min ( ašis = nėra, skipna = Nėra, lygis = Nėra, numeric_only = Nėra, ** kwargs ) ¶ Šis metodas pateikia minimalias objekto reikšmes. Jei norite indeksas nuo minimumo, naudokite „idxmin“. Tai yra numpy.ndarray metodo argmino atitikmuo.

ašis: skipna: loginė reikšmė, numatytoji tiesa

min .: serija arba „DataFrame“ (jei nurodytas lygis)

Duomenų rėmo modulis ir kiti elementai (dvejetainis operatoriaus mod).

Lygiavertis duomenų rėmeliui,% kitam, bet palaikant užpildymo vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

režimas ( ašis = 0, numeric_only = False ) ¶

Gauna kiekvieno elemento režimą (-us) išilgai pasirinktos ašies. Prideda kiekvieno režimo eilutę kiekvienoje etiketėje, užpildo spragas nan.

Atkreipkite dėmesį, kad pasirinktai ašiai gali būti pateiktos kelios vertės (kai daugiau nei vienam elementui būdingas maksimalus dažnis), todėl duomenų rėmas grąžinamas. Jei norite priskirti trūkstamas reikšmes duomenų kadro df režimu, galite tai padaryti: df.fillna (df.mode (). Iloc [0])

Duomenų rėmelio ir kitų elementų dauginimas (dvejetainis operatorius mul).

Atitinka „dataframe * other“, bet palaikant užpildymo_vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

padauginti ( kita, ašis = 'stulpeliai', lygis = Nėra, fill_value = Nėra ) ¶

Duomenų rėmelio ir kitų elementų dauginimas (dvejetainis operatorius mul).

Atitinka „dataframe * other“, bet palaikant užpildymo_vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

Ašių skaičius / matricos matmenys

Lankstaus palyginimo metodų vyniotuvas ne

Gaukite „DataFrame“ eilutes, surūšiuotas pagal n didžiausias stulpelių reikšmes.

Grąžinkite loginį vienodo dydžio objektą, nurodydami, ar reikšmės nėra NA.

DataFrame.isna: loginė atvirkštinė notna DataFrame.notnull: „notna notna“ pseudonimas: aukščiausio lygio „notna“

Grąžinkite loginį vienodo dydžio objektą, nurodydami, ar reikšmės nėra NA.

DataFrame.isna: loginė atvirkštinė notna DataFrame.notnull: „notna notna“ pseudonimas: aukščiausio lygio „notna“

Gaukite „DataFrame“ eilutes, surūšiuotas pagal n mažiausias stulpelių reikšmes.

Grąžinti seriją su skirtingų stebėjimų skaičiumi per prašomą ašį.

ašis: <0 arba „rodyklė“, 1 arba „stulpeliai“>, numatytoji 0 dropna: loginė, numatytoji tiesa

Nurodo, ar dviejų geometrijų susikirtimo formos tipas yra tas pats, kaip vienos iš įvesties geometrijų ir nėra lygiavertis nei vienai iš įvesties geometrijų.

Funkcijos geometrijos dalių skaičius.

pct_change ( laikotarpiai = 1, fill_method = 'padas', riba = Nėra, dažnis = Nėra, ** kwargs ) ¶

Procentų pokytis per tam tikrą laikotarpių skaičių.

periodai: int, numatytasis 1 Periodai, kuriuos reikia pakeisti formuojant procentinį pokytį fill_method: str, default 'pad' Kaip elgtis su NA prieš skaičiuojant procentų pokyčių ribą: int, default Nėra vienas po kito einančių NA, kuriuos reikia užpildyti prieš sustabdant dažnį: DateOffset, timedelta, arba kompensuoti pseudonimo eilutę, neprivalomas prieaugis, kurį reikia naudoti iš laiko eilučių API (pvz., „M“ arba „BDay“ ())

Pagal numatytuosius nustatymus procentinis pokytis apskaičiuojamas išilgai statistikos ašies: „0“ arba „Index“, „DataFrame“ ir 1, arba „minor“ - skydui. Tai galite pakeisti naudodami ašies raktinio žodžio argumentą.

Taikyti func (self, * args, ** kwargs)

func: funkcijos funkcija taikoma NDFrame. argai ir kwargs perduodami į func. Arba (iškviečiamas, duomenų_raktinis žodis) paketas, kuriame duomenų_raktinis žodis yra eilutė, nurodanti skambintino raktinį žodį, kuris tikisi NDF rėmo. argumentai: kartojami, pasirinktiniai poziciniai argumentai perduodami į funkciją. kwargs: susiejimas, neprivalomas raktinių žodžių argumentų žodynas, perduodamas į func.

objektas: func grąžinimo tipas.

Naudokite .pipe, kai sujungiate funkcijas, kurios tikisi „Series“, „DataFrames“ ar „GroupBy“ objektų. Užuot rašiusi

Jei turite funkciją, kuri duomenis priima kaip (tarkim) antrąjį argumentą, perduokite atkaklį, nurodantį, kuris raktinis žodis tikisi duomenų. Pvz., Tarkime, kad f duomenis laiko arg2:

pandos.DataFrame.apply pandas.DataFrame.applymap pandos.Series.map

sukti ( indeksas = Nėra, stulpeliai = Nėra, reikšmės = Nėra ) ¶

Formuokite duomenis (sukurkite „suvestinės“ lentelę), remdamiesi stulpelių vertėmis. Naudojamos unikalios reikšmės iš indekso / stulpelių, kad būtų sudarytos gauto „DataFrame“ ašys.

rodyklė: eilutė ar objektas, neprivalomas stulpelio pavadinimas, naudojamas naujo kadro indeksui kurti. Jei Nėra, naudoja esamą indeksą. stulpeliai: eilutė arba objektas Stulpelio pavadinimas, naudojamas norint sukurti naujo rėmelio stulpelių vertes: eilutė arba objektas, pasirinktinis stulpelio pavadinimas, naudojamas naujo rėmelio reikšmėms pildyti. Jei nenurodoma, bus naudojami visi likę stulpeliai, o rezultatas turės hierarchiškai indeksuotus stulpelius

„DataFrame.pivot_table“: suvestinės, kuri gali apdoroti vienos indekso / stulpelio poros pasikartojančias vertes, apibendrinimas DataFrame.unstack: „pivot“ pagal indekso reikšmes, o ne stulpelį

Norėdami išsamiau sureguliuoti valdymą, žr. Hierarchinę indeksavimo dokumentaciją kartu su susijusiais „stack / unstack“ metodais

Sukurkite skaičiuoklės stiliaus sukamą lentelę kaip „DataFrame“. „Pivot“ lentelės lygiai bus saugomi „MultiIndex“ objektuose (hierarchinėse rodyklėse) rezultato „DataFrame“ rodyklėje ir stulpeliuose

reikšmės: stulpelis sujungti, pasirenkamas indeksas: stulpelis, grupuotojas, masyvas arba ankstesnių sąrašas

DataFrame.pivot: „pivot“ be agregavimo, kuris gali tvarkyti ne skaitmeninį duomenų brėžinį ( * argumentuoja, ** kwargs ) ¶

įrašo erdvinių duomenų kadrą į žemėlapį

Bendras funkcijos taškų skaičius.

point_from_angle_and_distance ( kampu, atstumas, metodas = 'GEODESKINIS' ) ¶

Pateikia nurodyto matavimo tipo tašką nurodytu kampu ir atstumu laipsniais ir metrais.

  • Kampas laipsniais iki grąžinto taško.
  • Atstumas metrais iki grąžinto taško.
  • PLANAR matavimai atspindi geografinę projekciją

duomenis į 2D paviršių (kitaip tariant, jie neatsižvelgs į žemės kreivumą). Jei pageidaujama, matavimo tipus GEODESIC, GREAT_ELLIPTIC, LOXODROME ir PRESERVE_SHAPE galima pasirinkti kaip alternatyvą.

Grąžinkite elementą ir numeskite iš rėmelio. Jei nerandate, pakelkite „KeyError“.

item: str Stulpelio etiketė turi būti iššokta

Grąžina tiesės tašką nurodytu atstumu nuo tiesės pradžios.

matas arba linijos ilgio santykis. Jei „True“, vertė naudojama kaip procentinė dalis, jei „False“, vertė naudojama kaip atstumas. Procentams vertė turėtų būti išreikšta dvigubai nuo 0,0 (0%) iki 1,0 (100%).

Duomenų rėmo ir kitų elementų eksponentinė galia (dvejetainis operatoriaus variklis).

Lygiavertis duomenų rėmui ** kitam, bet palaikant užpildymo_vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

prod ( ašis = nėra, skipna = Nėra, lygis = Nėra, numeric_only = Nėra, ** kwargs ) ¶

Grąžinkite prašomos ašies verčių sandaugą

ašis: skipna: loginė, numatytoji tiesa

prod: serija arba „DataFrame“ (jei nurodytas lygis)

produktas ( ašis = nėra, skipna = Nėra, lygis = Nėra, numeric_only = Nėra, ** kwargs ) ¶

Grąžinkite prašomos ašies verčių sandaugą

ašis: skipna: loginė, numatytoji tiesa

prod: serija arba „DataFrame“ (jei nurodytas lygis)

project_as ( erdvinis_referencija, transformacijos_vardas = Nėra ) ¶

Projektuoja geometriją ir pasirinktinai taiko geotransformaciją.

„SpatialReference“ objektas arba koordinačių sistemos pavadinimas.

Grąžinkite reikšmes nurodytoje kvantile virš prašomos ašies, a la numpy.percentile.

q: plūdė arba panašus į masyvą, numatytasis 0,5 (50% kvantilis) 0 & lt = q & lt = 1, kvilis (-ai) ašiai apskaičiuoti: <0, 1, 'rodyklė', 'stulpeliai'> (numatytasis 0) 0 arba „indeksas“, jei reikia eilutės, 1 arba „stulpeliai“, jei reikia interpoliacijos pagal stulpelius:

Šis neprivalomas parametras nurodo naudojamą interpoliacijos metodą, kai norimas kvantilis yra tarp dviejų duomenų taškų i ir j:

  • tiesinė: i + (j - i) * trupmena, kur trupmena yra indekso dalis, apsupta i ir j.
  • žemiau: i.
  • aukštesnis: j.
  • artimiausias: i arba j, kuris yra artimiausias.
  • vidurio taškas: (i + j) / 2.

kvantiliai: serija arba „DataFrame“

  • Jei q yra masyvas, „DataFrame“ bus grąžintas ten, kur indeksas yra q, stulpeliai yra „aš“ stulpeliai, o reikšmės yra kvantilės.
  • Jei q yra plūduriuojantis, grąžinama serija, kur indeksas yra savęs stulpeliai, o vertės - kvantilės.

Užklausa rėmelio stulpelius su logine išraiška.

expr: string Užklausos eilutė, kurią reikia įvertinti. Galite nurodyti aplinkos kintamuosius prieš juos įrašydami simbolį „& # 64“, pvz., & # 64a + b. vietoje: bool

Ar užklausa turėtų pakeisti vietoje esančius duomenis, ar grąžinti pakeistą kopiją

Šios išraiškos vertinimo rezultatas pirmiausia perduodamas „DataFrame.loc“ ir jei tai nepavyksta dėl daugiamačio rakto (pvz., „DataFrame“), rezultatas bus perduotas „DataFrame“ .__ getitem __ ().

Šis metodas naudoja aukščiausio lygio funkciją pandas.eval (), kad įvertintų perduotą užklausą.

Pagal užklausą () metodas pagal numatytuosius nustatymus naudoja šiek tiek pakeistą „Python“ sintaksę. Pavyzdžiui, & amp ir | (bitais) operatoriai turi pirmenybę savo pusbroliams iš būlio ir, ir. Tai yra sintaksiniu požiūriu pagrįstas „Python“, tačiau semantika skiriasi.

Išraiškos semantiką galite pakeisti perduodami raktinio žodžio argumentą parser = 'python'. Tai įgyvendina tą pačią semantiką kaip ir vertinimas „Python“ erdvėje. Taip pat galite perduoti „engine = 'python“, kad įvertintumėte išraišką, naudodami patį „Python“ kaip vidinę programą. Tai nerekomenduojama, nes tai neefektyvu, palyginti su numexpr naudojimu kaip varikliu.

„DataFrame“ egzemplioriaus „DataFrame.index“ ir „DataFrame.columns“ atributai pagal numatytuosius nustatymus dedami į užklausos vardų sritį, o tai leidžia rėmelio rodyklę ir stulpelius laikyti rėmelyje esančiais stulpeliais. Rėmelio indeksui naudojamas identifikatoriaus indeksas. Taip pat galite naudoti indekso pavadinimą norėdami jį identifikuoti užklausoje.

Norėdami gauti daugiau informacijos ir pavyzdžių, peržiūrėkite užklausos dokumentaciją indeksuodami.

Randa linijos tašką arčiausiai „in_point“ ir atstumą tarp tų taškų. Taip pat pateikia informaciją apie tiesės, kurioje yra taškas „in_point“, kraštą ir atstumą išilgai tiesės, kurioje yra artimiausias taškas.

atstumas, tiesa, matas bus procentas

Duomenų rėmo ir kitų elementų pridėjimas (dvejetainis operatoriaus radd).

Lygiavertis kitam + duomenų rėmui, tačiau palaikant užpildymo vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

rangas ( ašis = 0, metodas = „vidutinis“, numeric_only = Nėra, na_option = 'išlaikyti', kylanti = Tiesa, pct = klaidinga ) ¶

Apskaičiuokite skaitinių duomenų eilutes (nuo 1 iki n) išilgai ašies. Vienodoms reikšmėms priskiriamas rangas, kuris yra tų verčių laipsnių vidurkis

  • vidutinis: vidutinis grupės reitingas
  • min .: žemiausias rangas grupėje
  • max: aukščiausias rangas grupėje
  • pirmas: rangai, priskirti pagal masyvą
  • tankus: kaip „min“, tačiau reitingas tarp grupių visada padidėja 1
  • išlaikyti: palikite NA reikšmes ten, kur jos yra
  • viršuje: mažiausias rangas, jei kyla
  • apačioje: mažiausias rangas, jei mažėja

rangai: tas pats tipas kaip skambinantysis

Plaukiojantis duomenų kadrų ir kitų elementų padalijimas (dvejetainis operatorius rtruediv).

Lygiavertis kitam / dataframe, bet palaikant užpildymo_vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

reindex ( etiketės = Nėra, indeksas = Nėra, stulpeliai = Nėra, ašis = nėra, metodas = Nėra, kopija = Tiesa, lygis = Nėra, užpildymo_vertė = nan, riba = Nėra, tolerancija = Nėra ) ¶

Suderinkite „DataFrame“ su nauju indeksu su pasirinktine pildymo logika, pridedant NA / NaN vietose, neturinčiose vertės ankstesniame rodyklėje. Sukuriamas naujas objektas, nebent naujas indeksas yra lygiavertis dabartiniam ir kopija = False

Etiketės: panašios į masyvą, pasirinktinai Naujos etiketės / rodyklė, kad atitiktų „ašimi“ nurodytą ašį. rodyklė, stulpeliai: panašūs į masyvą, neprivalomi (turėtų būti nurodyti naudojant raktinius žodžius) Naujos etiketės / indeksas, kurį reikia atitikti. Pageidautina, kad būtų indekso objektas, kad būtų išvengta duomenų ašių dubliavimo: int arba str, pasirinktinė ašis, į kurią reikia nukreipti. Tai gali būti ašies pavadinimas („rodyklė“, „stulpeliai“) arba skaičius (0, 1). metodas: , neprivaloma

metodas, naudojamas užpildyti skyles „reindexed DataFrame“. Atkreipkite dėmesį: tai taikoma tik „DataFrames“ / serijoms, kurių rodiklis yra monotoniškai didėjantis / mažėjantis.

  • numatytasis: neužpildykite spragų
  • pad / ffill: skleiskite paskutinį galiojantį stebėjimą į kitą galiojantį
  • backfill / bfill: naudokite kitą galiojantį stebėjimą, kad užpildytumėte spragą
  • artimiausias: spragai užpildyti naudokite artimiausius galiojančius stebėjimus

Didžiausias atstumas tarp originalių ir naujų etikečių netikslioms atitikmenims. Indekso reikšmės atitinkančiose vietose labiausiai tenkina abs lygtį (indeksas [indeksuotojas] - tikslas) & lt = tolerancija.

Tolerancija gali būti skaliarinė vertė, taikanti vienodą toleranciją visoms reikšmėms, arba panaši į sąrašą, taikanti kintamą toleranciją vienam elementui. Į sąrašą panašus yra sąrašas, paketas, masyvas, serija ir turi būti tokio pat dydžio kaip indeksas, o jo tipo tipas turi tiksliai atitikti indekso tipą.

Nauja versija 0.21.0 versijoje: (į sąrašą panaši tolerancija)

DataFrame.reindex palaiko dvi skambinimo sutartis

Mes labai rekomenduokite norėdami patikslinti raktinių žodžių argumentus.

Sukurkite duomenų kadrą su keliais išgalvotais duomenimis.

Sukurkite naują indeksą ir iš naujo indeksuokite duomenų rėmelį. Pagal numatytąsias reikšmes naujoje rodyklėje, kurios neturi atitinkamų įrašų duomenų kadre, priskiriama NaN.

Trūkstamas reikšmes galime užpildyti perduodami vertę raktiniam žodžiui fill_value. Kadangi indeksas monotoniškai nedidėja ir nesumažėja, mes negalime naudoti raktinių žodžių metodo argumentų NaN reikšmėms užpildyti.

Taip pat galime perindeksuoti stulpelius.

Arba galime naudoti „ašies stiliaus“ raktinių žodžių argumentus

Norėdami toliau iliustruoti užpildymo funkciją reindex, sukursime duomenų kadrą su monotoniškai didėjančiu indeksu (pavyzdžiui, datų seka).

Tarkime, kad nusprendėme išplėsti duomenų rėmą, kad apimtų platesnę dienų seką.

Indekso įrašai, kurie neturėjo vertės pirminiame duomenų rėmelyje (pavyzdžiui, „2009-12-29“), pagal numatytuosius nustatymus užpildomi NaN. Jei norite, mes galime užpildyti trūkstamas reikšmes naudodami vieną iš kelių variantų.

Pvz., Norėdami pakartotinai išplėsti paskutinę galiojančią reikšmę, kad užpildytumėte NaN reikšmes, „bfill“ kaip argumentą perduokite metodo raktiniam žodžiui.

Atkreipkite dėmesį, kad NaN reikšmė, esanti pradiniame duomenų kadre (indekso verte 2010-01-03), nebus užpildyta jokia vertės skleidimo schema. Taip yra todėl, kad pildant reindeksuojant nežiūrimos į duomenų kadrų reikšmes, o lyginamos tik pradinės ir norimos rodyklės. Jei norite užpildyti NaN reikšmes, esančias pradiniame duomenų kadre, naudokite „fillna“ () metodą.

Daugiau informacijos rasite vartotojo vadove.

reindex_axis ( etikečių, ašis = 0, metodas = Nėra, lygis = Nėra, kopija = Tiesa, riba = Nėra, užpildymo_vertė = nan ) ¶

Suderinkite įvesties objektą su nauju indeksu su pasirinktine pildymo logika, pridedant NA / NaN vietose, neturinčiose vertės ankstesniame rodyklėje. Sukuriamas naujas objektas, nebent naujas indeksas yra lygiavertis dabartiniam ir kopija = False

Etiketės: panašios į masyvą. Naujos etiketės / indeksas, kurį reikia atitikti. Pageidautina indekso objektas, kad būtų išvengta duomenų dubliavimo

  • numatytasis: neužpildykite spragų
  • pad / ffill: skleiskite paskutinį galiojantį stebėjimą į kitą galiojantį
  • užpildymas / užpildymas: naudokite kitą galiojantį stebėjimą, kad užpildytumėte spragą
  • artimiausias: spragai užpildyti naudokite artimiausius galiojančius stebėjimus

Didžiausias atstumas tarp originalių ir naujų etikečių netikslioms atitiktims. Indekso reikšmės atitinkančiose vietose labiausiai tenkina abs lygtį (indeksas [indeksuotojas] - tikslas) & lt = tolerancija.

Tolerancija gali būti skaliarinė vertė, taikanti vienodą toleranciją visoms reikšmėms, arba panaši į sąrašą, taikanti kintamą toleranciją vienam elementui. Į sąrašą panašus yra sąrašas, paketas, masyvas, serija ir turi būti tokio pat dydžio kaip indeksas, o jo tipas turi tiksliai atitikti indekso tipą.

Nauja versija 0.21.0 versijoje: (į sąrašą panaši tolerancija)

reindex_like ( kita, metodas = Nėra, kopija = Tiesa, riba = Nėra, tolerancija = Nėra ) ¶

Grąžinkite sau objektą su atitinkančiais indeksais.

kita: Objekto metodas: eilutė arba Nėra kopijos: loginė reikšmė, numatytoji tikroji riba: int, numatytoji Nėra

Didžiausias atstumas tarp kito objekto ir šio objekto etikečių netikslioms atitiktims. Gali būti panašus į sąrašą.

Nauja versija 0.21.0 versijoje: (į sąrašą panaši tolerancija)

pervardyti ( žemėlapis = Nėra, indeksas = Nėra, stulpeliai = Nėra, ašis = nėra, kopija = Tiesa, vietoje = Klaidinga, lygis = Nėra ) ¶

Funkcijos / dikto reikšmės turi būti unikalios (nuo 1 iki 1). Etiketės, kurių nėra diktante / serijoje, bus paliktos tokios, kokios yra. Pateiktos papildomos etiketės nemeta klaidos.

Daugiau informacijos rasite vartotojo vadove.

žemėlapis, rodyklė, stulpeliai: panašus į diktą ar funkcija, pasirinktinai panašus į diktatą ar funkcijų transformacijos, taikomos tos ašies vertėms. Naudokite arba žemėlapį, ir ašį, kad nurodytumėte ašį, į kurią norite nukreipti žemėlapį, arba rodyklę ir stulpelius. ašis: int arba str, pasirinktina ašis, skirta nukreipti su žemėlapiu. Tai gali būti ašies pavadinimas („rodyklė“, „stulpeliai“) arba skaičius (0, 1). Numatytasis nustatymas yra „indeksas“. kopija: loginė reikšmė, numatytoji teisinga Taip pat nukopijuokite pagrindinius duomenis vietoje: loginė reikšmė, numatytoji klaidinga klaidinga Ar grąžinti naują% (klass) s. Jei teisinga, tada kopijos vertė nepaisoma. level: int arba level name, default Nėra Jei yra „MultiIndex“, pervardykite tik nurodyto lygio etiketes.

DataFrame.rename palaiko dvi skambinimo sutartis

Mes labai rekomenduokite norėdami patikslinti raktinių žodžių argumentus.

Ašies stiliaus parametrų naudojimas

Pakeiskite indekso ar stulpelių pavadinimą.

mapper: skaliarinis, panašus į sąrašą, pasirenkama reikšmė ašies pavadinimo atributui nustatyti.

ašis: int arba eilutė, numatytoji 0 kopija: loginė, numatytoji True

vidinė: loginė, numatytoji klaidinga

pervadinta: skambinančiojo tipas arba Nėra, jei vietoje = Tiesa

Iki versijos 0.21.0 ašies pakeitimui taip pat galima naudoti rename_axis etikečių praleidžiant žemėlapį ar skaliarą. Šis elgesys nebenaudojamas ir būsimoje versijoje bus pašalintas. Vietoj to naudokite pervadinti.

pandos.Series.rename, pandas.DataFrame.rename pandas.Index.rename

Pertvarkykite indekso lygius naudodami įvesties tvarką. Negali nukristi ar pasikartoti lygių

order: int sąrašas arba str sąrašas, nurodantis naujo lygio tvarką. Atskaitos lygis pagal skaičių (vietą) arba pagal raktą (etiketę). ašis: int Kur pertvarkyti lygius.

skambinančiojo tipas (naujas objektas)

pakeisti ( to_replace = Nėra, reikšmė = Nėra, vietoje = klaidinga, riba = Nėra, regex = klaidinga, method = 'pad', ašis = nėra ) ¶

Pakeiskite „to_leplace“ nurodytas reikšmes „value“.

to_replace: str, regex, list, dict, Series, skaitmeniniai arba Nėra

  • str: eilutė, tiksliai atitinkanti_pakeisti, bus pakeista reikšme
  • regex: regexs, atitinkantys_pakeisti, bus pakeisti verte

str, regex arba skaitinis sąrašas:

  • Pirma, jei to_replace ir value yra abu sąrašai, jie turi būti vienodo ilgio.
  • Antra, jei regex = True, tada visos eilutės tiek sąrašai bus aiškinami kaip regexex, kitaip jie tiesiogiai atitiks. Tai neturi didelės reikšmės, nes galite naudoti tik keletą galimų pakaitinių režimų.
  • str ir regex taisyklės taikomos kaip pirmiau.
  • Lizdiniai žodynai, pvz., <’A’: <’b’: nan >>, skaitomi taip: „a“ stulpelyje ieškokite vertės „b“ ir pakeiskite ją nan. Taip pat galite įdėti įprastus posakius. Atminkite, kad stulpelių pavadinimai (aukščiausio lygio žodyno raktai įdėtame žodyne) negali būti reguliariais posakiais.
  • Raktai susiejami su stulpelių pavadinimais, o vertės - su pakaitinėmis vertėmis. Tai galite laikyti specialiu dviejų sąrašų perdavimo atveju, išskyrus tai, kad nurodote stulpelį, kuriame norite ieškoti.
  • Tai reiškia, kad regex argumentas turi būti eilutė, sudaryta reguliarioji išraiška arba tokių elementų sąrašas, dict, ndarray arba Series. Jei vertė taip pat yra None, tada tai turi būti įdėtasis žodynas ar serija.

Kiekvieno iš jų pavyzdžius rasite skyriuje „Pavyzdžiai“.

NDFrame.reindex NDFrame.asfreq NDFrame.fillna

  • Jei „regex“ nėra „Bool“, o „to_replace“ nėra „None“.
  • Jei pakeičiamas yra diktas, o reikšmė nėra sąrašas, diktas, ndarray ar serija
  • Jei to_replace yra Nėra, o regex negalima kompiliuoti į įprastą išraišką arba yra sąrašas, dict, ndarray ar Series.
  • Jei to_pakeisti ir vertė yra sąrašas s arba ndarray s, bet jie nėra vienodo ilgio.
  • Regex pakeitimas atliekamas po gaubtu su re.sub. Re.sub pakeitimo taisyklės yra tos pačios.
  • Reguliarūs posakiai pakeis tik eilutes, o tai reiškia, kad negalite pateikti, pavyzdžiui, reguliaraus posakio, atitinkančio slankiojo kablelio skaičius, ir tikitės, kad rėmo stulpeliai, kurių skaitmeninis tipas yra suderinti. Tačiau jei tie slankiojo kablelio skaičiai yra stygos, tada galite tai padaryti.
  • Šis metodas turi daug variantų. Esate raginami eksperimentuoti ir žaisti su šiuo metodu, kad gautumėte intuiciją apie tai, kaip jis veikia.

Pateiktą duomenų kadrą perprojektuoja į naują koordinačių sistemą.

Patogus dažnio keitimo ir laiko eilučių atrankos metodas. Objektas turi turėti į datetime panašų indeksą (DatetimeIndex, PeriodIndex arba TimedeltaIndex) arba perduoti į datetime panašias reikšmes on arba level raktiniam žodžiui.

taisyklė: įveskite poslinkio eilutę ar objektą, nurodantį tikslinę konversiją

ašis: int, neprivaloma, numatytasis 0 uždarytas:

Jei „DataFrame“ stulpelis naudojamas pakartotinei atrankai, vietoj indekso. Stulpelis turi būti panašus į datos laiką.

„MultiIndex“ lygiui (pavadinimui arba numeriui) naudoti pakartotinę atranką. Lygis turi būti panašus į datos laiką.

Norėdami sužinoti daugiau apie poslinkio eilutes, žr. Šią nuorodą.

Pradėkite kurdami seriją su 9 vienos minutės laiko žymėmis.

Sumažinkite seriją į 3 minučių šiukšliadėžes ir susumuokite laiko žymių, patenkančių į šiukšliadėžę, vertes.

Nurodykite seriją į 3 minučių šiukšliadėžes, kaip nurodyta aukščiau, tačiau pažymėkite kiekvieną šiukšliadėžę naudodami dešinįjį kraštą, o ne kairįjį. Atminkite, kad etiketėje naudojamo segmento vertė nėra įtraukta į etiketę. Pvz., Originalios serijos segmente 2000-01-01 00:03:00 yra 3 reikšmė, tačiau sumuotoje iš naujo atrinkto segmento su etikete 2000-01-01 00:03:00 verte 3 nėra ( jei taip būtų, bendra vertė būtų 6, o ne 3). Norėdami įtraukti šią vertę, uždarykite dešinę šiukšliadėžės intervalo pusę, kaip parodyta pavyzdyje po šiuo.

Nurodykite seriją į 3 minučių šiukšliadėžes, kaip nurodyta aukščiau, bet uždarykite dešinę šiukšliadėžės intervalo pusę.

Peržiūrėkite seriją į 30 sekundžių šiukšliadėžes.

Imkite seriją į 30 sekundžių konteinerius ir užpildykite NaN reikšmes naudodami trinkelių metodą.

Imkite seriją į 30 sekundžių konteinerius ir užpildykite NaN reikšmes naudodami bfill metodą.

Perduokite pasirinktinę funkciją naudodami „Apply“

Jei serijoje yra „PeriodIndex“, raktinių žodžių sutartis gali būti naudojama norint valdyti, ar naudoti taisyklės pradžią, ar pabaigą.

Imkite mėginius pagal mėnesį naudodami „pradžios“ susitarimą. Vertės priskiriamos pirmajam laikotarpio mėnesiui.

Imkite mėginius pagal mėnesį naudodami „pabaigos“ susitarimą. Vertės priskiriamos paskutiniam laikotarpio mėnesiui.

„DataFrame“ objektuose raktinis žodis gali būti naudojamas stulpeliui nurodyti, o ne indeksui iš naujo atrinkti.

„DataFrame“ su „MultiIndex“ atveju raktinio žodžio lygį galima naudoti norint nurodyti pakartotinį atrankos lygį.

Jei naudojate „DataFrame“ su daugiapakopiu indeksu, grąžinkite naują „DataFrame“ su žymėjimo informacija stulpeliuose po indekso pavadinimais, pagal numatytuosius nustatymus - „level_0“, „level_1“ ir kt., Jei jų nėra. Standartiniam indeksui bus naudojamas indekso pavadinimas (jei jis nustatytas), priešingu atveju bus naudojamas numatytasis „index“ arba „level_0“ (jei „index“ jau yra paimtas).

lygis: int, str, tuple arba list, numatytasis Nėra. Pašalinkite tik nurodytus lygius iš indekso. Pašalina visus lygius pagal numatytąjį kritimą: loginė reikšmė, numatytoji klaidinga Negalima bandyti įterpti rodyklės į duomenų kadrų stulpelius. Tai grąžina indeksą į numatytąjį sveiko skaičiaus indeksą. inplace: Boolean, numatytasis Neteisingas Pakeiskite DataFrame vietoje (nekurkite naujo objekto) col_level: int arba str, numatytasis 0 Jei stulpeliai turi kelis lygius, nustatoma, į kurį lygį įterpiamos etiketės. Pagal numatytuosius nustatymus jis įterpiamas į pirmąjį lygį. col_fill: object, default ‘’ Jei stulpeliai turi kelis lygius, nustatoma, kaip pavadinami kiti lygiai. Jei nėra, indekso pavadinimas kartojamas.

Kai mes iš naujo nustatome indeksą, senas indeksas pridedamas kaip stulpelis ir naudojamas naujas nuoseklus indeksas:

Mes galime naudoti kritimo parametrą, kad išvengtume seno indekso pridėjimo kaip stulpelio:

Taip pat galite naudoti „reset_index“ su „MultiIndex“.

Jei indeksas turi kelis lygius, galime iš naujo nustatyti jų pogrupį:

Jei mes nenumetame indekso, pagal numatytuosius nustatymus jis yra aukščiausiojo lygio. Mes galime jį išdėstyti kitame lygyje:

Kai indeksas įterpiamas po kitu lygiu, galime nurodyti, kuris iš jų turi parametrą col_fill:

Jei nurodome neegzistuojantį col_fill lygį, jis sukuriamas:

Duomenų rėmo ir kitų elementų dalijimasis sveiku skaičiumi (dvejetainis operatorius rfloordiv).

Lygiavertis kitam // dataframe, bet palaikant užpildymo_vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

Duomenų kadro modulis ir kiti elementai (dvejetainis operatorius rmod).

Lygiavertis kitiems% dataframe, bet palaikant užpildymo_vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

Duomenų rėmelio ir kitų elementų dauginimas (dvejetainis operatorius rmul).

Lygiavertis kitiems * duomenų rėmeliams, tačiau palaikant užpildymo vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

riedėjimas ( langas, min_periods = Nėra, dažnis = Nėra, centras = klaidingas, win_type = Nėra, on = Nėra, ašis = 0, uždaryta = nėra ) ¶

Pateikia riedančio lango skaičiavimus.

Judančio lango dydis. Tai yra stebėjimų, naudojamų statistikai apskaičiuoti, skaičius. Kiekvienas langas bus fiksuoto dydžio.

Jei tai yra poslinkis, tai bus kiekvieno lango laikotarpis. Kiekvienas langas bus kintamo dydžio, atsižvelgiant į stebėjimus, įtrauktus į laikotarpį. Tai galioja tik datetimelike panašiems indeksams. Tai nauja 0.19.0 versijoje

min_periods: int, numatytasis Nėra Minimalus stebėjimų skaičius lange, reikalingas reikšmei (kitaip rezultatas yra NA). Lango, kurį nurodo poslinkis, numatytoji reikšmė bus 1. freq: string arba objektas DateOffset, pasirinktinis (numatytasis Nėra)

Nebenaudojama nuo 0.18.0 versijos: dažnis, pagal kurį duomenys turi atitikti prieš skaičiuojant statistiką. Nurodyta kaip dažnio eilutė arba objektas „DateOffset“.

Padarykite intervalą uždarytą taškuose „dešinė“, „kairė“, „abu“ arba „nei vienas“. Kompensuojamiems langams numatytasis nustatymas yra „dešinė“. Jei tai yra fiksuoti langai, pagal numatytuosius nustatymus yra „abu“. Likę atvejai neįdiegti fiksuotiems langams.

ašis: int arba eilutė, numatytasis 0

langas arba „Rolling“, priskirtas tam tikrai operacijai

Slenkanti suma, kurios lango ilgis yra 2, naudojant lango „trikampis“ tipą.

Slenkanti suma, kai lango ilgis yra 2, min_periods pagal numatytuosius nustatymus yra lango ilgis.

Tas pats, kas aukščiau, bet aiškumas nustato min_periods

Nešvarus (tai reiškia, kad dažnas nėra įprastas) laiko indeksuotas „DataFrame“

Kontrastuojant su sveikojo skaičiaus slenkamuoju langu, bus rodomas kintamo ilgio langas, atitinkantis laikotarpį. Min_periods numatytasis nustatymas yra 1.

Pagal numatytuosius nustatymus rezultatas nustatomas dešiniajame lango krašte. Tai galima pakeisti į lango centrą nustatant centras = True.

Raktinis raktinis žodis naudojamas tam, kad laiko eilutės duomenys atitiktų nurodytą dažnumą, iš naujo imant duomenis. Tai daroma naudojant numatytuosius resample () parametrus (t. Y. Naudojant vidurkį).

Norėdami sužinoti daugiau apie poslinkius ir dažnio eilutes, žiūrėkite šią nuorodą.

Pripažinti win_types yra:

  • sunkvežimis
  • trikampis
  • juodas vyras
  • kumpis
  • bartletas
  • parzenas
  • bohmanas
  • blackmanharris
  • riešutinė
  • Bartanas
  • kaiseris (reikia beta versijos)
  • gaussianas (reikia standartinio)
  • general_gaussian (reikia galios, pločio)
  • slepianas (reikia pločio).

Suapvalinkite „DataFrame“ iki kintamo skaičiaus dešimtųjų.

Eksponentinė duomenų kadrų ir kitų elementų galia (dvejetainis operatorius rpow).

Lygiavertis kitiems ** duomenų rėmeliams, tačiau palaikant užpildymo vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

Duomenų kadrų ir kitų elementų atėmimas (dvejetainis operatorius rsub).

Lygiavertis kitam - „dataframe“, bet palaikant užpildymo_vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

rtruediv ( kita, ašis = 'stulpeliai', lygis = Nėra, fill_value = Nėra ) ¶

Plaukiojantis duomenų kadrų ir kitų elementų padalijimas (dvejetainis operatorius rtruediv).

Lygiavertis kitam / dataframe, bet palaikant užpildymo_vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

pavyzdys ( n = nėra, frac = Nėra, pakeisti = klaidinga, svoriai = Nėra, random_state = Nėra, ašis = nėra ) ¶

Pateikia atsitiktinę elementų imtį iš objekto ašies.

n: int, neprivaloma Elementų skaičius nuo ašies iki grąžinimo. Negalima naudoti su frac. Numatytasis = 1, jei frac = Nėra. frac: plūduriuojantis, neprivaloma grąžinti ašies elementų dalis. Negalima naudoti su n. pakeisti: loginis, neprivalomas mėginys su pakeitimu arba be jo. Numatytasis = klaidingas. svoriai: į str ar ndarray panašūs, pasirinktinai Numatytasis „Nėra“ lemia vienodą tikimybės svertį. Jei bus išlaikyta serija, bus sulygiuojama su indekso objektu. Svorio, kurio nėra atrinktame objekte, indekso reikšmės bus ignoruojamos, o atrinkto objekto, kurio svoris nėra svoris, indekso reikšmės bus priskirtos nuliui. Jei iškviečiamas „DataFrame“, jis priims stulpelio pavadinimą, kai ašis = 0. Jei svoriai nėra serija, svoriai turi būti tokio pat ilgio, kaip ir ašis, iš kurios atrenkama. Jei svoriai nesumuoja iki 1, jie bus normalizuoti taip, kad būtų susumuoti į 1. Trūkstamos reikšmės stulpelių svoriai bus traktuojamos kaip nulis. inf ir -inf reikšmės neleidžiamos. random_state: int arba numpy.random.RandomState, pasirinktinis atsitiktinių skaičių generatoriaus sėkla (jei int) arba objpy numpy RandomState. ašis: int arba eilutė, pasirenkama ašis. Priima ašies numerį ar pavadinimą. Numatytoji yra nurodyto duomenų tipo stat ašis (0 - „Series“ ir „DataFrame“, 1 - skydams).

Naujas to paties tipo objektas kaip skambinantysis.

Sugeneruokite „Series“ ir „DataFrame“ pavyzdžius:

Tada ištraukite atsitiktinę abiejų šių objektų imtį ...

3 atsitiktiniai elementai iš serijos:

Ir atsitiktinai 10% „DataFrame“ su pakeitimu:

Pateikia eilutę tarp pradžios ir pabaigos matų. Panašus į „Polyline.positionAlongLine“, bet grąžins linijos atkarpą tarp dviejų linijos taškų, o ne vieno taško.

fiksuotų vienetų arba santykiu. Jei „Tiesa“, pradžios_pabaiga ir pabaigos_matavimas naudojamos procentais, jei klaidinga, pradžios_pabaiga ir pabaigos_matavimas naudojamos kaip atstumas. Procentų atžvilgiu priemonės turėtų būti išreikštos dvigubai nuo 0,0 (0 proc.) Iki 1,0 (100 proc.).

Grąžinti duomenis, atitinkančius ašių etikečių atitikimo kriterijus

NEDRAUKTA: naudokite df.loc [df.index.map (crit)], jei norite pasirinkti per etiketes

crit: funkcija Turi būti iškviesta kiekvienoje rodyklėje (etiketėje). Turėtų grįžti teisinga arba klaidinga

pasirinkimas: skambinančiojo tipas

select_by_location ( kita, match_only = Tiesa ) ¶

Pagal nurodytą geometriją parenka visas tam tikros „SpatialDataFrame“ eilutes

kita: arcpy. Geometrijos objektas tik_ tik: loginė reikšmė, jei tiesa, bus tik suderinti įrašai

Grąžinkite „DataFrame“ pogrupį, įtraukiant / neįtraukiant stulpelių pagal jų tipą.

  • Jei abu įtraukti ir neįtraukti yra tušti
  • Jei įtraukite ir išskirkite, turite sutampančių elementų
  • Jei bet kokios rūšies eilutė dtype yra perduodama.
  • Norėdami pasirinkti visus skaitinis tipai naudoja numpy dtype numpy.number
  • Norėdami pasirinkti eilutes, turite naudoti objektą dtype, tačiau atkreipkite dėmesį, kad tai grįš visi objekto tipo tipai
  • Žr. Numpy dtype hierarchiją
  • Norėdami pasirinkti datos laiką, naudokite „np.datetime64“, „datetime“ arba „datetime64“
  • Norėdami pasirinkti „timedeltas“, naudokite „np.timedelta64“, „timedelta“ arba „timedelta64“
  • Norėdami pasirinkti „Pandas“ kategorinius tipus, naudokite „category“
  • Norėdami pasirinkti „Pandas datetimetz“ tipus, naudokite „datetimetz“ (naujas 0.20.0 versijoje) arba „datetime64 [ns, tz]“ eilutę

Pateikti nenumatytą vidutinę vidutinę paklaidą virš prašomos ašies.

Pagal numatytuosius nustatymus normuojama pagal N-1. Tai galima pakeisti naudojant argumentą ddof

ašis: skipna: loginė reikšmė, numatytoji tiesa

sem: serija arba „DataFrame“ (jei nurodytas lygis)

Grąžinkite vieną ribojantį langelį (xmin, ymin, xmax, ymax) visoms geometrijoms

Tai yra nuoroda, norint atskirai apskaičiuoti min / max x ir y ribas.

Priskirkite norimą indeksą tam tikrai ašiai

label: list-like arba Index Naujojo indekso reikšmės

ašis: int arba eilutė, numatytasis 0 vietoje: loginė reikšmė, numatytoji Nėra

Ar grąžinti naują NDFrame egzempliorių.

ĮSPĖJIMAS: „inplace“ = Niekas šiuo metu negrįžta į „True“, bet būsimoje versijoje numatytoji reikšmė yra „False“. Naudokite inplace = True aiškiai, o ne pasikliaukite numatytuoju.

Naujas 0.21.0 versijoje: parašas turi atitikti likusią API dalį. Anksčiau argumentai „ašis“ ir „etiketės“ ​​buvo atitinkamai pirmasis ir antrasis poziciniai argumentai.

Nustatykite „SpatialDataFrame“ geometriją naudodami esamą stulpelį arba nurodytą įvestį. Pagal numatytuosius nustatymus gaunamas naujas objektas.

Originalus geometrijos stulpelis pakeičiamas įvestimi.

Parametrai: col: stulpelio etiketė arba masyvo lašas: loginė reikšmė, numatytoji True

set_index ( raktai, kritimas = Tiesa, pridėti = klaidinga, vietoje = klaidinga, patikrinti_integritumas = klaidinga ) ¶

Nustatykite „DataFrame“ indeksą (eilučių etiketes) naudodami vieną ar daugiau esamų stulpelių. Pagal numatytuosius nustatymus gaunamas naujas objektas.

raktai: stulpelio etiketė arba stulpelių etikečių / masyvų sąrašas: loginė, numatytoji tiesa

Nustatykite, kad indeksas taptų „mėnesio“ stulpeliu:

Sukurkite kelis indeksus naudodami stulpelius „metai“ ir „mėnuo“:

Sukurkite kelis indeksus naudodami verčių rinkinį ir stulpelį:

Įveskite vieną vertę į išlaikytą stulpelį ir indeksą

Nebenaudojama nuo 0.21.0 versijos.

Prašome naudoti .at [] arba .iat [] prieigą.

rodyklė: eilutės etiketė col: stulpelio etiketės vertė: skaliarinė reikšmė: interpretuoti indeksą / koloną kaip indeksuotojus, numatytoji klaidinga

rėmas: „DataFrame“ Jei yra etikečių pora, tai bus nuoroda į „DataFrame“ iškvietimą, kitaip - nauja objekto forma ¶

Grąžinkite „DataFrame“ matmenų vaizdą.

Perkelti indeksą pagal norimą periodų skaičių su pasirinktinu laiko dažniu

periodai: int Perkeliamų laikotarpių skaičius, gali būti teigiamas arba neigiamas dažnis: DateOffset, timedelta arba laiko taisyklių eilutė, neprivalomas prieaugis, kurį reikia naudoti iš „tseries“ modulio arba laiko taisyklės (pvz., „EOM“). Žr. Pastabas.

Jei nurodomas dažnis, indekso reikšmės perkeliamos, bet duomenys nėra pertvarkomi. Tai yra, naudokite dažnį, jei norite išplėsti indeksą, kai keičiate ir išsaugote pradinius duomenis.

elementų skaičius NDFrame

iškreipti ( ašis = nėra, skipna = Nėra, lygis = Nėra, numeric_only = Nėra, ** kwargs ) ¶

Grąžinkite objektyvų kreivumą per prašomą ašį. Normalizuotas N-1

ašis: skipna: loginė reikšmė, numatytoji tiesa

iškreipimas: serija arba „DataFrame“ (jei nurodytas lygis)

Tolygus poslinkiui nekopijuojant duomenų. Į perkeltus duomenis nebus įtraukti nukritę periodai, o perkelta ašis bus mažesnė už originalą.

periodai: int Periodų skaičius judėti, gali būti teigiamas arba neigiamas

Nors „slice_shift“ yra greitesnis nei „shift“, galite sumokėti už jį vėliau derindami.

perkeltas: tas pats tipas kaip skambinantysis

Grąžina naują tašką, pagrįstą in_point, užfiksuotu šia geometrija.

Rūšiuoti objektą pagal etiketes (išilgai ašies)

ašis: rodyklė, stulpeliai iki tiesioginio rūšiavimo lygio: int arba lygio pavadinimas, intų sąrašas arba lygių pavadinimų sąrašas

rūšiuoti_values ​​( pateikė, ašis = 0, kylanti = Tiesa, vietoje = klaidinga, kind = „greitasis pasirinkimas“, na_position = 'paskutinis' ) ¶

Rūšiuoti pagal reikšmes išilgai bet kurios ašies

ATŠAUKTAS: naudokite DataFrame.sort_index ()

Rūšiuoti daugiapakopį indeksą pagal pasirinktą ašį ir pirminį lygį. Duomenys bus leksikografiškai rūšiuojami pagal pasirinktą lygį, po kurio eina kiti lygiai (tvarka)

lygis: int ašis: <0 arba „rodyklė“, 1 arba „stulpeliai“>, numatytasis 0 didėjantis: loginė, numatytoji tikroji vieta: loginė, numatytoji klaidinga

Geometrijos erdvinė nuoroda.

Išspauskite 1 ilgio matmenis.

ašis: nėra, sveikasis skaičius arba eilutės ašies pavadinimas, neprivaloma

Ašis išspausti, jei 1 dydžio.

skaliarinis, jei 1 dydžio, kitas originalus objektas

Sukite (galbūt hierarchinių) stulpelių etikečių lygį, grąžindami „DataFrame“ (arba „Series“, jei objektas turi vieną stulpelių etikečių lygį), turintį hierarchinį indeksą su nauju vidiniu viršutiniu eilučių etikečių lygiu. Atitinkamas lygis bus automatiškai rūšiuojamas.

lygis: int, eilutė arba jų sąrašas, numatytasis paskutinis (-iai) lygis (-ai), kurį (-ie) sukraunate, gali perduoti lygio pavadinimą dropna: loginė, numatytoji tiesa

sukrauti: „DataFrame“ arba „Series“

Grąžinkite mėginio standartinį nuokrypį virš prašomos ašies.

Pagal numatytuosius nustatymus normuojama pagal N-1. Tai galima pakeisti naudojant argumentą ddof

ašis: skipna: loginė reikšmė, numatytoji tiesa

standartinis: serija arba „DataFrame“ (jei nurodytas lygis)

Nuosavybė, grąžinanti „Styler“ objektą, kuriame yra metodų, kaip sukurti stiliaus „HTML“ vaizdą „DataFrame“.

Duomenų kadrų ir kitų elementų atėmimas (dvejetainis operatoriaus poskyris).

Lygiavertis duomenų rėmui - kitas, tačiau palaikant užpildymo vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

atimti ( kita, ašis = 'stulpeliai', lygis = Nėra, fill_value = Nėra ) ¶

Duomenų kadrų ir kitų elementų atėmimas (dvejetainis operatoriaus poskyris).

Lygiavertis duomenų rėmui - kitas, tačiau palaikant užpildymo vertę, jei trūksta duomenų viename iš įvesties.

kita: serija, „DataFrame“ arba pastovi ašis:

Neatitinkantys indeksai bus sujungti

Grąžinkite prašomos ašies verčių sumą

ašis: skipna: loginė reikšmė, numatytoji tiesa

suma: serija arba „DataFrame“ (jei nurodytas lygis)

Tinkamai pakeiskite ašis ir apsikeitimo vertės ašis

Pakeiskite i ir j lygius „MultiIndex“ tam tikroje ašyje

i, j: int, eilutė (galima maišyti) Keičiamo indekso lygis. Gali perduoti lygio pavadinimą kaip eilutę.

sukeista: skambinančiojo tipas (naujas objektas)

Pakeista 0.18.1 versijoje: Dabar indeksai i ir j yra neprivalomi ir pagal nutylėjimą yra du vidiniai indekso lygiai.

Sukuria geometriją, kuri yra dviejų geometrijų jungtis atėmus tų geometrijų pjūvį. Dvi įvesties geometrijos turi būti vienodo formos. Parametrai:

n: int, numatytasis 5 Eilučių, kurias reikia pasirinkti, skaičius. obj_tail: skambinančiojo tipas Paskutinės n skambinančiojo objekto eilutės. imti ( indeksai, ašis = 0, konvertuoti = Nėra, is_copy = Tiesa, ** kwargs ) ¶

Grąžinkite pateiktame elemente pozicinis indeksai išilgai ašies.

Tai reiškia, kad mes neindeksuojame pagal faktines reikšmes objekto indekso atribute. Indeksuojame pagal faktinę elemento padėtį objekte.

indeksai: panašūs į masyvą Intų masyvas, nurodantis, kurias pozicijas reikia užimti. ašis: int, numatytasis 0 Ašis, ant kurios reikia pasirinkti elementus. „0“ reiškia, kad mes pasirenkame eilutes, „1“ reiškia, kad mes pasirenkame stulpelius ir kt. Convert: Bool, default True

Nebenaudojama nuo versijos 0.21.0: Ateityje neigiami indeksai visada bus konvertuojami.

Ar konvertuoti neigiamus indeksus į teigiamus. Pavyzdžiui, -1 susietų su len (ašimi) - 1. Konversijos yra panašios į įprasto „Python“ sąrašo indeksavimo veiksmus.

is_copy: „Bool“, numatytasis „True“ - ar grąžinti originalaus objekto kopiją, ar ne.

Paimkite elementus 0 ir 3 pozicijose išilgai ašies 0 (numatytasis nustatymas).

Atkreipkite dėmesį, kaip pasirinkti faktiniai indeksai (0 ir 1) neatitinka mūsų pasirinktų indeksų 0 ir 3. Taip yra todėl, kad mes pasirenkame 0 ir 3 eilutes, o ne eilutes, kurių indeksai lygūs 0 ir 3.

Paimkite elementus prie 1 ir 2 indeksų išilgai 1 ašies (stulpelių pasirinkimas).

Mes galime paimti elementus, naudodami neigiamus sveikuosius skaičius teigiamiems indeksams, pradedant nuo objekto pabaigos, kaip ir naudojant „Python“ sąrašus.

Bandymas įrašyti objekto teksto atvaizdavimą į sistemos iškarpinę. Tai galima įklijuoti, pavyzdžiui, į „Excel“.

„excel“: „Boolean“, pagal numatytuosius nustatymus yra „True“, jei „True“, naudokite pateiktą skyriklį, rašydami csv formatu, kad būtų galima lengvai įklijuoti į „Excel“. jei klaidinga, parašykite objekto eilutės vaizdą į mainų sritį

sep: neprivaloma, pagal numatytuosius nustatymus kiti raktiniai žodžiai perduodami to_csv

Parašykite „DataFrame“ į kableliais atskirtų reikšmių (csv) failą

path_or_buf: eilutė arba failo rankena, numatytoji None Failo kelias ar objektas, jei None yra pateiktas, rezultatas grąžinamas kaip eilutė. sep: simbolis, numatytasis ‘,’ Išvesties failo lauko ribotuvas. na_rep: string, default ‘’ Trūksta duomenų reprezentacijos float_format: string, default Nėra Formatuoti eilutę slankiojo kablelio skaičių stulpeliams: seka, pasirinktinai Stulpeliai antraštei rašyti: loginė arba eilutės sąrašas, numatytasis True Išrašykite stulpelių pavadinimus. Jei pateikiamas eilučių sąrašas, manoma, kad tai yra stulpelių pavadinimų indekso slapyvardžiai: loginė reikšmė, numatytasis „True Write“ eilutės pavadinimai (indeksas) indekso etiketė: eilutė arba seka, arba „False“, pagal numatytuosius nustatymus Nėra stulpelio etiketės indekso stulpeliams . Jei nenurodoma Nėra, o antraštė ir rodyklė yra teisingi, tada naudojami indeksų pavadinimai. Jei DataFrame naudoja „MultiIndex“, reikia pateikti seką. Jei klaidinga, nespausdinkite indeksų pavadinimų laukų. Norėdami lengviau importuoti R režimu, naudokite index_label = False: „str Python“ rašymo režimas, numatytasis „w“ kodavimas: eilutė, neprivaloma Eilutė, žyminti išvesties faile naudojamą kodavimą, pagal numatytuosius nustatymus „ascii“ „Python 2“ ir „utf-8“ „on Python 3. compression: string, neprivaloma eilutė, atspindinti suspaudimą, kurį reikia naudoti išvesties faile, leidžiamos reikšmės yra„ gzip “,„ bz2 “,„ xz “, naudojamos tik tada, kai pirmasis argumentas yra failo vardas line_terminator: string, numatytasis ' n' Naujos eilutės simbolis arba simbolių seka, naudojama išvesties faile, cituojant: pasirenkama konstanta nuo csv modulio pagal numatytuosius nustatymus iki csv.QUOTE_MINIMAL. Jei nustatėte „float_format“, plūdės paverčiamos eilutėmis, todėl csv.QUOTE_NONNUMERIC jas traktuos kaip ne skaitmeninę kabučių eilutę: eilutė (ilgis 1), numatytasis simbolis „& quot“, naudojamas laukams cituoti doublequote: boolean, numatytasis True Control kabučių lauks lauke escapechar: eilutė (ilgis 1), numatytasis Nėra simbolio, naudojamo norint išvengti sep ir quotechar, kai reikia chunksize: int arba Nėra eilučių, kad būtų galima rašyti vienu metu tupleize_cols: boolean, default False

Nebenaudojama nuo versijos 0.21.0: Šis argumentas bus pašalintas ir kiekvieną daugialypio indekso eilutę visada parašys kaip atskirą eilutę CSV faile.

Parašykite „MultiIndex“ stulpelius kaip rinkinių sąrašą (jei teisinga) arba nauju išplėstiniu formatu, kur kiekvienas „MultiIndex“ stulpelis yra CSV eilutė (jei klaidinga).


Jūsų pagrindinė kilpa gali būti tik:

Kito visai nereikia, nes jūs nieko nedarote, jei aš nesu keista.

Be to, visiškai nereikia dviejų sąrašų. Pakanka tik vieno:

Tada likusi programos dalis yra tokia, kokią ją parašėte.

Tai sprendimas, kuriame nenaudojami sąrašai, o įvestis pereinama tik vieną kartą.

Vienas kitas nedidelis pakeitimas, kurį galėtumėte padaryti, būtų tik ciklo diapazonas, kiek kartų norite paprašyti vartotojo pateikti duomenis:

Nereikia kurti papildomo kintamojo ir jo čia didinti.

Mano 2c: nors aš taip gerai nepažįstu „Python“ sintaksės, pateikiame optimizavimo idėją, kuri būtų svarbesnė, atsižvelgiant į (daug) didesnį duomenų rinkinį.

Jums visiškai nereikia jokių sąrašų. Kilpos išorėje paskelbkite „maksimalų nelyginį“ kintamąjį, kuris iš pradžių lygus -1. Kilpos viduje, kai tik įvedamas skaičius, jei jis nelyginis ir didesnis už maximumOdd, tada nustatykite maximumOdd, lygų šiam skaičiui. Tam beveik nereikia atminties, o sudaryti sąrašą ir paskui jį operuoti atmintyje linijiškai (nėra gerai).