Questions marquées [pandas-groupby]

2 votes
0 réponses
Problème de performance pendant groupby.shift
Code de test: SIZE_MULT = 5 data = np.random.randint(0, 255, size=10**SIZE_MULT, dtype='uint8') index = pd.MultiIndex.from_product(...
a demandé il y a 4 mois
1 votes
1 réponses
garder le deuxième niveau du multi-index intact pendant le tri sur le premier pandas python
J'ai trié mon premier niveau d'index en utilisant la méthode suivante: Fonction de tri personnalisé pour groupby pandas python def my_func(g...
a demandé il y a 4 mois
0 votes
2 réponses
Fonction de tri personnalisé pour groupby pandas python
Supposons que j'ai une base de données groupée comme celle ci-dessous (obtenue via un fichier initial df.groupby(df["A"]).apply(some_func), où 0...
a demandé il y a 4 mois
0 votes
1 réponses
Calculer le pourcentage d’augmentation ou de diminution en fonction de la colonne précédente de la même ligne dans la base de données pandas
Mon cadre de données comporte 20 colonnes et plusieurs lignes. Je souhaite calculer l’augmentation ou la diminution en pourcentage en fonction d...
a demandé il y a 4 mois
1 votes
0 réponses
Autocorrélation avec Groupby à Pandas
J'utilise Python pour traiter un jeu de données de panel. Le cadre de données ressemble à stock date time spread VOD 01-01...
a demandé il y a 4 mois
2 votes
4 réponses
Pandas, obtenez les premier, deuxième et troisième auteurs préférés pour chaque utilisateur
J'ai une base de données pandas de la forme userID author_cat vote 234 1246 5.0 121 2954 3.2 234...
a demandé il y a 4 mois
1 votes
1 réponses
Comment compter et marquer l'occurrence d'une séquence d'une valeur dans une trame de données pandas?
Je souhaite créer une colonne C (basée sur B) qui compte chaque début de série à partir de '100' dans B. Je dispose du bloc de données de pandas...
a demandé il y a 4 mois
0 votes
1 réponses
créer une matrice avec deux bases de données - des pandas?
J'ai deux données, une avec des colonnes: df1 = ID As Hs Ts A A_1 A_6 A_7...
a demandé il y a 4 mois
0 votes
1 réponses
Comment résoudre ce «TypeError: élément de séquence 0: instance attendue str, float trouvé»
J'essaie de combiner les valeurs de cellule (chaînes) dans une colonne de structure de données à l'aide de la méthode groupby, en séparant les v...
a demandé il y a 4 mois
0 votes
0 réponses
Comment diviser des données en groupes et appliquer un filtre [dupliquer]
J'ai le jeu de données Yelp et je souhaite compter tous les avis ayant plus de 3 étoiles. Je reçois le nombre d'avis en faisant ceci: reviews....
a demandé il y a 4 mois
0 votes
2 réponses
Comment grouper les pandas dans une colonne et filtrer la structure de données en fonction des valeurs uniques minimales d'une autre colonne?
J'ai un cadre de données qui ressemble à ceci: CP AID type 1 1 b 1 2 b 1 3 a 2 4 a 2 4 b 3 5...
a demandé il y a 4 mois
1 votes
0 réponses
Comment créer une fenêtre et un mode de recherche pour une fenêtre créée dans des pandas (mode Agrégat, Fenêtre et Recherche)
J'ai un cadre de données (df) comme celui-ci: cpt units 36430 2 36440 5 36450 10 36430 1 36440 5 36450 10 36430 2 36440 6...
a demandé il y a 4 mois
2 votes
2 réponses
Création d'une nouvelle colonne et affectation de valeurs si l'une des lignes d'un groupe contient une certaine valeur
J'essaie d'attribuer des valeurs à une nouvelle colonne pour chaque groupe du groupe en fonction de: si l'une des lignes d'un groupe contient un...
a demandé il y a 4 mois
3 votes
2 réponses
Comment combiner des chaînes connectées au sein de pandas groupby [duplicate]
     Cette question a déjà une réponse ici:                   Comment faire la synthèse sur différentes combinaisons de groupby?         ...
a demandé il y a 4 mois
0 votes
1 réponses
Existe-t-il un moyen de localiser les n premiers éléments d’un groupe en
Besoin d'extraire l'attribut des n premiers éléments d'un cadre de données de pandas les données d'entrée sont comme ci-dessous KEY var...
a demandé il y a 4 mois
1 votes
1 réponses
numpy.vstack en tant qu'agrégateur dans un groupe de pandas
J'ai un cadre de données sur les pandas: d = {'group' : [1, 1, 2, 2], 'histogram' : [[1,2,3], [4,5,6], [7,8,9],[10,11,12]]} df = pd.DataFrame(...
a demandé il y a 4 mois
1 votes
1 réponses
Créer une colonne conditionnelle dans les pandas
J'essaie de créer une colonne conditionnelle dans les pandas. Voici à quoi ressemble le cadre de données. data = [{"owner" : "john", "dog"...
a demandé il y a 4 mois
1 votes
2 réponses
Rangées combinées lors de la tentative d'affichage de la première instance de données groupées
J'essaie de montrer la première ligne par groupe (dans ce cas, Car est le groupe). Lorsque j'essaie de faire cela avec les données ci-dessous, c...
a demandé il y a 4 mois
-2 votes
1 réponses
Parcours de groupes de pandas d'objets
J'ai besoin d'aide pour résoudre un gros problème de pandas. Alors que beaucoup de gens ont demandé à avoir la vraie contribution et la vraie...
a demandé il y a 4 mois
0 votes
0 réponses
Après les pandas, les noms des colonnes ne sont pas au même niveau [dupliquer]
J'ai le cadre de données Pandas suivant: In [8]: dfalph.head() Out[8]: token year uses books 386 xanthos 1830...
a demandé il y a 4 mois
0 votes
0 réponses
Comment rendre plus efficace la boucle itérative d'accès aux éléments du groupe Pandas?
J'utilise une boucle for pour accéder à des éléments groupés, effectuer des calculs, les sauvegarder et les répéter. L'exemple de code ci-dessou...
a demandé il y a 4 mois
2 votes
3 réponses
meilleure façon d'utiliser groupby ou agrégé dans les pandas
J'ai une table appelée clients et je veux montrer combien de fois quelqu'un a enregistré ou acheté un article en fonction de l'ID utilisateur....
0 votes
2 réponses
json structre imbriqué personnalisé avec différents ensembles
Je suis nouveau au python et les pandas ont un fichier csv avec .----.---------.-------.-------------------.-------------------.--------------...
a demandé il y a 4 mois
0 votes
1 réponses
Filtrage des images de données Pandas après groupby avec des séries temporelles irrégulières
J'ai un DataFrame avec une série chronologique indexée par un horodatage, comme ceci: timestamp A B 2018-11-12 14:03:53...
a demandé il y a 4 mois
0 votes
3 réponses
Comment calculer les valeurs moyennes de chaque âge conformément aux valeurs d'une autre colonne dans les pandas
Je cherche un moyen d'obtenir l'état matrimonial moyen de chaque âge: Par exemple, pour les personnes âgées de 34 ans, l’état martial médian...