Questions marquées [pandas]

1 votes
1 réponses
Comment extraire des données de la hiérarchie salesforce ordereddict à l'aide de Python & Pandas
Résumé En bref, je dois extraire les données d’une série de pandas contenant des ordres individuels. Jusqu'à présent, les progrès ont été b...
a demandé il y a 3 mois
1 votes
4 réponses
positionne ou déplace la colonne de pandas vers un index de colonne spécifique
J'ai cherché sur Google mais je n'arrive pas à trouver la réponse à cette question. Peut-être que je pose la question de la mauvaise façon? J...
a demandé il y a 3 mois
-1 votes
0 réponses
Existe-t-il un moyen de voir la taille d'une requête bq_helper avant de l'exécuter?
Je travaille avec un grand ensemble de données (~ 180 Go) et je me demande si je peux voir la taille (en Go) d'une requête avant de l'exécuter?...
a demandé il y a 3 mois
3 votes
3 réponses
Fonction sur les lignes de données pour réduire les paires en double Python
J'ai un cadre de données qui ressemble à: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 13...
a demandé il y a 3 mois
0 votes
1 réponses
Comment joindre les prévisions avec le test de données d'entrée dans sklearn
Je souhaite associer les prévisions d’un modèle aux données d’entrée utilisées par sklearn en Python. Le code est x_train, x_test, y_train, y_...
a demandé il y a 3 mois
1 votes
1 réponses
Remplacer le jeu de valeurs en double par NaN
Si j'avais les données suivantes: +---------------+---------------------+---------------------+----------+--------------+ | email | da...
a demandé il y a 3 mois
-1 votes
0 réponses
Comment calculer dynamiquement les rangs entre deux images?
J'ai deux cadres de données: une avec les classements en centiles de chaque groupe pour plusieurs périodes https://drive.google.com/file/d/14RP...
a demandé il y a 3 mois
0 votes
2 réponses
Extraire les lignes de la base de données pandas correspondant à la liste des mois-jours
Cela a dû être demandé auparavant, mais je ne trouvais pas ce que je cherchais. Je m'excuse si cela fait double emploi. J'ai une base de données...
a demandé il y a 3 mois
0 votes
2 réponses
Nettoyage Sans nom: 0, Sans nom: Fonction des colonnes d'index 1
J'ai un tas de jeux de données avec une colonne d'index supplémentaire appelée "Sans nom: 0", "Sans nom: 1", etc. et je souhaite créer une fonct...
a demandé il y a 3 mois
-1 votes
2 réponses
Comment donner une valeur booléenne pour décider si mon horodatage est un jour férié et le week-end ou non dans Dataframe en python
J'ai un calendrier de données, il contient la date et est en vacances ou non. J'ai une autre base de données contenant l'horodatage datetime...
a demandé il y a 3 mois
0 votes
1 réponses
J'essaie de diviser certaines lignes et certaines colonnes d'un cadre de données pour me retrouver avec le cadre de données d'origine, mais avec ces nouvelles valeurs
J'ai une base de données avec la date et les prix des différents stocks. J'essaie de modifier les valeurs de certaines lignes et de certaines co...
a demandé il y a 3 mois
1 votes
2 réponses
Pandas “coupés” basés sur une autre colonne
Je souhaite utiliser pd.cut (pour convertir des variables continues en variables discrètes) dans certaines variables de mon cadre de données de...
a demandé il y a 3 mois
-1 votes
0 réponses
Chargement du fichier Excel (xlsx) dans une application Web qui analyse ses données et exporte d'autres données dans un fichier xlsx différent
J'essaie donc de créer une application Web qui fasse ce que le titre dit. Le problème est que je ne sais pas exactement comment passer à autre c...
a demandé il y a 3 mois
2 votes
2 réponses
Quelle est la façon de créer DataFrame de longueur des intersections d'une liste d'ensembles
J'ai un dictionnaire rempli d'ensembles. Cela pourrait ressembler à ceci: import pandas as pd my_dict = {'gs_1': set(('ENS1', 'ENS2', 'ENS3'))...
a demandé il y a 3 mois
4 votes
0 réponses
Optimisation bayésienne pour un modèle Light GBM
Je suis en mesure d’améliorer avec succès les performances de mon modèle XGBoost grâce à l’optimisation Bayesienne, mais le meilleur résultat qu...
a demandé il y a 3 mois
-2 votes
0 réponses
Python Dataframe: Combinaison de colonnes et établissement de valeurs dans différentes colonnes
Je suis en train de configurer une table qui devrait régler le mappage de MAC avec le même utilisateur et ignorer le dernier si la limite autori...
a demandé il y a 3 mois
0 votes
1 réponses
Sqlalchemy: ajoute dans la table mysql les nouvelles lignes de la base de données pandas, si elles n'existent pas déjà dans la table
J'ai créé un tableau qui insère les données extraites d'une API et les stocke dans un cadre de données Pandas à l'aide de sqlalchemy. Je vais av...
a demandé il y a 3 mois
2 votes
0 réponses
Problème de performance pendant groupby.shift
Code de test: SIZE_MULT = 5 data = np.random.randint(0, 255, size=10**SIZE_MULT, dtype='uint8') index = pd.MultiIndex.from_product(...
a demandé il y a 3 mois
0 votes
1 réponses
Joignez deux grands fichiers CSV sans duplication dans les pandas Python (ou similaires), un peu comme si vous utilisiez VLOOKUP sur le premier cadre de données
J'ai un ensemble de données (ensemble de données 1) de 3425 lignes, il contient environ 600 "références" uniques. Le jeu de données 2 contient u...
a demandé il y a 3 mois
0 votes
0 réponses
Comment renommer mon cadre de données à l'aide d'une chaîne?
J'ai une boucle qui crée des trames de données. Chacun d'eux a besoin d'un nom unique. La boucle crée également des chaînes uniques, associées a...
a demandé il y a 3 mois
1 votes
2 réponses
Comment décaler les valeurs de colonne en fonction de la différence avec la ligne précédente dans les pandas en python?
J'ai un cadre de données qui ressemble à ce qui suit: Name width height breadth 0 1 13 90...
a demandé il y a 3 mois
-1 votes
1 réponses
Comment comparer 2 images et générer une nouvelle image
J'ai deux bases de données similaires pour lesquelles je voudrais comparer chaque ligne de la 1ère base de données avec la 2ème en fonction de l...
a demandé il y a 3 mois
0 votes
3 réponses
Tracé des points de données les plus récents avec le diagramme de dispersion Seaborn
J'essaie de tracer le pronostic par rapport au réel d'un stock à l'aide du diagramme de dispersion de Seaborn. Je peux tracer le scénario de dis...
a demandé il y a 3 mois
-1 votes
1 réponses
Table de parcelles avec des valeurs en notation scientifique en Python?
j'ai une base de données pandas Names leak start stop Vth F_E_M on/off 94 150-300-G11 True 3.0 2.0...
a demandé il y a 3 mois
0 votes
0 réponses
Vérifiez si la liste des dates est complète en Python avec Pandas
J'ai un fichier texte avec un en-tête contenant les dates de début et de fin d'une série chronologique. Le reste du fichier contient 3 colonnes:...
a demandé il y a 3 mois