Fragen markiert [data-manipulation]

1 Stimmen
2 Antworten
Wie ist es möglich, Unterstrings mit Schlüsselwörtern und Index zu extrahieren?
Ich versuche, eine bestimmte Unterzeichenfolge nach einem Schlüsselwort aus einer Datenzeichenfolge abzurufen. Diese gesammelten Unterzeichenfol...
fragte vor 8 Monaten
2 Stimmen
1 Antworten
Wie verwende ich mutate (), um Variablen zu generieren, die von vorherigen Zeilenwerten anderer neuer Variablen abhängen?
Ich versuche, die dplyr-Funktion mutate() zu verwenden, um neue Variablen zu erstellen, die von den vorherigen Zeilenwerten nachfolgender neuer...
fragte vor 8 Monaten
1 Stimmen
1 Antworten
RegEx zum Abgleichen von Zahlen und Dezimalstellen im Datenrahmen
Ich habe eine Spalte in einem Datenrahmen, der Zahlen gefolgt von Dezimalstellen enthält, die ich entfernen möchte, um sie übersichtlicher und s...
fragte vor 8 Monaten
0 Stimmen
0 Antworten
Zeichenfolgen markieren, die in einem Vektor, aber nicht in einem anderen (R) erscheinen [duplizieren]
     Diese Frage hat hier bereits eine Antwort:                   Testen Sie, ob ein Vektor ein bestimmtes Element enthält               ...
fragte vor 8 Monaten
1 Stimmen
1 Antworten
Bearbeitung der Liste der Datenrahmen in einer for-Schleife
Ich bereite Datenrahmen für die Analyse in R vor. Ich kann sie separat korrekt vorbereiten, möchte die Vorbereitung jedoch aus offensichtlichen...
fragte vor 8 Monaten
-1 Stimmen
3 Antworten
Gibt es eine Möglichkeit, einen Durchschnittswert pro Tag aus meinem Datensatz in Python zu ermitteln?
Ich habe einen Datensatz mit Datum, Uhrzeit und Temperatur, den ich mithilfe einer Abfrage an meine Datenbank erhalte. Ich weiß nicht, wie ich d...
fragte vor 8 Monaten
-1 Stimmen
2 Antworten
Wie können Werte einer Variablen basierend auf dem Maximalwert in der Variablen für Hunderte von Variablen neu codiert werden?
Ich möchte den Maximalwert einer Variablen als 1 und 0 umkodieren, wenn dies nicht der Fall ist. Für jede Variable kann es mehrere Beobachtungen...
fragte vor 8 Monaten
0 Stimmen
0 Antworten
Kann man in Pyspark eine Kreuztabelle aus einer einzelnen Spalte erstellen?
Ich möchte eine Tabelle erstellen, in der die Kreuztabellen der Benutzer angezeigt werden, die zu jeder Segmentkombination in Pyspark gehören. I...
1 Stimmen
2 Antworten
Drucken einer Liste von Wörterbüchern als Tabelle
Wie kann ich die folgenden Daten mit Python in Tabellenform formatieren? Gibt es eine Möglichkeit, die Daten gemäß dem erwarteten Format zu druc...
fragte vor 8 Monaten
-3 Stimmen
0 Antworten
Ich muss Android-Sensordaten manipulieren
Ich verwende eine Schrittzähler-App, die Google Fit API verwendet. Jeder kann sagen, wie ich falsche Sensordaten in die App eingeben kann, damit...
1 Stimmen
3 Antworten
So summieren Sie Spaltendaten in jeder n-ten Zeile, einschließlich nicht numerischer Daten in Rstudio
Ich habe einen Datenrahmen aus 420 Zeilen und 37 Spalten mit Stichprobendaten aus Insektenfeldern. Ich versuche, Spaltenwerte alle 5 Zeilen zu s...
fragte vor 8 Monaten
0 Stimmen
1 Antworten
Beschriften von Zeilenabschnitten eines Datenrahmens nach dem Kontext einer anderen Spalte in r
Ich habe ein Instrument, das in einem festgelegten Zeitintervall Messungen durchführt und jedes Ereignis nacheinander identifizieren möchte, wen...
fragte vor 8 Monaten
1 Stimmen
1 Antworten
R Spalten n-mal füllen
Hallo, ich möchte einen Datensatz wie diesen simulieren: City Person 1 1 1 2 1 3 2 1 2...
fragte vor 8 Monaten
-1 Stimmen
1 Antworten
Wie man die Beobachtungen basierend auf dem Wert einer Spalte neu nummeriert [duplizieren]
     Diese Frage hat hier bereits eine Antwort:                   How to Weisen Sie jeder Gruppe identischer Werte in einer Spalte [duplizi...
fragte vor 8 Monaten
1 Stimmen
1 Antworten
Zusammenführen und Anhängen von zwei großen Dateien mit Trennzeichen
Ich habe zwei große durch Kommas getrennte Dateien. Die erste Datei enthält 280 Millionen Zeilen und die folgenden Spalten first name, last n...
fragte vor 8 Monaten
0 Stimmen
1 Antworten
Reduzieren / Filtern von Daten basierend auf dem Auftreten von Klassen und Datum
Ich habe einen Datensatz mit verschiedenen Schiffen in verschiedenen Regionen. In der Datenausgabe werden der Name des Schiffes, der Typ (z. B....
2 Stimmen
1 Antworten
Löschen redundanter Datensätze, die keine perfekten Duplikate sind
     Diese Frage hat hier bereits eine Antwort:                   Entfernen doppelter Zeilen aus dem Datenrahmen in R                   ...
fragte vor 8 Monaten