Perguntas marcadas [data-manipulation]

1 votos
2 respostas
Como é possível extrair sub-strings usando palavras-chave e índice?
Estou tentando obter uma certa sequência após uma palavra-chave de uma string de dados. Estas sub-cadeias colecionadas são então unidas. Exis...
perguntei há 8 meses
2 votos
1 respostas
Como usar mutate () para gerar variáveis ​​que dependem de valores de linha anteriores de outras novas variáveis?
Estou tentando usar a função dplyr mutate() para criar novas variáveis ​​que dependem dos valores da linha anterior de novas variáveis ​​subsequ...
perguntei há 8 meses
1 votos
1 respostas
RegEx para correspondência numérica e decimais no dataframe
Eu tenho uma coluna dentro de um dataframe que tem números seguidos com decimais que eu quero remover para torná-la mais organizada e classificá...
perguntei há 8 meses
0 votos
0 respostas
sinalizando strings que aparecem em um vetor, mas não em outro (R) [duplicado]
     Esta pergunta já tem uma resposta aqui:                   Teste se um vetor contém um determinado elemento                         ...
perguntei há 8 meses
1 votos
1 respostas
Manipulação de lista de quadros de dados em um loop for
Estou preparando quadros de dados para análise em R. Eu posso prepará-los separadamente corretamente, mas eu quero colocar a preparação em um lo...
perguntei há 8 meses
-1 votos
3 respostas
Existe uma maneira de obter uma média por dia do meu conjunto de dados no Python?
Eu tenho um conjunto de dados com datetime e temperatura que uso uma consulta ao meu banco de dados. Eu não sei como obter a média para cada dia...
perguntei há 8 meses
-1 votos
2 respostas
Como recodificar valores de uma variável com base no valor maxmium na variável, para centenas de variáveis?
Eu quero recodificar o valor máximo de uma variável como 1 e 0 quando não é. Para cada variável, pode haver várias observações com o valor máxim...
perguntei há 8 meses
0 votos
0 respostas
Possível criar crosstab de coluna única no pyspark?
Eu estou querendo criar uma tabela que mostra as tabulações cruzadas de usuários pertencentes a cada combinação de segmentos no Pyspark. Abaixo...
1 votos
2 respostas
Imprimindo uma lista de dicionários como uma tabela
Como posso formatar os dados abaixo em formato tabular usando o Python? Existe alguma maneira de imprimir /gravar os dados de acordo com o forma...
perguntei há 8 meses
-3 votos
0 respostas
Eu preciso manipular dados do sensor android
Estou usando um aplicativo de pedômetro que usa google fit api. Alguém pode dizer "como posso inserir dados incorretos do sensor no aplicativo p...
1 votos
2 respostas
Ignore colunas contendo zeros em cada linha e crie um novo objeto
Eu tenho um objeto de lista da seguinte forma: V1=c(5,5,5,5,5,5,5,5) V2=c(0,10,0,10,0,10,0,10) V3=c(0,0,15,15,0,0,15,15) V4=c(0,0,0,0,20,20,20...
perguntei há 8 meses
0 votos
2 respostas
Estou tentando atribuir um classificador de feriados a uma lista de datas
Eu tenho dois quadros de dados, um com uma lista de datas e seu feriado correspondente (df2) e outro com uma lista de transações (df1). Estou te...
perguntei há 8 meses
0 votos
1 respostas
Remodela o conjunto de dados de formato grande para longo, agrupado por sufixo variável
Semelhante ainda diferente a este post: Reformulando dados.frame de ampla para formato longo Eu tenho um conjunto de dados abrangente com u...
perguntei há 8 meses
0 votos
2 respostas
Multiplique cada elemento de uma coluna por cada elemento de um outro dataframe
Eu tenho dois quadros de dados com o mesmo número de colunas, mas o primeiro quadro de dados tem várias linhas e o segundo tem apenas uma linha,...
perguntei há 8 meses
0 votos
1 respostas
Como reordenar valores em uma linha em ordem alfabética usando T-SQL?
Eu preciso reordenar os valores nas linhas de uma tabela por ordem alfabética, por exemplo: Id Values -------------------------------- 1...
perguntei há 8 meses
-1 votos
0 respostas
R - Contagem de ocorrências de um valor entre pares de outros valores em um vetor
Eu tenho um dataframe como abaixo: col1 001 x x 002 001 002 x 003 004 x x 003 x 004 x x 005 005 x Gostaria de adicionar a...
perguntei há 8 meses
0 votos
2 respostas
obter apenas elementos não numéricos puros de pandas de coluna
Eu tenho uma coluna de dados como esta: Phrase A4678LM AFNH 2l6m8 2312435 122 ABC HOW IS Pa805 e assim por d...
perguntei há 9 meses
0 votos
1 respostas
Precisa de orientação para criar um painel baseado no Django
Sou iniciante no Django e, como projeto prático, gostaria de criar uma página da Web com um painel para rastrear investimentos em uma determinad...
perguntei há 9 meses
-2 votos
1 respostas
Script do Google Apps: Manipulação de dados de formulários, exclusão de linhas se determinadas células estiverem em branco e manutenção de determinadas colunas
Esta questão é uma continuação do seguinte: Script do Google Apps: Manipulação de dados de formulários do Google Sheets e excluindo linhas se d...
0 votos
4 respostas
Como remover itens de dicionário na lista com base nos valores da string
Estou ocupado extraindo dados com o python 2.7 Até agora eu tenho uma lista com dicionários como itens. Por 2 dias eu não posso continuar com is...
perguntei há 9 meses
0 votos
1 respostas
Pesquisa do Azure - Importar dados que estão no arquivo .md
Estou tentando fazer upload de dados usando o postman e obtendo um erro: "O tipo de mídia da entidade de solicitação 'text /plain' não é suporta...
0 votos
1 respostas
Paralelizar para loop em R
Estou tentando aprender a usar o processamento paralelo em R. Um instantâneo dos dados e o código é fornecido abaixo. Criando um conjunto de...
perguntei há 10 meses
1 votos
2 respostas
várias transformações com lapply () - R
Eu tenho esse df: df <- structure(list(Created = structure(6:1, .Label = c("2018-12-27T08:53:32.794-0300", "2018-12-27T17:46:00.244-0300",...
perguntei há 9 meses
3 votos
2 respostas
converter vários fusos horários em um - r
Eu tenho esse dataframe: df <- data.frame(datetime = c("2018-08-23 11:03:25 0300", "2018-08-17 12:54:09 0300", "2018-08-07 17:15:29 0400",...
perguntei há 9 meses
1 votos
1 respostas
R dopar foreach em pedaços em vez de por linha
Esta questão é específica para usar processamento paralelo em R usando foreach e dopar. Eu criei um conjunto de dados simples e uma operação sim...
perguntei há 10 meses