Perguntas marcadas [scikit-learn]

0 votos
0 respostas
Adicionar fit_params na etapa do pipeline scikit-learn
Eu gostaria de não precisar especificar um dos fit_params de um pipeline scikit-learn ao chamar .fit() no pipeline, mas ter um dos passos do pip...
perguntei há 8 meses
0 votos
1 respostas
Como unir previsões com teste de dados de entrada em sklearn
Eu quero unir previsões de um modelo e os dados de entrada usados ​​pelo sklearn no Python. O código é x_train, x_test, y_train, y_test = trai...
perguntei há 8 meses
0 votos
0 respostas
Alguém poderia fornecer mais detalhes sobre os atributos do kmean do sklearn e verificar a função de cada método?
Eu tenho um conjunto de dados que tem 48000 linhas e 24 colunas, cada coluna foi normalizada para que seja um valor entre 0 e 1. Eu tentei ag...
perguntei há 8 meses
0 votos
0 respostas
Modelo LSI não consegue carregar o modelo
Eu tenho um modelo LSI armazenado e o modelo está sendo armazenado como model.pkl e model.pkl.projection. No entanto, quando tento carregar o...
perguntei há 8 meses
1 votos
0 respostas
Como esse problema de classificação de recursos pode ser implementado com a Classificação de vetores de suporte?
Se eu quiser que o classificador seja SVM (usando scikit-learn), como posso modificar a variável 'clf' de modo que o classificador svm usado par...
1 votos
1 respostas
Como posso exibir os pesos e o viés de LinearRegression ()?
Estou tentando resolver um problema de regressão linear e estou usando a função LinearRegression() de sklearn. É possível exibir os pesos e a po...
0 votos
1 respostas
sklearn.impute SimpleImputer: por que o transform () precisa do fit_transform () primeiro?
A sklearn fornece o método transform() para aplicar o codificador de uma vez. para usar o método transform(), fit_transform() é necessário an...
perguntei há 8 meses
2 votos
0 respostas
Python 3 - ValueError: matriz encontrada com 0 amostra (s) (forma = (0, 11)) enquanto um mínimo de 1 é exigido pelo MinMaxScaler
Estou realmente com problemas para tentar colocar esse projeto em funcionamento, mas continuo resiliente e acho que estou perto! Estou tentan...
perguntei há 8 meses
3 votos
1 respostas
Como pesar pontos de dados com algoritmos de treinamento sklearn
Estou procurando treinar um algoritmo de floresta aleatória ou de aumento de gradiente usando o sklearn. Os dados que tenho são estruturados de...
perguntei há 8 meses
0 votos
1 respostas
Encontrando os recursos mais relevantes ou importantes para o SVM usando SGD (perda = dobradiça)
Estou trabalhando em um problema de classificação de texto e descobri que o SVM tem melhor desempenho para meu problema de classificação de text...
1 votos
0 respostas
Sobreamostragem do Python combinam vários samplers em um pipeline
Meu problema diz respeito ao erro de valor gerado pela classe SMOTE.    N_neighbors esperados < = n_samples, mas n_samples = 1, n_neighbor...
0 votos
0 respostas
Graphviz parece pensar que cada linha na coluna um é um atributo, não pode resolver
Sou muito novo em ciência de dados e fiz alguns dos cursos de codecademy e sololeise. Estou tendo um problema com graphviz e sklearn. Parece que...
perguntei há 8 meses
0 votos
0 respostas
Minha discrepância entre as pontuações cruzadas de val e testes é problemática?
Estou executando um modelo Random Forest com extensa validação cruzada e, em seguida, comparando o grid.best_scorer, que acredito ser o mean_tes...
perguntei há 8 meses
0 votos
1 respostas
Amostragem estratificada em python, com restrição
Eu tenho um quadro de dados com observações data = [['red', 1, 0.2], ['blue', 1, 0.5], ['green', 2, 0.8], ['blue', 2, 0.55], ['blue', 2, 0.52]...
perguntei há 8 meses
1 votos
1 respostas
Em sklearn, como posso obter qual coeficiente corresponde a qual parâmetro em uma regressão linear polinomial?
Estou fazendo uma regressão linear com o scikit-learn no Python3. Eu tenho uma matriz de x e y dados e deseja implementar uma regressão linear u...
3 votos
0 respostas
Usando pacotes dependentes de scipy lança um ImportError (falha de carregamento de DLL) mesmo com instalação recente do Anaconda
Em todos os meus scripts em que uso pacotes dependentes de scipy (como sklearn e statsmodels) eu recebo este ImportError. Eu desinstalei o An...
perguntei há 8 meses
-1 votos
2 respostas
Número máximo de iterações deve ser positivo ao usar a Regressão Logística (python)
x_train, x_test, y_train, y_test = sklearn.model_selection.train_test_split(X, y, test_size=0.2, shuffle=False) return(x_train,...
-1 votos
1 respostas
Erro: Tipo de rótulo desconhecido: valores de 'desconhecido'… y_train não coincidem com valores de x_train
Eu tive essa sequência de códigos from sklearn.feature_extraction.text import TfidfVectorizer tfidfconverter = TfidfVectorizer(max_features=90...
0 votos
0 respostas
Classe personalizada gera erro ao tentar chamar fit_transform
Eu criei classes personalizadas que querem usar com Pipelines e Feature Unions do scikit-learn. Cada classe recebe como entrada um quadro de...
perguntei há 8 meses
0 votos
0 respostas
Análise de um arquivo csv hierárquico
Eu tenho um arquivo csv com seus dados em uma estrutura hierárquica específica. Embora eu possa carregá-lo em um quadro de dados de pandas, pref...
perguntei há 8 meses
0 votos
1 respostas
Como plotar uma árvore de regressão em Python
Então, em primeiro lugar, sou relativamente novo no Python, por isso não sei como alcançar minha tarefa. Eu estava seguindo um tutorial on-line...
perguntei há 8 meses
-2 votos
0 respostas
Como encaixar o OLS corretamente? Eu usei str antes. Eu não pude statsmodels. Erro: tipo (s) de operandos sem suporte para -: 'str' e 'str'
Eu quero prever compras. Eu uso a regressão linear múltipla e como você sabe eu preciso de R quadrado. Mas quando eu escrevi OLS.fit tenho erro....
1 votos
2 respostas
Como usar o countVectorizer para testar novos dados depois de fazer algum treinamento
Eu estava usando o countVectorizer assim: from sklearn.feature_extraction.text import CountVectorizer vectorizer = CountVectorizer(max_featu...
1 votos
1 respostas
Entendendo como a filtragem bayesiana funciona no SciKit e melhorando a precisão
Estou criando um filtro de spam simples usando o SciKit, e estou um pouco inseguro com meus resultados. Eu tenho um conjunto de dados que tem ce...
perguntei há 8 meses
2 votos
1 respostas
Como descartar linhas aleatoriamente no dataframe do Pandas até que haja um número igual de valores em uma coluna?
Eu tenho um dataframe pd com duas colunas, X e y. Em pd[y] eu tenho números inteiros de 1 a 10 inclusive. No entanto, eles têm frequências di...
perguntei há 8 meses