Questions marquées [scikit-learn]

0 votes
0 réponses
Ajouter fit_params dans l'étape de pipeline scikit-learn
Je souhaiterais ne pas avoir à spécifier l'un des 0600350991111101035062 d'un pipeline scikit-learn lors de l'appel du 0600350991111101035062 su...
a demandé il y a 5 mois
0 votes
1 réponses
Comment joindre les prévisions avec le test de données d'entrée dans sklearn
Je souhaite associer les prévisions d’un modèle aux données d’entrée utilisées par sklearn en Python. Le code est x_train, x_test, y_train, y_...
a demandé il y a 5 mois
0 votes
0 réponses
Quelqu'un pourrait-il fournir plus de détails sur les attributs de Skeanear kmean et vérifier la fonction de chaque méthode?
J'ai un ensemble de données comportant 48 000 lignes et 24 colonnes, chaque colonne ayant été normalisée de sorte qu'il s'agisse d'une valeur co...
a demandé il y a 5 mois
0 votes
0 réponses
Le modèle LSI ne parvient pas à charger le modèle
J'ai un modèle LSI stocké et le modèle est stocké sous les noms model.pkl et model.pkl.projection. Cependant, lorsque j'essaie de charger le...
a demandé il y a 5 mois
1 votes
0 réponses
Comment ce problème de classement des fonctionnalités peut-il être implémenté avec Support Vector Classification?
Si je veux que le classificateur soit SVM (en utilisant scikit-learn), comment puis-je modifier la variable 'clf' de sorte que le classificateur...
1 votes
1 réponses
Comment afficher les poids et les biais de LinearRegression ()?
J'essaie de résoudre un problème de régression linéaire et j'utilise la fonction LinearRegression() de 0600350991111101035062. Est-il possible d...
0 votes
1 réponses
sklearn.impute SimpleImputer: pourquoi transform () a-t-il besoin de fit_transform () en premier?
sklearn fournit la méthode transform() pour appliquer le codeur one-hot. pour utiliser la méthode 060035099111110101035062, 06003509911111010...
a demandé il y a 5 mois
2 votes
0 réponses
Python 3 - ValueError: tableau trouvé avec 0 échantillon (s) (forme = (0, 11)) alors qu'un minimum de 1 est requis par MinMaxScaler
J'ai vraiment du mal à lancer ce projet, mais je reste résilient et je pense que je suis proche! J'essaie de personnaliser ce projet pour qu'...
a demandé il y a 5 mois
3 votes
1 réponses
Comment peser des points de données avec des algorithmes d'apprentissage Sklearn
Je cherche à former un algorithme de forêt aléatoire ou de renforcement de gradient en utilisant sklearn. Les données que j'ai sont structurées...
a demandé il y a 5 mois
0 votes
1 réponses
Recherche des fonctionnalités les plus pertinentes ou les plus importantes pour SVM à l'aide de SGD (perte = charnière)
Je travaille sur un problème de classification de texte et j'ai constaté que SVM fonctionnait mieux pour mon problème de classification de texte...
1 votes
0 réponses
Le suréchantillonnage Python combine plusieurs échantillonneurs dans un pipeline
Mon problème concerne l'erreur de valeur générée par la classe SMOTE.    N_voisins attendus < = n_samples, mais n_samples = 1, n_voisins =...
0 votes
0 réponses
Graphviz semble penser que chaque ligne de la première colonne est un attribut, impossible à résoudre
Je suis assez novice dans le domaine de la science des données et j'ai participé à certains cours sur la codecademy et le sololearn. J'ai un pro...
a demandé il y a 5 mois
0 votes
0 réponses
Est-ce que mon écart entre les valeurs croisées et les résultats des tests est problématique?
J'utilise un modèle de forêt aléatoire avec une validation croisée approfondie, puis je compare le grid.best_scorer, qui correspond, selon moi,...
a demandé il y a 5 mois
0 votes
1 réponses
Échantillonnage stratifié en python, avec contrainte
J'ai un bloc de données avec des observations data = [['red', 1, 0.2], ['blue', 1, 0.5], ['green', 2, 0.8], ['blue', 2, 0.55], ['blue', 2, 0.5...
a demandé il y a 5 mois
1 votes
1 réponses
Dans sklearn, comment puis-je savoir quel coefficient correspond à quel paramètre d'une régression linéaire polynomiale?
Je fais une régression linéaire avec scikit-learn en Python3. J'ai un tableau de données 060035099111110101035062 et x et je souhaite implémente...
3 votes
0 réponses
L'utilisation de packages dépendants de scipy génère une requête ImportError (échec du chargement de la DLL), même avec une nouvelle installation d'Anaconda.
Dans tous mes scripts où j'utilise des packages dépendant de scipy (tels que sklearn et statsmodels), je reçois cette ImportError J'ai désins...
a demandé il y a 5 mois
-1 votes
2 réponses
Le nombre maximum d'itérations doit être positif. ERREUR lors de l'utilisation de la régression logistique (python)
x_train, x_test, y_train, y_test = sklearn.model_selection.train_test_split(X, y, test_size=0.2, shuffle=False) return(x_train,...
-1 votes
1 réponses
Erreur: Type d'étiquette inconnu: 'inconnu'… les valeurs y_train ne coïncident pas avec les valeurs x_train
J'ai eu cette séquence de codes from sklearn.feature_extraction.text import TfidfVectorizer tfidfconverter = TfidfVectorizer(max_features=900,...
a demandé il y a 5 mois
0 votes
0 réponses
La classe personnalisée génère une erreur lors d'une tentative d'appel de fit_transform
J'ai créé des classes personnalisées que vous souhaitez utiliser avec les pipelines et les entités-fonctions scikit-learn. Chaque classe pren...
a demandé il y a 5 mois
0 votes
0 réponses
Analyse à partir d'un fichier csv hiérarchique
J'ai un fichier csv avec ses données dans une structure hiérarchique particulière. Bien que je puisse le charger dans un bloc de données de pand...
a demandé il y a 5 mois
0 votes
1 réponses
Comment tracer un arbre de régression en Python
Donc, tout d’abord, je suis relativement nouveau en Python, je ne sais donc pas comment accomplir ma tâche. Je suivais un didacticiel en ligne s...
a demandé il y a 5 mois
-2 votes
0 réponses
Comment adapter OLS correctement? J'ai utilisé str avant. Je ne pouvais pas statsmodels. Erreur: type (s) d'opérande non pris en charge pour -: 'str' et 'str'
Je veux prédire les achats. J'utilise la régression linéaire multiple et, comme vous le savez, j'ai besoin de R. carré. Mais quand j'ai écrit OL...
1 votes
2 réponses
Comment utiliser countVectorizer pour tester de nouvelles données après une formation
J'utilisais countVectorizer comme ceci: from sklearn.feature_extraction.text import CountVectorizer vectorizer = CountVectorizer(max_feature...
a demandé il y a 5 mois
1 votes
1 réponses
Comprendre le fonctionnement du filtrage bayésien dans SciKit et améliorer la précision
Je construis un simple filtre anti-spam avec SciKit, et mes résultats me semblent un peu incertains. J'ai un jeu de données qui contient environ...
a demandé il y a 5 mois
2 votes
1 réponses
Comment supprimer des lignes de manière aléatoire dans une base de données Pandas jusqu'à ce qu'il y ait un nombre égal de valeurs dans une colonne?
J'ai une base de données pd avec deux colonnes, 0600350991111101035062 et 0600350991111101035062. Dans 060035099111110101035062, j'ai des ent...
a demandé il y a 5 mois