Помеченные вопросы [scikit-learn]

0 голосов
0 ответы
Добавьте fit_params в шаг конвейера scikit-learn
Я не хотел бы указывать один из fit_params конвейера scikit-learn при вызове .fit() для конвейера, но чтобы один из шагов конвейера генерировал...
спросил 3 месяца назад
0 голосов
1 ответы
Как объединить прогнозы с тестом входных данных в sklearn
Я хочу объединить прогнозы из модели и входные данные, используемые sklearn в Python. Код x_train, x_test, y_train, y_test = train_test_split(...
спросил 3 месяца назад
0 голосов
0 ответы
Может ли кто-нибудь предоставить более подробную информацию об атрибутах klean и проверке функции каждого метода?
У меня есть набор данных, который имеет 48000 строк и 24 столбцов, каждый столбец был нормализован, так что это значение между 0 и 1. Я попыт...
спросил 3 месяца назад
0 голосов
0 ответы
Модель LSI не может загрузить модель
У меня хранится модель LSI, а модель сохраняется как model.pkl и model.pkl.projection. Однако, когда я пытаюсь загрузить модель, загрузка не...
спросил 3 месяца назад
1 голосов
0 ответы
Как решить эту проблему ранжирования функций с помощью Классификации опорных векторов?
Если я хочу, чтобы классификатором был SVM (с использованием scikit-learn), как я могу изменить переменную 'clf' так, чтобы классификатор svm, и...
спросил 3 месяца назад
1 голосов
1 ответы
Как я могу отображать веса и смещения из LinearRegression ()?
Я пытаюсь решить проблему линейной регрессии и использую функцию LinearRegression() из sklearn. Можно ли отображать веса и смещения?      1...
спросил 3 месяца назад
0 голосов
1 ответы
sklearn.impute SimpleImputer: почему для transform () сначала требуется fit_transform ()?
sklearn предоставляет метод transform() для применения горячего энкодера. для использования метода transform(), перед вызовом метода fit_tran...
спросил 3 месяца назад
2 голосов
0 ответы
Python 3 - ValueError: найденный массив с 0 сэмплами (формами) (shape = (0, 11)), в то время как MinMaxScaler требует минимум 1
У меня действительно возникают проблемы, когда я пытаюсь запустить этот проект и запустить его, но я остаюсь упругим и думаю, что я близок! Я...
спросил 3 месяца назад
3 голосов
1 ответы
Как взвешивать точки данных с помощью алгоритмов обучения sklearn
Я хочу обучить алгоритм случайного леса или повышения градиента с использованием sklearn. Данные, которые я имею, структурированы таким образом,...
спросил 3 месяца назад
0 голосов
1 ответы
Поиск наиболее важных или важных функций для SVM с использованием SGD (потеря = шарнир)
Я работаю над проблемой классификации текста и обнаружил, что SVM лучше всего справляется с моей задачей классификации текста. Тем не менее, я п...
спросил 3 месяца назад
1 голосов
0 ответы
Передискретизация Python объединяет несколько семплеров в конвейер
Моя проблема связана с ошибкой значения, вызванной классом SMOTE.    Ожидаемые n_neighbors < = n_samples, но n_samples = 1, n_neighbors =...
спросил 3 месяца назад
0 голосов
0 ответы
Кажется, что Graphviz считает, что каждая строка в первом столбце является атрибутом, но не может решить
Я довольно новичок в науке о данных и прошел некоторые курсы по codecademy и sololearn. У меня проблема с графвизом и склеарном. Кажется, что ко...
спросил 3 месяца назад
0 голосов
0 ответы
Является ли мое расхождение между кросс-вальтом и результатами тестов проблематичным?
Я использую модель случайного леса с обширной перекрестной проверкой, а затем сравниваю grid.best_scorer, который, как я считаю, является mean_t...
спросил 3 месяца назад
0 голосов
1 ответы
Стратифицированная выборка в питоне с ограничением
У меня есть фрейм данных с наблюдениями data = [['red', 1, 0.2], ['blue', 1, 0.5], ['green', 2, 0.8], ['blue', 2, 0.55], ['blue', 2, 0.52], ['...
спросил 3 месяца назад
1 голосов
1 ответы
В sklearn, как я могу получить, какой коэффициент соответствует какому параметру в полиномиальной линейной регрессии?
Я делаю линейную регрессию с помощью scikit-learn в Python3. У меня есть массив данных x и y, и я хочу реализовать линейную регрессию с использо...
спросил 3 месяца назад
3 голосов
0 ответы
Использование пакетов, зависящих от scipy, вызывает ImportError (сбой загрузки DLL) даже при новой установке Anaconda
Во всех моих сценариях, где я использую пакеты, зависящие от scipy (такие как sklearn и statsmodels), я получаю эту ошибку ImportError. Я уда...
спросил 3 месяца назад
-1 голосов
2 ответы
Максимальное количество итераций должно быть положительным ERROR при использовании Logistic Regression (python)
x_train, x_test, y_train, y_test = sklearn.model_selection.train_test_split(X, y, test_size=0.2, shuffle=False) return(x_train,...
спросил 3 месяца назад
-1 голосов
1 ответы
Ошибка: неизвестный тип метки: «неизвестно»… значения y_train не совпадают со значениями x_train
У меня была эта последовательность кодов from sklearn.feature_extraction.text import TfidfVectorizer tfidfconverter = TfidfVectorizer(max_feat...
спросил 3 месяца назад
0 голосов
0 ответы
Пользовательский класс вызывает ошибку при попытке вызвать fit_transform
Я создал пользовательские классы, которые хотят использовать с конвейерами scikit-learn и Feature-Unions. Каждый класс принимает в качестве в...
спросил 3 месяца назад
0 голосов
0 ответы
Разбор из иерархического файла CSV
У меня есть CSV-файл с его данными в определенной иерархической структуре. Хотя я могу загрузить его во фрейм данных Pandas, я бы предпочел имет...
спросил 3 месяца назад
0 голосов
1 ответы
Как построить дерево регрессии в Python
Итак, во-первых, я относительно новичок в Python, поэтому я не уверен, как выполнить мою задачу. Я следовал онлайн-уроку о том, как построить де...
спросил 3 месяца назад
-2 голосов
0 ответы
Как правильно вписать OLS? Я использовал str раньше. Я не мог бы использовать statsmodels. Ошибка: неподдерживаемые типы операндов для -: 'str' и 'str'
Я хочу прогнозировать покупки. Я использую множественную линейную регрессию, и, как вы знаете, мне нужен квадрат R. Но когда я написал, OLS.fit...
спросил 3 месяца назад
1 голосов
2 ответы
Как использовать countVectorizer для проверки новых данных после некоторой тренировки
Я использовал countVectorizer следующим образом: from sklearn.feature_extraction.text import CountVectorizer vectorizer = CountVectorizer(ma...
спросил 3 месяца назад
1 голосов
1 ответы
Понимание того, как байесовская фильтрация работает в SciKit и повышение точности
Я создаю простой фильтр спама с помощью SciKit, и я немного не уверен в своих результатах. У меня есть набор данных, который содержит около 5000...
спросил 3 месяца назад
2 голосов
1 ответы
Как случайным образом удалить строки в кадре данных Pandas, пока в столбце не появится равное количество значений?
У меня есть кадр данных pd с двумя столбцами, X и y. В pd[y] у меня есть целые числа от 1 до 10 включительно. Однако они имеют разные частоты...
спросил 3 месяца назад