标记的问题 [scikit-learn]

37
4 回复
在Jupyter笔记本中绘制交互式决策树
有没有办法在Jupyter笔记本中绘制决策树,以便我可以交互式地探索它的节点?我正在考虑这样的事情 。这是KNIME的一个例子。 我找到了 https://planspace....
36
5 回复
sklearn情节混淆矩阵与标签
我想绘制一个混淆矩阵来显示分类器的性能,但它只显示标签的数量,而不是标签本身:  from sklearn.metrics import confusion_matrix import pylab as pl...
38
6 回复
sklearn中的SVM是否支持增量(在线)学习?
我目前正在设计文本文章的推荐系统(“有趣”或“不感兴趣”的二进制案例)。我的一个规格是它应该不断更新以适应不断变化的趋势。 据我所知,最好的方法是利...
111
7 回复
在python中是否存在用于均方根误差(RMSE)的库函数?
我知道我可以实现这样的均方根误差函数:  def rmse(predictions, targets): return np.sqrt(((predictions - targets) ** 2).mean()) 如果这个rmse...
问 6个月前
23
1 回复
理解sklearn中CountVectorizer中的`ngram_range`参数
我对如何在Python中的scikit-learn库中使用ngrams感到有点困惑,具体来说,ngram_range参数在CountVectorizer中是如何工作的。 运行此代码:  from skle...
16
3 回复
Django中的机器学习(tensorflow / sklearn)?
我有一个django表单,它正在收集用户响应。我也有张量流句分类模型。将这两者结合在一起的最佳/标准方法是什么? 详情: 张量流模型在Rotten Tomatoes的...
52
5 回复
参数“stratify”来自方法“train_test_split”(scikit Learn)
我正在尝试使用包scikit Learn中的train_test_split,但我遇到参数stratify的问题。以下是代码:  from sklearn import cross_validation, datasets X =...
20
4 回复
如何在sklearn上平衡训练集和测试集上的数据
我正在使用sklearn进行多分类任务。我需要将alldata拆分为train_set和test_set。我想从每个班级中随机抽取相同的样本编号。 实际上,我正在使用这个功能  ...
16
1 回复
(Python - sklearn)如何通过gridsearchcv将参数传递给自定义ModelTransformer类
下面是我的管道,似乎我无法通过使用ModelTransformer类将参数传递给我的模型,我从链接中获取它( http://zacstewart.com/2014/08/05/pipelines-of-featur...
26
2 回复
`sample_weight`对`DecisionTreeClassifier`在sklearn中的工作方式有何作用?
我已阅读此文档: “类平衡可以通过从每个类中抽取相同数量的样本来完成,或者最好通过将每个类的样本权重(sample_weight)的总和归一化为相同的值来完成...
23
1 回复
scikit-learn中SVC和SVM有什么区别?
来自文档的scikit-learn实现了SVC,NuSVC和LinearSVC,它们是能够执行多个的类 - 数据集上的类分类。另一方面,我也读到了scikit学习也使用libsvm进行支持...
15
1 回复
搜索查询的TF * IDF
好的,所以我一直关注TF * IDF的这两篇文章,但我很困惑: http: //css.dzone.com/articles/machine-learning-text-feature 基本上,我想创建一个包含...
17
3 回复
为CountVectorizer添加词干支持(sklearn)
我正在尝试使用sklearn为NLP中的管道添加词干。  from nltk.stem.snowball import FrenchStemmer stop = stopwords.words('french') stemmer = FrenchSte...
问 3年前
91
4 回复
如何用scikit学习多类案例的精确度,召回率,准确度和f1分数?
我正在处理情绪分析问题,数据看起来像这样:  label instances 5 1190 4 838 3 239 1 204 2 127 所以我的数据...
30
5 回复
Tensorflow Precision / Recall / F1得分和混淆矩阵
我想知道是否有办法从scikit学习包中实现不同的评分功能,如下所示:  from sklearn.metrics import confusion_matrix confusion_matrix(y_true, y_pred)...
34
9 回复
可用于Python的最快SVM实现
我正在用Python构建一些预测模型,并且一直在使用scikits learn的SVM实现。它真的很棒,易于使用,而且速度相对较快。 不幸的是,我开始受到运行时的限制...
26
3 回复
Scikit-Learn:使用DBSCAN预测新点数
我使用DBSCAN使用Scikit-Learn(Python 2.7)聚集一些数据:  from sklearn.cluster import DBSCAN dbscan = DBSCAN(random_state=0) dbscan.fit(X) 然...
22
1 回复
scikit中的OneVsRestClassifier和MultiOutputClassifier有什么区别?
有人可以解释(例如可能) OneVsRestClassifier 和 scikit-learn中的MultiOutputClassifier ? 我阅读了文档,我知道我们使用了: OneVsRestClassifi...
21
3 回复
如何解读scikit的学习混淆矩阵和分类报告?
我有一个情绪分析任务,因为我使用这个语料库,意见有5个班级(very neg,neg) ,neu,pos,very pos),从1到5.所以我的分类如下:  from sklearn.feature_...
19
1 回复
使用scikit-learn进行特征选择
我是机器学习的新手。我正在使用Scikit Learn SVM准备我的数据进行分类。为了选择最佳功能,我使用了以下方法:  SelectKBest(chi2, k=10).fit_transform(...
31
2 回复
Scikit Learn - K-Means - Elbow - 标准
今天我正在努力学习一些关于K-means的知识。我已经理解了算法,我知道它是如何工作的。现在我正在寻找正确的k ...我发现肘部标准作为检测正确k的方法,但我...
12
2 回复
使用scikit-learn进行递归特征消除和网格搜索
我想使用scikit-learn为每个要素子集的嵌套网格搜索和交叉验证执行递归特征消除。从 RFECV 文档中可以看出,使用estimator_params参数支持此类操作:  est...
65
13 回复
如何将Scikit-learn数据集转换为Pandas数据集?
如何将数据从Scikit-learn Bunch对象转换为Pandas DataFrame?  from sklearn.datasets import load_iris import pandas as pd data = load_iris() print(...
11
1 回复
使用Scikit Learn SVM准备文本分类数据
我正在尝试从Scikit应用SVM学习对我收集的推文进行分类。 因此,将有两个类别,命名为A和B. 现在,我将所有推文分为两个文本文件“A.txt”和“B.txt”。 但是,...
问 6年前
35
2 回复
如何预测scikit-learn中的时间序列?
Scikit-learn采用了基于fit和predict方法的非常方便的方法。我有适合fit和predict格式的时间序列数据。 例如,我有以下Xs:  [[1.0, 2.3, 4.5], [6.7, 2...