标记的问题 [neural-network]

19
1 回复
使用预先训练的word2vec和LSTM进行单词生成
LSTM /RNN可用于文本生成。 此显示使用方法为Keras模型预先训练的GloVe字嵌入。 如何使用Keras LSTM预训练的Word2Vec字嵌入 模型? 这篇帖子确实有所帮...
25
7 回复
时间序列预测(最终使用python)
时间序列预测/回归有哪些算法? 使用神经网络怎么样? (关于这个主题的最佳文档?) 是否有可以提供帮助的python库/代码片段? 25 如果你能解...
29
2 回复
用于音频的卷积神经网络(CNN)[关闭]
我一直在关注DeepLearning.net上的教程,以了解如何实现从图像中提取特征的卷积神经网络。本教程有很好的解释,易于理解和遵循。 我希望扩展相同的CNN,同...
41
3 回复
如何检查keras是否使用gpu版本的tensorflow?
当我运行keras脚本时,我得到以下输出:  Using TensorFlow backend. 2017-06-14 17:40:44.621761: W tensorflow/core/platform/cpu_feature_guard.cc:45...
19
4 回复
当存在GPU时,如何在TensorFlow中的单个脚本中训练多个模型?
假设我可以在一台机器上访问多个GPU(为了争论,假设8GPU,每台机器的最大内存为8GB,每台机器有一定数量的RAM和磁盘)。我想在单个脚本和一台机器上运行一...
706
19 回复
偏差在神经网络中的作用
我知道渐变下降和反向传播定理。我没有得到的是:什么时候使用偏见很重要,你如何使用它? 例如,在映射AND函数时,当我使用2个输入和1个输出时,它不会给...
128
7 回复
我在哪里调用Keras中的BatchNormalization函数?
如果我想在Keras中使用BatchNormalization函数,那么我是否只需要在开头调用它一次? 我为此阅读了此文档: http://keras.io/layers/normalization/ 我...
15
2 回复
Caffe的LSTM模块
有谁知道Caffe是否存在一个不错的LSTM模块?我在russel91的github帐户中找到了一个,但显然包含示例和解释的网页消失了(以前 http://apollo.deepmatter。...
157
9 回复
在TensorFlow中单词logits的含义是什么?
在下面的TensorFlow函数中,我们必须在最后一层提供人工神经元的激活。我明白了但我不明白为什么它被称为logits?这不是一个数学函数吗?  loss_function...
80
1 回复
Keras中的多对一和多对LSTM示例
我尝试了解LSTM以及如何使用Keras构建它们。我发现,主要有4种模式运行RNN(图中右边4种模式) 图片来源: Andrej Karpathy 现在我想知道每个人的...
88
3 回复
Pytorch,什么是梯度参数
我正在阅读PyTorch的文档,并找到了一个他们写的例子  gradients = torch.FloatTensor([0.1, 1.0, 0.0001]) y.backward(gradients) print(x.grad) 其中x...
22
1 回复
为什么sigmoid函数在神经网络中起作用?
我刚开始为神经网络编程。我目前正在研究Backpropogation(BP)神经网络是如何工作的。虽然BP网络中的训练算法非常简单,但我无法找到有关算法工作原理的任...
24
2 回复
什么是Caffe中的`weight_decay`元参数?
查看示例 'solver.prototxt' ,发布在BVLC /caffe git上,有一个训练元参数  weight_decay: 0.04 这个元参数是什么意思?我应该赋予它什么价值?     ...
16
2 回复
OCR算法的改进
我正在创建一个基于Java的OCR。我的目标是从视频文件中提取文本(后处理)。 这是一项艰难的搜索,试图找到纯粹基于Java的免费开源OCR。我发现Tess4J是唯...
19
6 回复
为什么使用tanh激活MLP的功能?
我亲自研究神经网络理论并得到一些问题。 在许多书籍和参考文献中,对于隐藏层的激活功能,使用了高正切函数。 书籍提出了一个非常简单的原因,即tanh...
15
5 回复
神经网络:激活函数与传递函数
似乎激活和传递功能之间存在一些混淆。来自 Wikipedia ANN : 似乎传递函数计算网络,而激活函数则是神经元的输出。但是在激活功能的Matlab文档中我引...
23
2 回复
设置GLOG_minloglevel = 1以防止来自Caffe的shell输出
我正在使用Caffe,它在加载神经网络时会向shell打印大量输出 我想抑制那个输出,据说可以通过在运行Python脚本时设置GLOG_minloglevel=1来完成。我尝试使用...
33
2 回复
什么是Caffe中的'lr_policy`?
我试着找出如何使用 Caffe 。为此,我刚看了示例文件夹中的不同.prototxt文件。有一个我不明白的选择:  # The learning rate policy lr_policy: "inv"...
151
2 回复
Keras输入说明:input_shape,units,batch_size,dim等
对于任何Keras图层(Layer级),有人可以解释如何理解input_shape,units,dim等之间的区别吗? 例如,doc说units指定了图层的输出形状。 在hidden layer...
121
9 回复
为什么使用softmax而不是标准规范化?
在神经网络的输出层中,通常使用softmax函数来近似概率分布: 由于指数,计算成本很高。为什么不简单地执行Z变换以使所有输出都是正的,然后通过将所...
17
1 回复
ValueError:变量rnn / basic_rnn_cell / kernel已经存在,不允许。您是不是要在VarScope中设置reuse = True或reuse = tf.AUTO_REUSE?
任何想法如何解决下面显示的问题?有了我在网上找到的信息,它与重新使用张量流范围的问题有关,但是没有任何作用。  ValueError: Variable rnn/basic_...
36
5 回复
如何计算卷积神经网络的参数个数?
我无法提供 AlexNet 或 VGG Net 。 例如,要计算conv3-256层VGG Net的参数个数,答案是0.59M =(3 * 3)*(256 * 256),即(内核大小)*(两者的乘积)然...
20
3 回复
与keras的facenet三胞胎损失
我正在尝试使用Thensorflow后端在Keras中实现facenet,并且我对三元组丢失有一些问题。 我用3 * n个图像调用fit函数,然后按如下方式定义自定义丢失函...
23
3 回复
理解一个简单的LSTM pytorch
 import torch,ipdb import torch.autograd as autograd import torch.nn as nn import torch.nn.functional as F import torch.optim as optim from torch...
26
4 回复
Keras文本预处理 - 将Tokenizer对象保存到文件以进行评分
我已经按照以下步骤(广泛地)使用Keras库训练了一个情绪分类器模型。 使用Tokenizer对象/类将文本语料库转换为序列 使用model.fit()方法构建模型 评估...