
[英]Using output cell and hidden states of one LSTM cell as input states for another
通常,在讨论堆叠 LSTM(具有独立权重)时,单元格和隐藏状态对于每个单独的单元格都是唯一的,并且不在它们之间共享。 每个 LSTM 单元以其自己的一组状态独立运行。 是否有任何理由使用一个 LSTM 单元的 output 单元 state 和隐藏的 state 作为输入单元 state 和另一个 ...
[英]Using output cell and hidden states of one LSTM cell as input states for another
通常,在讨论堆叠 LSTM(具有独立权重)时,单元格和隐藏状态对于每个单独的单元格都是唯一的,并且不在它们之间共享。 每个 LSTM 单元以其自己的一组状态独立运行。 是否有任何理由使用一个 LSTM 单元的 output 单元 state 和隐藏的 state 作为输入单元 state 和另一个 ...
[英]OCR PDF image to Excel by template
我需要将大量质量差的 PDF 表数据扫描转换为 excel 表。 我看到解决方案的唯一方法是在预生成的图像上训练 tesseract 或其他一些框架(在大多数情况下,PDF 中的所有表都是相同的)。 在家庭条件下有大约 70-80% 的出色解决方案是真的吗?您可以提供什么建议。 除了 Abby F ...
[英]How to output an array as actions in a Deep Reinforcement Learning Model?
我目前正在开发自定义多代理 DQN 环境,我的 action_space 是一个列表,例如 [2,4,3,2,1]。 其中 actionlist[0] 是第一个代理采取的行动,actionlist[1] 是第二个代理采取的行动,依此类推。 通常对于单个值 output,代码将如下所示: 但是,这不 ...
[英]What can I do to help make my TensorFlow network overfit a large dataset?
我特别尝试过拟合的原因是因为我正在按照 François Chollet 的“Deep Learning with Python”步骤来设计 a.network。 这很重要,因为这是我学位课程的最终项目。 在此阶段,我需要使 a.network 足够大以过度拟合我的数据,以确定最大容量,即我将优化 ...
[英]will non-trainable layer participate in backpropagation of other layers?
在下面的神经网络中,第二层是不可训练的。 但是,在计算第一层的梯度时,第二层会参与吗? 总之,当一个层设置为不可训练时,会不会影响其他层的梯度下降? ...
[英]how to use gradientTape() with non trainable variables
假设我有一个 2 层神经网络,我想让第二层不可训练。 所以我启动这些变量 并训练他们。 问题是,随着 GradientTape() 包含所有变量,w2 和 b2 也是可训练的。 如何使它们不可训练? ...
[英]Spiking Neural Network: ValueError: too many values to unpack (expected 2)
我正在编写尖峰神经网络来监控建筑物的结构健康状况。 我拥有的数据集是一个 (129, 5651) 矩阵,其中包含 .network 的触发时间,分为 (129, 3957) 训练集和 (129, 1694) 测试集。 这是触发时间矩阵 (129, 5651): 这是我用作参考的代码,但我想使用我的 ...
[英]NLP neural net validation accuracy increases too much (?) between folds in cross validation
我正在使用 BERT 训练 model 以使用两个标签进行分类。 我想使用交叉验证,因为我想对数据集中的每个观察结果进行样本外预测,以便稍后在线性回归中使用。 我有 5 个 EPOCHS。 第一次折叠的行为符合预期:验证准确度在 EPOCHS 中增加,并收敛到我在使用通常的 80-10-10 分割 ...
[英]Neural network accuracy improvement by using polynomials
我是 Neural.networks 背后的理论和历史的新手,并且了解到我们的主要神经元激活 function 是一个线性表达式,其形式为 w1 x1 + w2 x2 + w3 x3 +...+b 我的问题是为什么不使用更高次的多项式表达式呢? 那就像 a1 (w1 x1 + w2 x2 + w3 ...
[英]Constantly separated validation & training losses
我已经使用自动编码器工作了几个星期了,但是当涉及到我对整体损失的理解时,我似乎遇到了困难。 我面临的问题是,当尝试对我的 model 实施 Batchnormalization 和 Dropout 层时,我得到了没有收敛的损失和糟糕的重建。 典型的损失 plot 是这样的: 我使用的损失是带有 M ...
[英]Neural network built from scratch in python to classify digits stuck at 11.35 percent accuracy. I am using the MNIST dataset
我的 neural.network 停留在 11.35% 的准确率,我无法追踪错误。 准确度低,为 11.35% 我正在关注我在 youtube 视频中找到的代码https://github.com/MLForNerds/DL_Projects/blob/main/mnist_ann.ipynb 。 ...
[英]Split my dataset in train/validation using MapDataset in python
大家好我在详细说明图像和标签之后遇到了一个问题。 为了创建一个独特的数据集,我使用了 zip function。经过详细说明,图像和标签都是 18k 并且是正确的,但是当我调用 zip(image,labels) 时,项目变为 563。这里有一些代码可以让你理解: 我看不出错误在哪里。 你能帮我吗? ...
[英]How to get rid Error Input 0 of layer "sequential_2" is incompatible with the layer: expected shape=(None, 32, 1200), found shape=(None, 1148)
我正在尝试使用 ANN 进行文本分类。 我使用从 inte.net 获得的 keras python 来解决它。 我的数据中的单词数是 1148,但我将其四舍五入为 1200 for input_shape。 代码如下: 接下来,我将超参数包含在以下代码中: 但出现以下错误: 有谁知道问题出在哪里 ...
[英]What is the purpose of having the same input and output in PyTorch nn.Linear function?
我认为这是一个理解问题,但我将不胜感激任何帮助。 我正在尝试学习如何使用 PyTorch 进行自动编码。 在nn.Linear function中,指定了两个参数, nn.Linear(input_size, hidden_size) 当将张量重塑为其最小有意义的表示时,就像在自动编码中所做的那样 ...
[英]How to save and load a NeuralFit model or weights?
我已经开发了一个 neural.network 来使用neuralfit库学习y=x^2 ,但我想保存 model 以便稍后进行预测。 我目前有: 我将如何保存和加载model ? ...
[英]Classifiers and Numpy Array
我关于上面代码的问题是 我从代码中了解到Probs是N C,y是1 C。首先是y的形状1*C?上面的代码一定是正确的,因为我是从github上的可靠来源获取的。但是当我尝试时非常相似我的电脑出现问题我收到以下错误是我电脑中的代码。 请解释我上面提到的损失中发生了什么,我有尺寸问题。 在此处输入图像 ...
[英]how should I design the neural network model for training
假设一个数据有9个特征,当第三个特征的值大于第一个特征的值且第九个特征的值大于第八个特征的值时,label为1,否则标签为0. 对于这种类型的数据集,我们应该如何设计neural.network model 进行训练才能得到更好的结果? 这样的数据 5 85 9 6 7 9 3 15 19 labe ...
[英]How to completely read a .pt file
我正在使用weights = torch.load('file_name.pt')从 a.pt 文件中读取权重,因为我想使用获得的权重来实现这个 neural.network。 当我这样做并通过调用weights显示权重时,有些权重没有完全显示并被省略号缩短。 如何读取 .pt 文件中的所有权重值? ...
[英]Neural Network Creation in Octave
操作系统:Linux MINT GNU Octave,版本 7.1.0 我想在 Octave 中创建一个神经网络。 我已经安装并加载了以下 pkgs: 但是,当我尝试运行时: 我收到以下错误 ...
[英]Exception encountered when calling layer 'sequential' (type Sequential)
我正在尝试执行这个包含 6 个输入和 6 个输出的神经网络,但抛出了异常 ...