我正在智能设备上实现k最近邻算法,以便从识别数据中识别人类活动。 我将解释我将如何实施它。 你们能建议我对我正在采取的步骤进行任何改进,并回答我在途中可能会提出的任何问题吗?

这些步骤是:

  1. 我下载了一个带有标签的数据集 ,该数据集包含来自加速度计的三轴加速度以及描述活动的标签。 我将在此数据集中仅选择那些我想识别的活动的数据(在我的情况下,是步行,坐着或站立)。
  2. 然后,我将从数据集和I中的加速度计数据的每个窗口(即,从包含128个加速度计数据读数的数据集中的每个记录)中提取特征(在我的情况下,与幅度加速度的平均值,最小值,最大值,标准差)。会将这些功能与窗口标签(作为一条记录)一起以JSON格式存储在设备上的文本文件中。 因此,训练数据集中的一个记录/样本将包括:平均值,最小值,最大值,标准差和标签
  3. 在分类步骤中,我还将从收集的数据中获得一个加速度计数据窗口,从中可以提取上述4个特征。 因此,我需要将收集到的数据的4个特征与训练数据中的每个样本进行比较。 我应该如何找到它们之间的相似性,因为一条记录将包含4个特征?

为了解决第(3)点中的问题,我正在考虑通过计算每个特征的k-最近邻居之间的差异,然后从每个特征中选出多数。 你觉得怎么样? 您可以提出任何优化建议吗? 谢谢 :)

#1楼 票数:1

相当有趣和有趣的应用程序! ;-)

好吧,当然的问题之一就是知道何时启动和停止计算这些功能,但是我想您已经对此有了一些解决方案(固定时间窗口或按钮...)。 您当然可以使用knn分类器来执行此操作,但这当然不是我的首选,因为它对异常值非常敏感(如果您的度量标准在一次培训中被弄乱,它将永远影响您的下一个分类) 。 所以我宁愿选择高斯模型:

  1. 为每个活动记录大约10到20个示例(即4个值的向量)
  2. 计算每个活动的平均向量和对角协方差矩阵
  3. 在测试时,您可以计算出新的观测矢量是由三个高斯模型之一生成的高斯似然,然后选择可能性最大的活动。

#2楼 票数:0

我会以不同的方式处理这个问题。 我会在较长的一段时间(例如1周)内采集大量样本,然后在其中找到簇。 此后,只要当前测量值接近群集之一,用户就可以标记群集。 集群的数量应限制为几个活动,以便用户只需标记几个集群。

缺点:

  • 需要来自用户的培训数据/没有即时的满足感。
  • 实施起来比较复杂。

好处:

  • 为用户定制。
  • 不受外部/非个人培训数据的限制。
  • 使用其他数据(光/温度/ GPS /时间/声音/相机)。
  • 可能更准确。
  • 可以对算法进行连续的重新训练。
  • 随着可用数据的增加,准确性会随着时间的推移而提高。
  • 可以将标记的数据上传到中央服务器,并在以后的应用程序版本中使用。

  ask by duncanportelli translate from so

未解决问题?本站智能推荐:

2回复

k最近邻居算法

我正在智能设备上实现k最近邻算法,以便从识别数据中识别人类活动。 我将解释我将如何实施它。 你们能建议我对我正在采取的步骤进行任何改进,并回答我在途中可能会提出的任何问题吗? 这些步骤是: 我下载了一个带有标签的数据集 ,该数据集包含来自加速度计的三轴加速度以及描述活动的标签
4回复

K 最近邻算法

关闭。 此问题不符合Stack Overflow 准则。 它目前不接受答案。
1回复

我们如何返回 sklearn 中的 K 最近邻?

sklearn 的 KNeighborsClassifier 预测计算距离最小的 k 个实例的类,对吗? 但是,我们可以返回他用来做这个预测的实例吗? 例如:如果 knn 根据 Mary 和 Alexa 的距离计算出 Ana 应该是女性,我们可以返回 ['Mary','Alexa']
5回复

我需要哪些数据来实现k最近邻居?

我目前有一个reddit-clone类型的网站。 我正在尝试根据用户之前喜欢的帖子推荐帖子。 似乎K最近邻居或k均值是最好的方法。 我似乎无法理解如何实际实现这一点。 我已经看到了一些数学公式(比如k上的那个就意味着维基百科页面),但它们对我来说并没有多大意义。 有人可能会
1回复

使用K最近邻居创建特征

我是Python和机器学习的新手,但我一直在为按揭价格建立预测模型。 我苦苦挣扎的地方是使用K最近邻居算法来创建要素。 这是我了解要完成的工作的方式: 我有两个数据文件:已出售抵押和列出抵押 在这两个数据文件中,我具有相同的功能(包括纬度/经度)。 我想在“抵押
1回复

检索最近的树到输入树与k最近邻居?

我想使用K最近邻方法从数据集中检索最接近树到输入树。 树中的节点具有值,但每个树中的分支没有标签。 例如: 树1:(S(V c)(N(P y))(V(V o)(N(D t)(N d)))) 树2:(S(V(V p)(P(R o))(N(D t)(N d)))) 我想使用
2回复

k最近邻居,其中每个点都是自己的类

我正在尝试根据特征相似性进行推荐,其中我在特征空间中的点代表唯一的类。 本质上,我有数百个表示为低维特征向量的独特项,并且我想按排名顺序找到k个最近邻居,以进行新的观察。 按照惯例,您会找到k个邻居,然后选择其中代表最多的类别。 考虑到每个项目都有自己的类,对我而言这是行不通的。
3回复

移动查询点的K-最近邻居

我得到了n个固定点和m个查询点的坐标。 我必须找到来自n个固定点的每个m个查询点的k-最近邻居。 为每个查询点单独寻找距离是非常昂贵的。 有没有一种有效的方法呢?
1回复

k 最近邻回归本质上很慢吗?

我正在尝试在相当大的数据集上使用 scikit learn 中的 k 个最近邻实现。 问题是预测需要很长时间,几乎和没有意义的训练一样长。 这是算法的问题,还是 scikit learn 不适用于大型数据集(不支持 GPU)的事实。 有关更多信息,我正在尝试根据 x、y、z 和对象标签预测激光雷达
2回复

如何在k最近邻算法中处理重复的数据点?

我有一个很大的数据集,在上面运行k-最近邻居分类算法。 考虑一个场景k = 3,我有一个新的(未分类的)点“ x”,我发现3个最近的邻居n1,n2,n3。 问题在于,如果n1,n2,n3都具有完全相同的特征,即它们是重复的数据点。 在我的情况下,这是一个电影数据库,其中n1,n2,n3