繁体   English   中英

如何从python中的文本数据中提取特征?

[英]How to extract features from text data in python?

我正在尝试构建一个机器学习算法,以根据大脑的 eeg 信号预测一个人正在思考的数字。我发现的数据集以文本格式提供,并被描述为-“数据以非常简单的文本格式存储包含:

[id]:一个数字,仅供参考。

[event] id,一个整数,用于区分在不同大脑位置捕获的同一事件,仅用于多通道设备(除MW外的所有设备)。

[设备]:一个 2 个字符的字符串,用于标识用于捕获信号的设备,“MW”代表 MindWave,“EP”代表 Emotive Epoc,“MU”代表 Interaxon Muse 和“IN”代表 Emotiv Insight。

[channel]:一个字符串,用于识别信号的 10/20 大脑位置,可能的值:

MindWave "FP1" EPOC "AF3, "F7", "F3", "FC5", "T7", "P7", "O1", "O2", "P8", "T8", "FC6", "F4" ", "F8", "AF4" 缪斯 "TP9,"FP1","FP2", "TP10" Insight "AF3,"AF4","T7","T8","PZ"

[code]:一个整数,用于标识被认为/看到的数字,对于与任何不相关的随机捕获信号,可能的值为 0、1、2、3、4、5、6、7、8、9 或 -1数字。

[size]:一个整数,用于标识在该信号的 2 秒内捕获的值数量的大小,因为每个设备的赫兹不同,“理论上”该值接近 512Hz MW,128Hz EP,220Hz对于 MU 和 128Hz 对于 IN,对于 2 秒中的每一秒。

[数据]:一组昏迷分隔的数字,随着信号的时间序列幅度,每个设备使用不同的精度来识别从大脑捕获的电势:MW & MU 中的整数或实数中的实数EP 和 IN 的情况。

文件中没有标题,每一行都是一个信号,字段由制表符分隔“我如何处理这些数据(绘制数据,在其上训练不同的模型)?我应该将其转换为另一种格式吗?如果是,那么如何?数据集的链接- http://www.mindbigdata.com/opendb/MindBigData-MW-v1.0.zip

我已经为一个类似的 ml 项目使用了一个 csv 文件,但不知道如何使用这个文件,因为在每个信号的数据之前都有一个单独的标题我如何提取这些信号

字段以制表符分隔,您只需要 [code](数字)或第 5 个字段,以及 [data] 第 7 个字段(提取后,分隔)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM