在bash和awk中查找和排序数据点

Question

首先，让我澄清一下，很遗憾，我对编程还没有足够的经验，所以我确实需要一些帮助。

我有的：

我有一个包含3列的数据文件： $1=(Energy1) ， $2=(Energy2) ， $3=(intensity of their frequency in combination) 。 如果我通过执行spl "datafile.dat" u 1:2:3在gnuplot中绘制这些数据，则得到2D光谱的表面图。

我想要的是：

现在，我只想选择某些数据点，对于这些数据点，我的($1-$2)=5.7给出该特定值，从而获得沿对角线的线谱，其中$1和$2所有可能组合都会产生该值。

然后，新的数据文件应包含$1值和对应于所选行的强度（存储在$3 ），其中包含正确的值$1和$2产生5.7。

我尝试使用awk在bash中执行此操作，但不幸的是直到现在我都失败了。 请帮我！！！ 提前非常感谢您。

Answer 1

您不需要awk ， gnuplot可以做到。

admissible(x,y,value,epsilon)=(abs(x-y-value)<epsilon)
plot 'datafile.dat' using (admissible($1,$2,5.7,1e-5)?$1:1/0):3 with points

对于数据文件的每一行，测试admissible函数，如果返回true，则绘制点（$ 1，$ 3），否则x坐标设置为未定义（1/0），因此不绘制点。 唯一的缺点是您不能与此一起使用lines样式，因为线条将被不可接受的数据点中断。

Answer 2

也许我不理解所有问题，或者您遇到了浮点数相等的问题，但是为什么不对数据进行简单的筛选呢？：

awk -v s=5.7 -v e=.01 '{d=$1-$2-$s}d<e&&d>-e{print $1,$3}'

如有需要，请按以下说明进行排序：

| sort -n

或者，您的数据是否太稀疏，并且您正在寻找某种价值插值解决方案？

Answer 3

如果要将每个$ 1与每个$ 2进行比较，则需要对文件进行2次遍历，一次要收集所有对$ 1，$ 3对，然后下一步进行所有比较：

awk -v diff=5.7 '
    NR == FNR {
        # this is the first trip through
        val[$1] = $3
        next
    }
    {
        for (v1 in val) {
            if ( (v1 - $2) == diff ) {
                print v1, val[v1]
            }
        }
    }
' file file   # yes, give the same filename twice.

要解决@Baruchel关于浮点精度的评论，请尝试以下操作：

awk -v diff=5.7 -v epsilon=0.0001'
    NR == FNR {val[$1] = $3; next}
    {
        for (v1 in val) {
            delta = v1 - $2 - diff
            if (-epsilon <= delta && delta <= epsilon) 
                print v1, val[v1]
        }
    }
' file file

在bash和awk中查找和排序数据点

问题描述

3 个解决方案

解决方案1
1 2015-10-13 16:10:24

解决方案2
1 2015-10-13 17:35:06

解决方案3
0 2015-10-13 14:50:07

在bash和awk中查找和排序数据点

问题描述

3 个解决方案

解决方案1 1 2015-10-13 16:10:24

解决方案2 1 2015-10-13 17:35:06

解决方案3 0 2015-10-13 14:50:07

解决方案1
1 2015-10-13 16:10:24

解决方案2
1 2015-10-13 17:35:06

解决方案3
0 2015-10-13 14:50:07