如何将字符串的 ndarray 列表转换为浮点数

Question

如何将包含字符串对象的 ndarray 列表映射到特定的浮点数？ 例如，如果用户决定将orange映射到 1.0 并将grapefruit映射到 2.0 ？

myList = [np.array([['orange'], ['orange'], ['grapefruit']], dtype=object), np.array([['orange'], ['grapefruit'], ['orange']], dtype=object)]

所以一个人会有：

convList = [np.array([['1.0'], ['1.0'], ['2.0']], dtype=float), np.array([['1.0'], ['2.0'], ['1.0']], dtype=float)]

我试图实现这个功能：

def map_str_to_float(iterator):
    d = {}
    for ndarr in iterator:
        for string_ in ndarr:
            d[string_] = float(input('Enter your map for {}: '.format(string_)))
    return d

test = map_str_to_float(myList)
print(test)

但我收到以下错误：

d[string_] = float(input('Enter your map for {}: '.format(string_)))
TypeError: unhashable type: 'numpy.ndarray'

我相信这是因为string_的类型是一个 numpy 数组而不是字符串......

Answer 1

使用该嵌套循环，您将要求用户输入 6 次（但您有 2 个值grapefruit和orange ）。 我建议您先获取唯一值，然后仅要求唯一值：

这样做：

unique_values = np.unique(np.array(myList))

现在作为一个数字的每个唯一值的用户：

d = {}

for unique_value in unique_values:
    d[unique_value] = float(input(f"give me a number for {unique_value} "))

现在你在变量d得到了你的地图。

评论后更新

然后你可以编写自己独特的方法。 请注意，只要是一维的，无论长度如何，下面的代码都会获得所有唯一值。

unique_values = []
for each_ndarray in myList:
    for value in each_ndarray:
        if not value[0] in unique_values:
            unique_values.append(value[0])

Answer 2

对于错误，调试时 string_ 是一个数组 ['orange']，不能是字典的键

至于如何将字符串的 ndarray 列表转换为浮点数我们使用索引，获取字符串的索引，并使用这些索引以相同的顺序打印所需的新索引。 基本上np.array([1, 2])[0, 1, 0, 0]将给出大小为 4 的新数组，其中包含按索引顺序排列的条目。 将应用相同的逻辑，这将跳过 python 中的字典映射。 映射操作将通过 C 中的索引发生，所以应该很快。

评论应该解释发生了什么

import numpy as np

dataSet = np.array(['kevin', 'greg', 'george', 'kevin'], dtype='U21')

# Get all the unique strings, and their indices
# Values of indices are based on uniques ordering
uniques, indices = np.unique(dataSet, return_inverse=True)
# >>> uniques
# array(['george', 'greg', 'kevin'], dtype='<U21')
# >>> indices
# array([2, 1, 0, 2])
# Originial array
# >>> uniques[indices]
# array(['kevin', 'greg', 'george', 'kevin'], dtype='<U21')

new_indices = np.array([float(input()) for e in uniques])

# Get new indices indexed using original positions of unique strings in numpy array
print(new_indices[indices])

# You can do the same for multi dimensional arrays

如何将字符串的 ndarray 列表转换为浮点数

问题描述

2 个解决方案

解决方案1
1 2021-07-29 17:17:00

解决方案2
1 已采纳 2021-07-29 17:22:08

如何将字符串的 ndarray 列表转换为浮点数

问题描述

2 个解决方案

解决方案1 1 2021-07-29 17:17:00

解决方案2 1 已采纳 2021-07-29 17:22:08

解决方案1
1 2021-07-29 17:17:00

解决方案2
1 已采纳 2021-07-29 17:22:08