[英]Specific string slicing
我有一個很大的字符串數組,我將其存儲為名為np_base的nparray: np.shape(np_base) Out[32]: (65000000, 1)
我打算做的是垂直分割數組,以便將其分解為多列,稍后將以獨立的方式存儲,因此我嘗試遍歷行索引並追加:
for i in range(65000000): INCDN.append(np.base[i, 0][0:5])
但這會導致內存錯誤。
有人可以幫我解決這個問題嗎,我一直在尋找幾天尋找切片字符串數組的另一種方法。
謝謝,
將函數應用於numpy數組的方法有很多,其中一種是以下方法:
np_truncated = np.vectorize(lambda x: x[:5])(np_base)
在大多數情況下,迭代添加列表的方法通常是最不可行的解決方案。
另外,如果您打算使用許多列,則可能要使用pandas
。
import pandas as pd
df = pd.DataFrame(np_base, columns=["Raw"])
truncated = df.Raw.str.slice(0,5)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.