簡體   English   中英

特定的字符串切片

[英]Specific string slicing

我有一個很大的字符串數組,我將其存儲為名為np_base的nparray: np.shape(np_base) Out[32]: (65000000, 1)

我打算做的是垂直分割數組,以便將其分解為多列,稍后將以獨立的方式存儲,因此我嘗試遍歷行索引並追加:

for i in range(65000000): INCDN.append(np.base[i, 0][0:5])但這會導致內存錯誤。

有人可以幫我解決這個問題嗎,我一直在尋找幾天尋找切片字符串數組的另一種方法。

謝謝,

將函數應用於numpy數組的方法有很多,其中一種是以下方法:

np_truncated = np.vectorize(lambda x: x[:5])(np_base)

在大多數情況下,迭代添加列表的方法通常是最不可行的解決方案。


另外,如果您打算使用許多列,則可能要使用pandas

import pandas as pd    
df = pd.DataFrame(np_base, columns=["Raw"])
truncated = df.Raw.str.slice(0,5)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM