簡體   English   中英

如何在包含冗長的“單詞”或一組字符的列中查找字符串

[英]How to find a string in a column that contains a lengthy “word” or set of characters

我正在尋找包含用戶編寫的注釋的特定數據列中的異常長單詞或字符分組。 舉例來說,如果是這樣-

I am looking for an unusuallylongwordorgroupingofcharactersina specific column

  • 存在,我需要找到它,以便在必要時添加空格。 我的問題是:如何查找超過一定數量字符的單詞或一組字符?

問題在於,在此數據中的某個地方,正在解析異常長的單詞或字符組,並導致OutOfMemoryException ,因此我需要找到源並進行修復。

如果原始字符串適合內存,則可以在C#中使用正則表達式: \\w{15,}給出的單詞長度至少為15個字符。 有許多方法可以對此進行調整(超前,向后看,更具體的字符類等)。

您可以編寫一個可以在相關列上運行的C#存儲過程。 它將列拆分成包含單詞的字符串數組,然后您可以輕松地找到列中最大的單詞。

參見http://msdn.microsoft.com/zh-cn/library/vstudio/zxsa8hkf%28v=vs.100%29.aspx

有關如何在SQL Server中編寫,安裝和調試C#存儲過程的詳細信息

使用給出的答案,我創建了一個程序來提取數據並將每個單詞扔進一個列表中。 然后,它拉出給定長度的單詞(在我的情況下,我的單詞長度超過20個字符),並發現了錯誤的“單詞”。 現在,我可以修復數據了。

謝謝大家的幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM