[英]How to find a string in a column that contains a lengthy “word” or set of characters
我正在尋找包含用戶編寫的注釋的特定數據列中的異常長單詞或字符分組。 舉例來說,如果是這樣-
I am looking for an unusuallylongwordorgroupingofcharactersina specific column
問題在於,在此數據中的某個地方,正在解析異常長的單詞或字符組,並導致OutOfMemoryException
,因此我需要找到源並進行修復。
如果原始字符串適合內存,則可以在C#中使用正則表達式: \\w{15,}
給出的單詞長度至少為15個字符。 有許多方法可以對此進行調整(超前,向后看,更具體的字符類等)。
您可以編寫一個可以在相關列上運行的C#存儲過程。 它將列拆分成包含單詞的字符串數組,然后您可以輕松地找到列中最大的單詞。
參見http://msdn.microsoft.com/zh-cn/library/vstudio/zxsa8hkf%28v=vs.100%29.aspx
有關如何在SQL Server中編寫,安裝和調試C#存儲過程的詳細信息
使用給出的答案,我創建了一個程序來提取數據並將每個單詞扔進一個列表中。 然后,它拉出給定長度的單詞(在我的情況下,我的單詞長度超過20個字符),並發現了錯誤的“單詞”。 現在,我可以修復數據了。
謝謝大家的幫助。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.