[英]Xpath and regex for autocompletion filter
我有一個巨大的xml文檔。
這樣的東西
<?xml version="1.0" encoding="utf-8"?>
<elements>
<element id="1" name="france" />
<element id="2" name="usa" />
<element id="3" name="Spaïn" />
<element id="4" name="spain and africa" />
<element id="5" name="italie and Spâin" />
</elements>
我想要這樣的東西:
string str = "spain";
XmlDocument xmlDoc = new XmlDocument();
xmlDoc.LoadXml(myXML);
// Xpath with regex or something very veloce
XmlNodeList xmlNodeList = xmlDoc.SelectNodes("//element"+ something);
xmlNodeList將包含:
<element id="3" name="Spaïn" />
<element id="4" name="france with spâin and africa" />
<element id="5" name="italie and Spain" />
它必須忽略這種情況
和口音
就我而言
XmlNodeList xmlNodeList = xmlDoc.SelectNodes("/*/*[contains(concat(' ',translate(translate(@n,translate(@n, 'aaabcdefghiiijklmnopqrstuvwxyzâÂABCDEFGHïÏIJKLMNOPQRSTUVWXYZ', ''),''), 'âÂABCDEFGHïÏIJKLMNOPQRSTUVWXYZ','aaabcdefghiiijklmnopqrstuvwxyz'),' '),' "+prefix+" ')]");
其中@n = @name和prefix可能是:“ spain”或“ Spain”或“Spaïn”,它給了我0解決方案
采用
//element[contains(concat(' ',translate(@name,'SPAIN','spain'),' '),' spain ')]
編輯 :現在,問題已更改,但答案仍然...
只需在翻譯模式中添加以下更改即可:
//element[contains(concat(' ',
translate(@name,
'SPAÂâIÏïN',
'spaaaiiin'),
' '),
' spain ')]
注意:當然,更通用的表達將需要更通用的翻譯模式。
string str = "spain";
XmlDocument xmlDoc = new XmlDocument();
xmlDoc.LoadXml(myXML);
// Xpath with regex or something very veloce
XmlNodeList xmlNodeList = xmlDoc.SelectNodes("//element[contains(@name,'spain')]");
更新 :由於原來的問題是改變將要求識別單詞“西班牙”不僅在所有可能的市值也包括重音符號,我已經更新了下面的解決方案,使現在的“西班牙”與AA和/或II是正確的公認的。
這是一個比@Alejandro更通用的解決方案 :
如果要選擇所有name
屬性都包含大寫字母“ Spain”的元素,並且可能的單詞分隔符都是非字母字符,則
這個XPath表達式 :
/*/*[contains(
concat(' ',
translate(translate(@name,
translate(@name, $vAlpha, ''),
' '),
$vUpper,
$vLower),
' '
),
' spain '
)
]
當應用於此XML文檔時 :
<elements>
<element id="1" name="france" />
<element id="2" name="usa" />
<element id="3" name="Spaïn" />
<element id="4" name="france with spâin and africa" />
<element id="5" name="-Spain!" />
<element id="6" name="spain and africa" />
<element id="7" name="italie and Spain." />
</elements>
選擇以下元素 :
<element id="3" name="Spaïn"/>
<element id="4" name="france with spâin and africa"/>
<element id="5" name="-Spain!"/>
<element id="6" name="spain and africa"/>
<element id="7" name="italie and Spain."/>
在上面的XPath表達式$vLower
,必須用(分別)替換$vUpper
:
'aaabcdefghiiijklmnopqrstuvwxyz'
和
'âÂABCDEFGHïÏIJKLMNOPQRSTUVWXYZ'
$vAlpha
必須由$vLower
和$vUpper
的串聯$vUpper
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.