Xpath和regex用於自動補全過濾器

Question

我有一個巨大的xml文檔。

這樣的東西

<?xml version="1.0" encoding="utf-8"?>
<elements>
 <element id="1" name="france" />
 <element id="2" name="usa" />
 <element id="3" name="Spaïn" />
 <element id="4" name="spain and africa" />
 <element id="5" name="italie and Spâin" />
</elements>

我想要這樣的東西：

string str = "spain";
XmlDocument xmlDoc = new XmlDocument();                
xmlDoc.LoadXml(myXML);
// Xpath with regex or something very veloce
XmlNodeList xmlNodeList =  xmlDoc.SelectNodes("//element"+ something);

xmlNodeList將包含：

<element id="3" name="Spaïn" />
<element id="4" name="france with spâin and africa" />
<element id="5" name="italie and Spain" />

它必須忽略這種情況
和口音

就我而言

XmlNodeList xmlNodeList = xmlDoc.SelectNodes("/*/*[contains(concat(' ',translate(translate(@n,translate(@n, 'aaabcdefghiiijklmnopqrstuvwxyzâÂABCDEFGHïÏIJKLMNOPQRSTUVWXYZ', ''),''), 'âÂABCDEFGHïÏIJKLMNOPQRSTUVWXYZ','aaabcdefghiiijklmnopqrstuvwxyz'),' '),' "+prefix+" ')]");

其中@n = @name和prefix可能是：“ spain”或“ Spain”或“Spaïn”，它給了我0解決方案

Answer 1

采用

//element[contains(concat(' ',translate(@name,'SPAIN','spain'),' '),' spain ')]

編輯：現在，問題已更改，但答案仍然...

只需在翻譯模式中添加以下更改即可：

//element[contains(concat(' ',
                          translate(@name,
                                    'SPAÂâIÏïN',
                                    'spaaaiiin'),
                          ' '),
                   ' spain ')]

注意：當然，更通用的表達將需要更通用的翻譯模式。

Answer 2

string str = "spain";
XmlDocument xmlDoc = new XmlDocument();                
xmlDoc.LoadXml(myXML);
// Xpath with regex or something very veloce
XmlNodeList xmlNodeList =  xmlDoc.SelectNodes("//element[contains(@name,'spain')]");

Answer 3

更新：由於原來的問題是改變將要求識別單詞“西班牙”不僅在所有可能的市值也包括重音符號，我已經更新了下面的解決方案，使現在的“西班牙”與AA和/或II是正確的公認的。

這是一個比@Alejandro更通用的解決方案 ：

如果要選擇所有name屬性都包含大寫字母“ Spain”的元素，並且可能的單詞分隔符都是非字母字符，則

這個XPath表達式 ：

/*/*[contains(
              concat(' ',
                     translate(translate(@name,
                                         translate(@name, $vAlpha, ''),
                                         '                                                           '),
                               $vUpper,
                               $vLower),
                     ' '
                     ),
              ' spain '
              )
     ]

當應用於此XML文檔時 ：

<elements>
 <element id="1" name="france" />
 <element id="2" name="usa" />
 <element id="3" name="Spaïn" />
 <element id="4" name="france with spâin and africa" />
 <element id="5" name="-Spain!" />
 <element id="6" name="spain and africa" />
 <element id="7" name="italie and Spain." />
</elements>

選擇以下元素 ：

<element id="3" name="Spaïn"/>
<element id="4" name="france with spâin and africa"/>
<element id="5" name="-Spain!"/>
<element id="6" name="spain and africa"/>
<element id="7" name="italie and Spain."/>

在上面的XPath表達式$vLower ，必須用（分別）替換$vUpper ：

'aaabcdefghiiijklmnopqrstuvwxyz'

和

'âÂABCDEFGHïÏIJKLMNOPQRSTUVWXYZ'

$vAlpha必須由$vLower和$vUpper的串聯$vUpper 。

Xpath和regex用於自動補全過濾器

問題描述

3 個解決方案

解決方案1
3

解決方案2
2 2010-12-10 14:42:45

解決方案3
1 已采納 2010-12-10 21:07:57

Xpath和regex用於自動補全過濾器

問題描述

3 個解決方案

解決方案1 3

解決方案2 2 2010-12-10 14:42:45

解決方案3 1 已采納 2010-12-10 21:07:57

解決方案1
3

解決方案2
2 2010-12-10 14:42:45

解決方案3
1 已采納 2010-12-10 21:07:57