标签[case-folding] - 堆栈内存溢出

用过滤器过滤 dataframe 的两列 - Filtering two columns of a dataframe with filter

我有以下类型的 dataframe：df = pd.DataFrame( { "Name": [ [ " VerbundmÃ¶rtel ", " Compound Mortar ", ...

Java 正则表达式 unicode 支持是否包括全箱折叠？ - Does Java regex unicode support include full case folding?

假设这些字符串定义：String lowerStream = "ﬂüßchen"; String upperStream = "FLÜSSCHEN"; String streamPattern = ".*(ss).*"; 使用这种模式：Pattern pattern = Pattern.com ...

测试两个 pathlib.Paths 大小写相等的最简单方法？ - Easiest way to test casefolded equality for two pathlib.Paths?

在 Python 3.7 或更高版本中，我想测试两个pathlib.Path对象p1和p2的大小写相等。写出我想要的结果是否有内置函数或运算符？或者更简单/更短的方法来测试这个？ ps：我在 macOS 上需要这个，但首选PosixPath和WindowsPath的通用解决方案。 ...

为什么大写不足以进行不区分大小写的比较？ - Why is upper casing not enough for case-insensitive comparison?

要不区分大小写地比较两个字符串，一种正确的方法是先将它们大小写折叠。这比上壳或下壳好多少？我发现小写字母不能在网上正常工作的例子。例如，“σ”和“ς”（“Σ”的两个 forms）在转换为小写时不会变得相同。但我没能找到为什么大小写折叠比映射到大写更好。是否存在应该不区分大小写的两个字符串 ...

如何使各种浏览器的toLowerCase（）和toUpperCase（）保持一致 - How do I make toLowerCase() and toUpperCase() consistent across browsers

是否存在String.toLowerCase（）和String.toUpperCase（）的JavaScript polyfill实现，或者JavaScript中可以使用Unicode字符并且跨浏览器一致的其他方法？背景信息执行以下操作将在浏览器中或甚至浏览器版本之间产生不同的结 ...

折叠案例以加快比较 - Folding case to speed up comparisons

这返回真。这是正确的。不幸的是，当我将其中一个存储在 postgres 中时，它认为在进行不区分大小写的匹配时它们是不一样的（例如，使用~* ）。我也用 citext 测试过。因此，一个解决方案是预先折叠案例，从而将这些值中的任何一个的strasse存储在另一列中。然后我可以索引并搜 ...

Python寻求找到缩短我的.casefold（）。count（）的简便方法 - Python looking to find an easier way to shorten my .casefold().count()

我的python代码运行良好，但是代码看起来有些乏味和凌乱。我想知道是否有更简单的方法来编写它。我有一个文本文件，需要查找是否在行内找到字母“ aardvark”。 ...

带有 Unicode 的正则表达式模式不进行大小写折叠 - Regex Pattern with Unicode doesn't do case folding

在C＃中似乎Grüsse和Grüße被认为在大多数情况下等于如通过解释这个漂亮的网页。我试图在 Java 中找到类似的行为 - 显然不是在java.lang.String 。我以为我很幸运将java.regex.Pattern与Pattern.UNICODE_CASE结合使用。 Javado ...

我应该使用 Python casefold 吗？ - Should I use Python casefold?

最近在阅读忽略大小写时的 casefold 和字符串比较。我读过 MSDN 标准是使用 InvariantCulture 并且绝对避免使用 toLowercase。然而，从我所读到的 casefold 就像一个更激进的 toLowercase。我的问题是我应该在 Python 中使用 case ...

U_FOLD_CASE_DEFAULT引用哪种案例折叠类型？ - Which case folding types does U_FOLD_CASE_DEFAULT refer to?

我正在JavaScript的函数中实现大小写折叠。我已经从CaseFolding.txt文件中生成了所需的JavaScript代码。 U_FOLD_CASE_DEFAULT的文档说ICU将使用： CaseFolding.txt中定义的默认映射。我想确认使用类型C和F ...

使用casefold（）时，出现错误，如“ AttributeError：'str'对象没有属性'casefold'” - While using casefold(), I am getting an error as “ AttributeError: 'str' object has no attribute 'casefold' ”

错误： ...

如果我知道较长的字符串不区分大小写，该如何从另一个字符串的开头删除一个字符串？ - How should I remove one string from the start of another given that I know the longer string matches case-insensitively?

假设我有一个工作流程，其中涉及检查长字符串（例如LS ）的开头，以查看它是否以较短的字符串SS开头。如果是这样，我会砍掉LS的匹配部分，并对其余部分做一些处理。否则，我会做其他事情。（提示此问题的特定情况是解析库。）这很简单。现在，尽管，我想做同样的事情，但是这次我希望 ...

执行unicode casefolding后字符串的最大长度 - Maximum length of a string after performing unicode casefolding

我需要对一组字符串执行casefolding，并且必须事先确保它们在完成之后不会超过给定的长度（以硬编码所需的缓冲区大小）。问题是在应用casefolding后字符串长度（在代码点中）可能会发生变化。参见，例如，在Python3中：现在，可以轻松计算执行casefolding后 ...

Unicode案例折叠为大写 - Unicode case folding to upper case

我正在尝试实现一个库来读取Microsoft CFB（复合文件二进制）格式文件，根据该格式的官方规范。该规范可从该站点获得。简而言之 - 文件的某些结构存储在一个红黑树中。我在用于在该树中存储这些结构的比较谓词时遇到问题。规范说，如果这些结构的名称（字符串存储为UTF-16 ...

假设Unicode和不区分大小写，模式“..”是否匹配“FfIsS”？ - Assuming Unicode and case-insensitivity, should the pattern “..” match “FfIsS”?

这听起来像个笑话，但我可以证明这一点。假设： Dot匹配任何单个字符。当且仅当它与s.toUpperCase()匹配时，不区分大小写的模式匹配s 。以下所有内容都非常符合逻辑并且在Java中保留： "ﬃ".matches(".") .matse " ...

python：lower（）德语变音符号 - python: lower() german umlauts

我有一个问题，用变音符号将大写字母转换为小写字母。 A，O和U可以正确转换，但Ä，Ö和Ü保持大写。有任何想法吗？第一个问题是使用.decode（'utf-8'）修复的，但我仍然有第二个问题：回溯（最近一次调用最后一次）：文件“Untitled.py”，第4行，在or ...

如何在 Go 中创建不区分大小写的地图？ - How to create a case insensitive map in Go?

我想有一个键不敏感的字符串作为键。它是由语言支持还是我必须自己创建？谢谢编辑：我正在寻找的是一种默认设置的方法，而不是每次使用地图时都必须记住转换密钥。 ...