cost 116 ms
如何在R中对文本字符串(utf8)进行多序列对齐 - How to do multiple sequence alignment of text strings (utf8) in R

给定三个字符串: 我想做多序列比对,以便得到以下结果: 使用我尝试过的 msa 包中的 msa() 函数: 并得到以下结果: 我想将此函数用于可以包含任何 unicode 字符的序列,但在此示例中,该函数已经给出警告:找到无效字母。 有任何想法吗? ...

查找最长相邻重复非重叠 substring - Find longest adjacent repeating non-overlapping substring

(这个问题与音乐无关,但我以音乐为例。) 在音乐中,构造乐句的一种常见方式是作为一系列音符,其中中间部分重复一次或多次。 因此,该短语由引言、循环部分和结尾部分组成。 这是一个例子: 我们可以“看到”intro 是 [EEE],重复部分是 [FGAF],outro 是 [C D]。 所以拆分列表 ...

在序列中查找元素包的算法 - Algorithm for finding bags of elements in a sequence

假设我有一系列感兴趣的元素A, B, C...穿插着无关符号x 。 我想从预定义距离内发生的一组预定义有趣组合中识别元素包。 符号跨度之间可能存在重叠。 例如,在字符串C xx AA xx C ,如果最大距离为 5,算法将检测到模式AAC两倍。 例如说我的一组有趣的组合是: 我有一个序列: ...

使用自定义距离功能模糊搜索数百万个字符串 - Fuzzy search over millions of strings with custom distance function

我有大量的短字符串和一个自定义的距离函数(例如,Damerau–Levenshtein距离)。 问:根据自定义距离从池中获取前N个字符串的最新解决方案是什么? 我正在寻找解决该问题的理论方法以及编码实现(Java,Python等)。 ...

我希望我的机器人删除包含关键字或包含相似字符的消息 - I would like my bot to delete the message that contains a keyword or that contains similar characters

在我的机器人中,我实现了一个关键字过滤器,该机器人会在聊天记录中编写的每条消息中对其进行审阅,直到现在为止,它仍然有效,但是我想对其进行改进,出于尊重的考虑,我不会在此处加上任何文字,因此我将其他一些例子 该漫游器会检测您是否编写了例如“粗俗”,“ badword”,“ hello” ...

如何为字符串相似度算法实现数组列表输入? - How can I implement array list input for string similarity algorithm?

我实现了jarowinkler算法。 在该算法中,我采用了字符串源和字符串目标。 将字符串目标作为输入字符串源,将其作为数组,例如source [0]。 如何将jarowinkler算法实现为数组列表输入? 请看下面的代码 } 上面的代码是静态类,需要实现为该类的数组列表。 ...

如何在二进制字符串的特定范围内找到010的数量 - How to find number of 010 in a certain range of a binary string

给出二进制字符串。 如何在字符串的某个范围内找到“010”的出现。 例如,我有字符串“0100110” 。 如果给定范围是3 7 (基于1的索引),则输出将为4 。 我找不到任何更快的方法来解决它。 在尝试这个时,我可以用O(N)复杂度来解决它。 方法是 - 首先我指出所有'1 ...

字符串解决方案的等级 - Rank of string solution

我正在研究一个问题,它要求您在按字典顺序排序的排列中查找字符串的等级。 O(N ^ 2)很清楚。 一些网站也有O(n)解决方案 。 经过优化的部分基本上是预先填充一个count array ,以便 count [i]包含存在于str中且小于i的字符数。 我知道这会 ...

KMP字符串搜索算法? - KMP Algorithm for string search?

我在网上发现了这个非常具有挑战性的编码问题,尽管我会尝试一下。 通常的想法是,给定文本T和模式P字符串,找到该模式的出现,将其对应的值相加并返回max和min。 如果您想详细阅读问题,请参阅此 。 但是,下面是我提供的代码,它适用于简单的测试用例,但是在多个复杂的测试用例上运行时, ...

C ++查找子字符串中字符串的最后一次出现 - C++ Find last ocurrence of a string inside a substring

我需要一个方法来帮助我在另一个子字符串中找到一个字符串,换句话说,在其他字符串的子范围内找到一个字符串。 此外,我需要以相反的顺序找到它,因为我知道我正在寻找的字符串是关闭到用作“haystack”的子字符串的末尾。 让我们假设下面的一段代码,其中rfind_in_substr是我要求的 ...

计算一个查询中字符串中某个字符出现的次数? - Count the number of occurrences of a character in a string for a number of queries?

我想在n个查询的字符串中查找某个字符的出现:例如,字符串为:“ i_love_mathematics”,任务是查找以下各项的出现: 范围内的“ i”: '_' 在范围内: 输出为: 类似的问题是查找字符串中某个字符出现的次数,但其复杂度为O(N),但在这种情况下,如 ...

在句子(具有多个单词)中找到多个单词字符串(关键字)的优化算法或方法? - An optimized algorithm or a method to find a multi word string (keywords) in a sentence (that has multi words)?

我有一个字符串(您好,这是一个字符串),我想在其中搜索关键字。 我该怎么办? 我必须在字符串中搜索以下关键字: 字符串:您好,这是一个字符串。 关键字:1.你好(应该匹配)2.你好(应该匹配)3.你好t(不应该匹配)4.你好我(不应该匹配) 请提出构建存储和搜索数据结构 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM