繁体   English   中英

Javascript正则表达式:在特定行和字符处获取文本

[英]Javascript regex: get text at a particular line and character #

给定一大堆文本(想象一本书的一页),我如何在特定行和字符#处得到单词?

查找并返回单词Ln#3,Ch#7“正好”。

var text = "Lorem ispum dolar\n
Si emit I dont know latin\n
Really just making this up as I go\n
Ok this should be enough for us to work on.\n

JSFiddle尝试以下代码: http : //jsfiddle.net/xa9xS/709/

您可以使用类似(?:.*\\n){2}.{6}\\s+(\\w+)字符,其中从字符6 + 1开始将得到第2 + 1行的单词。

编辑:想通了一点。 如果您在一个单词的中间提供一个字符索引,则以上内容将不匹配任何内容。 以下内容将跳过,直到单词开始捕获之前的单词开头: (?:.*\\n){2}.{6}.*?\\b(\\w+)\\b

PS:JavaScript中的Regex不支持正向查找,因此,跳回到单词的开头会有些棘手。

Edit2:使string.replace工作需要我们捕获字符串的其他部分。 这似乎可以解决问题: text.replace(/((?:.*\\n){2}(?:.{6}.*?))\\b(\\w+)\\b((?:.*\\n?)*)/g, "$1[the-replacement]$3")但这会使事情复杂化。 在这种情况下,最好使用更直接的方法。 简约为王!

window.example_text = "Lorem ispum dolar\n\
Si emit I dont know latin\n\
Really just making this up as I go\n\
Ok this should be enough for us to work on.\n";

var lineNumber = 3;
var charNumber = 7;

var match = (example_text.split("\n")[lineNumber - 1]).substr(charNumber).split(/\s/)[0];
console.log(match);

http://jsfiddle.net/2DFhM/1/

使用此正则表达式:

^(?:.*(?:\r?\n)*){2}.{6}\W+(\w+)

说明

  • ^锚断言我们在字符串的开头
  • 要到达第3行,我们需要跳过两行
  • 我们的换行符是(?:.*(?:\\r?\\n)*){2} ,匹配所有非换行符,然后换行符
  • .{6}吃掉前六个字符
  • 从第7个字符开始没有单词,因此我们要匹配下一个单词:
  • \\W+匹配任何非单词字符
  • (\\w+)将单词字符捕获到组1
  • 我们从组1检索匹配项

在JS中:

var myregex = /^(?:.*[\r\n]*){2}.{6}\W+(\w+)/;
var matchArray = myregex.exec(yourString);
if (matchArray != null) {
    thematch = matchArray[1];
} else {
    thematch = "";
}

现在可能已经太晚了,哈哈,很多好的答案,但是为了完整起见,这里是:

在此处进行了此正则表达式: http : //regex101.com/r/nF2vX8/1

(?:.*\\n.*){2}^(?:.{7})(\\w*\\W)

这是javascript中的解决方案:

var index_left = 0, index_right = 0, stringy = "";
for (; line_number-- > 0;){
    index_left = index_right;
    index_right = example_text.indexOf("\n", index_right) + 1;
}

stringy = example_text.substring(index_left, index_right-1);

index_left = 0;
index_left = stringy.indexOf(" ", char_number+1);
stringy = stringy.substring(0, index_left);
index_left = stringy.lastIndexOf(" ", index_left);
stringy = stringy.substring(index_left+1);

console.log(stringy);

和js的提琴: http : //jsfiddle.net/xa9xS/714/

它会破坏line_number但是很容易通过复制值来修复,我现在很无聊,不能这样做:P

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM