我知道有一种perl正则表达式是一种次要的事实标准,但为什么没有人提出一套通用的标准符号、语法和行为呢?因为制定标准很难。几乎不可能让足够多的人同意任何使其成为官方标准的事情,更不用说像regex这样复杂的事情了。事实标准更容易获得
举个例子:HTML5预计要到2022年才会成为官方标准。但是规范草案已经发布,标准的主要功能将在标准正式发布之前很久就开始出现在浏览器中。Perl是第一个(或者说danm接近第一个),虽然它是Perl,我们都喜欢它,但它很旧,一些人认为它需要更完善(即功能)。这就是
我需要在一堆文件中搜索任何包含“tblPayment”或“tblInvoice”的内容
我还想匹配任何名为“tblPaymentMethod”、“tblInvoiceItem”、“tblInvoicePayment”的表
有人愿意帮我写一个正则表达式吗
再次感谢
tbl(Invoice|Payment)+
如果您需要这种灵活性,这也将匹配没有表前缀的表
编辑:有几种方法可以明确做到这一点(即tblInvoice | tblPayment |……),但每次添加需要匹配的新表时,都必须修改正则表达
我试图让它与perl的正则表达式一起工作,但似乎无法解决它。。我想抓取任何包含“.website.”的url,除了像这样的url(在“.website”前面加上“en”)
这是一个我希望正则表达式返回的url示例,而上面的url被拒绝
$linkhtml = ' http://exsample.website.com/?q=beach&' ;
这是我的尝试1.任何关于我做错了什么的建议都将不胜感激
$re2='(?<!en)'; # Any number of ch
我想用替换的实例,因为我决定用这种方式格式化我的页面。所以我想出了这个命令:
perl -pe "s/<span +class *= *['\"]i['\"] *>(.*?)<\/span>/<i>\1<\/i>/g"
perl-pe“s/以下内容将迭代pages/中的所有html文件,并使用perl脚本进行就地编辑
#!/bin/bash
for file in pages/*.html; do
perl -pi -e "s/<sp
我对使用.htaccess处理格式良好的URL还不熟悉,我只是不确定我是否做对了
我当前的.htaccess文件如下所示:
RewriteEngine On
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^search/(.*) search.php?query=$1 [L]
RewriteRule !\.(gif|jpg|ico|css|js|txt|xml|png|swf
我在Jquery中使用正则表达式来验证名称。我遇到了这个问题,我需要一个模式来允许名称中有一个撇号。这意味着它可以有字母表和一个撇号
Valid: D'souza,Danny
Invalid: D''souza
有人能帮我解决这个问题吗?目前我正在使用这个模式
var rxPattern=/^([a-zA-Z]+)$/
谢谢您可能需要这样的东西:
[a-zA-Z]+('[a-zA-Z])?[a-zA-Z]*
你可能需要这样的东西:
[a-zA-Z]+('[a-zA-Z])?[a-zA-Z]*
我有一个文件,里面有电话号码数据,还有一些无用的东西。
我正在尝试解析这些号码,当每行只有一个电话号码时,这不是问题。
但是当我有多个数字时,sed会匹配最后一个数字(即使它说它应该匹配的地方只匹配第一个模式?),而我无法得到其他数字
My data.txt:
bla bla bla NUM:09011111111 bla bla bla bla NUM:08022222222 bla bla bla
当我解析数据时,我的想法是首先删除第一个电话号码前面的所有“初始”“bla bla bla”
我有一个问题,我想用正则表达式解决。我想要一个正则表达式,它将接受以下输入字符串并生成以下输出
input output
----- ------
/ /?path=/
/mypath/ /?path=/mypath/
/?myquery /?path=/&myquery
/mypath/?myquery /?path=/mypath/&my
我正在使用这个正则表达式来验证端口号。不知何故,这不起作用。有什么问题吗?有人能指出我吗。你不起作用到底是什么意思
你可以这样做:^([0-9]{1,4}{124;[1-5][0-9]{4}}6[0-4][0-9]{3}65[0-4][0-9]{2}655[0-2][0-9]{6553[0-5])$(从获得)
这将确保任何给定的字符串都是数字,并且介于0和65535之间
假设正则表达式匹配相同的范围,它缺少起始和结束锚(^和$),因此它将允许实际端口之外的其他字符串。Number()是您希望“1
比如说有两个词:googleweb.us和google.us
这是我在一个正则表达式中匹配这些的一种方法,但它看起来很难看
/(google|espn|foxtel)\w*[web\.\w+|\.\w+]/
我只想在“网络”存在与否的情况下讨论这两种情况。如何改进这种模式 这将允许“web”仅对google是可选的:
/(google(web)?|espn|foxtel)\.\w+/
这将允许“web”对任何域都是可选的:
/(google|espn|foxtel)(web)?\.\w+/
我试图为Sublime文本创建一个新的语法定义。我已经计算出正则表达式来突出显示每行中的匹配,但是我希望匹配包括新行以及任何字符。以下是tmLanguage文件中的正则表达式,它在一行中工作:
<key>match</key>
<string>\{\+\+(.*?)\+\+[ \t]*(\[(.*?)\])?[ \t]*\}</string>
匹配
\{\+(.**?\+[\t]*(\[(.**?)?[\t]*}
我试图修改点(.)匹配以跨越多
我试图在sed中的正则表达式中使用\d,但它不起作用:
sed -re 's/\d+//g'
但这是可行的:
sed -re 's/[0-9]+//g'
sed中没有这样的特殊字符组。您必须使用[0-9]
在GNU sed中,\d引入了一个十进制字符代码,其范围为0-255,由一到三位数字组成。
如图所示。\code>\d是一个开关,而不是正则表达式宏。如果要使用一些预定义的“常量”而不是[0-9]表达式,请尝试运行以下代码:
s/[[:digit:]]+//g
您最好通过添加-E在sed
我正在尝试用Perl编写一个正则表达式,它可以处理混合了文本和帐号的文本文件。我想做的是重新格式化帐号。我遇到了一个问题,当给定行上有多个匹配项时,使用*来匹配帐号的任意一侧。我已经做了一些搜索,但找不到任何答案,所以我希望有人能向我解释我的正则表达式有什么问题,这样我以后就可以避免这个陷阱
while(<>) {
s/(.*)\b([0-9]+)\b(.*)/$1xxx\-$2$3/g;
print;
}
我希望:
First Part xxx-223456 T
我有一个字符串,我希望根据字符串中的下划线删除一些字符。比如说
我想换衣服
2_MASTER BEDROOM_CFM
到
或
到
关于如何使用coldfusion执行此操作的任何建议?coldfusion具有GetToken()函数,这使得使用分隔符(实际上是任何分隔符)操作字符串非常容易。假设您要解析的每个字符串都是两组字符串,那么这将输出主卧室
<cfset String1 = '2_MASTER BEDROOM_CFM'>
<cfset FirstWord = List
如何使正则表达式只与r.js或build.js匹配,而不与router.js匹配(例如)?
我这样做:/^r.js$| ^build.js$/,但我觉得有一种方法可以删除^和$。如果我删除它们,router.js将匹配。尝试:
/^(r|build)\.js$/
“.”应该逃脱。如果删除“^”,它将与router.js匹配;如果删除$,它将与r.jsx匹配。所以它们是必需的。为什么要删除^和$?我正在寻找一种方法使它看起来更好。。如果有,那么从技术上讲,如果你真的是指一个点,那么避开这个点是一
我使用递归Perl正则表达式扫描嵌套的singlechar括号:
$RE = qr'(?:[\(]((?:(?>[^\(\)]+)|(??{$RE}))*)[\)])';
这让我可以扫描c函数调用,比如:
"func (a(b()))" ~= /$RE/
匹配“(a(b()))”。现在我想解析Pascal风格的嵌套[if,if end]括号,即:
if (a) then
if (b) then
blaif := 1;
else
blaend :
我使用Sublime 2开发R和PHP代码,尽管我认为这个快捷方式对其他语言很有用
如果我从Windows资源管理器/XYPlorer(或其他源)复制文件的路径,它会对目录使用反斜杠。在源代码中输入路径时,它需要正斜杠
升华有一些相当强大的宏命令,但我想不出一个组合能够:
获取当前行上的文本字符串
将“\”的所有实例替换为“/”
以下是我设想的工作流程:
在资源管理器中找到我的文件名并复制其路径
在Sublime中,编写一行代码并粘贴到路径中
点击键盘快捷键,如Ctrl+Shift+\,所有
我有一个目录中的文件列表,这些文件具有以下命名约定:前缀\u 2chars\u后缀
示例:currentfile\u aa\u belongstorprojectfordepcurrentfile\u bb\u belongstorprojectfordep等
我想“提取前缀和后缀之间的2个字符。因此我想使用sed。
我尝试了以下方法:
ls currentfile_* | sed 's/currentfile_\([..]\)_belongsToprojectForDep/\1/g'
我得到
我正在读取R中的csv文件“dopers”
举你的例子
s <- c(" United States", " United States ", "United States ")
然后由以下人员执行替换:
gsub(pat, "USA", s)
*允许您拥有0个或多个上一项+为1或更多匹配任何东西(我认为)^和$是您正在查找的向量的起点和终点;您可以阅读help('regex')了解如何识别空格。事实上,所有这些都记录在那里。@Frank为什么不把它作为一个答案呢?@janos:)我想
所以我是emacs lisp的新手,我有一个很长的文件,上面有按日期划分的文本墙。有时候,如果不向上滚动并失去我的位置,我就看不到我正在阅读的日期,我决定要一直看到这个
在浏览了手册、借用了代码示例并在黑暗中进行了大胆尝试之后,以下内容非常有效:
(add-hook 'text-mode-hook
(lambda ()
(setq header-line-format
'(:eval
;;(setq temp
我希望有人能帮助我。我们有一个旧的VBScript应用程序,在IE 10(和11)发布之前一直运行良好。应用程序将不再接受模式属性
我们正在检查6种不同的模式,但在本例中,我只关心“Phone_2”模式
有人能帮我吗
我得到以下错误:
第32行
错误:对象不支持此属性或方法:“thisItem.pattern”
编码:
我的提交按钮
Dim strError
Function doSubmit(frmID)
DIM idArray, numberElements, pattern
strE
例如,假设我有一组变量和一个插入这些变量的正则表达式数组:
my ($var1, $var2, $var3);
my @search_regexes=(
qr/foo $var1/,
qr/foo bar $var2/,
qr/foo bar baz $var3/,
);
上述代码将向我们发出警告,告诉我们,$var1、$var2和$var3在$search\u regexes中的正则表达式编译点未定义。但是,我想延迟这些正则表达式中的变量插值,直到它们实际被使用为止(或者在变量有
我观察数据帧中的许多单元格,并试图提取几个字符序列中的任意一个;每个细胞只有一个这样的序列
我的意思是:
dF$newColumn = str_extract_all(string = "dF$column1", pattern ="sequence_1|sequence_2")
我把语法搞砸了吗?我可以用stringr拉这种东西吗?请纠正我的无知 是的,您可以使用|,因为它在正则表达式中表示逻辑or。下面是一个例子:
vec <- c("abc text", "text abc", "
我遇到了一个奇怪的问题。我想提取两个字符串之间的内容。文件的结构几乎相同,但大小不同。
我使用的命令在一个文件temp上运行良好,但在另一个文件tmp2上运行不好
-bash-3.2# cat temp
<env:Envelope xmlns:env="http://schemas.xmlsoap.org/soap/envelope/"><env:Body><dp:response xmlns:dp="http://www.datapower.com/schemas
我需要有经验的地鼠给我一些建议
我正在分析一些句子中的单词,我的\w+regexp可以很好地处理拉丁字符。然而,它在一些西里尔文字中完全失败了
以下是一个示例应用程序:
package main
import (
"fmt"
"regexp"
)
func get_words_from(text string) []string {
words := regexp.MustCompile("\\w+")
return words.FindAllString(t
如果我有文字:
AAAAAA
BBBBBB
CCCCCC
DDDDDD
EEEEEE
FFFFFF
GGGGGG
HHHHHH
我想匹配所有行的结尾,除了空白行,并将行的末尾替换为TAB。代码>[^\s]$部分有效,但它也匹配非空行的最后一个字符[^^]$不起作用。什么是正确的正则表达式?为此,可以使用lookback:
(?<=[^\s])$
(?您可以使用负lookbehind正则表达式:
/(?<!\s)$/mg
/(?
很乐意提供帮助。虽然两者都相同,但我建议您使用
我是个Perl业余爱好者。最近,我收到了一个Perl脚本,它接受一个文本文件并删除所有格式,除了后面有空格的单个单词。问题是脚本不清楚如何输入文件位置。我已经设置了一些代码来运行整个文件目录,但是还不能让代码执行。我将发布原始代码,然后是我添加的代码。谢谢你的帮助
原件:
while(<>) {
chomp;
s/\<[^<>]*\>//g; # eliminate markup
tr/[A-Z]/[a-z]/;
我不熟悉URL重写、正则表达式和.htaccess
这是我面临的一个问题:
我有一个带有GET参数的url:
www.mysite.in/alpha beta/abc.php?id=APPLE%strike=200.00
我想将其显示为:
www.mysite.in/alpha/beta/APPLE/200.00
这是.htaccess中的代码:
RewriteRule ^alpha/beta/(.*)/([0-9]+(\.[0-9]+))$ alpha-beta/abc.php?id=$1&a
我对powershell中的正则表达式有点问题。我的正则表达式只适用于一行。我需要在多条线上工作
例如html:
<li> test </li>
</ul>
测试
我要REGEX拿走所有东西,包括“/ul>”。我的建议是:
'(^.*<li>.*</ul>)'
”(^.*.*/ul>)
但它不起作用。有可能吗?谢谢。这取决于您使用的正则表达式方法
如果使用.NETRegex::Match,则还有第三个参数,您可以在其中定义其
是否可以创建一个与两个或三个不同模式匹配的Makefile模式?我正在使用Gnu make
在我当前的设置中,以简化的形式,我使用两个Bash for循环,以便将某一组文件转换为另一组文件,并创建最终的结果文件。例如:
#!/bin/bash
XMIN=$1
XMAX=$2
YMIN=$3
YMAX=$4
z=$5
FINAL_LIST=
for y in `seq $YMIN $YMAX`;
do
SOURCE_LIST=
echo Processing column $y
for
我需要在twig中编写一个xml
xml将包含包含或不包含HTML或特殊字符的元素
为了使xml更具可读性,我只想在必要时添加CDATA转义
如果需要cdata,是否有任何正则表达式来检查以下字符串
<p>Test<p> : CDATA needed
Test124 : CDATA not needed
/de/test123 : CDATA not needed
测试:需要CDATA
Test124:CDATA不需要
/de
我有一个类似于下面的文件
Jobs |Status |Wait Reason |Wait Local |Wait Remote |Running |Passing |Failing |Skipped |Failures
--------------------------------- ------- ------------ ----------- ------------ -------- -------- -------- ----
我在看一些regex,但我没找到
我正在使用Notepad++编辑许多字段
数据如下所示
CmntStatus += row[""];
TcKey += row[""];
但是,我想将第一个值复制到正确的引号中
最终结果:
CmntStatus += row["CmntStatus "];
TcKey += row["TcKey "];
我在努力
^1 += row["$1"];
查找内容:^(.*)\+=行\[“”\]
替换为:(\1)+=行[“\1]”查找内容:
我有一个包含数千行的大型日志文件:(示例)
我有一个较小的数字列表,我需要从这个日志文件中提取行
i、 e
3130=ADUBOVUGFB01.ugfbanca.lan_1449288049_C1_F3
3138=adugbo1dir1.direzione.gr-u.IT1449288169_C1_HDR
我可以运行正则表达式搜索(3130)|(3138)|
但是,这并不是搜索“仅匹配整个单词”
即,相同的搜索将拉出:
23130=pegasoweb.servizi.gr-u.it_144994
我目前正在尝试使用Elm 0.16中的正则表达式查找字符串中的左括号,并用一个括号后跟一个空格来替换它们。我还计划将字符串中的每个右括号替换为后跟右括号的空格。这样我就可以用逗号替换空格来分隔字符串。我试图使用正则表达式的字符串如下:
((数据“引用数据”1234.5)(数据(!@#(4.5)”(更多“数据”))
我已经使用regex删除了用于转义引号的反斜杠。为此,我使用了此函数:
getRidOfBackslashes : String -> String
getRidOfBacksl
输入:“字符串和数字一和二”以及“单词和数字二和三”
所需输出:“字符串数字1-2”和“单词数字2-3”
换句话说,regexp必须只在引用的短语中匹配&,并保持在它们之间。我只做到了以下几点:
(?<=^|\s").*?([&])[^"]+
(?你不能只用一个正则表达式。你需要编写一些在引号之间查找字符串的代码,用空格替换&,然后继续
var str = '"string&number one&two" & "word&number two&am
我试图使用awk获取文件中每个匹配字符串的总长度和每个匹配的计数。$5中的匹配字符串是计数,每个$3-$2的总和是总长度。希望下面的awk是一个好的开始。谢谢:)
输入
chr1 1266716 1266926 chr1:1266716-1266926 TAS1R3
chr1 1267008 1267328 chr1:1267008-1267328 TAS1R3
chr1 1267394 1268196 chr1:1267394-1268196 TAS1R3
chr1 1268291 12685
我有一个tex文件,其中包含以下几个段落:
\paragraph{name1}
...
\paragraph{name2}
...
现在我想用item替换所有“段落”,就像:
\item
...
\item
...
为了达到这个目的,我尝试了许多命令,最后我使用了以下命令:
(注意,我使用了“a:”到“z:”作为段落名称)
我认为这不是很好,也不是很有效。我试图匹配包含“段落”的行,但不知怎么的,只有这个词被替换了。现在我可以用
**:% g/_*paragraph_*/d**
以
我有一个文本文件,其中有以下行:
201174480 11-01-1911 J Student 25-07 11585 2 0 SPOED BEZORGEN 1ST 25,00
320819019 11-01-1911 T. Student 28-07 13561 1 15786986 DESLORATADINE TABL OMH 5MG 60ST
我有这样一个CSV文件,以@作为分隔符:
Chapter 1@This is some text.
@This is some more text.
@This is yet some more text.
Chapter 2@This is some text.
@This is some more text.
@This is yet some more text.
第一列包含章节号。第二栏包含本章的文本
我需要填写A列中的所
我试图删除出现在特定上下文中的字符,但我想不出方法。比方说,我想去掉每个元音前出现的x。是不是有点像:s/x[aeiou]/然后呢?如何将x替换为零并保留其后的匹配项?使用a和a:
详情:
x([aeiou])-匹配x并捕获下一个元音
$1是保留元音的反向引用,因此元音将被还原
/g用于替换所有匹配项。使用a和a:
详情:
x([aeiou])-匹配x并捕获下一个元音
$1是保留元音的反向引用,因此元音将被还原
/g用于替换所有匹配项。我的答案有帮助吗?然后请接受答案。我的答案有帮助吗?
输入:(3个单独的字符串)
我试图返回第一个“on”实例之前的字符串
我使用的是:(.*)(on),但对于“软蜡笔”,它不会返回任何内容
我找不到使“开”成为可选的方法。
仅当字符串中存在“on”时,如何包含一个最大为“on”的regexmatch
所需输出
soft pastel
mixed media
oil, sawdust
可能是您正在寻找的:
^(.*?)(?: on.*)?$
它同时使用惰性量词*?和“可选”运算符?,因此您还将捕获不包含的字符串,这些字符串可能就是您要查找的:
我写了一个正则表达式,它基本上与组匹配,但是我想限制它的搜索,这样它就不会在末尾查找匹配项,如果找到n个组,它就会停止
我的日志--
我的模式-
([^\[\]]+)
上述模式可以匹配所有模式,但我只想将前2个模式分组,即[2017年2月27日星期一15:40:12.341031][auth_digest:notice]
比如-
([^\[\]]+){2}
单个字符或单词使用eg(abc){2}工作,但组如何?
可能吗?试试这个。您只需要处理末尾的一个额外空白
const str=“[Mo
标签: Regex
negative-lookahead
我想写一个reg-ex,在合同中用引号分隔某些定义。但是,有些定义中包含带引号的定义
我不确定如何编写一个reg ex,它不会在第一个引号处停止,而是在第二个实例处停止
以下是我对以下文本的理解--^\s*\“合并利息费用\”([^“]*)
“合并利息费用”是指,就任何期间而言,在不重复的情况下,本协议中定义的该期间的利息费用(包括但不限于资本租赁义务下被视为利息的利息费用)“在此规定。合并利息费用应在预估基础上确定该期间,如同该等收购或处置以及任何相关债务发生或偿还已在该期间开始时发生
“合并
标签: Regex
regex-groupregex-greedy
我在使用XDB后端过滤Grafana中的标记时遇到问题。我试图过滤掉标签的前8个字符和最后2个字符,但我遇到了一个非常奇怪的问题
这里有一些名字
吉普赛人VLMP2L1HBS135WH
吉普赛人VLMP2L2HBS135WH
RSHLKSVLMP1L1HBS045RD
RSHLKSVLMP35L1HBS135WH
RSHLKSVLMP35L2HBS135WH
只想返回如下内容:
MP8L1HBS225
MP24L2HBS045
我首先使用以下表达式:
[MP]*
但它只返回148个值中的
我想找到一个至少有一个1和偶数0的正则表达式二进制字符串表达式
对于偶数为0的字符串,我有:
1*(01*01*)*
对于至少有一个1的字符串,我有:
0*1(0+1)*
然而,我很难将两者结合起来。有人能给我一个如何做的提示吗?谢谢 一个匹配偶数个零和至少一个1的选项可能使用正向前瞻(?=(如果支持)
^字符串的开头
(?=正向前瞻,断言右边的是
(?:1*01*01*)+$重复1+次,将两次零与可选的零进行匹配
)关闭前瞻
0*1匹配零的一个或多个倍,然后匹配所需的一个
[10]*
我已经回答了几十个问题,但似乎没有一个能满足我的需要,希望有人能帮我解决这个问题
我的URL结构如下所示
https://www.example.com/this-is-static/random_text_32-11
我需要重定向到
https://www.example.com/this-is-static/random/text_32-11
因此,总是“random”后面的下划线需要重定向到斜杠/
下划线后面的所有内容都是动态的(random\u text\u 32-11)
还有其他类
我有一个配置文件,其条目名用括号括起来:[]。我需要将每个条目名称提取到列表或变量中,以便在for循环中使用。仍然是新的和摸索一些命令。我觉得grep是我的答案,但我不知道从哪里开始。任何帮助都将不胜感激
[dropbox]
type = dropbox
scope = dropbox
token = {"access_token":"my_token"}
[drive2]
type = drive
scope = drive
token = {&qu
我在PostgreSQL 11.0表的一列中有以下值
interactor_info
uniprotkb:Q99728(protein(MI:0326), 9606 - Homo sapiens)|chebi:CHEBI:61151(poly a(MI:0679), -2 - Chemical synthesis (Chemical synthesis))
uniprotkb:Q99728(protein(MI:0326), 9606 - Homo sapiens)|uniprotkb:Q997
我需要一种查找长引号的方法,它不排除包含撇号s的长引号。这是我的代码:
‘.{250,}(?=[\.’])(?=[,’])(?=[\?’])(?=[!’])
看
有两个长引号(一个带所有格撇号s)和一个短引号,它可以找到两个长引号。但在InDesign中,它只会找到任何250个字符,前面有一个撇号(它忽略了整点、问号、逗号和感叹号)。我认为这是因为它只是从正面的角度看一个角色。有没有办法让它同时查找两个字符?您可以使用
“[^']{250,}[,?!]”
看
细节
'-a'字符
[^']{
1 2 3 4 5 6 ...
下一页 最后一页 共 1009 页