我正在尝试匹配 url 中的一部分。此 url 已被处理,仅包含域名。
例如:
我现在拥有的网址是 business.time.com 现在我想摆脱顶级域(.com)。我想要的结果是business.time
我正在使用以下代码:
gawk'{
match($1, /[a-zA-Z0-9\-\.]+[^(.com|.org|.edu|.gov|.mil)]/, where)
print where[0]
print where[1]
}' test
在测试中,有四行:
business.time.com
mybest.try.com
this.is.a.example.org
this.is.another.example.edu
我期待这个:
business.time
mybest.try
this.is.a.example
this.is.another.example
但是,输出是
business.t
mybest.try
this.is.a.examp
this.is.another.examp
谁能告诉我出了什么问题,我该怎么办?
谢谢