代码之家 › 专栏 › 技术社区 › Adnan

简单regex提取文件夹

regex java

Adnan · 技术社区 · 14 年前

什么是最有效的方法来覆盖所有案例以检索 folder1/folder22

来自:

http://localhost:8080/folder1/folder22/file.jpg
or
http://domain.com/folder1/folder22/file.jpg
or
http://127.0.0.0.1:8080/folder1/folder22/file.jpg

因此可能有一个或多个文件夹/子文件夹。基本上,我想删除域名和端口(如果可用)以及末尾的文件名。

感谢您抽出时间。

4 回复 | 直到 14 年前

splash 14 年前

那呢? URL 类和 getPath() ?

也许这不是最有效的方法,但我认为最简单的方法之一:

String[] urls = { 
  "http://localhost:8080/folder1/folder22/file.jpg", 
  "http://domain.com/folder1/folder22/file.jpg",
  "http://127.0.0.0.1:8080/folder1/folder22/file.jpg" };
for (String url : urls)
  System.out.println(new File(new URL(url).getPath()).getParent());

Tim Pietzcker 14 年前

您可能应该为此使用Java的URL解析器,但是如果有成为一个正则表达式:

\b(?=/).*(?=/[^/\r\n]*)

将匹配 /folder1/folder22 在你所有的例子中。

try {
    Pattern regex = Pattern.compile("\\b(?=/).*(?=/[^/\r\n]*)");
    Matcher regexMatcher = regex.matcher(subjectString);
    if (regexMatcher.find()) {
        ResultString = regexMatcher.group();
    }

说明:

\b :在单词边界处断言位置(这将在单个斜杠之前工作,但不在斜杠之间或斜杠之后工作) : )

(?=/) :断言下一个字符是斜杠。

.* :匹配任何内容,直到…

(?=/[^/\r\n]*) :…刚好是最后一个 / (以及除斜线或换行线以外的任何其他内容)如下。

Alan Haggai Alavi 14 年前

^.+/([^/]+/[^/]+)/[^/]+$

flaab 14 年前

从URL获取最后两个目录的最佳方法如下:

preg_match("/\/([^\/]+\/){2}[^\/]+$/", $path, $matches);

如果匹配,$matches[1]将始终包含所需内容,无论完整URL的文件名如何。

推荐文章

lonix · 使用sed从JSON中提取非贪婪正则表达式

1 年前

me-me · regex检查电子邮件字符串是否有@后跟一个点以及点符号后至少2个字符[重复]

2 年前

Dave Guerrero · 是否有一个正则表达式模式来捕获字符串中直到第一个字母字符的数字?

2 年前

Dima Malko · 如何在指定符号前添加符号?

2 年前

shekharsabale · 从列表元素捕获子字符串

2 年前

maycca · 正则表达式:过滤年份数值大于某个值的文件?字符串中编码的年份

2 年前

Katia · 根据特定规则进行多行匹配

2 年前

Andrei Cleland · 在长正则表达式中包含unicode字符

2 年前

MHA · Pandas str.extract()以字母结尾的数字

2 年前

Slava Vir · 如何查找后面“/”之间的最后一组

2 年前