0

我正在寻找一个实用程序来使用正则表达式一次批量重命名一堆文件。我将一次重命名的文件遵循特定的命名约定,我想使用文件名中已有的数据将它们更改为新的命名约定;但目前并非我所有的文件都遵循相同的约定。

所以我希望能够编写一个通用程序,让我在运行时将文件名的模式输入到文本框中,以及我想从文件名中提取哪些标记以用于重命名。

例如 - 假设我有一个名为[Coalgirls]_Suite_Precure_02_(1280x720_Blu-Ray_FLAC)_[33D74D55].mkv. 我希望能够将此文件重命名为Suite Precure - Ep 02 [Coalgirls][33D74D55].mkv

这意味着我最好能够在重命名类似的东西之前进入我的程序[%group%]_Suite_Precure_%ep%_(...)_[%crc%].mkv,它会填充局部变量group,epcrc在批量重命名中使用。

我正在考虑的一个特定程序是 mp3tag,用于将文件名转换为 id3 标签。它可以让您输入 %artist% - %album% - %tracknumber% - %title% 之类的内容,然后将这 4 个标记放入相应的 id3 标签中。

如何在不让用户知道正则表达式语法的情况下制作类似于此的系统?

4

2 回答 2

2

正如 usr 所提到的,您可以使用%(?<name>[^%]+)%. 这将为您提供“组”、“ep”和“crc”。

现在您需要扫描占位符之间的所有片段,并在正则表达式中的每个占位符处进行捕获。我将从上面遍历匹配项(您可以获得每个匹配项的开始偏移量和长度以浏览非占位符片段)。

(你的例子中有错误,我假设最后一部分是正确的,我放弃了神秘的(...))

它将构建一个如下所示的正则表达式:

^%(?<group>.*?)_Suite_Precure_(?<ep>.*?)_(?<crc>.*?).mkv$

将文字片段传递给 Regex.Escape,然后在正则表达式中使用它以正确处理麻烦的字符。

现在,对于每个文件名,您尝试将正则表达式与其匹配。如果匹配,您将获得该文件的占位符的值。然后获取这些占位符值并将它们合并到输出模式中,适当地替换占位符。这为您提供了新名称,您可以进行重命名。

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using System.Text.RegularExpressions;

namespace renamer
{
    class RenameImpl
    {
        public static IEnumerable<Tuple<string,string>> RenameWithPatterns(
            string path, string curpattern, string newpattern,
            bool caseSensitive)
        {
            var placeholderNames = new List<string>();

            // Extract all the cur_placeholders from the user's input pattern
            var input_regex = new Regex(@"(\%[^%]+\%)");
            var cur_matches = input_regex.Matches(curpattern);
            var new_matches = input_regex.Matches(newpattern);
            var regex_pattern = new StringBuilder();

            if (!caseSensitive)
                regex_pattern.Append("(?i)");
            regex_pattern.Append('^');

            // Do a pass over the matches and grab info about each capture
            var cur_placeholders = new List<Tuple<string, int, int>>();
            var new_placeholders = new List<Tuple<string, int, int>>();
            for (var i = 0; i < cur_matches.Count; ++i)
            {
                var m = cur_matches[i];
                cur_placeholders.Add(new Tuple<string, int, int>(
                    m.Value, m.Index, m.Length));
            }
            for (var i = 0; i < new_matches.Count; ++i)
            {
                var m = new_matches[i];
                new_placeholders.Add(new Tuple<string, int, int>(
                    m.Value, m.Index, m.Length));
            }

            // Build the regular expression
            for (var i = 0; i < cur_placeholders.Count; ++i)
            {
                var ph = cur_placeholders[i];

                // Get the literal before the first capture if it is the first
                if (i == 0 && ph.Item2 > 0)
                    regex_pattern.Append(Regex.Escape(
                        curpattern.Substring(0, ph.Item2)));

                // Generate the capture for the placeholder
                regex_pattern.AppendFormat("(?<{0}>.*?)",
                    ph.Item1.Replace("%", ""));

                // The literal after the placeholder
                if (i + 1 == cur_placeholders.Count)
                    regex_pattern.Append(Regex.Escape(
                        curpattern.Substring(ph.Item2 + ph.Item3)));
                else
                    regex_pattern.Append(Regex.Escape(
                        curpattern.Substring(ph.Item2 + ph.Item3,
                        cur_placeholders[i + 1].Item2 - (ph.Item2 + ph.Item3))));
            }

            regex_pattern.Append('$');

            var re = new Regex(regex_pattern.ToString());

            foreach (var pathname in Directory.EnumerateFileSystemEntries(path))
            {
                var file = Path.GetFileName(pathname);
                var m = re.Match(file);

                if (!m.Success)
                    continue;

                // New name is initially same as target pattern 
                var newname = newpattern;

                // Iterate through the placeholder names
                for (var i = new_placeholders.Count; i > 0; --i)
                {
                    // Target placeholder name
                    var tn = new_placeholders[i-1].Item1.Replace("%", "");

                    // Get captured value for this capture
                    var ct = m.Groups[tn].Value;

                    // Perform the replacement
                    newname = newname.Remove(new_placeholders[i - 1].Item2,
                        new_placeholders[i - 1].Item3);
                    newname = newname.Insert(new_placeholders[i - 1].Item2, ct);
                }

                newname = Path.Combine(path, newname);
                yield return new Tuple<string, string>(pathname, newname);
            }
        }
    }
}
于 2012-12-16T01:09:34.813 回答
1

制作正则表达式模式%(?<name>[^%]+)%。这将捕获字符串中被百分号包围的所有标记。

然后,用于Regex.Replace替换它们:

var replaced = Regex.Replace(input, pattern, (Match m) => EvaluateToken(m.Groups["name"].Value));

Regex.Replace可以接受允许您提供动态值的回调。

于 2012-12-15T19:43:04.823 回答