给定一个日期时间格式字符串,是否有一种标准方法可以找到与该格式匹配的第一个匹配子字符串?
例如,给定...
d-MMM-yy H:mm:ss
和一些文字...
"blah 1 2 3 7-Jul-13 6:15:00 4 5 6 blah"
我希望它会回来
"7-Jul-13 6:15:00"
现在我可以通过解析找到这个字符串,但我想知道是否有任何库支持这样做?
给定一个日期时间格式字符串,是否有一种标准方法可以找到与该格式匹配的第一个匹配子字符串?
例如,给定...
d-MMM-yy H:mm:ss
和一些文字...
"blah 1 2 3 7-Jul-13 6:15:00 4 5 6 blah"
我希望它会回来
"7-Jul-13 6:15:00"
现在我可以通过解析找到这个字符串,但我想知道是否有任何库支持这样做?
这可能不是最有效的,但它似乎是一个有趣的问题,所以我想我会尝试这种方法。
它采用您的 DateTime 格式字符串,并通过将任何字母替换为 ..
并将空格替换为\\s
. 然后它根据该模式创建一个 Regex 对象,并尝试在输入句子中找到第一个匹配项。
该匹配项(如果存在)然后被传递到DateTime.TryParseExact
调用中。我确信可以进行改进,但这可能有助于对不需要硬编码正则表达式或输入句子格式的技术给出一个总体思路。
string inputSentence = "blah 1 2 3 7-Jul-13 6:15:00 4 5 6 blah";
string dtformat = "d-MMM-yy H:mm:ss";
//convert dtformat into regex pattern
StringBuilder sb = new StringBuilder();
foreach (char c in dtformat)
{
if (Char.IsLetter(c))
{
if (char.ToUpperInvariant(c) == 'D' || char.ToUpperInvariant(c) == 'H' || char.ToUpperInvariant(c) == 'S')
sb.Append(".{1,2}");
else
sb.Append(".");
}
else if(Char.IsWhiteSpace(c))
sb.Append("\\s");
else
sb.Append(c);
}
string dtPattern = sb.ToString();
Regex dtrx = new Regex(dtPattern);
//get the match using the regex pattern
var dtMatch = dtrx.Match(inputSentence);
if(dtMatch != null)
{
string firstString = dtMatch.Value.Trim();
//try and parse the datetime from the string
DateTime firstMatch;
if (DateTime.TryParseExact(dstr, dtformat, null, DateTimeStyles.None, out firstMatch))
{
Console.WriteLine("Parsed");
}
else
{
Console.WriteLine("Could not parse");
}
}
也许是这样的:
通过解析文本中的每个单词来查找格式字符串的每个部分,并将 2 组合起来以创建 DateTime
string test = "blah 1 2 3 7-Jul-13 6:15:00 4 5 6 blah";
int formatPart = 0;
bool dateFound = false;
string format = "d-MMM-yy H:mm:ss";
DateTime myDateTime = DateTime.MinValue;
foreach (var item in test.Split(' '))
{
DateTime dummy;
if (DateTime.TryParseExact(item, format.Split(' ')[formatPart], null, DateTimeStyles.NoCurrentDateDefault, out dummy))
{
if (myDateTime == DateTime.MinValue)
{
formatPart++;
myDateTime = dummy;
dateFound = myDateTime.Date != DateTime.MinValue.Date;
continue;
}
// If date was found first, add time, else add date
myDateTime = dateFound
? myDateTime.Add(new TimeSpan(dummy.Hour, dummy.Minute, dummy.Second))
: dummy.Add(new TimeSpan(myDateTime.Hour, myDateTime.Minute, myDateTime.Second));
break;
}
}
测试:
Input: "blah 1 2 3 7-Jul-13 6:15:00 4 5 6 blah"
Format: "d-MMM-yy H:mm:ss"
Input: "blah 1 2 3 6:15:00 7-Jul-13 4 5 6 blah"
Format: "H:mm:ss d-MMM-yy"
Input: "blah 1 2 3 6:15:00 7-7-2013 4 5 6 blah"
Format: "H:mm:ss d-M-yyyy"
Input: "blah 1 2 3 07-07-2013 6:15:00 4 5 6 blah"
Format: "dd-MM-yyyy H:mm:ss"
你可以试试NodaTime:
var input = "blah 1 2 3 7-Jul-13 6:15:00 4 5 6 blah";
var pattern = "d-MMM-yy H:mm:ss";
var nodaPattern = NodaTime.Text
.LocalDateTimePattern
.Create(pattern, System.Globalization.CultureInfo.CurrentUICulture);
for (int i = 0; i < input.Length - pattern.Length; i++)
{
var result = nodaPattern.Parse(input.Substring(i, pattern.Length));
if (result.Success)
{
Console.WriteLine(result.Value);
break;
}
}
除了 DateTime.TryParse(或 RegEx)之外,我不知道在 .NET 中执行此操作的任何其他内容。
我将设置一个流标记器,仅将候选标记对传递给 DateTime.TryParse (基于最小字符串长度的某种组合,一个可能的子字符串检查标记 0 上的一对破折号和标记 1 上的一对冒号等。确切的检查将取决于您支持多少日期/时间格式)
您可以尝试使用正则表达式,例如:
^[0-9]+-[a-z A-z]+-[0-9]+\s[0-9]+:[0-9]+:[0-9]+
你可以试试这个:
string original = "blah 1 2 3 7-jul-13 6:15:00 4 5 6 blah";
Match mc = Regex.Match(original, @"\s*(?<date>\d+[-/][A-Z]{3}[-/]\d+)\s*([01]?[0-9]|2[0-3]):[0-5][0-9]:[0-5][0-9]", RegexOptions.IgnoreCase);
if (mc.Success)
{
string datetime = mc.Groups[0].Value;
}