我有一个在 U-SQL 中使用的 Web 日志文件,其查询类似于:
@x =
EXTRACT Col1 string, UserAgent string, Col2 string
FROM "/file"
USING Extractors.Text(delimiter : ' ');
但有时,UserAgent 包含以下内容:-
Android Tablet 10" blah blah
这总是意味着脚本认为该行有四列而不是三列..
任何人都有任何好主意我该如何处理这个问题..我不确定是否有可能逃脱该字符或在提取时以某种方式忽略它?