我正在编写一个 Applescript 播放列表生成器。该过程的一部分是读取 iTunes 库 XML 文件以获取用户库中所有流派的列表。这是 python 实现,它可以按我的意愿工作:
#!/usr/bin/env python
# script to get all of the genres from itunes
import re,sys,sets
## Boosted from the internet to handle HTML entities in Genre names
def unescape(text):
def fixup(m):
text = m.group(0)
if text[:2] == "&#":
# character reference
try:
if text[:3] == "&#x":
return unichr(int(text[3:-1], 16))
else:
return unichr(int(text[2:-1]))
except ValueError:
pass
else:
# named entity
try:
text = unichr(htmlentitydefs.name2codepoint[text[1:-1]])
except KeyError:
pass
return text # leave as is
return re.sub("&#?\w+;", fixup, text)
# probably faster to use a regex than to try to walk
# the entire xml document and aggregate the genres
try:
xml_path = "/Users/%s/Music/iTunes/iTunes Music Library.xml" % sys.argv[1]
except:
print '\tUsage: python '+sys.argv[0]+' <your OSX username>'
raise SystemExit
pattern = "<key>Genre</key><string>([^<]+)</string>"
try:
xml = file(xml_path,'r').read()
except:
print '\tUnable to load your iTunes Library XML file'
raise SystemExit
matches = re.findall(pattern,xml)
uniques = map(unescape,list(sets.Set(matches)))
## need to write these out somewhere so the applescript can read them
sys.stdout.write('|'.join(uniques))
raise SystemExit
问题是,我希望 Applescript 是独立的,并且不需要存在这个附加文件(我计划将它提供给其他人)。而且,据我所知,Applescript 不提供开箱即用的任何类型的正则表达式功能。我可以遍历库中的每个曲目以获取所有流派,但这是一个非常长的过程,我在构建播放列表时已经做过一次。所以,我正在寻找替代品。
由于 Applescript 允许我运行 shell 脚本并捕获结果,我想我可以使用某种类型的 shell 命令来完成相同的行为,无论是 grep、perl 还是其他命令。我的 *nix 命令行技能非常生疏,我正在寻找一些指导。
所以,简而言之,我想找到一种方法将上面的 python 代码翻译成我可以直接从 shell 调用的东西,并得到类似的结果。谢谢!