我想将包含行尾注释的 ascii 文件读入 Astropy 表。像这样的东西:
a | b
1 | 2
3 | 4 # this is a comment
# another comment
5 | 6
如此处所示,这不符合我的要求:
Table.read(filename, format='ascii.csv', delimiter='|', comment='\s*#')
我必须传递哪些选项才能完成Table.read
这项工作?
没有内置的方法可以做到这一点,但它应该只需要几行自定义代码。基本思想是创建CSV 阅读器的子类,您可以在其中使用自己的 Data 类覆盖 .Datadata_class = CsvData
类,该类本身是CsvData
. 在您的 Data 子类中覆盖该process_lines
方法以进行自定义注释行处理。查看BaseData
类core.py
以查看基线process_lines
行为。
from astropy.io.ascii.basic import Csv, CsvData
class CsvCommentData(CsvData):
comment = '#' # regular expression not allowed for this reader
def _strip_trailing_comments(self, lines):
for line in lines:
index = line.rfind(self.comment)
if index >= 0:
line = line[:index]
yield line
def process_lines(self, lines):
return super(CsvCommentData, self).process_lines(self._strip_trailing_comments(lines))
class CsvComment(Csv):
_format_name = 'csv_comment'
_io_registry_can_write = True
_description = 'Comma-separated-values with trailing comments allowed'
data_class = CsvCommentData