我有来自 ENCODE 的两个不同细胞系(任何细胞系中没有控制数据)中的 DNase-seq 数据(两个 SAM 文件或两个 BED 文件)。我想要丰富/显着差异开放的染色质位置。简而言之,在以下可访问区域之间进行比较:单元格-A/单元格-B。
有什么工具可以为我做到这一点吗?该工具的建议/推荐命令行选项设置也会有所帮助。
谢谢
我有来自 ENCODE 的两个不同细胞系(任何细胞系中没有控制数据)中的 DNase-seq 数据(两个 SAM 文件或两个 BED 文件)。我想要丰富/显着差异开放的染色质位置。简而言之,在以下可访问区域之间进行比较:单元格-A/单元格-B。
有什么工具可以为我做到这一点吗?该工具的建议/推荐命令行选项设置也会有所帮助。
谢谢
您可以尝试 BEDTools 中的“intersectbed”程序并使用“-wao”标志来报告 BED 文件中每个元素之间存在多少重叠。您可以将“-f”和“-r”标志与“-wao”标志结合使用,以将报告的重叠限制为“相互重叠”。设置“-f”和“-r”标志后,您可以将倒数重叠阈值指定为每个元素从文件 A 到文件 B 以及从文件 B 到文件 A 的碱基重叠百分比。通过这种方式,您可以搜索在两个文件中几乎覆盖相同碱基集的 BED 元素,并简单地识别那些不显示高水平相互重叠的 BED 元素以定义显着差异区域。
床具:http ://code.google.com/p/bedtools/
上面的站点包含很好的文档和示例,包括一个出色的可下载 PDF 手册。我希望这会有所帮助!