问题标签 [pysam]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1271 浏览

python - 手动安装 pysam 错误:“ImportError: No module named version”

我正在尝试手动安装 pysam,因为我在没有互联网连接的集群上工作并且我没有管理员权限(因此通过 conda 进行安装是不可能的,我已经尝试过)。我已经从开发人员的存储库 ( https://github.com/pysam-developers/pysam/archive/master.zip ) 下载了所有压缩文件,然后将它们传输到集群中的目录。

我已经尝试通过运行从解压缩的存储库手动安装(如说明https://github.com/pysam-developers/pysam/blob/master/INSTALL中所示):

但我收到以下错误:

setup.py 文件中的第 165、166 和 167 行是:

不幸的是,我的知识只带了我到这一步。是否需要修改 setup.py 文件?

我的系统规格:

  • Python 2.7.13 :: Anaconda, Inc.
  • CentOS 6.5 版
  • Linux 2.6.32-431.20.5.el6.x86_64
0 投票
5 回答
20691 浏览

linux - 无法执行'x86_64-conda_cos6-linux-gnu-gcc':没有这样的文件或目录(pysam安装)

我正在尝试安装 pysam。

执行后:

产生此错误:

有类似的线程,但它们似乎都解决了我没有管理员权限的问题。有没有办法安装所需的文件?

免责声明:这个问题来自我以前的帖子。 手动安装 pysam 错误:“ImportError: No module named version” 但由于它可能需要不同的方法,所以我将其作为一个问题。

0 投票
1 回答
172 浏览

python - 将连接替换为连接

我有下面给出的代码:

上面的代码花费了很多时间,我想用 join 替换第 11 行和第 13 行的连接。有什么办法吗?

0 投票
2 回答
398 浏览

python - 无法安装 pysam 0.13

我一直无法在 macOS High Sierra 上安装 pysam 0.13。总结一下我的两个错误:

产生 2 个错误。

错误:命令“gcc”失败,退出状态为 1

有什么想法该怎么做?

0 投票
0 回答
476 浏览

python - 当每行中的列顺序不固定时,将制表符分隔文件导入为熊猫数据框

我正在尝试将制表符分隔的 sam 文件导入为 pandas 数据框。

下面是我将文件作为数据框读取的代码。

上面的代码导入文件,如下所示: 在此处输入图像描述

在数据框中,最初的 11 列可用于所有行,因此它们被正确导入。但是,在某些行中,当存在 MC:Z:xxxxx 标记时,它会与该列中的 MD:Z:xxxx 标记混合。因此,某些列在导入期间会发生偏移。

您能否建议在检查列表的开头时如何 read_csv,例如,如果它以 MD 值开头,则将所有值放入 M​​D 列中,当它以 RG、NM 等开头时以及没有值时相同找到特定的标签,然后把 NA 或保持为空?可以跳过前 12 列进行此类检查,因为它们始终以正确的顺序出现在所有行中。这样,对于大多数行,带有 MC 标签的列将为空。

在读取文件时或稍后在处理数据帧时实施的任何建议将不胜感激。我可以使用 awk 通过一一读取所有列并匹配列的开头(如果 MD/MC/等)来执行此操作。并相应地分配。但我是 python 新手,正在寻求帮助。

阿米特

0 投票
0 回答
107 浏览

python - 数百个作业后多处理挂起

我正在尝试将这个问题用于我的文件处理: Python multiprocessing safe writing to a file

这是我对代码的修改:

我在函数中打开和关闭文件的不同之处在于,否则我会从 bgzip 中得到不寻常的错误。

起初,print(parts) 和 print('get') 可以互换打印(或多或少),然后 'get' 的打印越来越少。最终代码挂起,没有打印任何内容(所有部分都打印了,但“get”根本不再打印)。输出文件保持零字节。

任何人都可以伸出援助之手吗?干杯!

0 投票
1 回答
255 浏览

python - Python 错误:OSError:打开文件“all_fprau.fasta”时出错。Fasta 文件太大?

我有一个脚本可以搜索 csv 文件和 fasta 文件,两个文件中的任何 ID 都将用于从 fasta 文件中提取 fasta 序列。它看起来像这样:

但是,我在运行此脚本时遇到问题。我收到此错误:

fasta 文件all_fprau.fasta包含大量序列,我认为这可能是问题所在?当我减小文件的大小时,脚本可以工作,但是我需要所有序列都可用于此管道中的下一步工作。我曾尝试使用:

代替

试图单独搜索 fasta 文件,但我收到错误:TypeError: list indices must be integers or slices, not str与上面脚本中的第 38 行相关:

任何帮助或建议将不胜感激!

0 投票
1 回答
187 浏览

python - 在 fasta 文件中更改反向序列的方向不起作用

我正在尝试在文件中正确定位反向序列。这是代码:

当我打印出反向序列时,代码有效。但是当在文件中时,它会以相反的顺序打印出来。谁能帮我找出问题所在?这是我的 infile 的链接: https ://www.dropbox.com/sh/68ui8l7nh5fxatm/AABUr82l01qT1nL8I_XgJaeTa?dl=0

0 投票
2 回答
1226 浏览

python - 无法在 Python 3.6 中使用 pip 安装 pysam

Macbook Mac OSX 10.12.6 Python 3.6.2 cython 0.28.5 pip 18.0

我正在尝试安装 pysam:

它在以下位置不断出现错误:

似乎this issuethisthis是版本问题。但我已经尝试过pip3 install pysam==0.13并且0.14得到0.15了相同的结果。

建议?

真的不想处理安装 conda ......

0 投票
2 回答
387 浏览

snakemake - snakemake 脚本访问标准输入/标准输出以进行流处理

对于 Snakemake 工作流程,我需要处理许多 BAM 文件中的标签,并希望通过脚本(使用 Snakemake 脚本:指令)来处理这些标签。我这样做的具体方法是使用pysam 流处理

该脚本独立运行良好,但我无法弄清楚如何通过snakemakescript指令集成它。我更喜欢这种方式来最小化 IO 和 RAM 的使用。

编辑:采用直接加载来修复 RG 标签。

编辑:Snakemakesrun:shell:指令设置workdir:目录,而script:指令相对于执行 Snakefile 的目录进行操作(保持一切整洁)。因此,将流处理器置于script:.