问题标签 [pysam]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 手动安装 pysam 错误:“ImportError: No module named version”
我正在尝试手动安装 pysam,因为我在没有互联网连接的集群上工作并且我没有管理员权限(因此通过 conda 进行安装是不可能的,我已经尝试过)。我已经从开发人员的存储库 ( https://github.com/pysam-developers/pysam/archive/master.zip ) 下载了所有压缩文件,然后将它们传输到集群中的目录。
我已经尝试通过运行从解压缩的存储库手动安装(如说明https://github.com/pysam-developers/pysam/blob/master/INSTALL中所示):
但我收到以下错误:
setup.py 文件中的第 165、166 和 167 行是:
不幸的是,我的知识只带了我到这一步。是否需要修改 setup.py 文件?
我的系统规格:
- Python 2.7.13 :: Anaconda, Inc.
- CentOS 6.5 版
- Linux 2.6.32-431.20.5.el6.x86_64
linux - 无法执行'x86_64-conda_cos6-linux-gnu-gcc':没有这样的文件或目录(pysam安装)
我正在尝试安装 pysam。
执行后:
产生此错误:
有类似的线程,但它们似乎都解决了我没有管理员权限的问题。有没有办法安装所需的文件?
免责声明:这个问题来自我以前的帖子。 手动安装 pysam 错误:“ImportError: No module named version” 但由于它可能需要不同的方法,所以我将其作为一个问题。
python - 将连接替换为连接
我有下面给出的代码:
上面的代码花费了很多时间,我想用 join 替换第 11 行和第 13 行的连接。有什么办法吗?
python - 无法安装 pysam 0.13
我一直无法在 macOS High Sierra 上安装 pysam 0.13。总结一下我的两个错误:
产生 2 个错误。
错误:命令“gcc”失败,退出状态为 1
有什么想法该怎么做?
python - 当每行中的列顺序不固定时,将制表符分隔文件导入为熊猫数据框
我正在尝试将制表符分隔的 sam 文件导入为 pandas 数据框。
下面是我将文件作为数据框读取的代码。
在数据框中,最初的 11 列可用于所有行,因此它们被正确导入。但是,在某些行中,当存在 MC:Z:xxxxx 标记时,它会与该列中的 MD:Z:xxxx 标记混合。因此,某些列在导入期间会发生偏移。
您能否建议在检查列表的开头时如何 read_csv,例如,如果它以 MD 值开头,则将所有值放入 MD 列中,当它以 RG、NM 等开头时以及没有值时相同找到特定的标签,然后把 NA 或保持为空?可以跳过前 12 列进行此类检查,因为它们始终以正确的顺序出现在所有行中。这样,对于大多数行,带有 MC 标签的列将为空。
在读取文件时或稍后在处理数据帧时实施的任何建议将不胜感激。我可以使用 awk 通过一一读取所有列并匹配列的开头(如果 MD/MC/等)来执行此操作。并相应地分配。但我是 python 新手,正在寻求帮助。
阿米特
python - 数百个作业后多处理挂起
我正在尝试将这个问题用于我的文件处理: Python multiprocessing safe writing to a file
这是我对代码的修改:
我在函数中打开和关闭文件的不同之处在于,否则我会从 bgzip 中得到不寻常的错误。
起初,print(parts) 和 print('get') 可以互换打印(或多或少),然后 'get' 的打印越来越少。最终代码挂起,没有打印任何内容(所有部分都打印了,但“get”根本不再打印)。输出文件保持零字节。
任何人都可以伸出援助之手吗?干杯!
python - Python 错误:OSError:打开文件“all_fprau.fasta”时出错。Fasta 文件太大?
我有一个脚本可以搜索 csv 文件和 fasta 文件,两个文件中的任何 ID 都将用于从 fasta 文件中提取 fasta 序列。它看起来像这样:
但是,我在运行此脚本时遇到问题。我收到此错误:
fasta 文件all_fprau.fasta
包含大量序列,我认为这可能是问题所在?当我减小文件的大小时,脚本可以工作,但是我需要所有序列都可用于此管道中的下一步工作。我曾尝试使用:
代替
试图单独搜索 fasta 文件,但我收到错误:TypeError: list indices must be integers or slices, not str
与上面脚本中的第 38 行相关:
任何帮助或建议将不胜感激!
python - 在 fasta 文件中更改反向序列的方向不起作用
我正在尝试在文件中正确定位反向序列。这是代码:
当我打印出反向序列时,代码有效。但是当在文件中时,它会以相反的顺序打印出来。谁能帮我找出问题所在?这是我的 infile 的链接: https ://www.dropbox.com/sh/68ui8l7nh5fxatm/AABUr82l01qT1nL8I_XgJaeTa?dl=0
python - 无法在 Python 3.6 中使用 pip 安装 pysam
Macbook Mac OSX 10.12.6 Python 3.6.2 cython 0.28.5 pip 18.0
我正在尝试安装 pysam:
它在以下位置不断出现错误:
似乎this issue,this和this是版本问题。但我已经尝试过pip3 install pysam==0.13
并且0.14
得到0.15
了相同的结果。
建议?
我真的不想处理安装 conda ......
snakemake - snakemake 脚本访问标准输入/标准输出以进行流处理
对于 Snakemake 工作流程,我需要处理许多 BAM 文件中的标签,并希望通过脚本(使用 Snakemake 脚本:指令)来处理这些标签。我这样做的具体方法是使用pysam 流处理。
该脚本独立运行良好,但我无法弄清楚如何通过snakemakescript
指令集成它。我更喜欢这种方式来最小化 IO 和 RAM 的使用。
编辑:采用直接加载来修复 RG 标签。
编辑:Snakemakesrun:
和shell:
指令设置workdir:
目录,而script:
指令相对于执行 Snakefile 的目录进行操作(保持一切整洁)。因此,将流处理器置于script:
.