这里有新的编码器,试图在 Python 3.6 中运行一些 t 检验。现在,为了在我的 2 个数据集之间运行我的 t 检验,我一直在执行以下操作:
import plotly.plotly as py
import plotly.graph_objs as go
from plotly.tools import FigureFactory as FF
import numpy as np
import pandas as pd
import scipy
from scipy import stats
long_term_survivor_GENE1 = [-0.38,-0.99,-1.04,0.1, etc..]
short_term_survivor_GENE1 = [0.32, 0.33,0.96, etc...]
stats.ttest_ind(long_term_survivor_GENE1,short_term_survivor_GENE1)
这需要我为每个特定基因(在本例中为 GENE1)手动输入两个数据集的每一列的值。有什么方法可以调用数据集中的值,这样 Python 就可以读取这些值,而无需我自己输入它们?例如,我可以说某种方式:
long_term_survivor_GENE1 = ##call values from GENE1 column from dataset 1##
short_term_survivor_GENE1 = ## call values from GENE1 column from dataset 2##
感谢您的帮助,很抱歉我对这些东西不是很精通。感谢任何反馈/提示。如果您有任何其他问题,请告诉我!