问题标签 [eda]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何跳过 dlookr 包中的部分报告
我有一个包含 160 个变量的数据集,我想使用“dlookr”包生成报告,同时跳过比较部分,因为变量太多,这需要很长时间才能完成。我使用的是eda_paged_report
函数,但在文档中找不到任何内容。提前感谢您回答问题。
python - pandas 使用 dask-dataframe 进行分析。索引错误
IndexError: only integers, slices (:), ellipsis, nmpy.newaxis and integer or bolean arays are valid indices
当 pandas 使用 dask 进行分析时,我得到一个 IndexError ( )。数据:290170 x 55
python - 计算数据集 pandas 列中的所有单词
我正在对数据集执行 EDA,并希望在删除重复项之前和之后计算一列中的单词总数。
这是我的代码:
它抛出这个错误: