问题标签 [census]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何从人口普查 Shapefile(邮政编码级别)中删除所有小岛?
我已经下载了邮政编码级别的人口普查 shapefile,cb_2017_us_zcta510_500k.shp
(https://www.census.gov/geo/maps-data/data/cbf/cbf_zcta.html)
我还下载了允许我添加相应STATE
变量的映射文件(https://www.census.gov/geo/maps-data/data/zcta_rel_download.html)
我将两者合并,我得到:
现在,我尝试过滤所有小岛和阿拉斯加:
但我仍然有一些小岛。
我在这里想念什么?谢谢!
r - GTrends 位置不匹配与美国人口普查 Shapefile
我正在尝试将 Google 趋势中的数据与人口普查中的地理编码数据联系起来。这是 Google Trends for Florida 提供的位置数据示例:
可以在此处找到有关此输出的更多详细信息。
从这里,可以下载 MSA shapefile。我已经下载了 20m 分辨率的 2017 年 CBSA 数据。以下是佛罗里达州的相应数据:
我知道 Gtrends 包含所有可能的 MSA 的一个子集,但是虽然有些完全匹配(例如,佛罗里达州巴拿马城),但对于其他人来说,应该与什么合并并不是很清楚。例如,来自第一个数据的 Ft.Myers-Naples, FL 可以与 Cape Coral-Fort Myers, FL 或 Naples-Immokalee-Marco Island, FL 合并。
在处理此类不一致时,我将不胜感激。也许我遗漏了一些明显的东西,所以如果你发现它,很高兴知道!
json - 如何解析来自美国人口普查 API 调用的不规则 JSON 响应?
以下是来自美国人口普查 API 调用的响应。它在响应中使用不规则的 JSON(或简单的 javascript 对象)格式。形式为{一组数据}{第二组数据}。如何解析第二组,即第二个 { } 块中 data: 标记之后的数组数据。非常感谢。
r - 如何遍历列表并在 R 中创建单独的数据框
我正在尝试按县提取整个美国的人口普查局数据。由于数据的大小,Census 要求您为数据导入指定“区域”(即州或县)。因此,我需要遍历所有状态的列表(通过 fips 代码)以获取所有导入的数据。我需要的输出是每个状态的单独数据帧,然后我可以使用这些数据帧并将其组合成一个大数据帧。这是我编写的代码示例:
我想要得到的是每个名为“migr2010_01”、“migr2010_02”等的状态的单独数据框。我实际上得到的是一个名为“migr”的数据框,其中只有列表中最后一个状态的数据。我知道我的循环中有问题,但我不确定我需要在哪里进行更改,因为我是 R 循环的新手。感谢您的任何想法。
r - 从坐标中检索人口普查区
我有一个带有经度和纬度坐标的数据集。我想检索相应的人口普查区。是否有允许我这样做的数据集或 API?
我的数据集如下所示:
我想添加一个带有相应人口普查区的列。
最终输出应该是这样的(这些不是正确的数字,只是一个例子)。
r - 使用带有不同 funs() 参数的 summarise_at() 以及其他与误差幅度相关的 Q
我正处于构建使用来自 HUD 的 CHAS 数据的包的早期阶段。这些数据基本上是重新打包的 ACS 数据,已针对家庭收入中位数的区域差异进行了调整,并创建了自定义表格。从最小的人口普查区到最大的州,在几个地理级别上有 18 个表格。在 2013 年之前,区域级别的文件根据地方和县细分进行拆分。也就是说,如果一个人口普查区是一个城市的一部分,另一个城市的一部分,以及一个县的非建制部分,那么该人口普查区将有三个记录。除了每个表格产生的估计值外,还报告了误差范围。表设计如下所示:
我创建的函数基本上清理了一些标题字段,并且可以将数据转换为长格式,如下所示:
上面的例子是我想要的格式,但我不确定如何以我当前的 R 知识/技能水平用 dplyr 总结它,所以它们仍然是宽格式。
我遇到的真正问题是如何总结(求和)按 GEOID 分组的估计值,同时正确计算误差范围并保留辅助头文件。tidycensus包有一个误差范围功能,如果我能弄清楚如何使用它,那就太好了。
因此,这可以对部分区域的估计值求和,但它只是将误差幅度加在一起,这不是正确的方法。问题似乎是表需要单独的功能才能发生,但我不确定如何构造我的数据来实现这一点。一种可能的解决方案是仅对 moe 列进行子集化,grepl
并运行单独的误差范围计算,然后重新组合数据。关于如何进行的任何想法?如何组织数据?
r - choroplethr:绘制 MSA 级别的地图?
我的问题涉及通过choroplethr和choroplethrZip在 MSA 级别上绘制整个美国地图。
在下面的示例中,我们绘制了 1) 县级美国地图上的人口普查人口信息和 2) 选定大都市/小城市统计区 (MSA) 级别的缩放地图。
示例 R 代码:
除了放大特定的 MSA,我们还可以绘制整个 MSA 级别的美国地图吗?像这样的方法
没有用,而且很可能会绘制 ZCTA 区域,而不是 MSA 区域。
谢谢!
r - 使用 tigris 从 Lat/Lon 获取 Census Tract
我有相对大量的坐标,我想获取人口普查区(除了 FIPS 代码)。call_geolocator_latlon
我知道我可以使用(如此处所做的)查找单个纬度/经度对,但这对于我的目的来说似乎不切实际,因为该函数发出对人口普查局 API 的一次调用,我想这需要很长时间才能在我的〜200,000双上运行。
有没有更快的方法来做到这一点,也许是通过使用函数下载每个州的 shapefileblock_groups
并从那里映射从纬度/经度到人口普查区?
c++ - 人口普查转换与互信息
我需要使用一种算法来处理立体图像(或帧——因为我打算将它用于用 C/C++ 编写的实时应用程序)并且我正在考虑: 基于互信息的人口普查变换算法和匹配成本计算我最好的选择,但据我所知,人口普查转换并没有像互信息那样给出准确的结果,而且互信息更昂贵。
哪一个更适合我的情况?
python - 网络抓取人口普查数据
我正在尝试从基于人口普查数据的统计地图集网站的教育程度部分的第一个表中抓取数据。本质上,我想从表格中抓取百分比,然后将这些百分比添加到一个数据框中,该数据框在最左边有邮政编码,并且有单独的 HS、无 HS 和更高程度的列。我正在尝试对纽约市的所有邮政编码执行此操作。
这是我到目前为止提出的代码,你能帮我改进一下吗,这样我就可以遍历所有邮政编码,并从第一个带有纽约邮政编码的表中获取一个数据框,其中包含每个教育类别的列城市?
以下是统计图集的链接:https ://statisticalatlas.com/place/New-York/New-York/Overview