所有问题
pyspark - Pyspark 获取前置值
我有一个类似于这个的数据集
| 经验 | PID | 垫 | 键 | 命令 |
|---|---|---|---|---|
| 1 | 铬 | 磷 | 1-CR-P | 1 |
| 1 | 米 | C | 1-MC | 2 |
| 1 | 铬 | C | 1-CR-C | 3 |
| 1 | 聚丙烯 | C | 1-PP-C | 4 |
| 2 | 铬 | 磷 | 2-CR-P | 1 |
| 2 | 铬 | 磷 | 2-CR-P | 1 |
| 2 | 米 | C | 2-MC | 2 |
| 2 | 铬 | C | 2-CR-C | 3 |
| 2 | 铬 | C | 2-CR-C | 3 |
| 2 | 铬 | C | 2-CR-C | 3 |
| 2 | 铬 | C | 2-CR-C | 3 |
| 2 | 铬 | C | 2-CR-C | 3 |
| 2 | 聚丙烯 | C | 2-PP-C | 4 |
| 2 | 聚丙烯 | C | 2-PP-C | 4 |
| 2 | 聚丙烯 | C | 2-PP-C | 4 |
| 2 | 聚丙烯 | C | 2-PP-C | 4 |
| 2 | 聚丙烯 | C | 2-PP-C | 4 |
| 3 | 米 | C | 3-MC | 2 |
| 4 | 铬 | 磷 | 4-CR-P | 1 |
| 4 | 米 | C | 4-MC | 2 |
| 4 | 铬 | C | 4-CR-C | 3 |
| 4 | 聚丙烯 | C | 4-PP-C | 4 |
我需要的是获得相同 exp 的前任的 pskey,给出以下关系:
订单 1 -> 没有前任
订单 2 -> 没有前任
订单 3 -> [1,2]
订单 4 -> [3]
并将这些值添加到一个名为的新列中predecessor
预期的结果如下:
我对 pyspark 很陌生,所以我不知道如何管理它。
python - 试图循环功能。协程从未在第二个循环中等待
我对编程很陌生,但我一直在研究这段代码,终于有所收获。我正在使用 Telethon api 扫描 TG 组,然后对代码执行一些操作。
我的程序有一个主屏幕,在那里我接受输入,然后在返回主屏幕之前循环遍历函数。
第一次运行完美,但是当它回到主屏幕时,发生了 2 件事。
- 我得到协程从来没有等待过。
- 它在没有发生其他事件的情况下开始运行它之后的功能
实际的代码除了打印之外还有更多的功能,但我省略了这些,只是用打印代替,以了解它们在做什么,因为它们正在工作。
任何帮助是极大的赞赏。如果我的代码非常混乱,我提前道歉!
visual-studio-code - Visual Studio Code:Vim - 跳线计算折叠代码块中的行数
在使用 VSC 的 Vim 模拟器时,如果我想跳行,假设输入 10 行10j<Enter>,如果这 10 行中有折叠的代码块,它将打开代码块并整体转到第 10 行。
我不是指在向下/向上滚动代码时打开折叠代码块,只需按j或,如此处所k引用。我在我的偏好中检查了“Vim:Foldfix”。
注意:当一次跳转多行时,常规 Vim 不包括折叠块内的行,这就是我正在寻找的响应。
html - 检查特定的 url 并渲染 jinja2 / html
如何在 html 文件中检查 jinja2 中的特定 URL,然后根据我当前所在的 URL 呈现不同的 html 文件?
例如。
我觉得目前的逻辑不是很好:
另外,如果我想在未来做一些事情,我该如何扩展它:
docker - (GitHub Actions,上传工件)尽管授予文件完全权限,但访问被拒绝尝试上传文件
描述问题
我正在执行一个从 docker 容器运行 API 测试的操作,该容器会生成一个 report.html。此报告保存到 docker 卷中。在操作中,创建报告后,我尝试在 report.html 上使用操作/上传工件,使用主机上卷中其位置的路径。
问题是Error: EACCES: permission denied, lstat /path/to/report.html当操作尝试执行此操作时我得到了。
我试图通过sudo chmod ugo+rwx /path/to/report.html 在使用该操作之前执行此操作来解决此问题,但它没有任何改变。我认为使用 sudo 运行该操作会起作用,但这似乎不受支持。
如何重现
复制一个类似的例子,我只是在卷中创建一个 test.txt 文件。github 操作如下所示:
Dockerfile 很简单:
和 docker 组成:
python - 有条件地提前退出 Pytest 中的完整测试套件
我有一个参数化的 pytest 测试套件。每个参数都是一个特定的网站,测试套件使用 Selenium 自动化运行。考虑参数后,我总共有数百个测试,它们都是按顺序运行的。
每周一次,Selenium 会因各种原因而失败。连接丢失,无法实例化 chrome 实例等。如果它在测试运行过程中失败一次,它将使所有即将进行的测试崩溃。这是一个示例失败日志:
理想情况下,我想在 Selenium 发生故障后立即退出套件,因为我知道所有即将进行的测试也会失败。
有没有这种方法:
或者其他一些机制可以让我根据检测到的条件提前退出完整的测试套件。
node.js - 如何使用 node-pg-migrate 定义“INT GENERATED ALWAYS AS IDENTITY”列?
如何使用 node-pg-migrate 为下表定义迁移文件
似乎没有关于如何使用 node-pg-migrate 执行 INT GENERATED ALWAYS AS INDENTITY 列的文档
c++ - 如何在卷积算法中使用 SSE 正确访问具有特定指针算法的数组?
我的数组大小是 4 的倍数并且它们是对齐的:
我已经编写了 CPU“方法”并且它可以正常工作:
另一方面,我应该将函数与 SSE 一起使用。我尝试了以下代码:
并且上面的函数工作不正确,并且产生的值与 CPU 不同。
该问题是在 stackoverflow 上指定的,并带有以下评论:
*(pInputSignal + i - j) 在 SSE 的情况下不正确,因为它不是远离当前值的 ij 偏移量,而是 (ij) * 4 。事情是,正如我所记得的那样,除非内在函数从那时起发生了变化,否则以这种方式使用指针的想法是不正确的——在我的时代,在这种情况下,必须将值“加载”到 __m128 的实例中,如 H(J) 和X(IJ) 位于未对齐的位置(和序列中断)。
和
由于您关心单个浮点数及其顺序,因此最好使用 const float* 和 _mm_loadu_ps 而不是仅仅取消引用(类似于 _mm_load_ps)。这样,您可以轻松地进行未对齐的加载,将您想要的浮点数放入您想要的向量元素位置,并且指针数学的工作方式与标量相同。您只需要考虑到 load(ptr) 实际上会为您提供来自 ptr+0..3 的元素向量。
但我无法使用此信息,因为在这种情况下不知道如何使用 SSE 正确访问数组。
python - 我可以在使用 aws_cdk 创建 lambda 后立即调用它吗?
使用下面的代码,我可以创建和部署一个 lambda,但我想在每次执行部署时调用它。此代码在 github 操作工作流中运行。
我也尝试过使用CustomResourcefromaws_cdk但它没有用,它只在创建之后运行 lambda(第一次创建 cloudformation 资源),而不是在每次调用 github 操作之后(在 cloudformation 上生成更新)资源)。
更新
我选择创建一个boto3用于调用 lambda 的脚本,并使用 Github Actions 进行调用。
我得出的结论CDK是更好地用于创建和管理基础设施作为代码,而boto3更好地操作这些创建的资源。
rest - 包含日期的泛型类型对象发送到 FE 并返回具有相同类型的 BE
我有一个像这样的通用对象的 DTO:
初始数据是一张地图,可以包含任何内容。例如数字、字符串或有问题的日期。当我在后端创建 initialData 并将其保存到数据库(MongoDB)时,它以相应的类型保存(createdAt 是日期类型)。
之后,我以 JSON 格式将数据发送到前端,当然日期是字符串格式。前端将这个包含日期的通用 Any 对象发回给我。我的杰克逊映射器不知道这个字符串是日期并将 createdAt 映射到字符串类型,我也将它作为字符串保存到 MongoDB。
我应该怎么做才能从 FE 对应类型中获得?或者实现这一目标的最佳实践是什么?
我想为 DTO 保存一些元数据,例如 -> 数据:
元数据:
或在每个日期周围使用一些包装器
或将 objectMapper(反序列化器)更改为在字符串名称末尾包含Date的每个字段,尝试像日期一样解析它:
谢谢!
c# - Parallel.For 循环清理
我是多线程的新手。我有一个Parallel.For循环工作得很好!
我确实有一个取消令牌。
我们的 DBA 恰好注意到我有很多活动线程(我正在测试和使用该工具,但它不会在生产中使用)。
无论如何,我开始寻找处理后清理线程的方法,但找不到任何东西。除了清理之外,我还需要清理cts.Cancel吗?
git - 为什么 repo sync 没有检出我在清单文件中指定的分支?
假设我有以下repo工具的清单文件(MSE 脚本包含在本文末尾):
我可以进入一个repo init ...全新repo sync的目录(即,没有任何先前的内容)。但是当我 cd 进入生成的repo1子目录(例如,
/tmp/standalone_repo_expt/work_area/myproject/repo1/),然后执行 a 时,git status我看到了:
然后显示我看到的可用分支:
为什么没有repo sync签出到我在清单文件master的标记中指定的默认分支 ( ) ?default
类似问题
这类似于为什么 git repo checkout 指定的分支?但不是完全相同的问题。我的问题是没有签出任何分支,这似乎是错误的。除了 之外,我不应该做任何其他事情repo sync,并且我不应该git checkout master在该清单文件管理的所有存储库中运行。
这似乎也类似于https://stackoverflow.com/a/66264612/257924
但 usingrepo init -b master也没有做我想要的(对没有将存储库签出到指定分支的问题没有影响)。
https://stackoverflow.com/a/16917618/257924接近回答这个问题,但没有解释git branch -a为什么master在repo sync.
回购工具版本
回购工具于 2021年11 月 15 日通过以下方式直接从源中提取:
卷曲https://storage.googleapis.com/git-repo-downloads/repo > /tmp/standalone_repo_expt/bin/repo
并且 PATH 设置为包含/tmp/standalone_repo_expt/bin.
MSE 脚本
flutter - Flutter 错误:ParentDataWidget 使用不正确
试图在 listview builder 中构建一个类似 Facebook 的按钮,但在我运行我的项目时没有出现。我每次都收到此错误,但它没有显示哪个小部件导致错误
这是我的代码:
renderBtnlike 小部件:
会感谢一些帮助现在被卡住了一段时间,我不知道如何解决这个问题,提前谢谢你。
r - 如何使用列表列 dbplyr 进行分组和汇总
我希望在数据库中执行以下操作,但似乎无法使用 { dbplyr}。还有其他方法吗?谢谢
由reprex 包(v2.0.1)于 2021 年 11 月 15 日创建
java - 如何解决错误检测到未知的 BSON 类型
您好,我正在尝试在使用 Mongo 4.4.6 数据库时找出 org.mongodb:mongodb-driver-sync 和 org.springframework.data:spring-data-mongodb 之间的正确依赖关系。仍然得到:
奇怪的是查询成功执行,然后响应被传递到CommandListener那里,在记录期间它抛出异常。
有人能指出我正确的方向吗?
sql - 如何将两条唯一记录相加并显示为一条新记录——OracleSQL?
我正在尝试合并表中的两条记录,然后将其表示为新记录。
这是我的桌子:
当我运行查询时,我希望表看起来像这样:
如您所见,我将 InfoSec 和 IT 记录合并为一个新记录。关于如何做到这一点的任何想法或建议?
这是我的查询到目前为止的样子:
database - 为什么在 Next.js 中缓存 MongoDB 连接?它有效吗?
我正在创建一个 Next.js 应用程序,我注意到许多开发人员缓存了 MongoDB 连接。例如
或者
我从未在 Express 应用程序中看到过这种情况,所以我有两个问题:
- 为什么缓存数据库连接在 Next.js 中如此常见,而我在 Express.js 中从未见过。他这样做的原因是什么?它是如何工作的?这值得吗?
- 正如您在上面的示例中看到的那样,一些开发人员使用有用的 let 变量,而其他一些开发人员使用全局变量。有什么区别,哪个是更好的解决方案?
invariants - Daikon 无法运行:“文件 example.dtrace 中的第 1 行出错:没有为程序点 program.point:::POINT 提供声明”
我正在尝试在使用开源 perl 脚本从 CSV 文件生成的 .decls 和 .dtrace 文件上运行 Daikon。下面将提供 .decls 和 .dtrace 文件。daikon.jar 文件保存在一个目录中,该目录有一个子目录“scripts”,我在其中保存 .dtrace 和 .decls。
我正在尝试使用以下命令从包含 daikon.jar 文件的目录中调用 daikon:
java -cp daikon.jar daikon.Daikon 脚本/example.dtrace 脚本/example.decls
程序响应如下:
我很困惑为什么它找不到我提供的包含 program.point 函数声明的声明文件。下面我提供了 example.dtrace 和 example.decls 文件的内容。
例子.dtrace
例子.decls
python - 有没有办法在 Python 的输入中输出数组?
刚开始学习 Python 并尝试测试一些东西以更好地理解在 Python 中编写代码的更好方法。对于这个问题,我要做的是让用户从选项列表中输入一个答案,然后转到下一个功能。例如,
我希望用户看到的输入是:
目前我遇到了像上面的代码一样工作的错误。dnd_weapons希望这是有道理的,只是试图找到一种更好的方法来从列表中进行输入,而不是在不同的代码部分一遍又一遍地重写。
先感谢您!!
reactjs - 为什么我使用“@brainhubeu/react-carousel”出现渲染问题:“^2.0.4
re警告:在呈现不同的组件 ( ) 时无法更新组件 ( wi)。要在内部找到错误的 setState() 调用wi,请按照...4 中所述的堆栈跟踪进行操作
知道为什么会这样吗?
json - Delphi Rest.JSON 不适用于简单类
我正在处理我的主要项目,我必须“JSON 序列化”一个简单的类:
我看不出有什么问题……知道吗?谢谢你。
r - 如何在 TWFE 中添加多个虚拟变量?
在此处输入图像描述我设计了一个带有虚拟变量的 twfe 模型,以便在 diff 中进行 diff。为了引入新的自变量,我需要再引入两个虚拟变量(北/南和海/湖自治市)。如果我在代码中添加它们然后总结结果,我看不到这些系数的估计值。
不能引入多个假人吗?对于其他变量,例如人口统计数量,我没有任何问题。
代码下方:
输出=
如何解决此问题并引入多个虚拟变量?
数据结构如下:
pine-script - PINESCRIPT - 锁定 ATR 用于止损和获利
我想使用 ATR 获利并设置止损。问题是,ATR 继续调整每根柱线。如何根据开盘蜡烛将 ATR 设置为静态数字,而不是继续更新每个柱?
仅供参考:stackoverflow 上有几个同样的问题,但没有一个真正起作用。
我也尝试过使用 strategy.position_avg_price 而不是 close 但这似乎也不起作用。
这是我的代码。
我正在使用 v4。
谢谢!
reactjs - TypeError:无法读取未定义测试库 + Jest 的属性“关闭”
我创建了一个组件,它有两个按钮和它们各自的 Chakra UI 点击事件。
所以我创建了一个简单的测试,想法是生成快照然后点击事件,但是出现以下错误。
在那种情况下,我应该做一个模拟还是什么?如果是,会怎样?
组件
测试

