问题标签 [polish]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
213 浏览

r - R:使用带有波兰字符的 readtext() 上传 doc 文件

让我们有一个包含以下波兰语句子的 .doc 文件(DOC 不是 DOCX !!!):

" Na każde 40 mg% powyżej 100 mg% dodać 1j NovoRapidu, przy glikemii poniżej 100 mg% odjąć 1j NovoRapidu od dawki wyliczonej na WW w posiłku głównym. Przekąski liczyć 1j/ 1WW. W przypadku hiperglikem.ii, 22.00, proszę liczyć na zbicie 1j NovoRapidu na każde 50 mg% powyżej 150 mg%。”

您也可以从这里下载 doc 文件 (my_doc.doc)

我想通过代码将此字符向量上传到 R 中:

该代码独立于使用的编码提供相同的输出。我想在 .doc 文件和 R 中获取相同的文本。我使用 Windows。我该如何编辑我的代码?

0 投票
1 回答
101 浏览

spring-boot - spring boot 中对返回类型 api 的本地波兰字符支持

我正在使用 springboot 版本 = 1.5.13.RELEASE。如果我通过第一种方式使用响应实体中的对象返回数据,则它返回字符 Ã 作为Ã\u008d 并且如果我通过第二种方式使用 ObjectMapper 将对象转换为字符串并将其作为字符串的响应实体返回,则返回字符Ã正确的。如果我在 ResponseEntity 中使用对象作为输出,您能否请教为什么会出现问题。我需要做任何配置吗?我还尝试使用 (.contentType(MediaType.APPLICATION_JSON_UTF8)) 使用 UTF-8 的 MimeType,但它也不起作用。请帮助

1) ResponseEntity 中的返回对象

1) 在 ResponseEntity 中返回字符串

我的 TESTClass 如下所示

0 投票
2 回答
264 浏览

c# - 将 csv 导入 mysql 数据库 - 如何读取带有波兰语字符的文件?

我有一个 csv 文件,它也有波兰语字符。这个的内容在这里:

如您所见,它有这些字符,例如“Ąą Ćć Ęę Łł Ńń Óó Śś Źź Żż”。然后我使用以下代码导入 csv 文件:

当我使用下面的代码将包含所有内容的导入数据从 csv 文件插入数据库时​​:

我在“LNAME”列中的 mysql 数据库中看到并非所有波兰字符:“Aa Cc Ee Ll Nn Óó Ss Zz Zz”。这还不够好。

我试过什么?

我尝试使用其他编码格式导入 csv 文件:

1) Encoding.Default - 然后它像我在这个例子中展示的那样显示:“Aa Cc Ee Ll Nn Óó Ss Zz Zz”。

2)Encoding.ASCII - 然后它显示所有'?人物

3) Encoding.UTF8 - 但它显示所有“?” 字符也。

4) Encoding.GetEncoding(1252) - 没有太大帮助。

至于mysql数据库,我已经设置utf8_polish_ci了比较字幕的方法。

现在,我如何使用波兰字符导入 csv。可能需要在导入 csv 文件代码的第一段中更改代码行:

有任何想法吗?

编辑

我使用phpmyadmin 4.8.4和 mysql 数据库版本是10.1.37-MariaDB

0 投票
2 回答
150 浏览

regex - 正则表达式 - 在字符串中查找单词

我有一个字符串:(prawy p pęknięty p zderzak pęknięcie它是波兰语)

我想全选p(除了单词“pęknięty”和“peknięcie”中的“p”)

我试图做这样的事情:\b(s*ps*)\b,但它不能正常工作。有任何想法吗?

0 投票
1 回答
109 浏览

java - word2vec 中是否有类似单词的波兰语实现?

我找到了 GoogleNews-vectors-negative300.bin 库,但仅适用于 ENG 单词,word2vec 中是否有类似单词的波兰语实现?

我已经尝试过使用 cc.pl.300.bin 和 NKJP-PodkorpusMilionowy 库...

0 投票
0 回答
156 浏览

python - Python - 保存网络抓取的文件 - 波兰语字符编码错误

我创建了一个代码块,该代码块在网络上抓取波兰网站的房产列表信息。

我已经到了保存文件的阶段,但是波兰语字体被破坏了,例如Åódź, łódzkie

有没有办法让它将波兰语字符转换为纯拉丁语,例如óto o,或者只是保持它们不变的形式?

0 投票
1 回答
54 浏览

nlp - 如何自动查找与给定列表中相似的句子?

我有一个让我们说“禁止句子”的列表(其中 1000 个,每个大约 40 个单词)。我想创建一个工具,可以在给定的文档中找到并标记它们。

问题是,在这样的文件中,这个被禁止的句子可以用不同的方式表达,而不是在这个列表中保持相同的意思,但通过使用同义词、或多或少的几个词、不同的词序、标点符号、语法等来改变。事实上,这个is all in Polish 并不是让每个名词、代词和形容词总共有 14 个格加上修饰词和进一步改变单词的性别来让事情变得更容易。我也在考虑制作它,以便找到的句子按它们被禁止的概率排列,其中一些显示不太相似。

我学了两年 IT,但对 NLP 了解不多。你认为这可以由业余爱好者完成吗?你能给我一些建议,从哪里开始,最好用什么工具把它们放在一起?不需要花哨,只要实用。我希望能找到一些现成的代码,因为我想这是以前制作的。有什么想法可以在哪里找到此类资源或在搜索时使用哪些关键字?我真的很感激一些帮助,因为我对此很陌生,需要从基础开始。

提前致谢,

卡米拉

0 投票
0 回答
34 浏览

php - 如何获取没有和带有特殊(抛光)字符的所有记录

这是我当前的查询:

我的数据库中有很多不同的行,我希望此查询能够获取名称以“myName”开头的所有行。它适用于此代码,但它不返回带有波兰字符的行。

我知道“COLLATE utf8_polish_ci”,但我也想删除类似的词,比如这个例子:

我想刮掉这样的名字:

  • 可怕
  • 脚本_
  • 滚动_

等等

但也有波兰语相似字符的名称,如

  • 希恰纳
  • 希切尼奥
  • 希奇米奇

(其中“s”可以是“ś”,“c”可以是“ć”)。

这对我来说有点难以解释,我希望你能理解这一点,并且可以帮助我找到比为每个特定查询进行“或”更好的解决方案。

0 投票
1 回答
82 浏览

html - 波兰语字符有不同的权重

我已经购买了 html 模板 -> https://themeforest.net/item/bredh-multipurpose-web-hosting-with-whmcs-template/23474111,现在我需要添加一些波兰语,但问题是一些波兰语字符看起来不同。

使用字体:“Poppins”

在此处输入图像描述

在此处输入图像描述

有人知道如何消除这个吗?

0 投票
0 回答
102 浏览

java - DateUtils.formatDateRange 不尊重 Formatter 的语言环境

我正在尝试使用DateUtils.formatDateRange()具有以下选项的方法显示我的日期的文本:

我希望得到以下结果(波兰语):

切尔维克 2020

但我得到:

2020 年 6 月

任何人都知道可能是什么问题?