问题标签 [french]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
parsing - 使用斯坦福工具解析具有通用依赖关系的法语
我想使用斯坦福解析器版本 3.7.0(最后一个)解析具有通用依赖项的法语文本。
这是我的命令:
我使用最后可用的模型https://nlp.stanford.edu/software/lex-parser.shtml#Download
但是我的输出不包含任何功能,并且 POS 不是 UD 的
1 拉 _ DD _ 2 空 _ _
2 pluie _ NN _ 3 NULL _ _
3 蝙蝠 _ VV _ 0 根 _ _
4 les _ DD _ 5 NULL _ _
5 carreaux _ NN _ 3 NULL _ _
我也在尝试使用 CoreNLP 的解析器工具,这是我的命令行:
我的属性文件包含以下几行:
注释器 = 标记化、分割、位置、解析
tokenize.language = fr
parse.model = edu/stanford/nlp/models/lexparser/frenchFactored.ser.gz
pos.model = edu/stanford/nlp/models/pos-tagger/french/french.tagger
depparse.model = edu/stanford/nlp/models/parser/nndep/UD_French.gz depparse.language = 法语
我收到以下错误消息
原因:java.io.IOException:无法将“edu/stanford/nlp/models/pos-tagger/french/french.tagger”作为类路径、文件名或 URL 打开
我该如何解决?
email - 如何让法国口音在 mailto 中正确显示?
我有一个带有正文副本的邮件链接。内容全部为法语。不幸的是,它显示有趣的字符而不是我需要的口音。
任何帮助,将不胜感激!
我尝试对电子邮件进行编码
coldfusion - 使用逗号的表单中的 ColdFusion 区域设置特定货币输入(即法语加拿大 2 222,22$)
是否有更简单/更短的方法将货币输入的最终逗号转换为小数。
输入看起来像 2 000,99 或 2,000,99
MySQL 希望它们看起来像 2000.99
java - p: 对语言环境的日历支持
当我尝试在 JSF primefaces 日历中添加对语言环境的支持时,我遇到了一些问题。
我正在传递语言环境并且还添加了用于日历 UI 支持的语言环境 js 文件。但是当用户从日历中选择日期&之后,我有下面的java代码来解析日期&来验证日期。
当前语言环境:fr 假设用户从 UI 日历中选择“21-Aoû-2015”。但是对于java日期格式
相似地 :
我正在使用下面的代码和选定的语言环境是“fr”:
所以,我发现的主要原因是 java DateFormat 解析不匹配。即:当区域设置为“fr”法语时。
Java解析:
对于“fr”语言环境 -
八月 => "août" 而不是 "Aoû"
四月 => “平均” 而不是“AVR”
java - 匹配 à 和 À 的不区分大小写的正则表达式
我遇到了与大小写无关的正则表达式 like/(?i)À/
与小写中的行不匹配的问题 like à
。
我在代码中检查了这个并确保"À".toLowerCase() == "à"
不区分大小写的正则表达式是否仅适用于英文(或拉丁文)字符?
这是应该返回true但返回false的代码示例
Pattern.compile("À", Pattern.CASE_INSENSITIVE).matcher("à").matches()
hibernate - JPA 将法语字符从 CLOB 转义到字符串列
我对多语言数据库有以下问题。我需要将每种语言的属性文件存储到数据库中。我在实体中使用了 CLOB 数据类型和 String 字段,我在 @PrePersist 和 @PreUpdate 上将 java.util.Properties 转换为 String,在 @PostLoad 中我将它从字符串转回属性。这对于德语本地化效果很好,但不适用于法语。可能值得一提的是,我到处都在使用 ISO8859-1 编码
我试过转义特殊的法语字符,然后从我的角度来看,clob 很好。但是,当我将数据加载到实体时,JPA 确实取消了字符转义并搞砸了法语字符。
我通过将我的 clob 转换为 blob 并将实体中的列转换为 byte[] 数组来解决了这个问题,这使我能够解决这个问题并使用 Properties.load(InputStream stream) 方法进行转义,即使对于法语也可以人物
然而,我的问题是如何通过将 clob 保存在数据库中来管理它(它包含的内容清晰可见,等等)。在将数据从 clob 写入字符串时,我需要强制 JPA 或休眠不要转义字符。它有一些配置属性吗?
python-3.x - 如何 POS_TAG 一个法语句子?
我正在寻找pos_tag
一种法语句子的方法,例如以下代码用于英语句子:
report - 法语特殊字符在 BIRT 报告中未正确呈现
我想用法语创建一份报告。我正在使用 birt-runtime-3_7_2。报告标题、表格标题在 messages.properties 文件中配置。问题是加载报告时法语特殊字符未正确显示。
例如。Année 在报告中显示为 Année
我在 web.xml 中更改了 birt 语言环境,如下所示
并且还改变了 fontsConfig.xml 如下。
这些都没有奏效。我们如何解决这个问题?
c# - 正则表达式中的法语/葡萄牙语扩展 ASCII 符号
我需要编写一个编辑控件掩码,它应该接受[a-zA-Z]
字母以及扩展的法语和葡萄牙语符号,如[ùàçéèçǵ]
. 掩码应接受大写和小写符号。如果找到两个建议:
和
编写这样一个正则表达式的正确方法是什么?
更新:我的问题是关于形成一个应该匹配(而不是过滤)法语和葡萄牙语字符的正则表达式,以便在编辑控件中显示它。不区分大小写的解决方案对我没有帮助。[\p{L}] 似乎是一个 Unicode 字符类,我需要一个 ASCII 正则表达式。允许使用数字,但不允许使用特殊字符,例如 !@#$%^&*)_+}{|"?><(应过滤)。
我发现最有效的变体是 [a-zA-Z0-9\u00B5-\u00FF]
https://regex101.com/r/EPF1rg/2
问题是为什么 [ùàçéèçǵ] 的范围是 \u00B5-\u00FF 而不是 \u0080-\u009F ?正如我从 CP860(葡萄牙语代码页)和 CP863(法语代码页)中看到的,它应该在 \u0080-\u009F 范围内。
https://www.ascii-codes.com/cp860.html
谁能解释一下?
php - PHP 单词边界 /b 正则表达式不适用于法语
我正在尝试将句子“ça vous dit quoi”与正则表达式模式匹配:
除了法语专有字符(如 ça 开头的 ç)之外,单词边界适用于任何内容。我可以通过更改 PHP 语言环境来解决单词边界问题:
当我这样做时,它成功匹配了句子,但是所有法语字符都显示为 � 所以我得到:
有点烦人。解决一个问题只是为了创造另一个问题。我已经将 html 语言环境设置为:
不确定还需要做什么来解决这个问题?当然,法语应该在所有语言环境都设置为法语的情况下显示 ok...?
编辑:我的服务器通过 phpinfo 将 UTF-8 显示为本地和主值的默认字符集。
编辑:这个问题与建议的问题不同,因为这个问题根本不相似。解决方案可能是相同的,但任何在谷歌搜索我遇到的问题的人都不会找到那个问题,但他们会找到我的。我认为人们开始只是为了它而将问题标记为重复。
这个问题也与我的问题相似,因为答案是相同的: 法语字符的正则表达式 但这会使所有三个问题都重复。