2

我希望有人可以帮助使用 CFML实现TeXHyphenator-J 。

我正在使用 JavaLoader.cfc 创建 TeXHyphenator-J 的 ColdFusion 对象(如下面的代码所示)。运行代码时,我没有收到任何错误,并且返回了一个字符串。但是它没有连字符吗?

<!--- Load Javaloader --->
<cfset paths    = arrayNew(1)>
<cfset paths[1] = expandPath("assets/Hyphenator/texhyphj.jar")>
<cfset loader   = createObject("component", "assets.javaloader.JavaLoader").init(paths)>

<!--- Create buffered stream to TeX file --->
<cfset FileInputStream = createobject("java", "java.io.FileInputStream").init(expandPath("assets/Hyphenator/hyphen.tex"))>
<cfset BufferedInputStream = createobject("java","java.io.BufferedInputStream").init(FileInputStream)>

<!--- Initiate Hyphenator --->
<cfset h = loader.create('net.davidashen.text.Hyphenator').init()>
<!--- load the TeX table into Hyphenator --->
<cfset h.loadTable(BufferedInputStream)>
<!--- Get hyphenated string, Hyphenator should return as-so-ci-ate --->
<cfset retStr = h.hyphenate('associate')>

<cfdump var="#retStr#">
4

1 回答 1

0

但是它没有连字符

虽然不是很明显,但返回的值实际上连字符的。所选连字符,即 \u00ad只是不可见。转储字符串中的每个字符显示软连字符的 ascii 值为 173:

97  : a
115 : s
173 : ­    <== soft hyphen
115 : s
111 : o
173 : ­    <== soft hyphen
99  : c
105 : i
97  : a
116 : t
101 : e

因此,一个简单的解决方案是用标准连字符替换该字符:

newString = replace(retStr, chr(173), "-", "all")

旁注,直接在 java 中运行相同的示例也会产生“as-so-ciate”,而不是“as-so-ci-ate”。

于 2017-01-19T02:35:27.630 回答