问题标签 [words]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
grep - grep 只能显示与搜索模式匹配的单词吗?
有没有办法让 grep 从匹配搜索表达式的文件中输出“单词”?
如果我想在多个文件中找到“th”的所有实例,我可以这样做:
但输出将类似于(粗体是我的);
我希望它使用相同的搜索输出的是:
这可能使用grep吗?还是使用其他工具组合?
php - PHP - 正确输入了哪个单词?
我正在寻求有关编写脚本以检查短语/单词列表并将它们相互比较并查看哪个是正确键入的短语/单词的帮助。
因此,在比较每个数组中的每个索引时,它应该遍历每个数组并比较两个值。最后,它应该产生:
任何帮助,我很感激!
python - WordNet 有“级别”吗?(自然语言处理)
例如...
鸡是一种动物。
墨西哥卷饼是一种食物。
WordNet 允许您执行“is-a”...层次结构功能。
但是,我怎么知道什么时候停止爬树呢?我想要一个级别。
那是一致的。
例如,如果呈现一堆单词,我希望 wordNet 对所有单词进行分类,但在一定的级别上,所以它不会走得太远。将“墨西哥卷饼”归类为“事物”过于宽泛,而“墨西哥包裹食品”则过于具体。我想上升或下降..直到正确的水平。
html - 限制 HTML 段落中的字符
我想让它在段落内只有 350 个字符,无论放入多少个字符,我只希望显示 350 个。
我怎样才能做到这一点?文本只是在一个 div 标签中
文本。
干杯
html - 长字打破布局。UTF-8 中的 HTML 输入呢?
想象一下,如果我在文本中有类似 [a href="this-is-a-very-big-link"] 这没关系[/a](用 [ 和 ] 切换 < 和 >)... 还有这个-是一个非常大的词。
我需要将第二个案例分成两行......
注意 wordwrap 会终止链接,因此它对于解决此类问题没有用处。
任何的想法?
words - 很多文章的单词列表 - 文档术语矩阵
我有近 15 万篇土耳其语文章。我将使用文章进行自然语言处理研究。我想在处理文章后存储每篇文章的单词和频率。
我现在将它们存储在 RDBS 中。
我有 3 张桌子:
文章 -> article_id,text
Words -> word_id, type, word
Words-Article -> id, word_id, article_id, frequency (index for word_id, index for article_id )
我会查询
- 一篇文章中的所有单词
- 每篇文章一个词的频率
- 单词出现在所有文章和哪些文章中
我在 word-article 表中有数百万行。在这个项目中,我一直使用 RDBS。从mysql开始,现在使用oracle。但是我不想用oracle,想要比mysql更好的性能。
此外,我必须在具有 4gb 内存的机器上处理这项工作。
简单地说,如何存储文档术语矩阵并对其进行查询?性能是必要的。“键值数据库”可以在性能上击败 mysql 吗?或者什么可以打败mysql?
如果您的答案编程语言取决于,我正在用 python 编写代码。但是 C/C++ , Java 没问题。
python - 通过python将一个大字符串拆分为包含'n'个单词的多个子字符串
原文:美国独立宣言
如何将上述源文本拆分为多个包含“n”个单词的子字符串?
我使用 split(' ') 来提取每个单词,但是我不知道如何在一个操作中使用多个单词来做到这一点。
我可以浏览我拥有的单词列表,并通过将第一个列表中的单词粘合在一起来创建另一个单词(同时添加空格)。但是我的方法不是很pythonic。
list - SIFR - 列表中的链接
我在将 sIFR 用于列表中的链接时遇到问题。
当我尝试将它应用于我的链接时,我的链接是完美的皮肤(使用正确的字体和正确的颜色),但是每个链接的最后一个单词被剪切或显示在另一行上。
当我将它应用于
- 文本显示良好,但显示为超文本链接(蓝色和下划线)。
我尝试过类似 forceWidth: true, fitExactly: true, forceSingleLine: true preventWrap: true 似乎没有任何效果。
我现在完全绝望了。有人遇到同样的问题吗?
我正在使用 wordpress。
这是问题的一个例子: http ://www.thibaudcartigny.com/exemple.jpg
感谢阅读。
database - 如何获取英语单词数据库?
我需要一个包含每个英语有效单词的数据库。我检查了/usr/share/dict/words
文件,它包含少于 100k 个单词。维基百科说英语有 475k 单词。我在哪里可以获得完整列表(美式拼写)?
另外,是否有一个网站也提供其他语言的单词,包括亚洲和欧洲语言?
编辑:忘了补充,我不需要名字等,只需要有效的英文单词。