问题标签 [tagging]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
performance - 如何在保持有效性的同时自动标记文本?
假设我有一组一百万个标签和一个需要为这些标签和可能的新标签解析的文本。这里的标签数量只是说明我的思维问题的一个例子——太多而无法以线性方式循环,太多而无法保存在内存中等等。
不知何故,我想不出一个占用空间小的解决方案(并且保持快速)。我知道人们必须进行权衡,但我认为我忽略了一些概念。
这对于智能标记(“Michael Jackson”=“artist”等)特别有趣,因为应用的标记可能不是文本本身的一部分。
除了做单词黑名单、流行标签缓存和大量 sql 查询之外,解决这个问题的最有效方法是什么?
(很有趣,我必须自己标记这个问题:-))
由于我的评论空间有限,让我在这里补充一些想法:
- 我同意使用整数哈希可以提高速度。好主意。
- 散列不会解决迭代问题(循环遍历每个散列/标签,同时根据标签列表检查单词或单词组合)
- 细化问题:假设像“hello world”这样的文本。此文本有 3 个潜在标签(“hello”、“world”和“hello world”)。标签列表可能只包含“hello”,但解析后可能会添加“world”或“hello world”,这意味着这些标签不会应用于文本。
问题:
- 假设一个书本大小的文本,遍历所有组合(如“九英寸钉子”,但我们假设组合限制为 4 个单词)以将它们与数据库中的标签进行比较需要很长时间,即使假设使用整数哈希也是如此。
- 标签列表可能很长,因此迭代存储的标签也可能很慢。
- 标签更新将意味着对文本进行额外的全文搜索 - 取决于文本的数量及其长度,这可能是数据库杀手并且根本没有效率?
- 如何自动找到“相关”的新标签?(在一篇关于音乐的文章中再次想到“九寸钉”——但“发行一首新歌”并不是一个好的标签)。不过,这可能是一个问题。
svn - SVN:我可以将文件子集复制到新标签吗?
在我的 repo 主干中,我有一个目录unit-tests
,我想把它放在我的发布标签之外。我一直在做的是将主干复制到一个新标签,然后删除unit-tests
. 这行吗?感觉不对,因为每个版本都需要进行两次修订。有没有办法从 svn 副本中排除目录?
例如我有:
我想创建:
我通常使用 Tortoise/Eclipse 客户端,但如果需要,我可以使用它。
web-applications - 设计一个强大的社交/协作标签系统
我如何实现一个系统,每个人都可以为每个项目添加/删除标签,但仍然保护它免受垃圾邮件/标签破坏?我认为它可能需要存储每个人为一个项目标记的标签,然后以某种方式为该项目提供一个聚合/“顶部”标签。
我认为 Slashdot 有一个这样的标签系统——他们的标签系统到底是如何工作的?似乎没有太多关于它的文档。
svn - 使用 CruiseControl.Net 构建标记项目
我的经理要求我为我们的项目设置构建自动化。我决定使用 CruiseControl.Net 作为我们的持续集成服务器,因为其他一些团队成员对它有一点经验,但我没有——这就是我很高兴承担这项任务的原因。
我们使用 Subversion 作为我们的存储库,最终目标是在每次标记项目时实例化构建。例如:
将文件夹添加到 svn://svn/tags/ProjectX/ 例如 svn://svn/tags/ProjectX/JulyCheckPoint 应该将新添加的标签 (svn://svn/tags/ProjectX/JulyCheckPoint) 检出到本地目录(D:\temp\tags\ProjectX\JulyCheckPoint) 并运行一个 nant 文件 (D:\temp\tags\ProjectX\JulyCheckPoint\nant.build)
我知道 CruiseControl 能够监视 svn://svn/tags/ProjectX/ 的更改,但我不确定如何将最新标签签出到构建服务器的本地磁盘并在其中运行 nant.build 如果我不知道最新标签的名称。我做了一些谷歌搜索,并相信 svn post-commit 钩子可能是我应该研究的东西。
我希望这一切都有意义,如果您需要更多详细信息/说明,请告诉我。任何指导/建议将不胜感激。
干杯。
php - 如何正确输入标签?
我的网页中有一个标签字段,用户可以在其中输入用,
(逗号)分隔的标签,就像在 StackOverflow 中所做的一样。我正在使用PHP,我使用explode函数根据逗号分隔用户输入的所有标签,然后将它们添加到我的数据库中的标签表中。
我的代码非常适合普通标签,例如如果用户输入battleship, strategy, sea war
然后它的工作,但可以说用户输入battleship, strategy, sea war,
或battleship, strategy, games, sea war, , , , ,
或battleship, strategy, games,, sea war
或任何错误的值,那么我将如何检测它,然后在数据库中只输入正确的值。
是否可以使用 regExp 或任何其他方式,请告诉我如何?
svn - SVN 布局——最佳实践
在 CVS 中,我们的项目中有多个目录。有一个夜间构建,它必须从同一个 CVS 项目的不同目录中提取内容才能构建夜间构建。所以我应该记住这一点,如果我们迁移到 SVN,我必须修改构建脚本以从不同的存储库中检查内容。
我阅读了相关的 SVN QA,但我有自己的问题需要答案。
我可以:
我们开发的所有东西都来自/trunk,而我们不更改的任何 3rdparty 都来自/3rdparty。
很好,现在夜间构建脚本必须标记主干,签出标签,将所需的 3rdparty 内容签出到适当的目录中,然后开始构建过程。
构建结果(编译的东西)可以在 NFS 挂载上保留一段时间,因此集成团队可以返回 2 周并重新创建问题。
我的所有基地都覆盖了吗?
php - 面部识别/检测 PHP 或用于照片和视频库的软件
我有一个非常大的照片库,里面有成千上万个相似的人、物体、地点、事物。照片中的大多数人都有自己的用户帐户和头像照片来匹配。根据可用于每张照片的附加数据,还有可能出现在照片中的人的逻辑短名单。我允许用户将照片与他们的朋友和他们认识的人一起标记,但自动化过程会更好。
我使用了来自 face.com 的照片标记器/查找器与 Facebook 照片集成,而用于个人相册的谷歌 Picasa 照片标记器也做了同样的事情,这正是我想要做的。
是否有 PHP 脚本、Google Picasa 的 API、face.com 或其他识别服务或任何其他提供服务器端面部识别和/或按相似性分组照片的开源项目?
示例:如您所见,各种照片共享网站都提供了该功能,但是否有任何提供 API 用于存储在我自己的服务器上的图像或足够广泛的东西以链接到我自己的画廊和标记系统?
- viewdle - 视频的人脸识别/标记
- PHP - 纯 PHP 中的人脸检测
- 沙格
- 开放式CV
- Face.com - 在 Facebook 中查找和标记照片的应用程序
- Google Picasa - 照片共享
- TeraSnaps - 照片分享网站
- Google Portrait - 来自 Google 图片结果的照片分组
- FaceOnIt - 视频人脸识别
- PittPatt - 检测、识别、视频人脸挖掘
- BetaFace
- ChaosFace - 实时人脸检测器
jquery - Jquery和格式化文本区域进行标记?
我正在寻找一种方法来使用 textarea 并获取用逗号分隔的值,然后将它们放入数组中。
真的,我正在寻找如何自动格式化 textarea 以便当用户在其中键入内容时强制或逗号中断。我想使用自动完成,但我没有数据可以检查它,因为这将是一个新用户注册。
最好的方法是什么?
php - PHP - 民俗标签检查正则表达式
我正在尝试创建一个正则表达式来检查自由形式的民俗系统提交的标签的值。这就是我现在所拥有的。
我想允许:连字符、反斜杠、正斜杠、az、AZ、0-9、句点、下划线、at 符号和单引号,并禁止所有其他。
我很确定否定字符类是继续进行此操作的方法...
但是我上面的代码似乎允许其他字符(例如 +),我不知道为什么。另外作为旁注,我不确定我是否确保我不会无意中允许 SQL 注入。有小费吗?
tagging - 自动文档标记相关
我开始从事一个项目,在该项目中我必须用关键字标记文档,如果您手动操作(特别是如果您有数千个文档),这真的很难而且很耗时。所以我打算自动化这个过程(知道结果不会完美,但至少它会给你一些建议的标签)。在最新的 Firefox 版本中,他们实现了这样的系统(当您为页面添加书签时,它会建议您一些标签)。
雅虎术语提取服务也是一个很好的例子
因此,如果任何机构可以帮助我解决这个问题,我将非常感谢您的帮助。或者,如果有人知道 Firefox 标记系统,那么一点帮助会很棒。