“structured-data”的相关标签问题

0 投票

1 回答

126 浏览

seo - 使用 schema.org 在文章中标记标签的正确方法是什么？

我找到了以下 3 种方法，但不清楚哪种方法是正确的，或者它们都是正确的？我什至应该在我的文章中标记标签吗？我特别关心 SEO 问题。

或者

2014-06-02T07:42:33.233

0 投票

1 回答

3211 浏览

solr - 如何上传/索引富/结构化文本文档以使用 ElasticSearch 进行搜索？

我正在围绕包括 Microsoft Word Docs、PowerPoints、PDF 和文本文件在内的文档语料库构建搜索引擎。我已经成功下载并安装了 ElasticSearch 并让它运行（从命令提示符和浏览器中可见 - localhost:9200）。

我可以上传和搜索手动输入的数据（在几个在线教程中找到 - 例如这个：http ://www.elasticsearchtutorial.com/elasticsearch-in-5-minutes.html#Indexing ）

现在我需要进行（大？）从搜索手动输入的数据到搜索大型结构化文本文件的语料库。我的问题是 - 我如何上传/索引这些文档以使它们可用于我已经运行的 Elasticsearch 实例。

我知道这可能太大而无法在单个回复中回答 - 即使指向工具或教程链接也会有所帮助。

版本：Windows 7、Elasticsearch 1.2.1

solr indexing elasticsearch information-retrieval structured-data

2014-06-11T17:44:41.210

0 投票

1 回答

117 浏览

python - 在 python 2.7 中解析巨大的结构化文件

我是python世界和生物信息学的新手。我正在处理一个将近 50GB 的结构化文件来写出来。所以我想从你那里得到一些很棒的建议。

文件是这样的。（实际上叫做 FASTQ_format）

这四行按顺序重复。这4行就像一个团队。而且我有近30个候选DNA序列。例如atgcat，tttagc

我正在做的是让每个候选 DNA 序列通过巨大的文件来查找候选序列是否与团队 dna 序列相似，这意味着每个候选序列允许一个不匹配（例如taaaaa= aaaata），如果它们相似或相同，我使用字典存储它们以便以后写出来。候选DNA序列的关键。List 中（4 行）的值以按行顺序存储它们

所以我所做的是：

我的函数不使用任何全局变量（我想我对我的函数很满意），而字典变量是一个全局变量，它获取所有数据以及制作大量列表实例。代码很简单，但速度很慢，对 CPU 和内存来说是一个巨大的痛苦。我虽然使用 pypy。

那么有什么提示是按行顺序写出来的吗？

python parsing structured-data

2014-06-27T14:23:55.070

0 投票

3 回答

2617 浏览

schema.org - 如何使用 Schema.org for Google 标记重复事件？

我正在使用 schema.org 为本地企业标记一个页面，并且我有一个每周（周一至周四）的重复事件，我想发送元数据。

我环顾了 internetz，似乎找不到任何关于如何正确标记它的答案。openingHours尽管我知道它不是Event架构的一部分，但我还是按照 Google 用户组的建议做了。谷歌当然打电话给我。

关于如何标记它的任何建议？

如果可行，我很乐意将其更改为其他类型，但我不确定我可以将其更改为什么。作为参考，这里是有问题的页面。

更新我稍微研究了一下Event类型，发现了一个叫做subEvent. Schema.org 还说“重复的事件可以构造为单独的事件对象。” 但是我到底如何才能做到这一点超出了我的范围。主要问题在于重复事件在很大程度上是未定义的。每周只是周一到周四，时间不定，因此尝试给出一堆实际日期（例如 7 月 10 日周四、7 月 15 日周二等）是没有意义的。

跟进如果 schema.org 没有解决方案，是否还有其他微数据格式可以解决？

schema.org google-rich-snippets structured-data

2014-07-10T20:19:18.923

0 投票

1 回答

1866 浏览

python - Python解析结构化文本文件

我想在 python 中解析格式的结构化文本文件：

文本文件可能包含具有不同数量字段的其他标题。对我来说，该结构类似于 Windows ini 文件。我希望以与 ConfigParser 提供访问权限相同的方式访问数据，即能够列出部分，然后对于给定的部分，查看字段及其对应的值是什么。目的是读取文件，修改它的位并以相同的格式写回。

原始代码

输出

我出错的地方是不存在名为“测试”的文件，这是我的蹩脚错误。

背景

在发布之前，我尝试了 ConfigParser（因为很久以前我曾在 .ini 文件中使用过它）但我无法让它工作。Google 和 SO 引导我使用 pyparser，但这似乎更多地用于解释句子，我无法弄清楚如何为多行构建模板。我一直在寻找类似 ConfigParser 以及它如何处理 .ini 文件或 BeautifulSoup 处理 html/xml 文档或 lxml 处理 xml 文档等的东西。

不幸的是，我不知道这属于编程/数据处理的哪个分支，也不知道使用正确的关键字来确定自己的解决方案。在我的沮丧中，我在这里发布了一个问题。

可接受的答案

以下任何一项都是可以接受的：

展示如何使用 ConfigParser 来解决问题。
或者，如果有另一个模块可以解释这种类型的结构化文本文件，请说明并提供示例。

奖励积分

这类问题属于编程或数据处理的哪个分支？在您有一些数据的地方，您定义一个模板或自动定义一个模板，然后将其应用于以结构化方式访问数据。

谢谢！

python structured-data

2014-07-19T14:37:48.440

0 投票

1 回答

47 浏览

database - 将结构松散的数据导入数据库

我每天都会收到包含结构松散的数据的数据馈送。我需要将它导入数据库，这样我就可以运行一个报告来查找新记录和对现有记录的更改。

数据如下所示：

如您所见，有一些字段标题，如“blah”、“lorum”等，但有些数据缺少标题，如电话号码或斜线分隔列表。有些标题在同一行，有些则不在。

只是为了让我们保持警惕，记录没有相同数量的字段。

所以我认为解析需要至少有3种方法来解析数据，比如，

如果 "heading:$" 然后抓取下一行，直到读取下一个 "*.:" 并抓取 "heading: value"，如果行以数字开头，则假设标题为 "phone"，如果行包含斜杠分隔列表假设标题 "功能”直到“--------...”

但我不知道如何开始编写这样的代码。尽管我必须在 MacOS 中运行代码，但此时该语言是开放的。

我想 perl 可能对此有好处，但是 perl foo 很差。

甚至不知道从哪里开始。

database perl scripting structured-data

2014-07-25T00:11:48.450

0 投票

0 回答

22 浏览

structured-data - 如何在片段中显示明星？

我也添加了 itemprop 我的评分值代码，但它没有显示在我的片段（星星）中，我该怎么办？需要时间吗？

structured-data

2014-08-02T05:01:51.523

0 投票

1 回答

148 浏览

video - videoFrameSize 属性是否有标准格式？

我即将将结构化数据添加到包含视频数据的页面类型，在查看 schema.org 上的文档后，VideoObject我发现该字段videoFrameSize应该是 type Text。

现在我想知道是否有一些标准或首选格式来提供这个，比如[height]x[width]什么？

video schema.org structured-data

2014-08-27T13:22:49.913

0 投票

1 回答

932 浏览

html - 这个使用 schema.org 进行游戏评论的结构化数据标记是否正确？

我了解 Google 需要时间来显示网站的丰富网页摘要。但是，我想确保同时正确标记我的结构化数据。下面的代码可以审核吗？可以做得更好吗？

作为旁注，我注意到当我搜索“review site:example.com”时会出现丰富的片段，但当我不使用“site:example.com”时它们不会出现。有人知道为什么吗？

再次感谢您的阅读。任何帮助将不胜感激。

html schema.org rich-snippets structured-data

2014-09-13T18:29:24.243

0 投票

1 回答

2951 浏览

structured-data - 为没有价格的产品设置结构化数据

我正在尝试将 schema.org 中的结构化数据添加到我的电子商务网站，但我没有显示价格，因为我们的大多数产品都需要报价。是否可以将价格添加为请求报价或搜索引擎对此不满意？

structured-data

2014-09-16T22:20:17.183

问题标签 [structured-data]

原始代码

背景

可接受的答案

奖励积分

Reference