问题标签 [structured-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
126 浏览

seo - 使用 schema.org 在文章中标记标签的正确方法是什么?

我找到了以下 3 种方法,但不清楚哪种方法是正确的,或者它们都是正确的?我什至应该在我的文章中标记标签吗?我特别关心 SEO 问题。

或者

或者

0 投票
1 回答
3211 浏览

solr - 如何上传/索引富/结构化文本文档以使用 ElasticSearch 进行搜索?

我正在围绕包括 Microsoft Word Docs、PowerPoints、PDF 和文本文件在内的文档语料库构建搜索引擎。我已经成功下载并安装了 ElasticSearch 并让它运行(从命令提示符和浏览器中可见 - localhost:9200)。

我可以上传和搜索手动输入的数据(在几个在线教程中找到 - 例如这个:http ://www.elasticsearchtutorial.com/elasticsearch-in-5-minutes.html#Indexing )

现在我需要进行(大?)从搜索手动输入的数据到搜索大型结构化文本文件的语料库。我的问题是 - 我如何上传/索引这些文档以使它们可用于我已经运行的 Elasticsearch 实例。

我知道这可能太大而无法在单个回复中回答 - 即使指向工具或教程链接也会有所帮助。

版本:Windows 7、Elasticsearch 1.2.1

0 投票
1 回答
117 浏览

python - 在 python 2.7 中解析巨大的结构化文件

我是python世界和生物信息学的新手。我正在处理一个将近 50GB 的结构化文件来写出来。所以我想从你那里得到一些很棒的建议。

文件是这样的。(实际上叫做 FASTQ_format)

这四行按顺序重复。这4行就像一个团队。而且我有近30个候选DNA序列。例如atgcattttagc

我正在做的是让每个候选 DNA 序列通过巨大的文件来查找候选序列是否与团队 dna 序列相似,这意味着每个候选序列允许一个不匹配(例如taaaaa= aaaata),如果它们相似或相同,我使用字典存储它们以便以后写出来。候选DNA序列的关键。List 中(4 行)的值以按行顺序存储它们

所以我所做的是:

我的函数不使用任何全局变量(我想我对我的函数很满意),而字典变量是一个全局变量,它获取所有数据以及制作大量列表实例。代码很简单,但速度很慢,对 CPU 和内存来说是一个巨大的痛苦。我虽然使用 pypy。

那么有什么提示是按行顺序写出来的吗?

0 投票
3 回答
2617 浏览

schema.org - 如何使用 Schema.org for Google 标记重复事件?

我正在使用 schema.org 为本地企业标记一个页面,并且我有一个每周(周一至周四)的重复事件,我想发送元数据。

我环顾了 internetz,似乎找不到任何关于如何正确标记它的答案。openingHours尽管我知道它不是Event架构的一部分,但我还是按照 Google 用户组的建议做了。谷歌当然打电话给我。

关于如何标记它的任何建议?

如果可行,我很乐意将其更改为其他类型,但我不确定我可以将其更改为什么。作为参考,这里是有问题的页面

更新我稍微研究了一下Event类型,发现了一个叫做subEvent. Schema.org 还说“重复的事件可以构造为单独的事件对象。” 但是我到底如何才能做到这一点超出了我的范围。主要问题在于重复事件在很大程度上是未定义的。每周只是周一到周四,时间不定,因此尝试给出一堆实际日期(例如 7 月 10 日周四、7 月 15 日周二等)是没有意义的。

跟进 如果 schema.org 没有解决方案,是否还有其他微数据格式可以解决?

0 投票
1 回答
1866 浏览

python - Python解析结构化文本文件

我想在 python 中解析格式的结构化文本文件:

文本文件可能包含具有不同数量字段的其他标题。对我来说,该结构类似于 Windows ini 文件。我希望以与 ConfigParser 提供访问权限相同的方式访问数据,即能够列出部分,然后对于给定的部分,查看字段及其对应的值是什么。目的是读取文件,修改它的位并以相同的格式写回。

原始代码

输出

我出错的地方是不存在名为“测试”的文件,这是我的蹩脚错误。

背景

在发布之前,我尝试了 ConfigParser(因为很久以前我曾在 .ini 文件中使用过它)但我无法让它工作。Google 和 SO 引导我使用 pyparser,但这似乎更多地用于解释句子,我无法弄清楚如何为多行构建模板。我一直在寻找类似 ConfigParser 以及它如何处理 .ini 文件或 BeautifulSoup 处理 html/xml 文档或 lxml 处理 xml 文档等的东西。

不幸的是,我不知道这属于编程/数据处理的哪个分支,也不知道使用正确的关键字来确定自己的解决方案。在我的沮丧中,我在这里发布了一个问题。

可接受的答案

以下任何一项都是可以接受的:

  1. 展示如何使用 ConfigParser 来解决问题。
  2. 或者,如果有另一个模块可以解释这种类型的结构化文本文件,请说明并提供示例。

奖励积分

这类问题属于编程或数据处理的哪个分支?在您有一些数据的地方,您定义一个模板或自动定义一个模板,然后将其应用于以结构化方式访问数据。

谢谢!

0 投票
1 回答
47 浏览

database - 将结构松散的数据导入数据库

我每天都会收到包含结构松散的数据的数据馈送。我需要将它导入数据库,这样我就可以运行一个报告来查找新记录和对现有记录的更改。

数据如下所示:

如您所见,有一些字段标题,如“blah”、“lorum”等,但有些数据缺少标题,如电话号码或斜线分隔列表。有些标题在同一行,有些则不在。

只是为了让我们保持警惕,记录没有相同数量的字段。

所以我认为解析需要至少有3种方法来解析数据,比如,

如果 "heading:$" 然后抓取下一行,直到读取下一个 "*.:" 并抓取 "heading: value",如果行以数字开头,则假设标题为 "phone",如果行包含斜杠分隔列表假设标题 "功能”直到“--------...”

但我不知道如何开始编写这样的代码。尽管我必须在 MacOS 中运行代码,但此时该语言是开放的。

我想 perl 可能对此有好处,但是 perl foo 很差。

甚至不知道从哪里开始。

0 投票
0 回答
22 浏览

structured-data - 如何在片段中显示明星?

我也添加了 itemprop 我的评分值代码,但它没有显示在我的片段(星星)中,我该怎么办?需要时间吗?

0 投票
1 回答
148 浏览

video - videoFrameSize 属性是否有标准格式?

我即将将结构化数据添加到包含视频数据的页面类型,在查看 schema.org 上的文档后,VideoObject我发现该字段videoFrameSize应该是 type Text

现在我想知道是否有一些标准或首选格式来提供这个,比如[height]x[width]什么?

0 投票
1 回答
932 浏览

html - 这个使用 schema.org 进行游戏评论的结构化数据标记是否正确?

我了解 Google 需要时间来显示网站的丰富网页摘要。但是,我想确保同时正确标记我的结构化数据。下面的代码可以审核吗?可以做得更好吗?

作为旁注,我注意到当我搜索“review site:example.com”时会出现丰富的片段,但当我不使用“site:example.com”时它们不会出现。有人知道为什么吗?

再次感谢您的阅读。任何帮助将不胜感激。

0 投票
1 回答
2951 浏览

structured-data - 为没有价格的产品设置结构化数据

我正在尝试将 schema.org 中的结构化数据添加到我的电子商务网站,但我没有显示价格,因为我们的大多数产品都需要报价。是否可以将价格添加为请求报价或搜索引擎对此不满意?