问题标签 [structured-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
seo - 使用 schema.org 在文章中标记标签的正确方法是什么?
我找到了以下 3 种方法,但不清楚哪种方法是正确的,或者它们都是正确的?我什至应该在我的文章中标记标签吗?我特别关心 SEO 问题。
或者
或者
solr - 如何上传/索引富/结构化文本文档以使用 ElasticSearch 进行搜索?
我正在围绕包括 Microsoft Word Docs、PowerPoints、PDF 和文本文件在内的文档语料库构建搜索引擎。我已经成功下载并安装了 ElasticSearch 并让它运行(从命令提示符和浏览器中可见 - localhost:9200)。
我可以上传和搜索手动输入的数据(在几个在线教程中找到 - 例如这个:http ://www.elasticsearchtutorial.com/elasticsearch-in-5-minutes.html#Indexing )
现在我需要进行(大?)从搜索手动输入的数据到搜索大型结构化文本文件的语料库。我的问题是 - 我如何上传/索引这些文档以使它们可用于我已经运行的 Elasticsearch 实例。
我知道这可能太大而无法在单个回复中回答 - 即使指向工具或教程链接也会有所帮助。
版本:Windows 7、Elasticsearch 1.2.1
python - 在 python 2.7 中解析巨大的结构化文件
我是python世界和生物信息学的新手。我正在处理一个将近 50GB 的结构化文件来写出来。所以我想从你那里得到一些很棒的建议。
文件是这样的。(实际上叫做 FASTQ_format)
这四行按顺序重复。这4行就像一个团队。而且我有近30个候选DNA序列。例如atgcat
,tttagc
我正在做的是让每个候选 DNA 序列通过巨大的文件来查找候选序列是否与团队 dna 序列相似,这意味着每个候选序列允许一个不匹配(例如taaaaa
= aaaata
),如果它们相似或相同,我使用字典存储它们以便以后写出来。候选DNA序列的关键。List 中(4 行)的值以按行顺序存储它们
所以我所做的是:
我的函数不使用任何全局变量(我想我对我的函数很满意),而字典变量是一个全局变量,它获取所有数据以及制作大量列表实例。代码很简单,但速度很慢,对 CPU 和内存来说是一个巨大的痛苦。我虽然使用 pypy。
那么有什么提示是按行顺序写出来的吗?
schema.org - 如何使用 Schema.org for Google 标记重复事件?
我正在使用 schema.org 为本地企业标记一个页面,并且我有一个每周(周一至周四)的重复事件,我想发送元数据。
我环顾了 internetz,似乎找不到任何关于如何正确标记它的答案。openingHours
尽管我知道它不是Event
架构的一部分,但我还是按照 Google 用户组的建议做了。谷歌当然打电话给我。
关于如何标记它的任何建议?
如果可行,我很乐意将其更改为其他类型,但我不确定我可以将其更改为什么。作为参考,这里是有问题的页面。
更新我稍微研究了一下Event
类型,发现了一个叫做subEvent
. Schema.org 还说“重复的事件可以构造为单独的事件对象。” 但是我到底如何才能做到这一点超出了我的范围。主要问题在于重复事件在很大程度上是未定义的。每周只是周一到周四,时间不定,因此尝试给出一堆实际日期(例如 7 月 10 日周四、7 月 15 日周二等)是没有意义的。
跟进 如果 schema.org 没有解决方案,是否还有其他微数据格式可以解决?
python - Python解析结构化文本文件
我想在 python 中解析格式的结构化文本文件:
文本文件可能包含具有不同数量字段的其他标题。对我来说,该结构类似于 Windows ini 文件。我希望以与 ConfigParser 提供访问权限相同的方式访问数据,即能够列出部分,然后对于给定的部分,查看字段及其对应的值是什么。目的是读取文件,修改它的位并以相同的格式写回。
原始代码
输出
我出错的地方是不存在名为“测试”的文件,这是我的蹩脚错误。
背景
在发布之前,我尝试了 ConfigParser(因为很久以前我曾在 .ini 文件中使用过它)但我无法让它工作。Google 和 SO 引导我使用 pyparser,但这似乎更多地用于解释句子,我无法弄清楚如何为多行构建模板。我一直在寻找类似 ConfigParser 以及它如何处理 .ini 文件或 BeautifulSoup 处理 html/xml 文档或 lxml 处理 xml 文档等的东西。
不幸的是,我不知道这属于编程/数据处理的哪个分支,也不知道使用正确的关键字来确定自己的解决方案。在我的沮丧中,我在这里发布了一个问题。
可接受的答案
以下任何一项都是可以接受的:
- 展示如何使用 ConfigParser 来解决问题。
- 或者,如果有另一个模块可以解释这种类型的结构化文本文件,请说明并提供示例。
奖励积分
这类问题属于编程或数据处理的哪个分支?在您有一些数据的地方,您定义一个模板或自动定义一个模板,然后将其应用于以结构化方式访问数据。
谢谢!
database - 将结构松散的数据导入数据库
我每天都会收到包含结构松散的数据的数据馈送。我需要将它导入数据库,这样我就可以运行一个报告来查找新记录和对现有记录的更改。
数据如下所示:
如您所见,有一些字段标题,如“blah”、“lorum”等,但有些数据缺少标题,如电话号码或斜线分隔列表。有些标题在同一行,有些则不在。
只是为了让我们保持警惕,记录没有相同数量的字段。
所以我认为解析需要至少有3种方法来解析数据,比如,
如果 "heading:$" 然后抓取下一行,直到读取下一个 "*.:" 并抓取 "heading: value",如果行以数字开头,则假设标题为 "phone",如果行包含斜杠分隔列表假设标题 "功能”直到“--------...”
但我不知道如何开始编写这样的代码。尽管我必须在 MacOS 中运行代码,但此时该语言是开放的。
我想 perl 可能对此有好处,但是 perl foo 很差。
甚至不知道从哪里开始。
structured-data - 如何在片段中显示明星?
我也添加了 itemprop 我的评分值代码,但它没有显示在我的片段(星星)中,我该怎么办?需要时间吗?
video - videoFrameSize 属性是否有标准格式?
我即将将结构化数据添加到包含视频数据的页面类型,在查看 schema.org 上的文档后,VideoObject
我发现该字段videoFrameSize
应该是 type Text
。
现在我想知道是否有一些标准或首选格式来提供这个,比如[height]x[width]
什么?
html - 这个使用 schema.org 进行游戏评论的结构化数据标记是否正确?
我了解 Google 需要时间来显示网站的丰富网页摘要。但是,我想确保同时正确标记我的结构化数据。下面的代码可以审核吗?可以做得更好吗?
作为旁注,我注意到当我搜索“review site:example.com”时会出现丰富的片段,但当我不使用“site:example.com”时它们不会出现。有人知道为什么吗?
再次感谢您的阅读。任何帮助将不胜感激。
structured-data - 为没有价格的产品设置结构化数据
我正在尝试将 schema.org 中的结构化数据添加到我的电子商务网站,但我没有显示价格,因为我们的大多数产品都需要报价。是否可以将价格添加为请求报价或搜索引擎对此不满意?