问题标签 [gfs]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
759 浏览

performance - Google 文件系统的吞吐量是多少?

Google 文件系统的吞吐量是多少?

0 投票
0 回答
344 浏览

linux - 如何使用 GFS 和 lvm 检查文件是否在集群中的任何位置打开?

我想知道是否可以检查文件是否已被同一 GFS 集群中的另一个节点打开。例如,fuser 命令在 TruCluster 中在集群范围内运行。是否可以通过命令或 API 查询锁管理器的数据?

0 投票
5 回答
75831 浏览

computer-science - What is an SSTable?

In BigTable/GFS and Cassandra terminology, what is the definition of a SSTable?

0 投票
2 回答
5253 浏览

file-io - 为什么 Hadoop 文件系统不支持随机 I/O?

像 Google File System 和 Hadoop 这样的分布式文件系统不支持随机 I/O。
(它不能修改之前写入的文件。只能写入和附加。)

他们为什么要设计这样的文件系统?
设计的重要优势是什么?

PS 我知道 Hadoop 将支持修改写入的数据。
但是他们说,它的性能会很不好。为什么?

0 投票
2 回答
12558 浏览

hadoop - 是否可以从多个客户端并行追加到 HDFS 文件?

基本上整个问题都在标题中。我想知道是否可以同时从多台计算机附加到位于 HDFS 上的文件?诸如存储由多个进程不断产生的事件流之类的东西。顺序并不重要。

我记得在 Google 技术演示之一中听到 GFS 支持此类附加功能,但尝试使用 HDFS 进行一些有限的测试(使用常规文件 append() 或使用 SequenceFile)似乎不起作用。

谢谢,

0 投票
3 回答
460 浏览

filesystems - 文件系统上下文中的原子性是什么?

根据webopedia,这是一个处理器同时读取和写入总线的时候......不包括其他处理器访问它。

根据维基百科,在数据库中,这意味着一组操作要么全部发生,要么不发生

在并发编程中,这意味着一组操作瞬间发生,如系统维基百科所见

但是我需要知道在文件系统的上下文中原子性指的是什么,特别是谷歌文件系统。

似乎是一个过度使用的词,人们使用它听起来很酷..但是关于文件系统是否有更学术的定义?

似乎原子是指不分解某些东西,即原子......在一般情况下。我不断听到用于 Google 文件系统的原子读取和原子写入术语。

我的猜测将意味着它完全发生或根本不发生,并且在一个“步骤”中。指时间(出现瞬间)和构图(所有部分都完成)的统一。

这听起来正确吗?

0 投票
1 回答
426 浏览

gtk - Gnome-Shell-Extension 开发中的持久日志记录?

我正在尝试使用基于 Javascript 的绑定来构建自己的 Gnome-Shell-Extension,它只是嵌入了一个 webkitview。

但是以下 3 行让 gnome-shell 完全崩溃(顶部面板消失,需要重新登录才能重新启动)。因此无法查看“错误”标签来找出问题所在。

有什么办法可以获取一些信息是怎么回事?

0 投票
1 回答
296 浏览

architecture - 关于随机写操作的“附加操作”有哪些示例?

我刚刚读完 Google 文件系统 (GFS) 论文。论文说 GFS 是

看到整篇论文都强调了这一特点,我认为它一定非常重要。

作为一个完全没有工作经验的学生Appending Operations,谷歌所说的现实生活中有哪些例子?听起来很激烈。

0 投票
0 回答
276 浏览

hadoop - Flume 中的 HDFS 接收器是否使用带有默认配置的“反模式”

查看Apache Flume 中的 HDFS 接收器默认参数,这似乎会产生大量非常小的文件(1 kB 卷)。根据我对 GFS/HDFS 的了解,块大小为 64MB,文件大小应为千兆字节,以确保一切高效运行。

所以我很好奇 Flume 的默认参数是否只是误导,或者我是否在这里遗漏了其他东西。

干杯。

0 投票
1 回答
1515 浏览

distributed-system - google文件系统中的一致性模型问题

阅读文章The Google File System后,我仍然对以下几点感到困惑:

  1. '追加操作'与'写操作'有什么优势?文章强调使用追加操作而不是写操作,我想知道为什么。追加比写快?

  2. 为了保持一个chunk的redundancy之间的一致性,gfs使用lease让一个chunkserver作为primary,并且让primary决定操作顺序来达到一致性,我的问题是如果重试之后update操作还是不能成功,redundancys会处于不一致的状态。那么当不同的客户端来读取更新失败的相同偏移量的同一个chunk时,他们可能会读取不同的内容。gfs是如何处理这种问题的。

  3. 如果追加操作发生错误,主chunkserver会选择一个新的偏移量来追加记录吗?记录是什么意思?当客户端读取文件时,它如何处理文件中的一些填充或重复记录?