21
\ begingroup美元

我一直有一个悲惨的时间本周阅读SEGY文件。这是世界上最大的地震数据采集公司的客户是世界第七大石油公司。如果任何人都可以得到它你会觉得这两个。

SEGY标准存储使用地震数据在整个石油行业但正显示出它的年龄相当严重。问题包括:

  • 非标准头信息
  • 文本标题可以在ASCII、EBCDIC
  • 疯狂的阴谋诡计来拯救几个字节
  • 二进制数据存储在IEEE或IBM浮点
  • 等。

一些最明显的缺陷被修补的v2发布作品。细节是:http://www.seg.org/documents/51956/6062543/SEGY + 2.0 + + 2 + 2014草案

这不是一个标准就可以实现通过阅读规范,这个新版本不会帮助解决这个问题。不断的滥用的标准意味着需要日历年调试存在的图书馆能够承受现实世界数据文件。这是非常令人沮丧的软件开发人员和作者的工作。

有一个讨论这优秀的博客最近HDF5提到

我更希望看到一个新的标准,比SEGY那么复杂,没有依赖的第三方库。因此,尽管我认为技术HDF5(和JavaSeis等)可能有一个角色在公司他们不是一个替代SEGY。甚至像XML技江南登录网址app下载术由数据文件将会比在未来我们将不得不读。所以我认为需要的格式非常简单的和保守的。

一些可以取代SEGY格式的功能可能包括:

  • 一个字符编码(ASCII或utf - 8)
  • 所有标题以人类可读的形式——键-值对吗?
  • 强制性的头信息,如炮点、x / y位置等。
  • 标准单位定义、地图投影等。
  • 可能是二进制只有IEEE痕迹
  • 数据应该在一个文件中(SEGY得到这个权利)
  • 没有数据压缩

现在的问题——我们需要做什么超越非常沮丧SEGY标准吗?有什么我们应该已经开始宣传?如果不是,你认为更换格式需要看起来像什么?

感谢你的阅读。这咆哮后我感觉好多了,会回到调试为什么字节3603号是错误的。


编辑:在周末放松这里有一些更多的想法。SEGY是复杂的原因:

  • 固有的复杂性
  • 偶发复杂性
  • 从用户不同预期的格式

因此SEGY很难使用,因为地震问题域是一种固有的困难的一个模型。我们很幸运,有智慧的人的利益的格式。

即便如此,积累了大量的繁琐的格式。这将创建一个简单的认知负担,我可以没有但实际上只需要处理。

最后一点但很有趣。我们已经有SEGD存储原始字段数据。这比SEGY格式更有挑战性但也是一个好地方埋葬很多现实世界地震数据的固有复杂性。

当人们建议HDF作为替换我猜(可能)他们正在查看SEGY作为“处理”的形式?

上周我想SEGY作为车辆与口译员分享最终地震卷。我读过周末,80%的SEGY头并不在真实世界数据填充。对我来说这是猜测,但也许我们需要的是

  • SEGD原始字段数据
  • 别的实际处理
  • 再别的之间共享数据的处理器和翻译

准确,重复性良好,地震数据加载到系统解释我们并不需要太多的元数据但是绝对不需要介绍。处理器通过SEGY口译员的传球给队友,我认为我们可以用一种新方法。

\ endgroup美元
3
  • 1
    \ begingroup美元 厚颜无耻的答案是SEGY会好如果它实际上是一个标准的或文件格式。我们只需要更换我们的成千上万的不同SEGY格式与某种标准……然而,另一个标准是诞生了。:) \ endgroup美元
    - - - - - -乔院长
    2014年5月3日,在比赛吗
  • 1
    \ begingroup美元 我不知道SEGY或地震学,但像netcdf怎么样?二进制格式,真的,但它是一个开放和“自我记录”,并似乎在某些领域获得认可。 \ endgroup美元
    - - - - - -半日西蒙
    2014年5月5日在21:03吗
  • 1
    \ begingroup美元 这是一个好问题,本身可能是一个好地方去讨论它。 \ endgroup美元
    - - - - - -user2821
    2015年5月14日在9:08吗

4答案4

11
\ begingroup美元

我所做的工作与SEGY文件和固定长度的头与忽略的领域是一个问题。同时,元组排列顺序问题。你要记住SEGY是目前交换和归档标准。这是一件好事。

SEGY设计的问题是磁带,所以这是一个单一的文件中。在这个时代,可能不是一件好事。最好是允许扩展的“元数据”被作为一个单独的文件。基本上,目录记录,你可以复习之前购买的数据。你应该能够添加元数据回文件。

如果这是作为交换配置文件。基本信息的组织,而不是一个大的信息块然后不同的格式可能得到更多的购买,随着时间的推移和遵从性。

至于HDF,和其他格式,是关于数据结构是如何布局的。可以有一些性能问题timeseries数据访问(~痕迹)是如何组织在NetCDF文件中。

一些可以取代SEGY格式的功能可能包括:

  • 一个字符编码(ASCII或utf - 8)
    • 是的
  • 所有标题以人类可读的形式——关键值对吗?
    • 是的
  • 强制性的头信息如炮点、xy位置等。
    • 我认为是的,但我不认为会发生。
  • 标准单位定义、地图投影等。
    • 是的,
  • 可能是二进制只有IEEE痕迹
  • 数据应该在一个文件中(SEGY得到这个权利)
    • 所有数据,是的。所有信息,不。
    • 单包像一个tar文件,是的
  • 没有数据压缩

位是便宜的。包括详细的使用字典文件中的条目。在这个时代,我们不需要一个外部文件翻译书。但我们应该使用标准的参考项在线开放数据有关。

\ endgroup美元
2
  • 2
    \ begingroup美元 字节次序我有因素问题许多二进制格式,但没有SEGY大端字节序。新SEGY牧师2允许您使用小端字节序也将使处理SEGY更加令人兴奋。 \ endgroup美元
    - - - - - -坦诚的午餐
    2014年5月2日16:03
  • \ begingroup美元 我认为一个文件是好的。比如上周我下载了GIS文件(他们中的许多人)茶壶圆顶项目。我让他们吗?我也不知道。不过我知道我得到了一个segy文件。\ \ endgroup美元
    - - - - - -坦诚的午餐
    2014年5月5日20:30
4
\ begingroup美元

SEGY的优点也是它的主要问题;它已经存在了很长时间。我一直在努力开放十年word文档正确,有时候仍然可以访问一个SEGY从70年或80年。还有一个优势,所有程序包,不知何故,导入和导出文件。

我同意大卫的头不需要相同的文件的数据。我宁愿跟踪头可读的ASCII文件可以是二进制的数据,但至少比标准化或定义的头。ASCII跟踪头也很容易导入GIS应用,SQL或电子表格。

rsf从SEPlib格式(发达),可能是我在寻找什么,但跟踪头不写头文件,而是放置在单独的文件中。对处理工作流这不是坏事,但它很难导出文件。

完美的解决方案,从我有限的经验,将类似rsf文件,文件头和跟踪头.rsf相同。我一直在暗示一些马达加斯加的用户,并在大型项目的反对观点是头文件会非常大(太)。然而,我不认为这是一个问题,而另一种观点在一个简单的搜索和跟踪头据我所知没有ascii文件大小的限制。

\ endgroup美元
    3
    \ begingroup美元

    一件事已经存在的ph5从PASSCAL组格式:https://www.passcal.nmt.edu/content/ph5-what-it

    它本质上是一个端口的赛格Y格式,删除一些限制并添加一些新的元数据信息。它是基于HDF5,目前主要作为一种档案格式虽然我不明白为什么它也不可能被用作处理格式。

    下面的段落免责声明:我是一个男人。我们最近开发的新数据格式包括数据来源基于HDF5地震学也。目前主要适用于被动源数据,例如地震和电台录音环境波场,我们的社区非常广泛而完善的标准我们合并的元信息。一些工作但是地震源和接收器的概念转化为主动源情况下这可能是一个有价值的研究方向。更多信息:http://seismic-data.org

    \ endgroup美元
      2
      \ begingroup美元

      赛格有坐在SEG-Y委员会修订2,讨论了需要采用改变SEG-Y所需自上次修订(如删除跟踪连续数据的长度限制,被动格式数据,等等)。如果你想做点什么SEG-Y未来应该是什么样子,你应该加入委员会的凹陷和志愿者。

      人们需要记住SEG-Y是一个交换/交换格式,不处理的格式。收购格式(如SEG-D)对野外采集有好处。SEG-Y进行数据交换。事实上,是替代老赛格交换格式(SEG-X,得到吗?)。没有人会涉足的争论一个标准处理格式,因为它甚至比SEG-Y兼容性和遗留的问题。

      \ endgroup美元

        你的答案

        通过点击“发布你的答案”,你同意我们服务条款,隐私政策饼干的政策

        不是你要找的答案?浏览其他问题标记问你自己的问题