2
\ begingroup美元

任何一个能帮我处理巨大的netcdf文件循环中的每个1 gb内存和至少2文件一次ncl或linux或python或matlab。

例如era_interim日常压力水平的数据集。

\ endgroup美元
7
  • 1
    \ begingroup美元 也许更适合堆栈溢出的问题。江南足球鞋 \ endgroup美元
    - - - - - -user1066
    2017年12月24日16:00时
  • \ begingroup美元 我们有一组相关的问题在这个网站。例如:www.hoelymoley.com/questions/5259/… \ endgroup美元
    - - - - - -arkaia
    2017年12月24日在十六22
  • 1
    \ begingroup美元 很模糊的问题。“处理”如何?你有一个错误的类型或试图使用示例代码吗? \ endgroup美元
    - - - - - -f.thorpe
    2017年12月24日发表
  • 1
    \ begingroup美元 什么你想做什么? \ endgroup美元
    - - - - - -daniel.heydebreck
    2017年12月24日在44
  • 1
    \ begingroup美元 这里给出的答案可能是有用的,但是如果你可以更具体的文件,你想做什么,你可能会得到一个更具体的答案。 \ endgroup美元
    - - - - - -半日西蒙
    2017年12月29日,在十一27

2答案2

3
\ begingroup美元

处理大数据是一个很好的实践到RAM中调用数据切片(通过拆分时间轴或空间域)。在地球科学python包的利益江南体育网页版Xarray,虹膜,netCDF4h5py很少有伟大的工具来处理巨大的分层数据。标记的方式来处理数据Xarray和虹膜将是有用的,而netCDf4和h5py是好网格的方式来处理。

我个人的建议是h5py这是用来处理和归档大型数据集。文档在这里解释了它。如果你有netcdf hdf5格式的文件,并希望他们问题在堆栈江南足球鞋溢出可能会有所帮助。

\ endgroup美元
    1
    \ begingroup美元

    一种选择是不加载整个文件。您可以使用ncgeodataset。程序允许提取数据的一个子集,而无需加载整个文件或甚至一个数组到Matlab。这对大型数据集是伟大的。

    \ endgroup美元

      你的答案

      通过点击“发布你的答案”,你同意我们服务条款并承认您已阅读并理解我们的隐私政策的行为准则

      不是你要找的答案?浏览其他问题标记问你自己的问题