4
\ begingroup美元

需要温度24小时为每个县的美国。平均值是好的,季节性粒度的欢迎。我一直看着nClimDiv数据集

\ endgroup美元
2
  • \ begingroup美元 值得注意的是,在美国县范围从~ 13平方英里20100平方英里。最大的,如圣贝纳迪诺县,有一个混合的气候,所以没有可能没有一个代表值。 \ endgroup美元
    - - - - - -jeffronicus
    2020年2月7日15:59
  • \ begingroup美元 @jeffronicus:还有一个相当高度范围内的县。我可以在相当温暖的阳光在山谷,在看一场暴风雪在附近的山脉——或者在其他时候,那些山上滑雪在太阳谷被雾覆盖,甚至冰雾:en.wikipedia.org/wiki/Ice_fog \ endgroup美元
    - - - - - -jamesqf
    2020年2月7日在18:46

1回答1

6
\ begingroup美元

你可以得到这个的综合表面数据集(ISD)

首先获得所有气象站的列表ftp://ftp.ncdc.noaa.gov/pub/data/noaa/isd-history.txt:

站= pandas.read_fwf (parse_dates = " ftp://ftp.ncdc.noaa.gov/pub/data/noaa/isd-history.txt ", skiprows = 20日(“开始”、“结束”),skip_blank_lines = True, dtype = {" WBAN ": " O "})

然后选择那些在美国:

stations_us =电台(站(“CTRY”) = =“我们”)

这给我们7326个车站。虽然每个站的状态描述,县。获得县你需要把每个站的纬度/经度与县数据库。这有点超出了地球科学的范围,但也许你可以得到帮助江南体育网页版地理信息系统SE。车站的ID是一个组合两个字段:

id = stations_us(“空军”)+ stations_us (“WBAN”)

我们可以下载一个特定的测量从AWS S3:

量= pandas.read_csv (f”s3: / / noaa-global-hourly-pds / 2020 / {ids.iloc[200]:年代}。csv”, parse_dates =(“日期”))

和提取温度:

临时工= meas.TMP.str.extract (r”((+ -) \ d {4}), ([012345679 acimpru])”) [0] .astype (f4) / 10

让我们有效的(有一个9999年填补值)和情节:

有效=临时工< 999量(有效).set_index (meas.DATE[有效])(“临时工”).plot ()

测量

享受吧!

字段的描述,请参阅ISD格式文档https://www.ncei.noaa.gov/data/global-hourly/doc/isd-format-document.pdf

\ endgroup美元
3
  • \ begingroup美元 谢谢你这么多!这是我找的。然而,我跑你的代码,它只提供了阅读Anvik机场,阿拉斯加。我猜我应该循环遍历所有车站代码为每个然后得到一个代表性剖面匹配每个县。github AWS S3 + NOAA的文档吗? \ endgroup美元
    - - - - - -masaladosa
    2020年2月7日在2
  • \ begingroup美元 @masaladosa它给Anvik因为线ids.iloc [200]-站200 Anvik。你要检查DataFrame站选择你感兴趣的(大约一半的电台是历史,但车站DataFrame包含日期列表)。我与ISD页面和格式文档,你会发现的AWS ISD页面在这里。有很多在AWS S3但是如果你直接使用熊猫阅读它你不需要它。如果你不熟悉熊猫你可以使用他们的优秀教程(我很新我自己)。 \ endgroup美元
    - - - - - -gerrit
    2020年2月7日在36
  • \ begingroup美元 谢谢!我想我找到了我在寻找深入他们的文档。我将为别人清洁数据并上传使用不久。 \ endgroup美元
    - - - - - -masaladosa
    2020年2月10日22:28

你的答案

通过点击“发布你的答案”,你同意我们服务条款并承认您已阅读并理解我们的隐私政策的行为准则

不是你要找的答案?浏览其他问题标记问你自己的问题