4
\ begingroup美元

我深入数据科学和寻找一个完整的数据库的矿物质。我下载的csv文件http://rruff.info/ima/。它包含5516行数据,但是它没有图像或url。有谁知道如果有一个与图像数据库的矿物质?我想找到它来训练神经网络。

\ endgroup美元
8
  • 2
    \ begingroup美元 你想要一个神经网络图像识别,并根据数据库中的图像看起来尝试和匹配未知矿物图像?这将无法工作。欢迎你多问一个新的问题,我将解释为什么。 \ endgroup美元
    - - - - - -Gimelist
    2019年11月19日10:07
  • \ begingroup美元 如果这是你的目的,因为@Gimelist说这不能做。如果没有谷歌会这样做的。但它将是一个好专家解释为什么不读。我的朋友告诉我,“让一个应用程序recognizs矿物质”。我怀疑这是可能是我的回答。但也许你可以明确你想做什么。也许与AI你可以做一些其他有趣的事情 \ endgroup美元
    - - - - - -user18261
    2019年11月19日12:13
  • \ begingroup美元 Gimesist,是的它是图像识别。我很有信心将工作常见的矿物质与独特的视觉特征。我只是需要一个好的数据集,从多个角度的照片。 \ endgroup美元 2019年11月19日22:40
  • \ begingroup美元 @PedroAguiar视觉形状和颜色的两个最误导矿物用于识别的属性。这是其中一个原因为什么我们禁止矿物ID的问题,因为我们有一个照片,这是无用的。事实上,一些矿物质是如此独特的(有时),这可能会奏效。但我能数10矿物质可以识别只有看着他们(成千上万的),只有当他们在特定形式。 \ endgroup美元
    - - - - - -Gimelist
    2019年11月19日,实在
  • 2
    \ begingroup美元 矿产ID @PedroAguiar超过10年的经验告诉我,已经很难相信一个视觉矿物识别。除非你的神经网络也考虑硬度、光泽,密度、化学成分、地质环境,它可能不会工作。 \ endgroup美元
    - - - - - -Gimelist
    2019年11月19日23:45

2答案2

4
\ begingroup美元

首先rruff.info是一个出色的网站由化学家数据快速,你可以完全信任的来源。

其次,图片,大部分上市+ 5000物种在本质上是没有显示的,你不能让他们所有人的照片。你只会在网上找到图片从常见的矿物性质。

第三这取决于如果你的工作是否会出版,你如果需要许可或CC许可的图像。

Copyrigthed数据库的图片和数据:

Mindat可以与你分享他们的数据,他们会很快开放在CC格式和一个API,但他们拍的照片属于每个作者和他们中的许多人是copyrigthed(并且要保持copyrigthed如果他们公开数据,你需要问许可单独为每个图片)。

CC许可图片:

我想知道如何获得常见的矿物质在CC许可的照片因为我写一个矿物应用我的选择是Lavinsky博士收集上传到维基百科从矿物商店iRocks.com

在他的网站上有plentifull高质量的描述常见的矿物质的照片你可以下载脚本使获得上访,甚至你可以问他们许可,不上传照片的wiki。我自己做我的矿物指导和他们只是问我引用iRocks.com;他们是非常公平的人。很显然他们乐于分享如果你引用他的商店。

在维基百科上你可以找到CC许可> 2000张照片上传从mindat.org,并从iRocks.com > 5000上传

你有矿物质对维基共享图片的完整列表从哪里开始收集数据。我不知道如果你能提取所有图像url使用GET请求的代码。我只花了iRocks照片因为我的向导只覆盖180矿物质,描述Lavinsky博士提供了有价值的(例子),然后我只需要引用一位作者(我直接把他们从iRocks和链接在我工作到每一块在他的商店,他们很高兴,他们回答我的邮件,“多谢”)。

\ endgroup美元
2
  • \ begingroup美元 谢谢你白细胞。我很高兴知道他们将打开数据库并创建一个API,我的项目也将开放源码。我不会发布任何图片他们将用于训练软件识别矿物然后它可用于类的学生可以使用智能手机来找出名称和矿物的化学成分。的数据量,与列表最常见的矿物质足以开始。但是让它工作电脑需要很多照片从相同的矿物在许多角度和光照条件。真正的工作是DB。 \ endgroup美元 2019年11月19日20:39
  • \ begingroup美元 @Pedro Aguiar如果它帮助,在这里你可以下载180矿物质的选择我。我选择了矿物质,我见过地质学学位。Gimelist无论如何,我相信你能找到一个方法来识别矿物从一幅画。一个硬币可以有三种不同的习惯。 \ endgroup美元
    - - - - - -user18261
    2019年11月20日,霎时一切都
0
\ begingroup美元

我认为www.mindat.org你寻找的东西,但我不知道你是多么容易执行自己的底层数据库的查询。

\ endgroup美元
6
  • \ begingroup美元 mindat的问题他们的数据库是copyrigthed \ endgroup美元
    - - - - - -user18261
    2019年11月19日在6:03
  • \ begingroup美元 版权并不一定意味着他们不会让你工作。所以它可能仍然值得OP联系他们。 \ endgroup美元
    - - - - - -haresfur
    2019年11月19日,23
  • \ begingroup美元 @Leukocyte mindat允许访问数据库如果联系和信服。 \ endgroup美元
    - - - - - -Gimelist
    2019年11月19日10:10
  • \ begingroup美元 他们不能。如果你读过我的链接的评论他们将开放数据并创建一个API,但每张照片属于每个作者和要保持copyrigthed没有可用的API。海报可以只使用CC在维基百科上的图片共享,但接下来他应该要求每个作者的许可。在担忧什么,图片,最好是采取iRocks的。他们上传5000张照片Wkipedia (mindat上传2000,见链接我的答案),你只需要引用一位作者。对于数据rruff.info更适合,除非mindat地方。 \ endgroup美元
    - - - - - -user18261
    2019年11月19日在11
  • \ begingroup美元 @Gimelist不是因为他们属于每个作者照片。他们将开放数据,我的链接在评论中说。 \ endgroup美元
    - - - - - -user18261
    2019年11月19日,因

你的答案

通过点击“发布你的答案”,你同意我们服务条款并承认您已阅读并理解我们的隐私政策的行为准则

不是你要找的答案?浏览其他问题标记问你自己的问题