这是突出介绍Filecoin协议独特特性的新系列的第一篇博客文章。
Filecoin 旨在存储世界上最有价值的信息。在全球范围内,我们每天产生 2.5 亿个字节的数据。尽管其中许多数据不需要永久存储,但其中一些数据涵盖了人类在科学,数学,艺术,历史和人文科学领域创造的最重要的信息。
Filecoin 是用于买卖分散式存储的基于区块链的市场。区块链机制提供了安全的存储保证,而加密货币机制创建了一个动态的市场。
正如我们在加密经济学构造博客文章中讨论的那样,有时当您处理大量数据时,很难(昂贵且耗时)通过 Internet 传输这些文件以进行保管。对于 PB 级数据集和更大的数据集,最明智的解决方案通常涉及在硬盘上传输数据。Filecoin 协议和项目具有工具和结构来支持所谓的脱机数据传输。
何时考虑离线数据传输
决定是在线还是离线传输数据时要考虑的两个因素是费用和时间。
考虑像网络这样的存储程序,因为数据的高速公路从一个地方移动到另一个地方。这种运动很快就会变得非常昂贵。想象一下一个庞大的信息档案馆,例如博物馆或图书馆,希望在分散的 Web(dweb)上上传,存储和保护其馆藏。为此,组织可以通过互联网流式传输其数据或使用物理设备进行传输。
使用互联网流式传输数据,可以快速建立传输成本。在当今的云服务中传输 PB 级数据需要通过多个区域发送数据,从而产生互连费和区域带宽费,如果您选择租用专用线路或考虑重试需求,则还需要支付额外费用。
从粗略的成本角度来看,仅传输 2.5 PB 数据所需的带宽就需要约 140,000 美元-如果您要跨区域移动这些数据,则成本会更高。
这些费用可能会增加档案馆,博物馆和其他非营利组织的费用。在现代艺术收藏的博物馆超过 90 万亿字节,预计到 2025 年将增长到 1.2 PB 级的英文维基百科包含超过600万页的文章和超过 36 十亿字。
CERN 的开放数据门户网站在其粒子物理实验中包含超过1PB的数据。伦敦自然历史博物馆数据门户网站包含近 400 万个历史标本。国家档案馆的电子记录部门拥有500 TB的数据。这些是大量有价值的数据。
然后,考虑硬盘驱动器本身的成本–一种用于存储和运送数据的物理介质。服务器级 8 TB 驱动器的价格约为 200 美元。例如,要传输 2.5 PB 的数据,您将需要大约 315 个硬盘驱动器,总计约为 63,000 美元。
尽管您可能需要支付一些额外的运输,进口费用和货币兑换单位成本,但您的成本远低于通过互联网传输数据的成本!
现在,让我们想象一下,国家档案馆希望将其电子记录传输到另一台服务器。以 100 Mbps 的速度传输 500 TB 的数据需要一年多的时间。用硬盘驱动器传输相同的数据仅需花费下载和发送的时间,大概一周之内就可以完成!归根结底,很明显,在某些情况下,物理传输数据的成本效益更高且速度更快。
使用 Filecoin 进行脱机数据传输
对于较小的数据传输,当存储客户端希望与矿工进行交易时,他们会向矿工提出交易以在“ Y”时间段内存储“X”数据。矿工和客户协商交易后,他们通常通过网络启动从客户到矿工的数据传输。
Filecoin 的离线数据传输功能允许拥有非常大数据集的用户离线完成数据传输步骤(例如,通过将硬盘从客户端运送到存储矿工),并使交易按计划进行。它是通过一个标志来实现的,该标志告诉客户端不要通过网络传输数据。
相反,客户传递一个 CID(描述数据的唯一标识符),矿工随后必须匹配该 CID,交易才能通过。这为客户端节点提供了如何设置交易的灵活性,例如,将矿工在硬盘上的特定位置传递给矿工,以供他们用来生成分段 CID 的数据。
Filecoin 项目如何支持离线数据传输
5 月 7 日,我们启动了 Filecoin Discover,该项目旨在激励早期的矿工订购和存储装有有价值的开源数据的硬盘,并作为交换,获得其他 Filecoin 代币。这是一种帮助 Filecoin 成为人类最重要的数据集之家的种子,并使其可供其他人访问的途径,以扩大我们的知识库并形成新的想法。
矿工可以选择硬盘驱动器,并在 Filecoin Discover 商店中签署有保证的合同,Filecoin Discover 商店是 PB 级重要公共数据的目录(并且正在增长!)。然后,矿工将以一定成本在驱动器上接收该数据。为了交换存储这些数据,矿工获得了 Filecoin。
商店开业后的最初 24 小时内,我们收到了 600 多个驱动器的订单,这突显了该项目带来的兴奋。
对于,Filecoin Discover 这样的项目而言,成功编程的关键是降低硬件成本。4 月份,Filecoin 提出了一项有关存储设备(类似于 AWS Snowball)的提案请求,以实现更快的离线数据传输。
RFP 的目标是构建冗余且安全的低成本硬盘解决方案。矿工可以在设定的期限内租用这些设备,以保持数据传输。客户端可以将数据加载到这些设备上,而矿工则在收到数据后将其卸载到自己的服务器上。
脱机交易也可以在 Discover 程序之外进行。考虑一下海上的一艘潜水艇,它收集了 PB 级有关太平洋水下生物的信息。当船舶返回陆地时,邮寄这些硬盘驱动器可能更有意义,而不是依靠在线数据传输。随着我们努力分散网络的分散性,大量数据的物理传输将继续在信息传播中发挥重要作用。展望未来,埃字节规模的数据传输(例如AWS Snowmobile)是此演进过程中的下一步,用于传输大量数据。
最终,脱机数据传输之类的解决方案将使 Filecoin 成为用于存储数据的传统云存储平台的更强大替代品。数据存储是每个部门几乎所有企业的实际成本。如果存储成本下降,小企业将节省资金,他们可以将这些资金投资于雇用或研发。
这只是 Filecoin 网络独特功能如何帮助企业以更有效,安全和负担得起的方式满足其存储需求的一个示例。在接下来的几周中,我们将推出更多突出这些功能的帖子。我们希望您能与我们一起完成这项任务,以分散存储空间并改善对信息的访问。
非常感谢您对 IPFS&Filecoin 项目的持续支持。我们很高兴继续与您一起,为人类信息建立一个强大的,去中心化和高效的基础。
FilCloud 帮你迅速了解 IPFS 领域的热点技术和应用