一文读懂ProgPoW

一文读懂ProgPoW

Artano
2020-02-24
栏目：DAO
--
APP下载

以太坊ProgPoW升级再度无望？一文读懂ProgPoW

原本计划要在伊斯坦布尔硬分叉中实施的ProgPow终于又有消息了，但是什么时候升级仍然悬而未决。

据CryptoBriefing报道，

以太坊核心开发者正在推进ProgPoW，暂定在7月进行硬分叉升级。自从矿机制造商比特大路和芯动科技分别于2018年4月和7月发布专用集成电路（ASIC）的以太坊ASIC矿机E3和A10以来，为避免专业ASIC矿机制造商垄断以太坊算力，保护以太坊网络的去中心化和网络安全，以太坊社区在过去两年中一直在讨论将以太坊算法转换为ProgPoW的问题。新算法可以使以太坊挖矿具有抗ASIC性。

但是，最新消息是，硬分叉协调员James Hancock谈到ProgPoW是否应该跟 EIP-1962放到同一次分叉中，但是以太坊社区核心人员如Spankchain的Ameen Soleimani、Gnosis的MartinKöppelmann、Uniswap的Hayden Adams、ConsenSys的Igor Lilic以及众多以太坊开发人员表示反对ProgPoW。也就是说，以太坊核心开发者并未就ProgPoW达成一致意见，也没有暂定硬分叉的时间。

那么ProgPoW到底是个啥？ProgPoW何以能缩小GPU挖矿与ASIC之间的差距？

ProgPoW主要是根据GPU的特性对以太坊的Ethash算法做了修改，缩小GPU与专用ASIC之间的算力差距。

一句话解释，用ProgPoW开发团队IfDefElse的话是：“PoW挖矿，通常是设计硬件让算法更高效。但ProgPoW相反，先有硬件，然后再修改算法来匹配它。”

Ethash算法

PoW是一个概念统称，有很多种算法实现。目前以太坊使用的具体PoW算法是Ethash，它是Dagger—Hashimoto算法的变种。

Hashimoto算法采用IO饱和策略来对抗ASIC，使内存读取成为PoW挖矿过程中的限制因素。Dagger算法使用DAG（directed acyclic graphs—有向无环图）来同时实现内存难解和内存易验证两个特点。主要原理是挖矿过程需要存储完整的DAG数据，同时在计算每个nonce时需要抽取DAG中的部分数据。

选取这个算法的结果使得，挖矿计算性能的瓶颈在于内存大小和内存带宽，而和哈希计算能力关系不大。比如NVIDIA GTX1070执行Ethash时，内存在达到88.3%的利用时，作为显卡计算核心的SM（streaming multiprocessor）只有27.7%的利用率。

同时使得通过大规模部署共享内存的ASIC矿机并不能带来在挖矿效率上同比例线性增长。

Ethash算法的一般流程如下：

1、首先根据块信息计算一个种子；

2、使用这个种子，计算出一个16MB的cache数据。

3、通过cache，计算出一个1GB(初始大小)的数据集(DAG)，DAG可以理解为是一个完整的搜索空间，全客户端和矿工需要存储完整的DAG，

4、挖矿：需要从DAG中重复随机抽取64次数据拿去和其他数据计算mixhash（如下图）

在早期Ethereum和Solidity智能合约代码中，Keccak和SHA3是同义词。在2015年8月NIST标准化SHA3后，标准的SHA3和Keccak算法有所区别。为了避免和NIST标准的SHA3混淆，现在的代码直接使用Keccak作为函数名。

每次Ethash从DAG中随机取64128 bit=8192 Bytes数据。以GTX 1070显卡为例，带宽为256GB/s，那么每秒能承受256*1024*1024*1024/8192=33554432次Ethash运算，即33MH/s算力。

针对Ethash的专用ASIC

可以根据需要执行的命令量身定制专用硬件来解决，比如在Ethash开始和结束时调用的哈希函数Keccak在ASIC上可以更有效执行。

针对Ethash，专用ASIC大致可以采用三个专用功能来提高计算性能：

一个从DAG导入数据的高带宽内存接口（一般来说是GDDR6或者HBM2）

一个用于Keccak哈希计算的keccak引擎；

一个用于执行内部循环FNV和地址模运算的小型计算核心；

由此专门定制的ASIC将比现有GPU体积更小且能耗更低。高配置（GDDR6或者HBM2）的以太坊ASIC矿机可以达到GPU矿机挖矿性能的2倍。

事实上，大矿机商都曾推出过以太坊ASIC矿机。2018年4月比特大陆推出以太坊ASIC矿机E3，芯动科技2018年7月发布以太坊ASIC矿机A10。但因为以太坊社区抵制，威胁可能会修改算法，同时还有部分技术原因，比如比特大陆的E3因为采用的是DDR3内存，ASIC矿机相比GPU并没有多少算力优势。因此，以太坊ASIC矿机并没有得到大规模采用。

ProgPoW做了哪些改变

ProgPoW，是Programmatic Proof-of-Work的缩写。正如IfDefElse所说，为匹配现行主流GPU的硬件特征，ProgPoW算法主要做了如下改进：

1、把keccak_f1600（64字节的字）改成keccak_f800（32字节的字）。32字节是目前主流GPU一次操作处理的实际位数。

2、在主循环环节增加了数学随机序列。目前GPU计算核心内有着大量暂存器，可为高吞吐量可编程数学单元提供信号。Ethash的内部循环先是DAG载入，然后用FNV将数据合并为小的混合状态。ProgPoW添加了一系列随机数学指令和随机缓存读取，进而合并为更大的混合状态。

3、DAG数据读取大小从128 byte增加到256 byte。当前主流GPU DRAM均为32位（32*8=256 byte），这样ProgPoW可以在当前DRAM设备上更有效率地执行；

4、GPU具有少量高速暂存器内存，允许快速处理访问随机地址，ProgPoW也利用了GPU这一特性。

其中迭代运算次数即访问DAG次数保持不变，与Ethash一样仍是64次。

经过优化后，ProgPoW能大幅提高GPU计算能力。Nvidia GTX1070运行ProgPoW测试结果表明，在内存利用率达到87.55%时，GPU计算核心的SM（streaming multiprocessor）利用率能达到87.95%。

ProgPoW大幅缩小了ASIC和GPU间的性能差距

理论上，还是可以制造出专门用于执行ProgPoW的ASIC的。但这种ASIC不仅需要高带宽内存接口和小型Keccak+KISS99引擎；还需要具有大型寄存器、大量随机数学能力的计算核心；高吞吐量、低延迟、大存储的缓存。

造成的实际后果是这种专用ASIC会和与现有GPU的性能非常相似。经过优化后的ASIC计算性能将只有目前GPU的1.1-1.2倍，大幅缩小ASIC和GPU之间的性能差距。

考虑到研发ASIC的巨额成本以及以太坊社区的抵制，研发以太坊ASIC极低的性价比也会让矿机商主动远离以太坊。