?▽?
来在每个时钟执行一组wrap(线程束)。将每组CUDA阵列的数量从16个翻倍至32个解决了wrap的执行问题。同时SMX前端也将wrap的调度器和分配器翻倍,而寄存器堆也被翻倍到64K条来满足额外的执行单元的需要。面对芯片面积暴增的风险,SMX的PolyMorph Engine并没有也随其他部分翻倍,而是升级到了2。
?▽?
来在每个时钟执行一组wrap(线程束)。将每组CUDA阵列的数量从16个翻倍至32个解决了wrap的执行问题。同时SMX前端也将wrap的调度器和分配器翻倍,而寄存器堆也被翻倍到64K条来满足额外的执行单元的需要。面对芯片面积暴增的风险,SMX的PolyMorph Engine并没有也随其他部分翻倍,而是升级到了2。
作者:小乐剧情本文地址:https://debug8.com/9rrl3sm2.html发布于 2024-03-18 21:52
剧情转载或复制请以超链接形式并注明出处小乐剧情创作解说
发表评论