网站地图官方微信:
网站首页 辛丰镇 白鹤乡 双土乡 君坝乡 比尔乡 柳川镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 国产手机AI「好用」的背后,是技术差距还是文化差异? |

    前段时间回国参加了一些活动,还跟一些国内做AI的朋友深入的聊...

    查看详情>>
  • | 中国的航空发动机现在是什么水平? |

  • | 巴基斯坦援助伊朗防空,大家怎么看? |

  • | 女生被踢裆也会很疼吗? |

  • | 如何看待 iOS 应用在欧盟范围内可以使用非 WebKit 作为浏览器内核? |

  • | 有邻居的追求者出价三万,让我连续半个月每天找个女朋友晚上弄点动静,我该答应吗? |

  • | ***如古代长城用的是C140混凝土,那千百年下来会完整的留存至今还是损坏的更加严重? |

  • | 前端是不是快没了? |

  • | 一名女子在杭州万象城遭挟持被捅 20 多刀,隆胸***体救了一命,这反映出哪些公安系统的问题? |

  • | 利用爬虫技术能做到哪些很酷很有趣很有用的事情? |

  • | 你被哪个后来知道很sb的BUG困扰过一周以上吗? |

  • 2024.06.27更新 会不定期更新自己在用的软件和踩坑软...

    2025-06-22
  • 我看好多回答都在秀,认为自己只需要两三千预算就能搞定,凸现自...

    2025-06-22
  • 本文参考LLaDA:Large Language Diffu...

    2025-06-22
  • 华为服务器,无法安装Proxmox VE,测试了7.4.1和...

    2025-06-22

关注我们

添加微信好友,关注最新动态