Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,893,260字

标签 > 标签文章:#cuda# (共有5文章)

  • 初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

    初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行
    无需任何修改转换,AMD显卡也跑起原版CUDA程序了!英国一家初创公司,推出了针对AMD的CUDA程序编译工具,而且免费商用。工具一经发布就引发了网友们的广泛热议,并登顶了HackerNews热榜。该工具名为SCALE,开发者给它的定位是一个GPGPU(通用GPU)编程工具包。目前已有大模型框架llama-cpp等9个程序通过测试,实现了正常运行。与其他实现方式不同,SCALE直接模拟CUDA工具

     91    0    2024-07-16 12:48

  • 英伟达禁止第三方公司兼容 CUDA?摩尔线程回应称未受影响

    英伟达禁止第三方公司兼容 CUDA?摩尔线程回应称未受影响
    感谢IT之家网友咩咩洋、pzvincent、紫衣书生、lemon_meta的线索投递!IT之家3月6日消息,近日,网络上出现了对于英伟达CUDA(并行计算平台)兼容相关的报道,被认为是“禁止第三方公司兼容CUDA”。据外媒Tom'sHardware报道,英伟达CUDA11.6及更高版本的EULA(最终用户许可协议)中的某条款提到,“您不能逆向工程、反编译或反汇编使用此SDK生成的任何结果,并在非英

     197    0    2024-03-06 16:11

  • AMD ROCm 6.0 发布,支持 RX 7900 GRE 和 PRO W7800 显卡

    AMD ROCm 6.0 发布,支持 RX 7900 GRE 和 PRO W7800 显卡
    IT之家2月15日消息,AMD开源软件开发平台 ROCm(对标英伟达CUDA)近日发布6.0版本,引入了改进的硬件和软件支持。ROCm6.0宣布与ONNXRuntime兼容。ONNX作为机器学习算法和软件工具的开放标准,为开发人员提供了在不同框架之间转换AI模型的无缝方式。因此在升级到ROCm6.0后,用户就可以在本地AMD硬件上对更广泛的源数据进行推理。在硬件方面,ROCm6.0更新带

     206    0    2024-02-15 15:08

  • 英伟达 CUDA 太难:OpenAI 出手要取代它,新语言性能相当但编程更简单

    英伟达 CUDA 太难:OpenAI 出手要取代它,新语言性能相当但编程更简单
    用CUDA为GPU编程实在太难了。为了让没有CUDA编程经验的人写出和专家效率相当的GPU代码,现在OpenAI推出了一种新的语言和编译器——Triton。它的难度比CUDA低,但是性能却可与之相媲美。OpenAI声称:Triton只要25行代码,就能在FP16矩阵乘法shang上达到与cuBLAS相当的性能。OpenAI的研究人员已经使用Triton,来生成比同等Torch效率高出1倍的内核。T

     437    0    2021-07-29 15:59

  • 英特尔核显利用插件可开启 CUDA 加速,跑分单项提升 52%

    英特尔核显利用插件可开启 CUDA 加速,跑分单项提升 52%
    IT之家2月28日消息 CUDA核心加速一直以来是英伟达显卡的专属功能,其它显卡不可用。但是据外媒hothardware报道,国外开发者推出了一款名为ZLUDA的工具,可以为英特尔6代酷睿(Skylake)及以上处理器的核显提供CUDA加速功能,同时支持Windows以及Linux系统。此前英伟达CUDA加速的原理以及API一直是专用的,第三方无法获取。尽管有工具能将使用CUDA加速的应

     499    0    2021-02-28 16:41

  • 1