Add `cuda::device::warp_match_all` #4746

fbusato · 2025-05-19T22:56:45Z

Description

Following the same idea of the existing utilities in <cuda/warp>, this PR adds cuda::device::warp_match_all to check if a subset of lanes has the same value.
The function performs a bitwise comparison. We could raise a compile-time error if the data type overrides the operator==. On the other hand, this would prevent comparing types like cuda::std::array.

github-actions · 2025-05-21T00:51:33Z

🟨 CI finished in 3h 05m: Pass: 97%/183 | Total: 1d 08h | Avg: 10m 32s | Max: 35m 42s | Hits: 96%/281996

🟨 cudax: Pass: 92%/26 | Total: 2h 24m | Avg: 5m 34s | Max: 14m 26s | Hits: 99%/13662

🔍 cpu: arm64 🔍
  🟩 amd64              Pass: 100%/22  | Total:  2h 13m | Avg:  6m 03s | Max: 14m 26s | Hits:  99%/12474 
  🔍 arm64              Pass:  50%/4   | Total: 11m 27s | Avg:  2m 51s | Max:  3m 41s | Hits:  99%/1188  
🔍 ctk: 12.9 🔍
  🟩 12.0               Pass: 100%/3   | Total: 20m 42s | Avg:  6m 54s | Max: 13m 06s | Hits:  98%/1487  
  🟩 12.8               Pass: 100%/2   | Total: 17m 47s | Avg:  8m 53s | Max:  9m 03s | Hits:  97%/1184  
  🔍 12.9               Pass:  90%/21  | Total:  1h 46m | Avg:  5m 03s | Max: 14m 26s | Hits:  99%/10991 
🔍 cudacxx: nvcc12.9 🔍
  🟩 nvcc12.0           Pass: 100%/3   | Total: 20m 42s | Avg:  6m 54s | Max: 13m 06s | Hits:  98%/1487  
  🟩 nvcc12.8           Pass: 100%/2   | Total: 17m 47s | Avg:  8m 53s | Max:  9m 03s | Hits:  97%/1184  
  🔍 nvcc12.9           Pass:  90%/21  | Total:  1h 46m | Avg:  5m 03s | Max: 14m 26s | Hits:  99%/10991 
🔍 cxx: Clang19 🔍
  🟩 Clang14            Pass: 100%/2   | Total:  7m 43s | Avg:  3m 51s | Max:  4m 00s | Hits: 100%/1192  
  🟩 Clang15            Pass: 100%/1   | Total:  3m 59s | Avg:  3m 59s | Max:  3m 59s | Hits: 100%/594   
  🟩 Clang16            Pass: 100%/1   | Total:  3m 49s | Avg:  3m 49s | Max:  3m 49s | Hits: 100%/594   
  🟩 Clang17            Pass: 100%/1   | Total:  3m 35s | Avg:  3m 35s | Max:  3m 35s | Hits: 100%/594   
  🟩 Clang18            Pass: 100%/1   | Total:  3m 43s | Avg:  3m 43s | Max:  3m 43s | Hits: 100%/594   
  🔍 Clang19            Pass:  50%/4   | Total: 17m 31s | Avg:  4m 22s | Max:  9m 17s | Hits: 100%/1188  
  🟩 GCC10              Pass: 100%/2   | Total:  8m 03s | Avg:  4m 01s | Max:  4m 10s | Hits:  99%/1192  
  🟩 GCC11              Pass: 100%/1   | Total:  4m 11s | Avg:  4m 11s | Max:  4m 11s | Hits:  99%/594   
  🟩 GCC12              Pass: 100%/1   | Total:  4m 19s | Avg:  4m 19s | Max:  4m 19s | Hits:  99%/594   
  🟩 GCC13              Pass: 100%/8   | Total: 42m 37s | Avg:  5m 19s | Max: 12m 24s | Hits:  99%/4752  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 13m 06s | Avg: 13m 06s | Max: 13m 06s | Hits:  95%/295   
  🟩 MSVC14.43          Pass: 100%/1   | Total: 14m 26s | Avg: 14m 26s | Max: 14m 26s | Hits:  95%/295   
  🟩 NVHPC25.3          Pass: 100%/2   | Total: 17m 47s | Avg:  8m 53s | Max:  9m 03s | Hits:  97%/1184  
🔍 cxx_family: Clang 🔍
  🔍 Clang              Pass:  80%/10  | Total: 40m 20s | Avg:  4m 02s | Max:  9m 17s | Hits: 100%/4756  
  🟩 GCC                Pass: 100%/12  | Total: 59m 10s | Avg:  4m 55s | Max: 12m 24s | Hits:  99%/7132  
  🟩 MSVC               Pass: 100%/2   | Total: 27m 32s | Avg: 13m 46s | Max: 14m 26s | Hits:  95%/590   
  🟩 NVHPC              Pass: 100%/2   | Total: 17m 47s | Avg:  8m 53s | Max:  9m 03s | Hits:  97%/1184  
🔍 gpu: rtx2080 🔍
  🟩 h100               Pass: 100%/2   | Total: 11m 21s | Avg:  5m 40s | Max:  7m 55s | Hits:  99%/1188  
  🔍 rtx2080            Pass:  91%/24  | Total:  2h 13m | Avg:  5m 33s | Max: 14m 26s | Hits:  99%/12474 
🔍 jobs: Build 🔍
  🔍 Build              Pass:  91%/23  | Total:  1h 55m | Avg:  5m 00s | Max: 14m 26s | Hits:  99%/11880 
  🟩 Test               Pass: 100%/3   | Total: 29m 36s | Avg:  9m 52s | Max: 12m 24s | Hits:  99%/1782  
🟨 cudacxx_family
  🟨 nvcc               Pass:  92%/26  | Total:  2h 24m | Avg:  5m 34s | Max: 14m 26s | Hits:  99%/13662 
🟩 sm
  🟩 90                 Pass: 100%/3   | Total: 14m 53s | Avg:  4m 57s | Max:  7m 55s | Hits:  99%/1782  
  🟩 90a                Pass: 100%/1   | Total:  3m 40s | Avg:  3m 40s | Max:  3m 40s | Hits:  99%/594   
🟨 std
  🟨 17                 Pass:  75%/4   | Total: 18m 20s | Avg:  4m 35s | Max:  9m 03s | Hits:  98%/1780  
  🟨 20                 Pass:  95%/22  | Total:  2h 06m | Avg:  5m 44s | Max: 14m 26s | Hits:  99%/11882

🟨 stdpar: Pass: 50%/4 | Total: 18m 59s | Avg: 4m 44s | Max: 5m 38s

🚨 cpu: arm64 🚨
  🟩 amd64              Pass: 100%/2   | Total: 11m 10s | Avg:  5m 35s | Max:  5m 38s
  🔥 arm64              Pass:   0%/2   | Total:  7m 49s | Avg:  3m 54s | Max:  4m 01s
🟨 ctk
  🟨 12.8               Pass:  50%/4   | Total: 18m 59s | Avg:  4m 44s | Max:  5m 38s
🟨 cudacxx
  🟨 nvcc12.8           Pass:  50%/4   | Total: 18m 59s | Avg:  4m 44s | Max:  5m 38s
🟨 cudacxx_family
  🟨 nvcc               Pass:  50%/4   | Total: 18m 59s | Avg:  4m 44s | Max:  5m 38s
🟨 cxx
  🟨 NVHPC25.3          Pass:  50%/4   | Total: 18m 59s | Avg:  4m 44s | Max:  5m 38s
🟨 cxx_family
  🟨 NVHPC              Pass:  50%/4   | Total: 18m 59s | Avg:  4m 44s | Max:  5m 38s
🟨 gpu
  🟨 rtx2080            Pass:  50%/4   | Total: 18m 59s | Avg:  4m 44s | Max:  5m 38s
🟨 jobs
  🟨 Build              Pass:  50%/4   | Total: 18m 59s | Avg:  4m 44s | Max:  5m 38s
🟨 std
  🟨 17                 Pass:  50%/2   | Total:  9m 33s | Avg:  4m 46s | Max:  5m 32s
  🟨 20                 Pass:  50%/2   | Total:  9m 26s | Avg:  4m 43s | Max:  5m 38s

🟩 cub: Pass: 100%/47 | Total: 10h 47m | Avg: 13m 46s | Max: 35m 42s | Hits: 99%/57218

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total: 10h 32m | Avg: 14m 03s | Max: 35m 42s | Hits:  99%/54728 
  🟩 arm64              Pass: 100%/2   | Total: 15m 15s | Avg:  7m 37s | Max:  8m 30s | Hits:  99%/2490  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 58m 37s | Avg: 11m 43s | Max: 27m 33s | Hits:  99%/6042  
  🟩 12.8               Pass: 100%/2   | Total: 26m 53s | Avg: 13m 26s | Max: 13m 38s | Hits:  98%/2289  
  🟩 12.9               Pass: 100%/40  | Total:  9h 22m | Avg: 14m 03s | Max: 35m 42s | Hits:  99%/48887 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 11m 47s | Avg:  5m 53s | Max:  5m 56s | Hits:  99%/2143  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 58m 37s | Avg: 11m 43s | Max: 27m 33s | Hits:  99%/6042  
  🟩 nvcc12.8           Pass: 100%/2   | Total: 26m 53s | Avg: 13m 26s | Max: 13m 38s | Hits:  98%/2289  
  🟩 nvcc12.9           Pass: 100%/38  | Total:  9h 10m | Avg: 14m 29s | Max: 35m 42s | Hits:  99%/46744 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 11m 47s | Avg:  5m 53s | Max:  5m 56s | Hits:  99%/2143  
  🟩 nvcc               Pass: 100%/45  | Total: 10h 35m | Avg: 14m 07s | Max: 35m 42s | Hits:  99%/55075 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 28m 35s | Avg:  7m 08s | Max:  7m 51s | Hits:  99%/4982  
  🟩 Clang15            Pass: 100%/2   | Total: 14m 55s | Avg:  7m 27s | Max:  7m 33s | Hits:  99%/2487  
  🟩 Clang16            Pass: 100%/2   | Total: 14m 58s | Avg:  7m 29s | Max:  7m 40s | Hits:  99%/2487  
  🟩 Clang17            Pass: 100%/2   | Total: 15m 22s | Avg:  7m 41s | Max:  7m 54s | Hits:  99%/2487  
  🟩 Clang18            Pass: 100%/2   | Total: 14m 19s | Avg:  7m 09s | Max:  7m 14s | Hits:  99%/2487  
  🟩 Clang19            Pass: 100%/7   | Total:  1h 26m | Avg: 12m 19s | Max: 27m 24s | Hits:  99%/8362  
  🟩 GCC7               Pass: 100%/2   | Total: 17m 24s | Avg:  8m 42s | Max:  8m 50s | Hits:  99%/2490  
  🟩 GCC8               Pass: 100%/1   | Total:  8m 24s | Avg:  8m 24s | Max:  8m 24s | Hits:  99%/1245  
  🟩 GCC9               Pass: 100%/2   | Total: 17m 58s | Avg:  8m 59s | Max:  9m 03s | Hits:  99%/2490  
  🟩 GCC10              Pass: 100%/2   | Total: 18m 47s | Avg:  9m 23s | Max:  9m 49s | Hits:  99%/2491  
  🟩 GCC11              Pass: 100%/2   | Total: 18m 02s | Avg:  9m 01s | Max:  9m 15s | Hits:  99%/2487  
  🟩 GCC12              Pass: 100%/2   | Total: 18m 46s | Avg:  9m 23s | Max:  9m 39s | Hits:  99%/2487  
  🟩 GCC13              Pass: 100%/11  | Total:  3h 46m | Avg: 20m 37s | Max: 35m 42s | Hits:  99%/13703 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 56m 58s | Avg: 28m 29s | Max: 29m 25s | Hits:  99%/2122  
  🟩 MSVC14.43          Pass: 100%/2   | Total:  1h 03m | Avg: 31m 36s | Max: 32m 38s | Hits:  99%/2122  
  🟩 NVHPC25.3          Pass: 100%/2   | Total: 26m 53s | Avg: 13m 26s | Max: 13m 38s | Hits:  98%/2289  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 54m | Avg:  9m 10s | Max: 27m 24s | Hits:  99%/23292 
  🟩 GCC                Pass: 100%/22  | Total:  5h 26m | Avg: 14m 49s | Max: 35m 42s | Hits:  99%/27393 
  🟩 MSVC               Pass: 100%/4   | Total:  2h 00m | Avg: 30m 02s | Max: 32m 38s | Hits:  99%/4244  
  🟩 NVHPC              Pass: 100%/2   | Total: 26m 53s | Avg: 13m 26s | Max: 13m 38s | Hits:  98%/2289  
🟩 gpu
  🟩 h100               Pass: 100%/3   | Total:  1h 00m | Avg: 20m 01s | Max: 27m 58s | Hits:  99%/3738  
  🟩 rtx2080            Pass: 100%/36  | Total:  6h 27m | Avg: 10m 46s | Max: 32m 38s | Hits:  99%/43518 
  🟩 rtxa6000           Pass: 100%/8   | Total:  3h 19m | Avg: 24m 59s | Max: 35m 42s | Hits:  99%/9962  
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total:  6h 50m | Avg: 10m 32s | Max: 32m 38s | Hits:  99%/47254 
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 35m 42s | Avg: 35m 42s | Max: 35m 42s | Hits:  99%/1246  
  🟩 GraphCapture       Pass: 100%/1   | Total: 27m 10s | Avg: 27m 10s | Max: 27m 10s | Hits:  99%/1246  
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 30m | Avg: 30m 13s | Max: 35m 18s | Hits:  99%/3736  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 23m | Avg: 27m 45s | Max: 31m 50s | Hits:  99%/3736  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total:  1h 00m | Avg: 20m 01s | Max: 27m 58s | Hits:  99%/3738  
  🟩 90;90a;100         Pass: 100%/1   | Total:  9m 33s | Avg:  9m 33s | Max:  9m 33s | Hits:  99%/1246  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  4h 01m | Avg: 11m 28s | Max: 32m 38s | Hits:  99%/25302 
  🟩 20                 Pass: 100%/26  | Total:  6h 46m | Avg: 15m 38s | Max: 35m 42s | Hits:  99%/31916

🟩 thrust: Pass: 100%/47 | Total: 8h 33m | Avg: 10m 55s | Max: 34m 09s | Hits: 99%/84074

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 21m 07s | Avg: 10m 33s | Max: 13m 12s | Hits:  99%/3580  
🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  8h 21m | Avg: 11m 08s | Max: 34m 09s | Hits:  99%/80495 
  🟩 arm64              Pass: 100%/2   | Total: 12m 16s | Avg:  6m 08s | Max:  6m 47s | Hits:  99%/3579  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 51m 52s | Avg: 10m 22s | Max: 27m 34s | Hits:  99%/8941  
  🟩 12.8               Pass: 100%/2   | Total:  1h 01m | Avg: 30m 34s | Max: 31m 35s | Hits:  99%/3578  
  🟩 12.9               Pass: 100%/40  | Total:  6h 40m | Avg: 10m 01s | Max: 34m 09s | Hits:  99%/71555 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 11m 28s | Avg:  5m 44s | Max:  5m 45s | Hits: 100%/3578  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 51m 52s | Avg: 10m 22s | Max: 27m 34s | Hits:  99%/8941  
  🟩 nvcc12.8           Pass: 100%/2   | Total:  1h 01m | Avg: 30m 34s | Max: 31m 35s | Hits:  99%/3578  
  🟩 nvcc12.9           Pass: 100%/38  | Total:  6h 29m | Avg: 10m 14s | Max: 34m 09s | Hits:  99%/67977 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 11m 28s | Avg:  5m 44s | Max:  5m 45s | Hits: 100%/3578  
  🟩 nvcc               Pass: 100%/45  | Total:  8h 22m | Avg: 11m 09s | Max: 34m 09s | Hits:  99%/80496 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 23m 30s | Avg:  5m 52s | Max:  6m 24s | Hits: 100%/7156  
  🟩 Clang15            Pass: 100%/2   | Total: 12m 20s | Avg:  6m 10s | Max:  6m 11s | Hits: 100%/3578  
  🟩 Clang16            Pass: 100%/2   | Total: 12m 25s | Avg:  6m 12s | Max:  6m 17s | Hits: 100%/3578  
  🟩 Clang17            Pass: 100%/2   | Total: 13m 07s | Avg:  6m 33s | Max:  6m 44s | Hits: 100%/3578  
  🟩 Clang18            Pass: 100%/2   | Total: 12m 22s | Avg:  6m 11s | Max:  6m 22s | Hits: 100%/3578  
  🟩 Clang19            Pass: 100%/7   | Total: 48m 32s | Avg:  6m 56s | Max: 10m 44s | Hits: 100%/12523 
  🟩 GCC7               Pass: 100%/2   | Total: 13m 36s | Avg:  6m 48s | Max:  7m 02s | Hits:  99%/3580  
  🟩 GCC8               Pass: 100%/1   | Total:  7m 22s | Avg:  7m 22s | Max:  7m 22s | Hits:  99%/1790  
  🟩 GCC9               Pass: 100%/2   | Total: 14m 51s | Avg:  7m 25s | Max:  8m 09s | Hits:  99%/3580  
  🟩 GCC10              Pass: 100%/2   | Total: 14m 59s | Avg:  7m 29s | Max:  7m 34s | Hits:  99%/3580  
  🟩 GCC11              Pass: 100%/2   | Total: 15m 45s | Avg:  7m 52s | Max:  8m 02s | Hits:  99%/3580  
  🟩 GCC12              Pass: 100%/2   | Total: 16m 04s | Avg:  8m 02s | Max:  8m 04s | Hits:  99%/3580  
  🟩 GCC13              Pass: 100%/10  | Total:  1h 33m | Avg:  9m 18s | Max: 13m 27s | Hits:  99%/17900 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 57m 26s | Avg: 28m 43s | Max: 29m 52s | Hits:  99%/3566  
  🟩 MSVC14.43          Pass: 100%/3   | Total:  1h 37m | Avg: 32m 24s | Max: 34m 09s | Hits:  99%/5349  
  🟩 NVHPC25.3          Pass: 100%/2   | Total:  1h 01m | Avg: 30m 34s | Max: 31m 35s | Hits:  99%/3578  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 02m | Avg:  6m 26s | Max: 10m 44s | Hits: 100%/33991 
  🟩 GCC                Pass: 100%/21  | Total:  2h 55m | Avg:  8m 21s | Max: 13m 27s | Hits:  99%/37590 
  🟩 MSVC               Pass: 100%/5   | Total:  2h 34m | Avg: 30m 55s | Max: 34m 09s | Hits:  99%/8915  
  🟩 NVHPC              Pass: 100%/2   | Total:  1h 01m | Avg: 30m 34s | Max: 31m 35s | Hits:  99%/3578  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 18m 50s | Avg:  9m 25s | Max: 12m 56s | Hits:  99%/3580  
  🟩 rtx2080            Pass: 100%/35  | Total:  5h 53m | Avg: 10m 05s | Max: 32m 43s | Hits:  99%/62611 
  🟩 rtx4090            Pass: 100%/10  | Total:  2h 21m | Avg: 14m 09s | Max: 34m 09s | Hits:  99%/17883 
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  6h 51m | Avg: 10m 16s | Max: 32m 43s | Hits:  99%/71553 
  🟩 TestCPU            Pass: 100%/3   | Total: 52m 15s | Avg: 17m 25s | Max: 34m 09s | Hits:  99%/5362  
  🟩 TestGPU            Pass: 100%/4   | Total: 50m 19s | Avg: 12m 34s | Max: 13m 27s | Hits:  99%/7159  
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 18m 50s | Avg:  9m 25s | Max: 12m 56s | Hits:  99%/3580  
  🟩 90;90a;100         Pass: 100%/1   | Total:  7m 52s | Avg:  7m 52s | Max:  7m 52s | Hits:  99%/1790  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  3h 55m | Avg: 11m 12s | Max: 32m 43s | Hits:  99%/37560 
  🟩 20                 Pass: 100%/24  | Total:  4h 17m | Avg: 10m 42s | Max: 34m 09s | Hits:  99%/42934

🟩 libcudacxx: Pass: 100%/45 | Total: 8h 10m | Avg: 10m 54s | Max: 33m 06s | Hits: 93%/126714

🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total:  8h 01m | Avg: 11m 11s | Max: 33m 06s | Hits:  92%/120151
  🟩 arm64              Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  4m 49s | Hits:  99%/6563  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 51m 25s | Avg: 10m 17s | Max: 33m 06s | Hits:  99%/16044 
  🟩 12.8               Pass: 100%/2   | Total: 23m 09s | Avg: 11m 34s | Max: 12m 11s | Hits:  98%/6513  
  🟩 12.9               Pass: 100%/38  | Total:  6h 56m | Avg: 10m 57s | Max: 32m 07s | Hits:  92%/104157
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 52m 38s | Avg: 26m 19s | Max: 26m 57s | Hits:  26%/6527  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 51m 25s | Avg: 10m 17s | Max: 33m 06s | Hits:  99%/16044 
  🟩 nvcc12.8           Pass: 100%/2   | Total: 23m 09s | Avg: 11m 34s | Max: 12m 11s | Hits:  98%/6513  
  🟩 nvcc12.9           Pass: 100%/36  | Total:  6h 03m | Avg: 10m 06s | Max: 32m 07s | Hits:  96%/97630 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 52m 38s | Avg: 26m 19s | Max: 26m 57s | Hits:  26%/6527  
  🟩 nvcc               Pass: 100%/43  | Total:  7h 18m | Avg: 10m 11s | Max: 33m 06s | Hits:  96%/120187
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 26m 13s | Avg:  6m 33s | Max: 11m 49s | Hits:  96%/13010 
  🟩 Clang15            Pass: 100%/2   | Total: 10m 12s | Avg:  5m 06s | Max:  5m 08s | Hits:  99%/6523  
  🟩 Clang16            Pass: 100%/2   | Total: 10m 43s | Avg:  5m 21s | Max:  5m 39s | Hits:  99%/6523  
  🟩 Clang17            Pass: 100%/2   | Total: 16m 31s | Avg:  8m 15s | Max: 11m 27s | Hits:  94%/6523  
  🟩 Clang18            Pass: 100%/2   | Total: 10m 14s | Avg:  5m 07s | Max:  5m 12s | Hits:  99%/6523  
  🟩 Clang19            Pass: 100%/6   | Total:  1h 25m | Avg: 14m 10s | Max: 26m 57s | Hits:  68%/16331 
  🟩 GCC7               Pass: 100%/2   | Total:  9m 40s | Avg:  4m 50s | Max:  4m 58s | Hits:  99%/6459  
  🟩 GCC8               Pass: 100%/1   | Total:  4m 32s | Avg:  4m 32s | Max:  4m 32s | Hits:  99%/3240  
  🟩 GCC9               Pass: 100%/2   | Total: 15m 44s | Avg:  7m 52s | Max: 11m 24s | Hits:  94%/6471  
  🟩 GCC10              Pass: 100%/2   | Total: 16m 04s | Avg:  8m 02s | Max: 11m 13s | Hits:  93%/6525  
  🟩 GCC11              Pass: 100%/2   | Total: 15m 20s | Avg:  7m 40s | Max: 10m 12s | Hits:  95%/6521  
  🟩 GCC12              Pass: 100%/2   | Total: 16m 04s | Avg:  8m 02s | Max: 10m 32s | Hits:  96%/6525  
  🟩 GCC13              Pass: 100%/10  | Total:  1h 43m | Avg: 10m 21s | Max: 21m 19s | Hits:  95%/16577 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 05m | Avg: 32m 36s | Max: 33m 06s | Hits:  99%/6199  
  🟩 MSVC14.43          Pass: 100%/2   | Total:  1h 02m | Avg: 31m 18s | Max: 31m 25s | Hits:  99%/6251  
  🟩 NVHPC25.3          Pass: 100%/2   | Total: 23m 09s | Avg: 11m 34s | Max: 12m 11s | Hits:  98%/6513  
🟩 cxx_family
  🟩 Clang              Pass: 100%/18  | Total:  2h 38m | Avg:  8m 49s | Max: 26m 57s | Hits:  88%/55433 
  🟩 GCC                Pass: 100%/21  | Total:  3h 00m | Avg:  8m 37s | Max: 21m 19s | Hits:  95%/52318 
  🟩 MSVC               Pass: 100%/4   | Total:  2h 07m | Avg: 31m 57s | Max: 33m 06s | Hits:  99%/12450 
  🟩 NVHPC              Pass: 100%/2   | Total: 23m 09s | Avg: 11m 34s | Max: 12m 11s | Hits:  98%/6513  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 18m 04s | Avg:  9m 02s | Max: 13m 13s | Hits:  99%/3365  
  🟩 rtx2080            Pass: 100%/43  | Total:  7h 52m | Avg: 10m 59s | Max: 33m 06s | Hits:  93%/123349
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total:  6h 54m | Avg: 10m 38s | Max: 33m 06s | Hits:  93%/126674
  🟩 NVRTC              Pass: 100%/2   | Total: 39m 14s | Avg: 19m 37s | Max: 21m 19s | Hits:  90%/40    
  🟩 Test               Pass: 100%/3   | Total: 34m 18s | Avg: 11m 26s | Max: 13m 13s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 21s | Avg:  2m 21s | Max:  2m 21s
🟩 sm
  🟩 75                 Pass: 100%/2   | Total: 39m 14s | Avg: 19m 37s | Max: 21m 19s | Hits:  90%/40    
  🟩 90                 Pass: 100%/2   | Total: 18m 04s | Avg:  9m 02s | Max: 13m 13s | Hits:  99%/3365  
  🟩 90;90a;100         Pass: 100%/1   | Total: 11m 51s | Avg: 11m 51s | Max: 11m 51s | Hits:  88%/3365  
🟩 std
  🟩 17                 Pass: 100%/22  | Total:  4h 20m | Avg: 11m 50s | Max: 33m 06s | Hits:  94%/67622 
  🟩 20                 Pass: 100%/22  | Total:  3h 48m | Avg: 10m 21s | Max: 31m 11s | Hits:  92%/59092

🟩 python: Pass: 100%/12 | Total: 1h 36m | Avg: 8m 03s | Max: 20m 02s

🟩 cpu
  🟩 amd64              Pass: 100%/12  | Total:  1h 36m | Avg:  8m 03s | Max: 20m 02s
🟩 ctk
  🟩 12.9               Pass: 100%/12  | Total:  1h 36m | Avg:  8m 03s | Max: 20m 02s
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/12  | Total:  1h 36m | Avg:  8m 03s | Max: 20m 02s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/12  | Total:  1h 36m | Avg:  8m 03s | Max: 20m 02s
🟩 cxx
  🟩 GCC13              Pass: 100%/12  | Total:  1h 36m | Avg:  8m 03s | Max: 20m 02s
🟩 cxx_family
  🟩 GCC                Pass: 100%/12  | Total:  1h 36m | Avg:  8m 03s | Max: 20m 02s
🟩 gpu
  🟩 rtxa6000           Pass: 100%/12  | Total:  1h 36m | Avg:  8m 03s | Max: 20m 02s
🟩 jobs
  🟩 Build cuda.cccl    Pass: 100%/2   | Total:  6m 36s | Avg:  3m 18s | Max:  3m 18s
  🟩 Build cuda.cooperative Pass: 100%/2   | Total:  6m 39s | Avg:  3m 19s | Max:  3m 23s
  🟩 Build cuda.parallel Pass: 100%/2   | Total: 17m 30s | Avg:  8m 45s | Max:  8m 57s
  🟩 Test cuda.cccl     Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  4m 41s
  🟩 Test cuda.cooperative Pass: 100%/2   | Total: 37m 10s | Avg: 18m 35s | Max: 20m 02s
  🟩 Test cuda.parallel Pass: 100%/2   | Total: 19m 24s | Avg:  9m 42s | Max:  9m 45s
🟩 py_version
  🟩 3.10               Pass: 100%/6   | Total: 46m 48s | Avg:  7m 48s | Max: 17m 08s
  🟩 3.13               Pass: 100%/6   | Total: 49m 53s | Avg:  8m 18s | Max: 20m 02s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 15m 24s | Avg: 7m 42s | Max: 12m 45s | Hits: 98%/328

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 45s | Hits:  98%/328   
🟩 ctk
  🟩 12.9               Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 45s | Hits:  98%/328   
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 45s | Hits:  98%/328   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 45s | Hits:  98%/328   
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 45s | Hits:  98%/328   
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 45s | Hits:  98%/328   
🟩 gpu
  🟩 rtx2080            Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 45s | Hits:  98%/328   
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 39s | Avg:  2m 39s | Max:  2m 39s | Hits:  98%/164   
  🟩 Test               Pass: 100%/1   | Total: 12m 45s | Avg: 12m 45s | Max: 12m 45s | Hits:  98%/164

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	stdpar
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	stdpar
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 183)

#	Runner
129	`linux-amd64-cpu16`
15	`windows-amd64-cpu16`
12	`linux-arm64-cpu16`
12	`linux-amd64-gpu-rtxa6000-latest-1`
7	`linux-amd64-gpu-rtx2080-latest-1`
5	`linux-amd64-gpu-h100-latest-1`
3	`linux-amd64-gpu-rtx4090-latest-1`

github-actions · 2025-05-21T22:03:24Z

🟩 CI finished in 2h 59m: Pass: 100%/183 | Total: 1d 12h | Avg: 11m 58s | Max: 1h 24m | Hits: 93%/289460

🟩 cub: Pass: 100%/47 | Total: 10h 42m | Avg: 13m 40s | Max: 34m 17s | Hits: 99%/57406

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total: 10h 27m | Avg: 13m 56s | Max: 34m 17s | Hits:  99%/54908 
  🟩 arm64              Pass: 100%/2   | Total: 15m 20s | Avg:  7m 40s | Max:  8m 38s | Hits:  99%/2498  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 59m 39s | Avg: 11m 55s | Max: 29m 30s | Hits:  99%/6062  
  🟩 12.8               Pass: 100%/2   | Total: 29m 34s | Avg: 14m 47s | Max: 15m 05s | Hits:  98%/2297  
  🟩 12.9               Pass: 100%/40  | Total:  9h 13m | Avg: 13m 49s | Max: 34m 17s | Hits:  99%/49047 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 12m 01s | Avg:  6m 00s | Max:  6m 14s | Hits:  99%/2151  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 59m 39s | Avg: 11m 55s | Max: 29m 30s | Hits:  99%/6062  
  🟩 nvcc12.8           Pass: 100%/2   | Total: 29m 34s | Avg: 14m 47s | Max: 15m 05s | Hits:  98%/2297  
  🟩 nvcc12.9           Pass: 100%/38  | Total:  9h 01m | Avg: 14m 14s | Max: 34m 17s | Hits:  99%/46896 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 12m 01s | Avg:  6m 00s | Max:  6m 14s | Hits:  99%/2151  
  🟩 nvcc               Pass: 100%/45  | Total: 10h 30m | Avg: 14m 00s | Max: 34m 17s | Hits:  99%/55255 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 29m 02s | Avg:  7m 15s | Max:  7m 55s | Hits:  99%/4998  
  🟩 Clang15            Pass: 100%/2   | Total: 14m 56s | Avg:  7m 28s | Max:  7m 39s | Hits:  99%/2495  
  🟩 Clang16            Pass: 100%/2   | Total: 14m 49s | Avg:  7m 24s | Max:  7m 34s | Hits:  99%/2495  
  🟩 Clang17            Pass: 100%/2   | Total: 14m 37s | Avg:  7m 18s | Max:  7m 22s | Hits:  99%/2495  
  🟩 Clang18            Pass: 100%/2   | Total: 14m 47s | Avg:  7m 23s | Max:  7m 29s | Hits:  99%/2495  
  🟩 Clang19            Pass: 100%/7   | Total:  1h 31m | Avg: 13m 01s | Max: 32m 09s | Hits:  99%/8390  
  🟩 GCC7               Pass: 100%/2   | Total: 17m 20s | Avg:  8m 40s | Max:  9m 02s | Hits:  99%/2498  
  🟩 GCC8               Pass: 100%/1   | Total:  8m 35s | Avg:  8m 35s | Max:  8m 35s | Hits:  99%/1249  
  🟩 GCC9               Pass: 100%/2   | Total: 17m 56s | Avg:  8m 58s | Max:  9m 34s | Hits:  99%/2498  
  🟩 GCC10              Pass: 100%/2   | Total: 17m 53s | Avg:  8m 56s | Max:  9m 00s | Hits:  99%/2499  
  🟩 GCC11              Pass: 100%/2   | Total: 18m 36s | Avg:  9m 18s | Max:  9m 36s | Hits:  99%/2495  
  🟩 GCC12              Pass: 100%/2   | Total: 18m 04s | Avg:  9m 02s | Max:  9m 09s | Hits:  99%/2495  
  🟩 GCC13              Pass: 100%/11  | Total:  3h 41m | Avg: 20m 07s | Max: 34m 17s | Hits:  99%/13747 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 56m 04s | Avg: 28m 02s | Max: 29m 30s | Hits:  99%/2130  
  🟩 MSVC14.43          Pass: 100%/2   | Total: 57m 44s | Avg: 28m 52s | Max: 29m 37s | Hits:  99%/2130  
  🟩 NVHPC25.3          Pass: 100%/2   | Total: 29m 34s | Avg: 14m 47s | Max: 15m 05s | Hits:  98%/2297  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 59m | Avg:  9m 26s | Max: 32m 09s | Hits:  99%/23368 
  🟩 GCC                Pass: 100%/22  | Total:  5h 19m | Avg: 14m 32s | Max: 34m 17s | Hits:  99%/27481 
  🟩 MSVC               Pass: 100%/4   | Total:  1h 53m | Avg: 28m 27s | Max: 29m 37s | Hits:  99%/4260  
  🟩 NVHPC              Pass: 100%/2   | Total: 29m 34s | Avg: 14m 47s | Max: 15m 05s | Hits:  98%/2297  
🟩 gpu
  🟩 h100               Pass: 100%/3   | Total: 59m 36s | Avg: 19m 52s | Max: 28m 09s | Hits:  99%/3750  
  🟩 rtx2080            Pass: 100%/36  | Total:  6h 23m | Avg: 10m 39s | Max: 29m 37s | Hits:  99%/43662 
  🟩 rtxa6000           Pass: 100%/8   | Total:  3h 19m | Avg: 24m 53s | Max: 34m 17s | Hits:  99%/9994  
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total:  6h 48m | Avg: 10m 27s | Max: 29m 37s | Hits:  99%/47410 
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 34m 17s | Avg: 34m 17s | Max: 34m 17s | Hits:  99%/1250  
  🟩 GraphCapture       Pass: 100%/1   | Total: 25m 27s | Avg: 25m 27s | Max: 25m 27s | Hits:  99%/1250  
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 34m | Avg: 31m 26s | Max: 34m 01s | Hits:  99%/3748  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 20m | Avg: 26m 44s | Max: 30m 02s | Hits:  99%/3748  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total: 59m 36s | Avg: 19m 52s | Max: 28m 09s | Hits:  99%/3750  
  🟩 90;90a;100         Pass: 100%/1   | Total:  9m 45s | Avg:  9m 45s | Max:  9m 45s | Hits:  99%/1250  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  3h 56m | Avg: 11m 15s | Max: 29m 30s | Hits:  99%/25386 
  🟩 20                 Pass: 100%/26  | Total:  6h 46m | Avg: 15m 36s | Max: 34m 17s | Hits:  99%/32020

🟩 thrust: Pass: 100%/47 | Total: 8h 29m | Avg: 10m 50s | Max: 33m 58s | Hits: 99%/89096

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 21m 28s | Avg: 10m 44s | Max: 13m 44s | Hits:  99%/3794  
🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  8h 16m | Avg: 11m 01s | Max: 33m 58s | Hits:  99%/85303 
  🟩 arm64              Pass: 100%/2   | Total: 12m 48s | Avg:  6m 24s | Max:  7m 09s | Hits:  99%/3793  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 51m 17s | Avg: 10m 15s | Max: 26m 04s | Hits:  99%/9475  
  🟩 12.8               Pass: 100%/2   | Total:  1h 00m | Avg: 30m 16s | Max: 33m 58s | Hits:  99%/3790  
  🟩 12.9               Pass: 100%/40  | Total:  6h 37m | Avg:  9m 56s | Max: 31m 27s | Hits:  99%/75831 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 12m 12s | Avg:  6m 06s | Max:  6m 27s | Hits: 100%/3792  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 51m 17s | Avg: 10m 15s | Max: 26m 04s | Hits:  99%/9475  
  🟩 nvcc12.8           Pass: 100%/2   | Total:  1h 00m | Avg: 30m 16s | Max: 33m 58s | Hits:  99%/3790  
  🟩 nvcc12.9           Pass: 100%/38  | Total:  6h 25m | Avg: 10m 08s | Max: 31m 27s | Hits:  99%/72039 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 12m 12s | Avg:  6m 06s | Max:  6m 27s | Hits: 100%/3792  
  🟩 nvcc               Pass: 100%/45  | Total:  8h 17m | Avg: 11m 02s | Max: 33m 58s | Hits:  99%/85304 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 23m 49s | Avg:  5m 57s | Max:  6m 26s | Hits: 100%/7584  
  🟩 Clang15            Pass: 100%/2   | Total: 13m 00s | Avg:  6m 30s | Max:  6m 38s | Hits: 100%/3792  
  🟩 Clang16            Pass: 100%/2   | Total: 13m 06s | Avg:  6m 33s | Max:  6m 44s | Hits: 100%/3792  
  🟩 Clang17            Pass: 100%/2   | Total: 12m 24s | Avg:  6m 12s | Max:  6m 15s | Hits: 100%/3792  
  🟩 Clang18            Pass: 100%/2   | Total: 12m 19s | Avg:  6m 09s | Max:  6m 12s | Hits: 100%/3792  
  🟩 Clang19            Pass: 100%/7   | Total: 51m 21s | Avg:  7m 20s | Max: 11m 20s | Hits: 100%/13272 
  🟩 GCC7               Pass: 100%/2   | Total: 13m 46s | Avg:  6m 53s | Max:  7m 06s | Hits:  99%/3794  
  🟩 GCC8               Pass: 100%/1   | Total:  7m 13s | Avg:  7m 13s | Max:  7m 13s | Hits:  99%/1897  
  🟩 GCC9               Pass: 100%/2   | Total: 14m 42s | Avg:  7m 21s | Max:  7m 27s | Hits:  99%/3794  
  🟩 GCC10              Pass: 100%/2   | Total: 15m 22s | Avg:  7m 41s | Max:  7m 48s | Hits:  99%/3794  
  🟩 GCC11              Pass: 100%/2   | Total: 17m 20s | Avg:  8m 40s | Max:  9m 32s | Hits:  99%/3794  
  🟩 GCC12              Pass: 100%/2   | Total: 16m 20s | Avg:  8m 10s | Max:  8m 39s | Hits:  99%/3794  
  🟩 GCC13              Pass: 100%/10  | Total:  1h 36m | Avg:  9m 41s | Max: 13m 59s | Hits:  99%/18970 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 53m 36s | Avg: 26m 48s | Max: 27m 32s | Hits:  99%/3778  
  🟩 MSVC14.43          Pass: 100%/3   | Total:  1h 27m | Avg: 29m 12s | Max: 31m 27s | Hits:  99%/5667  
  🟩 NVHPC25.3          Pass: 100%/2   | Total:  1h 00m | Avg: 30m 16s | Max: 33m 58s | Hits:  99%/3790  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 05m | Avg:  6m 37s | Max: 11m 20s | Hits: 100%/36024 
  🟩 GCC                Pass: 100%/21  | Total:  3h 01m | Avg:  8m 38s | Max: 13m 59s | Hits:  99%/39837 
  🟩 MSVC               Pass: 100%/5   | Total:  2h 21m | Avg: 28m 14s | Max: 31m 27s | Hits:  99%/9445  
  🟩 NVHPC              Pass: 100%/2   | Total:  1h 00m | Avg: 30m 16s | Max: 33m 58s | Hits:  99%/3790  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 18m 45s | Avg:  9m 22s | Max: 12m 33s | Hits:  99%/3794  
  🟩 rtx2080            Pass: 100%/35  | Total:  5h 49m | Avg:  9m 59s | Max: 33m 58s | Hits:  99%/66351 
  🟩 rtx4090            Pass: 100%/10  | Total:  2h 20m | Avg: 14m 05s | Max: 31m 27s | Hits:  99%/18951 
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  6h 46m | Avg: 10m 09s | Max: 33m 58s | Hits:  99%/75827 
  🟩 TestCPU            Pass: 100%/3   | Total: 51m 15s | Avg: 17m 05s | Max: 31m 27s | Hits:  99%/5682  
  🟩 TestGPU            Pass: 100%/4   | Total: 51m 36s | Avg: 12m 54s | Max: 13m 59s | Hits:  99%/7587  
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 18m 45s | Avg:  9m 22s | Max: 12m 33s | Hits:  99%/3794  
  🟩 90;90a;100         Pass: 100%/1   | Total:  8m 30s | Avg:  8m 30s | Max:  8m 30s | Hits:  99%/1897  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  3h 47m | Avg: 10m 50s | Max: 27m 32s | Hits:  99%/39803 
  🟩 20                 Pass: 100%/24  | Total:  4h 19m | Avg: 10m 49s | Max: 33m 58s | Hits:  99%/45499

🟩 libcudacxx: Pass: 100%/45 | Total: 10h 43m | Avg: 14m 18s | Max: 48m 11s | Hits: 84%/127884

🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total: 10h 17m | Avg: 14m 21s | Max: 48m 11s | Hits:  84%/121261
  🟩 arm64              Pass: 100%/2   | Total: 26m 19s | Avg: 13m 09s | Max: 21m 29s | Hits:  79%/6623  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 44m 51s | Avg:  8m 58s | Max: 25m 40s | Hits:  98%/16194 
  🟩 12.8               Pass: 100%/2   | Total: 49m 17s | Avg: 24m 38s | Max: 37m 13s | Hits:  74%/6573  
  🟩 12.9               Pass: 100%/38  | Total:  9h 09m | Avg: 14m 27s | Max: 48m 11s | Hits:  82%/105117
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 49m 31s | Avg: 24m 45s | Max: 25m 17s | Hits:  26%/6587  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 44m 51s | Avg:  8m 58s | Max: 25m 40s | Hits:  98%/16194 
  🟩 nvcc12.8           Pass: 100%/2   | Total: 49m 17s | Avg: 24m 38s | Max: 37m 13s | Hits:  74%/6573  
  🟩 nvcc12.9           Pass: 100%/36  | Total:  8h 19m | Avg: 13m 53s | Max: 48m 11s | Hits:  86%/98530 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 49m 31s | Avg: 24m 45s | Max: 25m 17s | Hits:  26%/6587  
  🟩 nvcc               Pass: 100%/43  | Total:  9h 53m | Avg: 13m 48s | Max: 48m 11s | Hits:  87%/121297
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 21m 05s | Avg:  5m 16s | Max:  5m 46s | Hits:  98%/13130 
  🟩 Clang15            Pass: 100%/2   | Total: 30m 04s | Avg: 15m 02s | Max: 24m 05s | Hits:  75%/6583  
  🟩 Clang16            Pass: 100%/2   | Total: 10m 31s | Avg:  5m 15s | Max:  5m 25s | Hits:  99%/6583  
  🟩 Clang17            Pass: 100%/2   | Total: 27m 45s | Avg: 13m 52s | Max: 22m 21s | Hits:  76%/6583  
  🟩 Clang18            Pass: 100%/2   | Total: 28m 50s | Avg: 14m 25s | Max: 23m 52s | Hits:  76%/6583  
  🟩 Clang19            Pass: 100%/6   | Total:  1h 30m | Avg: 15m 04s | Max: 25m 17s | Hits:  70%/16481 
  🟩 GCC7               Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  4m 59s | Hits:  99%/6519  
  🟩 GCC8               Pass: 100%/1   | Total:  5m 18s | Avg:  5m 18s | Max:  5m 18s | Hits:  98%/3270  
  🟩 GCC9               Pass: 100%/2   | Total:  9m 51s | Avg:  4m 55s | Max:  5m 05s | Hits:  98%/6531  
  🟩 GCC10              Pass: 100%/2   | Total: 10m 36s | Avg:  5m 18s | Max:  5m 31s | Hits:  98%/6585  
  🟩 GCC11              Pass: 100%/2   | Total: 10m 27s | Avg:  5m 13s | Max:  5m 16s | Hits:  98%/6581  
  🟩 GCC12              Pass: 100%/2   | Total: 10m 41s | Avg:  5m 20s | Max:  5m 31s | Hits:  98%/6585  
  🟩 GCC13              Pass: 100%/10  | Total:  3h 36m | Avg: 21m 40s | Max: 48m 11s | Hits:  63%/16727 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 52m 05s | Avg: 26m 02s | Max: 26m 25s | Hits:  99%/6259  
  🟩 MSVC14.43          Pass: 100%/2   | Total:  1h 00m | Avg: 30m 15s | Max: 30m 44s | Hits:  72%/6311  
  🟩 NVHPC25.3          Pass: 100%/2   | Total: 49m 17s | Avg: 24m 38s | Max: 37m 13s | Hits:  74%/6573  
🟩 cxx_family
  🟩 Clang              Pass: 100%/18  | Total:  3h 28m | Avg: 11m 35s | Max: 25m 17s | Hits:  82%/55943 
  🟩 GCC                Pass: 100%/21  | Total:  4h 32m | Avg: 12m 59s | Max: 48m 11s | Hits:  87%/52798 
  🟩 MSVC               Pass: 100%/4   | Total:  1h 52m | Avg: 28m 09s | Max: 30m 44s | Hits:  85%/12570 
  🟩 NVHPC              Pass: 100%/2   | Total: 49m 17s | Avg: 24m 38s | Max: 37m 13s | Hits:  74%/6573  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 20m 32s | Avg: 10m 16s | Max: 15m 08s | Hits:  99%/3395  
  🟩 rtx2080            Pass: 100%/43  | Total: 10h 22m | Avg: 14m 29s | Max: 48m 11s | Hits:  84%/124489
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total:  8h 19m | Avg: 12m 48s | Max: 37m 13s | Hits:  84%/127844
  🟩 NVRTC              Pass: 100%/2   | Total: 52m 50s | Avg: 26m 25s | Max: 27m 05s | Hits:  90%/40    
  🟩 Test               Pass: 100%/3   | Total:  1h 28m | Avg: 29m 31s | Max: 48m 11s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 35s | Avg:  2m 35s | Max:  2m 35s
🟩 sm
  🟩 75                 Pass: 100%/2   | Total: 52m 50s | Avg: 26m 25s | Max: 27m 05s | Hits:  90%/40    
  🟩 90                 Pass: 100%/2   | Total: 20m 32s | Avg: 10m 16s | Max: 15m 08s | Hits:  99%/3395  
  🟩 90;90a;100         Pass: 100%/1   | Total: 37m 03s | Avg: 37m 03s | Max: 37m 03s | Hits:  29%/3395  
🟩 std
  🟩 17                 Pass: 100%/22  | Total:  4h 52m | Avg: 13m 18s | Max: 37m 13s | Hits:  87%/68252 
  🟩 20                 Pass: 100%/22  | Total:  5h 48m | Avg: 15m 49s | Max: 48m 11s | Hits:  81%/59632

🟩 cudax: Pass: 100%/26 | Total: 2h 47m | Avg: 6m 27s | Max: 30m 24s | Hits: 99%/14746

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 32m | Avg:  6m 57s | Max: 30m 24s | Hits:  99%/12386 
  🟩 arm64              Pass: 100%/4   | Total: 14m 49s | Avg:  3m 42s | Max:  3m 57s | Hits:  99%/2360  
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 19m 21s | Avg:  6m 27s | Max: 11m 45s | Hits:  99%/1475  
  🟩 12.8               Pass: 100%/2   | Total: 17m 33s | Avg:  8m 46s | Max:  8m 57s | Hits:  97%/1176  
  🟩 12.9               Pass: 100%/21  | Total:  2h 10m | Avg:  6m 13s | Max: 30m 24s | Hits:  99%/12095 
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 19m 21s | Avg:  6m 27s | Max: 11m 45s | Hits:  99%/1475  
  🟩 nvcc12.8           Pass: 100%/2   | Total: 17m 33s | Avg:  8m 46s | Max:  8m 57s | Hits:  97%/1176  
  🟩 nvcc12.9           Pass: 100%/21  | Total:  2h 10m | Avg:  6m 13s | Max: 30m 24s | Hits:  99%/12095 
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 47m | Avg:  6m 27s | Max: 30m 24s | Hits:  99%/14746 
🟩 cxx
  🟩 Clang14            Pass: 100%/2   | Total:  7m 19s | Avg:  3m 39s | Max:  3m 50s | Hits: 100%/1184  
  🟩 Clang15            Pass: 100%/1   | Total:  4m 08s | Avg:  4m 08s | Max:  4m 08s | Hits: 100%/590   
  🟩 Clang16            Pass: 100%/1   | Total:  3m 58s | Avg:  3m 58s | Max:  3m 58s | Hits: 100%/590   
  🟩 Clang17            Pass: 100%/1   | Total:  3m 56s | Avg:  3m 56s | Max:  3m 56s | Hits: 100%/590   
  🟩 Clang18            Pass: 100%/1   | Total:  3m 50s | Avg:  3m 50s | Max:  3m 50s | Hits: 100%/590   
  🟩 Clang19            Pass: 100%/4   | Total: 23m 50s | Avg:  5m 57s | Max: 12m 58s | Hits: 100%/2360  
  🟩 GCC10              Pass: 100%/2   | Total:  8m 10s | Avg:  4m 05s | Max:  4m 07s | Hits:  99%/1184  
  🟩 GCC11              Pass: 100%/1   | Total:  4m 20s | Avg:  4m 20s | Max:  4m 20s | Hits:  99%/590   
  🟩 GCC12              Pass: 100%/1   | Total:  4m 28s | Avg:  4m 28s | Max:  4m 28s | Hits:  99%/590   
  🟩 GCC13              Pass: 100%/8   | Total:  1h 02m | Avg:  7m 50s | Max: 30m 24s | Hits:  99%/4720  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 11m 45s | Avg: 11m 45s | Max: 11m 45s | Hits:  95%/291   
  🟩 MSVC14.43          Pass: 100%/1   | Total: 11m 47s | Avg: 11m 47s | Max: 11m 47s | Hits:  95%/291   
  🟩 NVHPC25.3          Pass: 100%/2   | Total: 17m 33s | Avg:  8m 46s | Max:  8m 57s | Hits:  97%/1176  
🟩 cxx_family
  🟩 Clang              Pass: 100%/10  | Total: 47m 01s | Avg:  4m 42s | Max: 12m 58s | Hits: 100%/5904  
  🟩 GCC                Pass: 100%/12  | Total:  1h 19m | Avg:  6m 38s | Max: 30m 24s | Hits:  99%/7084  
  🟩 MSVC               Pass: 100%/2   | Total: 23m 32s | Avg: 11m 46s | Max: 11m 47s | Hits:  95%/582   
  🟩 NVHPC              Pass: 100%/2   | Total: 17m 33s | Avg:  8m 46s | Max:  8m 57s | Hits:  97%/1176  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 12m 31s | Avg:  6m 15s | Max:  8m 29s | Hits:  99%/1180  
  🟩 rtx2080            Pass: 100%/24  | Total:  2h 35m | Avg:  6m 28s | Max: 30m 24s | Hits:  99%/13566 
🟩 jobs
  🟩 Build              Pass: 100%/23  | Total:  1h 55m | Avg:  5m 02s | Max: 11m 47s | Hits:  99%/12976 
  🟩 Test               Pass: 100%/3   | Total: 51m 51s | Avg: 17m 17s | Max: 30m 24s | Hits:  99%/1770  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total: 16m 12s | Avg:  5m 24s | Max:  8m 29s | Hits:  99%/1770  
  🟩 90a                Pass: 100%/1   | Total:  3m 35s | Avg:  3m 35s | Max:  3m 35s | Hits:  99%/590   
🟩 std
  🟩 17                 Pass: 100%/4   | Total: 19m 42s | Avg:  4m 55s | Max:  8m 36s | Hits:  99%/2358  
  🟩 20                 Pass: 100%/22  | Total:  2h 28m | Avg:  6m 43s | Max: 30m 24s | Hits:  99%/12388

🟩 python: Pass: 100%/12 | Total: 2h 00m | Avg: 10m 03s | Max: 22m 17s

🟩 cpu
  🟩 amd64              Pass: 100%/12  | Total:  2h 00m | Avg: 10m 03s | Max: 22m 17s
🟩 ctk
  🟩 12.9               Pass: 100%/12  | Total:  2h 00m | Avg: 10m 03s | Max: 22m 17s
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/12  | Total:  2h 00m | Avg: 10m 03s | Max: 22m 17s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/12  | Total:  2h 00m | Avg: 10m 03s | Max: 22m 17s
🟩 cxx
  🟩 GCC13              Pass: 100%/12  | Total:  2h 00m | Avg: 10m 03s | Max: 22m 17s
🟩 cxx_family
  🟩 GCC                Pass: 100%/12  | Total:  2h 00m | Avg: 10m 03s | Max: 22m 17s
🟩 gpu
  🟩 rtxa6000           Pass: 100%/12  | Total:  2h 00m | Avg: 10m 03s | Max: 22m 17s
🟩 jobs
  🟩 Build cuda.cccl    Pass: 100%/2   | Total:  7m 10s | Avg:  3m 35s | Max:  3m 44s
  🟩 Build cuda.cooperative Pass: 100%/2   | Total:  7m 23s | Avg:  3m 41s | Max:  3m 42s
  🟩 Build cuda.parallel Pass: 100%/2   | Total: 16m 00s | Avg:  8m 00s | Max:  8m 06s
  🟩 Test cuda.cccl     Pass: 100%/2   | Total:  9m 31s | Avg:  4m 45s | Max:  4m 50s
  🟩 Test cuda.cooperative Pass: 100%/2   | Total: 40m 30s | Avg: 20m 15s | Max: 21m 15s
  🟩 Test cuda.parallel Pass: 100%/2   | Total: 40m 03s | Avg: 20m 01s | Max: 22m 17s
🟩 py_version
  🟩 3.10               Pass: 100%/6   | Total:  1h 01m | Avg: 10m 16s | Max: 22m 17s
  🟩 3.13               Pass: 100%/6   | Total: 59m 01s | Avg:  9m 50s | Max: 21m 15s

🟩 stdpar: Pass: 100%/4 | Total: 19m 56s | Avg: 4m 59s | Max: 5m 35s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 11m 02s | Avg:  5m 31s | Max:  5m 35s
  🟩 arm64              Pass: 100%/2   | Total:  8m 54s | Avg:  4m 27s | Max:  4m 35s
🟩 ctk
  🟩 12.8               Pass: 100%/4   | Total: 19m 56s | Avg:  4m 59s | Max:  5m 35s
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/4   | Total: 19m 56s | Avg:  4m 59s | Max:  5m 35s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 19m 56s | Avg:  4m 59s | Max:  5m 35s
🟩 cxx
  🟩 NVHPC25.3          Pass: 100%/4   | Total: 19m 56s | Avg:  4m 59s | Max:  5m 35s
🟩 cxx_family
  🟩 NVHPC              Pass: 100%/4   | Total: 19m 56s | Avg:  4m 59s | Max:  5m 35s
🟩 gpu
  🟩 rtx2080            Pass: 100%/4   | Total: 19m 56s | Avg:  4m 59s | Max:  5m 35s
🟩 jobs
  🟩 Build              Pass: 100%/4   | Total: 19m 56s | Avg:  4m 59s | Max:  5m 35s
🟩 std
  🟩 17                 Pass: 100%/2   | Total:  9m 54s | Avg:  4m 57s | Max:  5m 35s
  🟩 20                 Pass: 100%/2   | Total: 10m 02s | Avg:  5m 01s | Max:  5m 27s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 1h 27m | Avg: 43m 36s | Max: 1h 24m | Hits: 98%/328

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total:  1h 27m | Avg: 43m 36s | Max:  1h 24m | Hits:  98%/328   
🟩 ctk
  🟩 12.9               Pass: 100%/2   | Total:  1h 27m | Avg: 43m 36s | Max:  1h 24m | Hits:  98%/328   
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/2   | Total:  1h 27m | Avg: 43m 36s | Max:  1h 24m | Hits:  98%/328   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total:  1h 27m | Avg: 43m 36s | Max:  1h 24m | Hits:  98%/328   
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total:  1h 27m | Avg: 43m 36s | Max:  1h 24m | Hits:  98%/328   
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total:  1h 27m | Avg: 43m 36s | Max:  1h 24m | Hits:  98%/328   
🟩 gpu
  🟩 rtx2080            Pass: 100%/2   | Total:  1h 27m | Avg: 43m 36s | Max:  1h 24m | Hits:  98%/328   
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 54s | Avg:  2m 54s | Max:  2m 54s | Hits:  98%/164   
  🟩 Test               Pass: 100%/1   | Total:  1h 24m | Avg:  1h 24m | Max:  1h 24m | Hits:  98%/164

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	stdpar
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	stdpar
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 183)

#	Runner
129	`linux-amd64-cpu16`
15	`windows-amd64-cpu16`
12	`linux-arm64-cpu16`
12	`linux-amd64-gpu-rtxa6000-latest-1`
7	`linux-amd64-gpu-rtx2080-latest-1`
5	`linux-amd64-gpu-h100-latest-1`
3	`linux-amd64-gpu-rtx4090-latest-1`

libcudacxx/include/cuda/__warp/warp_match_all.h

docs/libcudacxx/extended_api/warp/warp_match_all.rst

libcudacxx/include/cuda/__warp/warp_match_all.h

libcudacxx/include/cuda/__warp/warp_shuffle.h

github-actions · 2025-05-23T19:59:36Z

🟩 CI finished in 2h 09m: Pass: 100%/183 | Total: 4d 05h | Avg: 33m 14s | Max: 1h 37m | Hits: 58%/290783

🟩 cub: Pass: 100%/47 | Total: 1d 22h | Avg: 59m 14s | Max: 1h 33m | Hits: 30%/57406

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  1d 20h | Avg: 59m 11s | Max:  1h 33m | Hits:  31%/54908 
  🟩 arm64              Pass: 100%/2   | Total:  2h 00m | Avg:  1h 00m | Max:  1h 03m | Hits:  16%/2498  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total:  5h 14m | Avg:  1h 02m | Max:  1h 14m | Hits:  15%/6062  
  🟩 12.9               Pass: 100%/42  | Total:  1d 17h | Avg: 58m 47s | Max:  1h 33m | Hits:  32%/51344 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total:  1h 13m | Avg: 36m 56s | Max: 37m 35s | Hits:  14%/2151  
  🟩 nvcc12.0           Pass: 100%/5   | Total:  5h 14m | Avg:  1h 02m | Max:  1h 14m | Hits:  15%/6062  
  🟩 nvcc12.9           Pass: 100%/40  | Total:  1d 15h | Avg: 59m 53s | Max:  1h 33m | Hits:  32%/49193 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  1h 13m | Avg: 36m 56s | Max: 37m 35s | Hits:  14%/2151  
  🟩 nvcc               Pass: 100%/45  | Total:  1d 21h | Avg:  1h 00m | Max:  1h 33m | Hits:  31%/55255 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total:  4h 01m | Avg:  1h 00m | Max:  1h 06m | Hits:  16%/4998  
  🟩 Clang15            Pass: 100%/2   | Total:  2h 02m | Avg:  1h 01m | Max:  1h 01m | Hits:  16%/2495  
  🟩 Clang16            Pass: 100%/2   | Total:  2h 00m | Avg:  1h 00m | Max:  1h 00m | Hits:  16%/2495  
  🟩 Clang17            Pass: 100%/2   | Total:  2h 11m | Avg:  1h 05m | Max:  1h 05m | Hits:  16%/2495  
  🟩 Clang18            Pass: 100%/2   | Total:  1h 58m | Avg: 59m 23s | Max:  1h 00m | Hits:  16%/2495  
  🟩 Clang19            Pass: 100%/7   | Total:  5h 04m | Avg: 43m 32s | Max:  1h 01m | Hits:  40%/8390  
  🟩 GCC7               Pass: 100%/2   | Total:  2h 13m | Avg:  1h 06m | Max:  1h 09m | Hits:  16%/2498  
  🟩 GCC8               Pass: 100%/1   | Total:  1h 07m | Avg:  1h 07m | Max:  1h 07m | Hits:  16%/1249  
  🟩 GCC9               Pass: 100%/2   | Total:  2h 13m | Avg:  1h 06m | Max:  1h 10m | Hits:  16%/2498  
  🟩 GCC10              Pass: 100%/2   | Total:  2h 25m | Avg:  1h 12m | Max:  1h 14m | Hits:  16%/2499  
  🟩 GCC11              Pass: 100%/2   | Total:  2h 14m | Avg:  1h 07m | Max:  1h 09m | Hits:  15%/2495  
  🟩 GCC12              Pass: 100%/2   | Total:  2h 14m | Avg:  1h 07m | Max:  1h 07m | Hits:  15%/2495  
  🟩 GCC13              Pass: 100%/11  | Total:  8h 22m | Avg: 45m 40s | Max:  1h 14m | Hits:  61%/13747 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  2h 39m | Avg:  1h 19m | Max:  1h 24m | Hits:  12%/2130  
  🟩 MSVC14.43          Pass: 100%/2   | Total:  2h 54m | Avg:  1h 27m | Max:  1h 33m | Hits:  12%/2130  
  🟩 NVHPC25.5          Pass: 100%/2   | Total:  2h 39m | Avg:  1h 19m | Max:  1h 22m | Hits:  17%/2297  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total: 17h 19m | Avg: 54m 43s | Max:  1h 06m | Hits:  25%/23368 
  🟩 GCC                Pass: 100%/22  | Total: 20h 51m | Avg: 56m 53s | Max:  1h 14m | Hits:  38%/27481 
  🟩 MSVC               Pass: 100%/4   | Total:  5h 33m | Avg:  1h 23m | Max:  1h 33m | Hits:  12%/4260  
  🟩 NVHPC              Pass: 100%/2   | Total:  2h 39m | Avg:  1h 19m | Max:  1h 22m | Hits:  17%/2297  
🟩 gpu
  🟩 h100               Pass: 100%/3   | Total:  1h 29m | Avg: 29m 43s | Max: 35m 23s | Hits:  71%/3750  
  🟩 rtx2080            Pass: 100%/36  | Total:  1d 15h | Avg:  1h 05m | Max:  1h 33m | Hits:  15%/43662 
  🟩 rtxa6000           Pass: 100%/8   | Total:  5h 25m | Avg: 40m 39s | Max:  1h 14m | Hits:  78%/9994  
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total:  1d 18h | Avg:  1h 05m | Max:  1h 33m | Hits:  15%/47410 
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 37m 37s | Avg: 37m 37s | Max: 37m 37s | Hits:  99%/1250  
  🟩 GraphCapture       Pass: 100%/1   | Total: 30m 20s | Avg: 30m 20s | Max: 30m 20s | Hits:  99%/1250  
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 32m | Avg: 30m 54s | Max: 36m 25s | Hits:  99%/3748  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 23m | Avg: 27m 47s | Max: 34m 04s | Hits:  99%/3748  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total:  1h 29m | Avg: 29m 43s | Max: 35m 23s | Hits:  71%/3750  
  🟩 90;90a;100         Pass: 100%/1   | Total:  1h 04m | Avg:  1h 04m | Max:  1h 04m | Hits:  16%/1250  
🟩 std
  🟩 17                 Pass: 100%/21  | Total: 23h 28m | Avg:  1h 07m | Max:  1h 24m | Hits:  15%/25386 
  🟩 20                 Pass: 100%/26  | Total: 22h 55m | Avg: 52m 54s | Max:  1h 33m | Hits:  42%/32020

🟩 thrust: Pass: 100%/47 | Total: 1d 08h | Avg: 41m 51s | Max: 1h 37m | Hits: 60%/89613

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 54m 58s | Avg: 27m 29s | Max: 37m 45s | Hits:  69%/3816  
🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  1d 07h | Avg: 42m 01s | Max:  1h 37m | Hits:  60%/85798 
  🟩 arm64              Pass: 100%/2   | Total:  1h 15m | Avg: 37m 57s | Max: 40m 53s | Hits:  52%/3815  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total:  3h 48m | Avg: 45m 37s | Max:  1h 12m | Hits:  53%/9530  
  🟩 12.9               Pass: 100%/42  | Total:  1d 04h | Avg: 41m 24s | Max:  1h 37m | Hits:  61%/80083 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total:  1h 05m | Avg: 32m 43s | Max: 34m 24s | Hits:  53%/3814  
  🟩 nvcc12.0           Pass: 100%/5   | Total:  3h 48m | Avg: 45m 37s | Max:  1h 12m | Hits:  53%/9530  
  🟩 nvcc12.9           Pass: 100%/40  | Total:  1d 03h | Avg: 41m 50s | Max:  1h 37m | Hits:  61%/76269 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  1h 05m | Avg: 32m 43s | Max: 34m 24s | Hits:  53%/3814  
  🟩 nvcc               Pass: 100%/45  | Total:  1d 07h | Avg: 42m 15s | Max:  1h 37m | Hits:  60%/85799 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total:  2h 31m | Avg: 37m 57s | Max: 40m 49s | Hits:  60%/7628  
  🟩 Clang15            Pass: 100%/2   | Total:  1h 19m | Avg: 39m 36s | Max: 41m 17s | Hits:  53%/3814  
  🟩 Clang16            Pass: 100%/2   | Total:  1h 19m | Avg: 39m 51s | Max: 41m 00s | Hits:  53%/3814  
  🟩 Clang17            Pass: 100%/2   | Total:  1h 22m | Avg: 41m 03s | Max: 43m 43s | Hits:  53%/3814  
  🟩 Clang18            Pass: 100%/2   | Total:  1h 18m | Avg: 39m 24s | Max: 42m 00s | Hits:  53%/3814  
  🟩 Clang19            Pass: 100%/7   | Total:  3h 21m | Avg: 28m 48s | Max: 41m 32s | Hits:  67%/13349 
  🟩 GCC7               Pass: 100%/2   | Total:  1h 20m | Avg: 40m 24s | Max: 40m 32s | Hits:  60%/3816  
  🟩 GCC8               Pass: 100%/1   | Total: 43m 27s | Avg: 43m 27s | Max: 43m 27s | Hits:  52%/1908  
  🟩 GCC9               Pass: 100%/2   | Total:  1h 24m | Avg: 42m 01s | Max: 42m 25s | Hits:  62%/3816  
  🟩 GCC10              Pass: 100%/2   | Total:  1h 26m | Avg: 43m 22s | Max: 45m 09s | Hits:  52%/3816  
  🟩 GCC11              Pass: 100%/2   | Total:  1h 24m | Avg: 42m 26s | Max: 44m 36s | Hits:  52%/3816  
  🟩 GCC12              Pass: 100%/2   | Total:  1h 27m | Avg: 43m 53s | Max: 44m 24s | Hits:  52%/3816  
  🟩 GCC13              Pass: 100%/10  | Total:  4h 46m | Avg: 28m 40s | Max: 45m 41s | Hits:  75%/19080 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  2h 25m | Avg:  1h 12m | Max:  1h 13m | Hits:  42%/3800  
  🟩 MSVC14.43          Pass: 100%/3   | Total:  3h 26m | Avg:  1h 08m | Max:  1h 28m | Hits:  55%/5700  
  🟩 NVHPC25.5          Pass: 100%/2   | Total:  3h 07m | Avg:  1h 33m | Max:  1h 37m | Hits:  39%/3812  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total: 11h 13m | Avg: 35m 26s | Max: 43m 43s | Hits:  59%/36233 
  🟩 GCC                Pass: 100%/21  | Total: 12h 34m | Avg: 35m 55s | Max: 45m 41s | Hits:  65%/40068 
  🟩 MSVC               Pass: 100%/5   | Total:  5h 51m | Avg:  1h 10m | Max:  1h 28m | Hits:  50%/9500  
  🟩 NVHPC              Pass: 100%/2   | Total:  3h 07m | Avg:  1h 33m | Max:  1h 37m | Hits:  39%/3812  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 38m 53s | Avg: 19m 26s | Max: 25m 57s | Hits:  76%/3816  
  🟩 rtx2080            Pass: 100%/35  | Total:  1d 03h | Avg: 46m 21s | Max:  1h 37m | Hits:  53%/66736 
  🟩 rtx4090            Pass: 100%/10  | Total:  5h 05m | Avg: 30m 34s | Max:  1h 28m | Hits:  80%/19061 
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  1d 06h | Avg: 46m 26s | Max:  1h 37m | Hits:  53%/76267 
  🟩 TestCPU            Pass: 100%/3   | Total: 53m 51s | Avg: 17m 57s | Max: 35m 37s | Hits:  99%/5715  
  🟩 TestGPU            Pass: 100%/4   | Total: 55m 41s | Avg: 13m 55s | Max: 17m 13s | Hits:  96%/7631  
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 38m 53s | Avg: 19m 26s | Max: 25m 57s | Hits:  76%/3816  
  🟩 90;90a;100         Pass: 100%/1   | Total: 39m 10s | Avg: 39m 10s | Max: 39m 10s | Hits:  76%/1908  
🟩 std
  🟩 17                 Pass: 100%/21  | Total: 17h 06m | Avg: 48m 51s | Max:  1h 37m | Hits:  52%/40034 
  🟩 20                 Pass: 100%/24  | Total: 14h 46m | Avg: 36m 55s | Max:  1h 30m | Hits:  66%/45763

🟩 libcudacxx: Pass: 100%/45 | Total: 16h 14m | Avg: 21m 39s | Max: 54m 13s | Hits: 66%/128664

🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total: 15h 30m | Avg: 21m 37s | Max: 54m 13s | Hits:  67%/122001
  🟩 arm64              Pass: 100%/2   | Total: 44m 28s | Avg: 22m 14s | Max: 25m 05s | Hits:  57%/6663  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total:  1h 41m | Avg: 20m 18s | Max: 33m 14s | Hits:  71%/16294 
  🟩 12.9               Pass: 100%/40  | Total: 14h 32m | Avg: 21m 49s | Max: 54m 13s | Hits:  65%/112370
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 52m 12s | Avg: 26m 06s | Max: 28m 44s | Hits:  25%/6627  
  🟩 nvcc12.0           Pass: 100%/5   | Total:  1h 41m | Avg: 20m 18s | Max: 33m 14s | Hits:  71%/16294 
  🟩 nvcc12.9           Pass: 100%/38  | Total: 13h 40m | Avg: 21m 35s | Max: 54m 13s | Hits:  68%/105743
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 52m 12s | Avg: 26m 06s | Max: 28m 44s | Hits:  25%/6627  
  🟩 nvcc               Pass: 100%/43  | Total: 15h 22m | Avg: 21m 26s | Max: 54m 13s | Hits:  68%/122037
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total:  1h 14m | Avg: 18m 42s | Max: 23m 24s | Hits:  64%/13210 
  🟩 Clang15            Pass: 100%/2   | Total: 33m 43s | Avg: 16m 51s | Max: 19m 39s | Hits:  73%/6623  
  🟩 Clang16            Pass: 100%/2   | Total: 38m 42s | Avg: 19m 21s | Max: 20m 59s | Hits:  67%/6623  
  🟩 Clang17            Pass: 100%/2   | Total: 51m 27s | Avg: 25m 43s | Max: 33m 25s | Hits:  48%/6623  
  🟩 Clang18            Pass: 100%/2   | Total: 31m 55s | Avg: 15m 57s | Max: 17m 11s | Hits:  73%/6623  
  🟩 Clang19            Pass: 100%/6   | Total:  2h 14m | Avg: 22m 27s | Max: 28m 44s | Hits:  49%/16581 
  🟩 GCC7               Pass: 100%/2   | Total: 33m 13s | Avg: 16m 36s | Max: 17m 06s | Hits:  67%/6559  
  🟩 GCC8               Pass: 100%/1   | Total: 12m 25s | Avg: 12m 25s | Max: 12m 25s | Hits:  80%/3290  
  🟩 GCC9               Pass: 100%/2   | Total: 24m 03s | Avg: 12m 01s | Max: 14m 16s | Hits:  87%/6571  
  🟩 GCC10              Pass: 100%/2   | Total: 41m 07s | Avg: 20m 33s | Max: 28m 12s | Hits:  66%/6625  
  🟩 GCC11              Pass: 100%/2   | Total: 44m 29s | Avg: 22m 14s | Max: 26m 40s | Hits:  57%/6621  
  🟩 GCC12              Pass: 100%/2   | Total: 41m 06s | Avg: 20m 33s | Max: 22m 12s | Hits:  66%/6625  
  🟩 GCC13              Pass: 100%/10  | Total:  3h 22m | Avg: 20m 15s | Max: 54m 13s | Hits:  73%/16827 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 05m | Avg: 32m 35s | Max: 33m 14s | Hits:  88%/6299  
  🟩 MSVC14.43          Pass: 100%/2   | Total:  1h 10m | Avg: 35m 02s | Max: 36m 42s | Hits:  78%/6351  
  🟩 NVHPC25.5          Pass: 100%/2   | Total:  1h 14m | Avg: 37m 28s | Max: 46m 39s | Hits:  46%/6613  
🟩 cxx_family
  🟩 Clang              Pass: 100%/18  | Total:  6h 05m | Avg: 20m 17s | Max: 33m 25s | Hits:  60%/56283 
  🟩 GCC                Pass: 100%/21  | Total:  6h 38m | Avg: 18m 59s | Max: 54m 13s | Hits:  71%/53118 
  🟩 MSVC               Pass: 100%/4   | Total:  2h 15m | Avg: 33m 49s | Max: 36m 42s | Hits:  83%/12650 
  🟩 NVHPC              Pass: 100%/2   | Total:  1h 14m | Avg: 37m 28s | Max: 46m 39s | Hits:  46%/6613  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 25m 07s | Avg: 12m 33s | Max: 15m 42s | Hits:  91%/3415  
  🟩 rtx2080            Pass: 100%/43  | Total: 15h 49m | Avg: 22m 04s | Max: 54m 13s | Hits:  65%/125249
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total: 13h 59m | Avg: 21m 31s | Max: 46m 39s | Hits:  66%/128624
  🟩 NVRTC              Pass: 100%/2   | Total: 38m 39s | Avg: 19m 19s | Max: 19m 59s | Hits:  90%/40    
  🟩 Test               Pass: 100%/3   | Total:  1h 33m | Avg: 31m 15s | Max: 54m 13s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 31s | Avg:  2m 31s | Max:  2m 31s
🟩 sm
  🟩 75                 Pass: 100%/2   | Total: 38m 39s | Avg: 19m 19s | Max: 19m 59s | Hits:  90%/40    
  🟩 90                 Pass: 100%/2   | Total: 25m 07s | Avg: 12m 33s | Max: 15m 42s | Hits:  91%/3415  
  🟩 90;90a;100         Pass: 100%/1   | Total: 33m 33s | Avg: 33m 33s | Max: 33m 33s | Hits:  48%/3415  
🟩 std
  🟩 17                 Pass: 100%/22  | Total:  7h 12m | Avg: 19m 38s | Max: 33m 23s | Hits:  71%/68672 
  🟩 20                 Pass: 100%/22  | Total:  8h 59m | Avg: 24m 32s | Max: 54m 13s | Hits:  61%/59992

🟩 cudax: Pass: 100%/26 | Total: 3h 21m | Avg: 7m 45s | Max: 14m 28s | Hits: 86%/14772

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 57m | Avg:  8m 02s | Max: 14m 28s | Hits:  86%/12408 
  🟩 arm64              Pass: 100%/4   | Total: 24m 46s | Avg:  6m 11s | Max:  6m 57s | Hits:  85%/2364  
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 25m 57s | Avg:  8m 39s | Max: 14m 28s | Hits:  82%/1478  
  🟩 12.9               Pass: 100%/23  | Total:  2h 55m | Avg:  7m 38s | Max: 13m 45s | Hits:  86%/13294 
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 25m 57s | Avg:  8m 39s | Max: 14m 28s | Hits:  82%/1478  
  🟩 nvcc12.9           Pass: 100%/23  | Total:  2h 55m | Avg:  7m 38s | Max: 13m 45s | Hits:  86%/13294 
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  3h 21m | Avg:  7m 45s | Max: 14m 28s | Hits:  86%/14772 
🟩 cxx
  🟩 Clang14            Pass: 100%/2   | Total: 12m 00s | Avg:  6m 00s | Max:  6m 43s | Hits:  85%/1186  
  🟩 Clang15            Pass: 100%/1   | Total:  6m 44s | Avg:  6m 44s | Max:  6m 44s | Hits:  85%/591   
  🟩 Clang16            Pass: 100%/1   | Total:  6m 21s | Avg:  6m 21s | Max:  6m 21s | Hits:  85%/591   
  🟩 Clang17            Pass: 100%/1   | Total:  6m 19s | Avg:  6m 19s | Max:  6m 19s | Hits:  85%/591   
  🟩 Clang18            Pass: 100%/1   | Total:  6m 07s | Avg:  6m 07s | Max:  6m 07s | Hits:  85%/591   
  🟩 Clang19            Pass: 100%/4   | Total: 28m 42s | Avg:  7m 10s | Max: 10m 14s | Hits:  89%/2364  
  🟩 GCC10              Pass: 100%/2   | Total: 13m 05s | Avg:  6m 32s | Max:  6m 53s | Hits:  85%/1186  
  🟩 GCC11              Pass: 100%/1   | Total:  6m 49s | Avg:  6m 49s | Max:  6m 49s | Hits:  85%/591   
  🟩 GCC12              Pass: 100%/1   | Total:  7m 07s | Avg:  7m 07s | Max:  7m 07s | Hits:  85%/591   
  🟩 GCC13              Pass: 100%/8   | Total: 55m 41s | Avg:  6m 57s | Max: 10m 42s | Hits:  88%/4728  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 14m 28s | Avg: 14m 28s | Max: 14m 28s | Hits:  67%/292   
  🟩 MSVC14.43          Pass: 100%/1   | Total: 13m 45s | Avg: 13m 45s | Max: 13m 45s | Hits:  67%/292   
  🟩 NVHPC25.5          Pass: 100%/2   | Total: 24m 40s | Avg: 12m 20s | Max: 12m 43s | Hits:  83%/1178  
🟩 cxx_family
  🟩 Clang              Pass: 100%/10  | Total:  1h 06m | Avg:  6m 37s | Max: 10m 14s | Hits:  87%/5914  
  🟩 GCC                Pass: 100%/12  | Total:  1h 22m | Avg:  6m 53s | Max: 10m 42s | Hits:  87%/7096  
  🟩 MSVC               Pass: 100%/2   | Total: 28m 13s | Avg: 14m 06s | Max: 14m 28s | Hits:  67%/584   
  🟩 NVHPC              Pass: 100%/2   | Total: 24m 40s | Avg: 12m 20s | Max: 12m 43s | Hits:  83%/1178  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 13m 49s | Avg:  6m 54s | Max:  8m 20s | Hits:  92%/1182  
  🟩 rtx2080            Pass: 100%/24  | Total:  3h 07m | Avg:  7m 49s | Max: 14m 28s | Hits:  85%/13590 
🟩 jobs
  🟩 Build              Pass: 100%/23  | Total:  2h 52m | Avg:  7m 30s | Max: 14m 28s | Hits:  84%/12999 
  🟩 Test               Pass: 100%/3   | Total: 29m 16s | Avg:  9m 45s | Max: 10m 42s | Hits:  99%/1773  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total: 19m 01s | Avg:  6m 20s | Max:  8m 20s | Hits:  90%/1773  
  🟩 90a                Pass: 100%/1   | Total:  5m 23s | Avg:  5m 23s | Max:  5m 23s | Hits:  85%/591   
🟩 std
  🟩 17                 Pass: 100%/4   | Total: 29m 09s | Avg:  7m 17s | Max: 11m 57s | Hits:  84%/2362  
  🟩 20                 Pass: 100%/22  | Total:  2h 52m | Avg:  7m 50s | Max: 14m 28s | Hits:  86%/12410

🟩 python: Pass: 100%/12 | Total: 1h 54m | Avg: 9m 32s | Max: 19m 15s

🟩 cpu
  🟩 amd64              Pass: 100%/12  | Total:  1h 54m | Avg:  9m 32s | Max: 19m 15s
🟩 ctk
  🟩 12.9               Pass: 100%/12  | Total:  1h 54m | Avg:  9m 32s | Max: 19m 15s
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/12  | Total:  1h 54m | Avg:  9m 32s | Max: 19m 15s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/12  | Total:  1h 54m | Avg:  9m 32s | Max: 19m 15s
🟩 cxx
  🟩 GCC13              Pass: 100%/12  | Total:  1h 54m | Avg:  9m 32s | Max: 19m 15s
🟩 cxx_family
  🟩 GCC                Pass: 100%/12  | Total:  1h 54m | Avg:  9m 32s | Max: 19m 15s
🟩 gpu
  🟩 rtxa6000           Pass: 100%/12  | Total:  1h 54m | Avg:  9m 32s | Max: 19m 15s
🟩 jobs
  🟩 Build cuda.cccl    Pass: 100%/2   | Total:  7m 02s | Avg:  3m 31s | Max:  3m 38s
  🟩 Build cuda.cooperative Pass: 100%/2   | Total:  7m 22s | Avg:  3m 41s | Max:  3m 45s
  🟩 Build cuda.parallel Pass: 100%/2   | Total: 16m 05s | Avg:  8m 02s | Max:  8m 25s
  🟩 Test cuda.cccl     Pass: 100%/2   | Total: 10m 28s | Avg:  5m 14s | Max:  5m 42s
  🟩 Test cuda.cooperative Pass: 100%/2   | Total: 37m 51s | Avg: 18m 55s | Max: 19m 15s
  🟩 Test cuda.parallel Pass: 100%/2   | Total: 35m 40s | Avg: 17m 50s | Max: 18m 06s
🟩 py_version
  🟩 3.10               Pass: 100%/6   | Total: 56m 44s | Avg:  9m 27s | Max: 18m 36s
  🟩 3.13               Pass: 100%/6   | Total: 57m 44s | Avg:  9m 37s | Max: 19m 15s

🟩 stdpar: Pass: 100%/4 | Total: 23m 25s | Avg: 5m 51s | Max: 6m 36s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 13m 04s | Avg:  6m 32s | Max:  6m 36s
  🟩 arm64              Pass: 100%/2   | Total: 10m 21s | Avg:  5m 10s | Max:  5m 11s
🟩 ctk
  🟩 12.9               Pass: 100%/4   | Total: 23m 25s | Avg:  5m 51s | Max:  6m 36s
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/4   | Total: 23m 25s | Avg:  5m 51s | Max:  6m 36s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 23m 25s | Avg:  5m 51s | Max:  6m 36s
🟩 cxx
  🟩 NVHPC25.5          Pass: 100%/4   | Total: 23m 25s | Avg:  5m 51s | Max:  6m 36s
🟩 cxx_family
  🟩 NVHPC              Pass: 100%/4   | Total: 23m 25s | Avg:  5m 51s | Max:  6m 36s
🟩 gpu
  🟩 rtx2080            Pass: 100%/4   | Total: 23m 25s | Avg:  5m 51s | Max:  6m 36s
🟩 jobs
  🟩 Build              Pass: 100%/4   | Total: 23m 25s | Avg:  5m 51s | Max:  6m 36s
🟩 std
  🟩 17                 Pass: 100%/2   | Total: 11m 39s | Avg:  5m 49s | Max:  6m 28s
  🟩 20                 Pass: 100%/2   | Total: 11m 46s | Avg:  5m 53s | Max:  6m 36s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 18m 34s | Avg: 9m 17s | Max: 14m 29s | Hits: 92%/328

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 18m 34s | Avg:  9m 17s | Max: 14m 29s | Hits:  92%/328   
🟩 ctk
  🟩 12.9               Pass: 100%/2   | Total: 18m 34s | Avg:  9m 17s | Max: 14m 29s | Hits:  92%/328   
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/2   | Total: 18m 34s | Avg:  9m 17s | Max: 14m 29s | Hits:  92%/328   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 18m 34s | Avg:  9m 17s | Max: 14m 29s | Hits:  92%/328   
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 18m 34s | Avg:  9m 17s | Max: 14m 29s | Hits:  92%/328   
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 18m 34s | Avg:  9m 17s | Max: 14m 29s | Hits:  92%/328   
🟩 gpu
  🟩 rtx2080            Pass: 100%/2   | Total: 18m 34s | Avg:  9m 17s | Max: 14m 29s | Hits:  92%/328   
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  4m 05s | Avg:  4m 05s | Max:  4m 05s | Hits:  87%/164   
  🟩 Test               Pass: 100%/1   | Total: 14m 29s | Avg: 14m 29s | Max: 14m 29s | Hits:  98%/164

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	stdpar
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	stdpar
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 183)

#	Runner
129	`linux-amd64-cpu16`
15	`windows-amd64-cpu16`
12	`linux-arm64-cpu16`
12	`linux-amd64-gpu-rtxa6000-latest-1`
7	`linux-amd64-gpu-rtx2080-latest-1`
5	`linux-amd64-gpu-h100-latest-1`
3	`linux-amd64-gpu-rtx4090-latest-1`

libcudacxx/include/cuda/__warp/warp_match_all.h

docs/libcudacxx/extended_api/warp/warp_match_all.rst

davebayer · 2025-05-26T09:13:40Z

I've opened a PR #4804 for cuda::device::lane_mask. If accepted, can we use that instead of the uint32_t for the lane mask parameter?

Co-authored-by: David Bayer <48736217+davebayer@users.noreply.github.com>

fbusato · 2025-05-27T17:22:04Z

I've opened a PR #4804 for cuda::device::lane_mask. If accepted, can we use that instead of the uint32_t for the lane mask parameter?

Yes, it is perfectly fine with me. Btw, thanks for reviewing the PR!

github-actions · 2025-05-27T18:21:48Z

🟨 CI finished in 1h 07m: Pass: 98%/183 | Total: 1d 07h | Avg: 10m 23s | Max: 33m 57s | Hits: 97%/287451

🟨 libcudacxx: Pass: 97%/45 | Total: 7h 13m | Avg: 9m 37s | Max: 28m 31s | Hits: 95%/125332

🔍 cpu: arm64 🔍
  🟩 amd64              Pass: 100%/43  | Total:  7h 06m | Avg:  9m 55s | Max: 28m 31s | Hits:  95%/122001
  🔍 arm64              Pass:  50%/2   | Total:  6m 39s | Avg:  3m 19s | Max:  4m 57s | Hits:  99%/3331  
🔍 ctk: 12.9 🔍
  🟩 12.0               Pass: 100%/5   | Total: 44m 29s | Avg:  8m 53s | Max: 26m 39s | Hits:  99%/16294 
  🔍 12.9               Pass:  97%/40  | Total:  6h 28m | Avg:  9m 42s | Max: 28m 31s | Hits:  94%/109038
🔍 cudacxx: nvcc12.9 🔍
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 50m 50s | Avg: 25m 25s | Max: 26m 26s | Hits:  26%/6627  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 44m 29s | Avg:  8m 53s | Max: 26m 39s | Hits:  99%/16294 
  🔍 nvcc12.9           Pass:  97%/38  | Total:  5h 37m | Avg:  8m 53s | Max: 28m 31s | Hits:  99%/102411
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total: 50m 50s | Avg: 25m 25s | Max: 26m 26s | Hits:  26%/6627  
  🔍 nvcc               Pass:  97%/43  | Total:  6h 22m | Avg:  8m 53s | Max: 28m 31s | Hits:  99%/118705
🔍 cxx: GCC13 🔍
  🟩 Clang14            Pass: 100%/4   | Total: 20m 33s | Avg:  5m 08s | Max:  5m 45s | Hits:  99%/13210 
  🟩 Clang15            Pass: 100%/2   | Total: 10m 57s | Avg:  5m 28s | Max:  5m 33s | Hits:  99%/6623  
  🟩 Clang16            Pass: 100%/2   | Total: 11m 48s | Avg:  5m 54s | Max:  5m 55s | Hits:  99%/6623  
  🟩 Clang17            Pass: 100%/2   | Total: 10m 47s | Avg:  5m 23s | Max:  5m 30s | Hits:  99%/6623  
  🟩 Clang18            Pass: 100%/2   | Total: 11m 10s | Avg:  5m 35s | Max:  5m 42s | Hits:  99%/6623  
  🟩 Clang19            Pass: 100%/6   | Total:  1h 17m | Avg: 12m 53s | Max: 26m 26s | Hits:  70%/16581 
  🟩 GCC7               Pass: 100%/2   | Total:  9m 31s | Avg:  4m 45s | Max:  5m 12s | Hits:  99%/6559  
  🟩 GCC8               Pass: 100%/1   | Total:  4m 57s | Avg:  4m 57s | Max:  4m 57s | Hits:  99%/3290  
  🟩 GCC9               Pass: 100%/2   | Total:  9m 56s | Avg:  4m 58s | Max:  5m 32s | Hits:  99%/6571  
  🟩 GCC10              Pass: 100%/2   | Total: 10m 12s | Avg:  5m 06s | Max:  5m 17s | Hits:  99%/6625  
  🟩 GCC11              Pass: 100%/2   | Total: 10m 18s | Avg:  5m 09s | Max:  5m 15s | Hits:  99%/6621  
  🟩 GCC12              Pass: 100%/2   | Total: 10m 21s | Avg:  5m 10s | Max:  5m 33s | Hits:  99%/6625  
  🔍 GCC13              Pass:  90%/10  | Total:  1h 39m | Avg:  9m 58s | Max: 23m 46s | Hits:  99%/13495 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 55m 10s | Avg: 27m 35s | Max: 28m 31s | Hits:  99%/6299  
  🟩 MSVC14.43          Pass: 100%/2   | Total: 55m 51s | Avg: 27m 55s | Max: 28m 29s | Hits:  99%/6351  
  🟩 NVHPC25.5          Pass: 100%/2   | Total: 24m 29s | Avg: 12m 14s | Max: 12m 40s | Hits:  98%/6613  
🔍 cxx_family: GCC 🔍
  🟩 Clang              Pass: 100%/18  | Total:  2h 22m | Avg:  7m 55s | Max: 26m 26s | Hits:  90%/56283 
  🔍 GCC                Pass:  95%/21  | Total:  2h 35m | Avg:  7m 22s | Max: 23m 46s | Hits:  99%/49786 
  🟩 MSVC               Pass: 100%/4   | Total:  1h 51m | Avg: 27m 45s | Max: 28m 31s | Hits:  99%/12650 
  🟩 NVHPC              Pass: 100%/2   | Total: 24m 29s | Avg: 12m 14s | Max: 12m 40s | Hits:  98%/6613  
🔍 gpu: rtx2080 🔍
  🟩 h100               Pass: 100%/2   | Total: 20m 55s | Avg: 10m 27s | Max: 15m 42s | Hits:  99%/3415  
  🔍 rtx2080            Pass:  97%/43  | Total:  6h 52m | Avg:  9m 35s | Max: 28m 31s | Hits:  95%/121917
🔍 jobs: Build 🔍
  🔍 Build              Pass:  97%/39  | Total:  5h 45m | Avg:  8m 51s | Max: 28m 31s | Hits:  95%/125292
  🟩 NVRTC              Pass: 100%/2   | Total: 46m 13s | Avg: 23m 06s | Max: 23m 46s | Hits:  90%/40    
  🟩 Test               Pass: 100%/3   | Total: 38m 32s | Avg: 12m 50s | Max: 15m 42s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 42s | Avg:  2m 42s | Max:  2m 42s
🔍 std: 20 🔍
  🟩 17                 Pass: 100%/22  | Total:  3h 45m | Avg: 10m 15s | Max: 28m 31s | Hits:  95%/68672 
  🔍 20                 Pass:  95%/22  | Total:  3h 24m | Avg:  9m 18s | Max: 27m 22s | Hits:  94%/56660 
🟩 sm
  🟩 75                 Pass: 100%/2   | Total: 46m 13s | Avg: 23m 06s | Max: 23m 46s | Hits:  90%/40    
  🟩 90                 Pass: 100%/2   | Total: 20m 55s | Avg: 10m 27s | Max: 15m 42s | Hits:  99%/3415  
  🟩 90;90a;100         Pass: 100%/1   | Total:  5m 45s | Avg:  5m 45s | Max:  5m 45s | Hits:  99%/3415

🟨 stdpar: Pass: 75%/4 | Total: 22m 41s | Avg: 5m 40s | Max: 6m 18s

🔍 cpu: arm64 🔍
  🟩 amd64              Pass: 100%/2   | Total: 12m 24s | Avg:  6m 12s | Max:  6m 18s
  🔍 arm64              Pass:  50%/2   | Total: 10m 17s | Avg:  5m 08s | Max:  5m 20s
🔍 std: 17 🔍
  🔍 17                 Pass:  50%/2   | Total: 11m 03s | Avg:  5m 31s | Max:  6m 06s
  🟩 20                 Pass: 100%/2   | Total: 11m 38s | Avg:  5m 49s | Max:  6m 18s
🟨 ctk
  🟨 12.9               Pass:  75%/4   | Total: 22m 41s | Avg:  5m 40s | Max:  6m 18s
🟨 cudacxx
  🟨 nvcc12.9           Pass:  75%/4   | Total: 22m 41s | Avg:  5m 40s | Max:  6m 18s
🟨 cudacxx_family
  🟨 nvcc               Pass:  75%/4   | Total: 22m 41s | Avg:  5m 40s | Max:  6m 18s
🟨 cxx
  🟨 NVHPC25.5          Pass:  75%/4   | Total: 22m 41s | Avg:  5m 40s | Max:  6m 18s
🟨 cxx_family
  🟨 NVHPC              Pass:  75%/4   | Total: 22m 41s | Avg:  5m 40s | Max:  6m 18s
🟨 gpu
  🟨 rtx2080            Pass:  75%/4   | Total: 22m 41s | Avg:  5m 40s | Max:  6m 18s
🟨 jobs
  🟨 Build              Pass:  75%/4   | Total: 22m 41s | Avg:  5m 40s | Max:  6m 18s

🟩 cub: Pass: 100%/47 | Total: 10h 48m | Avg: 13m 47s | Max: 33m 33s | Hits: 99%/57406

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total: 10h 33m | Avg: 14m 04s | Max: 33m 33s | Hits:  99%/54908 
  🟩 arm64              Pass: 100%/2   | Total: 15m 06s | Avg:  7m 33s | Max:  8m 42s | Hits:  99%/2498  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 55m 44s | Avg: 11m 08s | Max: 25m 40s | Hits:  99%/6062  
  🟩 12.9               Pass: 100%/42  | Total:  9h 52m | Avg: 14m 06s | Max: 33m 33s | Hits:  99%/51344 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 12m 22s | Avg:  6m 11s | Max:  6m 14s | Hits:  99%/2151  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 55m 44s | Avg: 11m 08s | Max: 25m 40s | Hits:  99%/6062  
  🟩 nvcc12.9           Pass: 100%/40  | Total:  9h 40m | Avg: 14m 30s | Max: 33m 33s | Hits:  99%/49193 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 12m 22s | Avg:  6m 11s | Max:  6m 14s | Hits:  99%/2151  
  🟩 nvcc               Pass: 100%/45  | Total: 10h 35m | Avg: 14m 07s | Max: 33m 33s | Hits:  99%/55255 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 28m 54s | Avg:  7m 13s | Max:  8m 01s | Hits:  99%/4998  
  🟩 Clang15            Pass: 100%/2   | Total: 14m 37s | Avg:  7m 18s | Max:  7m 33s | Hits:  99%/2495  
  🟩 Clang16            Pass: 100%/2   | Total: 15m 32s | Avg:  7m 46s | Max:  7m 47s | Hits:  99%/2495  
  🟩 Clang17            Pass: 100%/2   | Total: 14m 59s | Avg:  7m 29s | Max:  7m 40s | Hits:  99%/2495  
  🟩 Clang18            Pass: 100%/2   | Total: 14m 16s | Avg:  7m 08s | Max:  7m 15s | Hits:  99%/2495  
  🟩 Clang19            Pass: 100%/7   | Total:  1h 30m | Avg: 12m 54s | Max: 31m 12s | Hits:  99%/8390  
  🟩 GCC7               Pass: 100%/2   | Total: 16m 43s | Avg:  8m 21s | Max:  8m 40s | Hits:  99%/2498  
  🟩 GCC8               Pass: 100%/1   | Total:  8m 48s | Avg:  8m 48s | Max:  8m 48s | Hits:  99%/1249  
  🟩 GCC9               Pass: 100%/2   | Total: 18m 10s | Avg:  9m 05s | Max:  9m 58s | Hits:  99%/2498  
  🟩 GCC10              Pass: 100%/2   | Total: 18m 10s | Avg:  9m 05s | Max:  9m 05s | Hits:  99%/2499  
  🟩 GCC11              Pass: 100%/2   | Total: 18m 40s | Avg:  9m 20s | Max:  9m 37s | Hits:  99%/2495  
  🟩 GCC12              Pass: 100%/2   | Total: 19m 55s | Avg:  9m 57s | Max:  9m 58s | Hits:  99%/2495  
  🟩 GCC13              Pass: 100%/11  | Total:  3h 49m | Avg: 20m 49s | Max: 33m 33s | Hits:  99%/13747 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 51m 53s | Avg: 25m 56s | Max: 26m 13s | Hits:  99%/2130  
  🟩 MSVC14.43          Pass: 100%/2   | Total: 58m 51s | Avg: 29m 25s | Max: 31m 11s | Hits:  99%/2130  
  🟩 NVHPC25.5          Pass: 100%/2   | Total: 29m 22s | Avg: 14m 41s | Max: 14m 54s | Hits:  98%/2297  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 58m | Avg:  9m 24s | Max: 31m 12s | Hits:  99%/23368 
  🟩 GCC                Pass: 100%/22  | Total:  5h 29m | Avg: 14m 58s | Max: 33m 33s | Hits:  99%/27481 
  🟩 MSVC               Pass: 100%/4   | Total:  1h 50m | Avg: 27m 41s | Max: 31m 11s | Hits:  99%/4260  
  🟩 NVHPC              Pass: 100%/2   | Total: 29m 22s | Avg: 14m 41s | Max: 14m 54s | Hits:  98%/2297  
🟩 gpu
  🟩 h100               Pass: 100%/3   | Total:  1h 02m | Avg: 20m 47s | Max: 28m 24s | Hits:  99%/3750  
  🟩 rtx2080            Pass: 100%/36  | Total:  6h 24m | Avg: 10m 40s | Max: 31m 11s | Hits:  99%/43662 
  🟩 rtxa6000           Pass: 100%/8   | Total:  3h 21m | Avg: 25m 12s | Max: 33m 33s | Hits:  99%/9994  
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total:  6h 47m | Avg: 10m 27s | Max: 31m 11s | Hits:  99%/47410 
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 31m 33s | Avg: 31m 33s | Max: 31m 33s | Hits:  99%/1250  
  🟩 GraphCapture       Pass: 100%/1   | Total: 30m 12s | Avg: 30m 12s | Max: 30m 12s | Hits:  99%/1250  
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 33m | Avg: 31m 03s | Max: 33m 33s | Hits:  99%/3748  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 25m | Avg: 28m 29s | Max: 32m 42s | Hits:  99%/3748  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total:  1h 02m | Avg: 20m 47s | Max: 28m 24s | Hits:  99%/3750  
  🟩 90;90a;100         Pass: 100%/1   | Total: 10m 34s | Avg: 10m 34s | Max: 10m 34s | Hits:  99%/1250  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  3h 58m | Avg: 11m 21s | Max: 31m 11s | Hits:  99%/25386 
  🟩 20                 Pass: 100%/26  | Total:  6h 49m | Avg: 15m 45s | Max: 33m 33s | Hits:  99%/32020

🟩 thrust: Pass: 100%/47 | Total: 8h 35m | Avg: 10m 57s | Max: 33m 57s | Hits: 99%/89613

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 23m 03s | Avg: 11m 31s | Max: 14m 20s | Hits:  99%/3816  
🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  8h 22m | Avg: 11m 09s | Max: 33m 57s | Hits:  99%/85798 
  🟩 arm64              Pass: 100%/2   | Total: 12m 50s | Avg:  6m 25s | Max:  7m 16s | Hits:  99%/3815  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 51m 30s | Avg: 10m 18s | Max: 25m 47s | Hits:  99%/9530  
  🟩 12.9               Pass: 100%/42  | Total:  7h 43m | Avg: 11m 02s | Max: 33m 57s | Hits:  99%/80083 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 12m 15s | Avg:  6m 07s | Max:  6m 19s | Hits: 100%/3814  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 51m 30s | Avg: 10m 18s | Max: 25m 47s | Hits:  99%/9530  
  🟩 nvcc12.9           Pass: 100%/40  | Total:  7h 31m | Avg: 11m 17s | Max: 33m 57s | Hits:  99%/76269 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 12m 15s | Avg:  6m 07s | Max:  6m 19s | Hits: 100%/3814  
  🟩 nvcc               Pass: 100%/45  | Total:  8h 22m | Avg: 11m 10s | Max: 33m 57s | Hits:  99%/85799 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 24m 21s | Avg:  6m 05s | Max:  6m 27s | Hits: 100%/7628  
  🟩 Clang15            Pass: 100%/2   | Total: 12m 47s | Avg:  6m 23s | Max:  6m 30s | Hits: 100%/3814  
  🟩 Clang16            Pass: 100%/2   | Total: 12m 42s | Avg:  6m 21s | Max:  6m 24s | Hits: 100%/3814  
  🟩 Clang17            Pass: 100%/2   | Total: 13m 34s | Avg:  6m 47s | Max:  6m 57s | Hits: 100%/3814  
  🟩 Clang18            Pass: 100%/2   | Total: 13m 02s | Avg:  6m 31s | Max:  6m 55s | Hits: 100%/3814  
  🟩 Clang19            Pass: 100%/7   | Total: 49m 46s | Avg:  7m 06s | Max: 10m 50s | Hits: 100%/13349 
  🟩 GCC7               Pass: 100%/2   | Total: 14m 04s | Avg:  7m 02s | Max:  7m 06s | Hits:  99%/3816  
  🟩 GCC8               Pass: 100%/1   | Total:  7m 58s | Avg:  7m 58s | Max:  7m 58s | Hits:  99%/1908  
  🟩 GCC9               Pass: 100%/2   | Total: 15m 29s | Avg:  7m 44s | Max:  8m 11s | Hits:  99%/3816  
  🟩 GCC10              Pass: 100%/2   | Total: 14m 40s | Avg:  7m 20s | Max:  7m 21s | Hits:  99%/3816  
  🟩 GCC11              Pass: 100%/2   | Total: 16m 26s | Avg:  8m 13s | Max:  8m 18s | Hits:  99%/3816  
  🟩 GCC12              Pass: 100%/2   | Total: 17m 18s | Avg:  8m 39s | Max:  8m 58s | Hits:  99%/3816  
  🟩 GCC13              Pass: 100%/10  | Total:  1h 38m | Avg:  9m 51s | Max: 14m 43s | Hits:  99%/19080 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 52m 18s | Avg: 26m 09s | Max: 26m 31s | Hits:  99%/3800  
  🟩 MSVC14.43          Pass: 100%/3   | Total:  1h 34m | Avg: 31m 21s | Max: 33m 57s | Hits:  99%/5700  
  🟩 NVHPC25.5          Pass: 100%/2   | Total: 58m 09s | Avg: 29m 04s | Max: 30m 26s | Hits:  99%/3812  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 06m | Avg:  6m 38s | Max: 10m 50s | Hits: 100%/36233 
  🟩 GCC                Pass: 100%/21  | Total:  3h 04m | Avg:  8m 47s | Max: 14m 43s | Hits:  99%/40068 
  🟩 MSVC               Pass: 100%/5   | Total:  2h 26m | Avg: 29m 16s | Max: 33m 57s | Hits:  99%/9500  
  🟩 NVHPC              Pass: 100%/2   | Total: 58m 09s | Avg: 29m 04s | Max: 30m 26s | Hits:  99%/3812  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 19m 13s | Avg:  9m 36s | Max: 12m 45s | Hits:  99%/3816  
  🟩 rtx2080            Pass: 100%/35  | Total:  5h 50m | Avg: 10m 00s | Max: 30m 26s | Hits:  99%/66736 
  🟩 rtx4090            Pass: 100%/10  | Total:  2h 25m | Avg: 14m 33s | Max: 33m 57s | Hits:  99%/19061 
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  6h 49m | Avg: 10m 14s | Max: 30m 26s | Hits:  99%/76267 
  🟩 TestCPU            Pass: 100%/3   | Total: 52m 36s | Avg: 17m 32s | Max: 33m 57s | Hits:  99%/5715  
  🟩 TestGPU            Pass: 100%/4   | Total: 52m 38s | Avg: 13m 09s | Max: 14m 43s | Hits:  99%/7631  
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 19m 13s | Avg:  9m 36s | Max: 12m 45s | Hits:  99%/3816  
  🟩 90;90a;100         Pass: 100%/1   | Total:  8m 27s | Avg:  8m 27s | Max:  8m 27s | Hits:  99%/1908  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  3h 54m | Avg: 11m 09s | Max: 30m 26s | Hits:  99%/40034 
  🟩 20                 Pass: 100%/24  | Total:  4h 17m | Avg: 10m 44s | Max: 33m 57s | Hits:  99%/45763

🟩 cudax: Pass: 100%/26 | Total: 2h 26m | Avg: 5m 38s | Max: 11m 52s | Hits: 99%/14772

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 12m | Avg:  6m 00s | Max: 11m 52s | Hits:  99%/12408 
  🟩 arm64              Pass: 100%/4   | Total: 14m 30s | Avg:  3m 37s | Max:  3m 51s | Hits:  99%/2364  
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 18m 05s | Avg:  6m 01s | Max: 10m 33s | Hits:  98%/1478  
  🟩 12.9               Pass: 100%/23  | Total:  2h 08m | Avg:  5m 35s | Max: 11m 52s | Hits:  99%/13294 
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 18m 05s | Avg:  6m 01s | Max: 10m 33s | Hits:  98%/1478  
  🟩 nvcc12.9           Pass: 100%/23  | Total:  2h 08m | Avg:  5m 35s | Max: 11m 52s | Hits:  99%/13294 
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 26m | Avg:  5m 38s | Max: 11m 52s | Hits:  99%/14772 
🟩 cxx
  🟩 Clang14            Pass: 100%/2   | Total:  7m 30s | Avg:  3m 45s | Max:  3m 56s | Hits: 100%/1186  
  🟩 Clang15            Pass: 100%/1   | Total:  4m 13s | Avg:  4m 13s | Max:  4m 13s | Hits: 100%/591   
  🟩 Clang16            Pass: 100%/1   | Total:  4m 05s | Avg:  4m 05s | Max:  4m 05s | Hits: 100%/591   
  🟩 Clang17            Pass: 100%/1   | Total:  4m 13s | Avg:  4m 13s | Max:  4m 13s | Hits: 100%/591   
  🟩 Clang18            Pass: 100%/1   | Total:  4m 02s | Avg:  4m 02s | Max:  4m 02s | Hits: 100%/591   
  🟩 Clang19            Pass: 100%/4   | Total: 20m 31s | Avg:  5m 07s | Max:  9m 32s | Hits: 100%/2364  
  🟩 GCC10              Pass: 100%/2   | Total:  8m 15s | Avg:  4m 07s | Max:  4m 17s | Hits:  99%/1186  
  🟩 GCC11              Pass: 100%/1   | Total:  4m 23s | Avg:  4m 23s | Max:  4m 23s | Hits:  99%/591   
  🟩 GCC12              Pass: 100%/1   | Total:  4m 51s | Avg:  4m 51s | Max:  4m 51s | Hits:  99%/591   
  🟩 GCC13              Pass: 100%/8   | Total: 42m 16s | Avg:  5m 17s | Max: 10m 23s | Hits:  99%/4728  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 10m 33s | Avg: 10m 33s | Max: 10m 33s | Hits:  95%/292   
  🟩 MSVC14.43          Pass: 100%/1   | Total: 11m 52s | Avg: 11m 52s | Max: 11m 52s | Hits:  95%/292   
  🟩 NVHPC25.5          Pass: 100%/2   | Total: 20m 00s | Avg: 10m 00s | Max: 10m 26s | Hits:  97%/1178  
🟩 cxx_family
  🟩 Clang              Pass: 100%/10  | Total: 44m 34s | Avg:  4m 27s | Max:  9m 32s | Hits: 100%/5914  
  🟩 GCC                Pass: 100%/12  | Total: 59m 45s | Avg:  4m 58s | Max: 10m 23s | Hits:  99%/7096  
  🟩 MSVC               Pass: 100%/2   | Total: 22m 25s | Avg: 11m 12s | Max: 11m 52s | Hits:  95%/584   
  🟩 NVHPC              Pass: 100%/2   | Total: 20m 00s | Avg: 10m 00s | Max: 10m 26s | Hits:  97%/1178  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 12m 01s | Avg:  6m 00s | Max:  8m 20s | Hits:  99%/1182  
  🟩 rtx2080            Pass: 100%/24  | Total:  2h 14m | Avg:  5m 36s | Max: 11m 52s | Hits:  99%/13590 
🟩 jobs
  🟩 Build              Pass: 100%/23  | Total:  1h 58m | Avg:  5m 09s | Max: 11m 52s | Hits:  99%/12999 
  🟩 Test               Pass: 100%/3   | Total: 28m 15s | Avg:  9m 25s | Max: 10m 23s | Hits:  99%/1773  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total: 15m 45s | Avg:  5m 15s | Max:  8m 20s | Hits:  99%/1773  
  🟩 90a                Pass: 100%/1   | Total:  3m 51s | Avg:  3m 51s | Max:  3m 51s | Hits:  99%/591   
🟩 std
  🟩 17                 Pass: 100%/4   | Total: 20m 32s | Avg:  5m 08s | Max:  9m 34s | Hits:  99%/2362  
  🟩 20                 Pass: 100%/22  | Total:  2h 06m | Avg:  5m 44s | Max: 11m 52s | Hits:  99%/12410

🟩 python: Pass: 100%/12 | Total: 1h 57m | Avg: 9m 49s | Max: 22m 58s

🟩 cpu
  🟩 amd64              Pass: 100%/12  | Total:  1h 57m | Avg:  9m 49s | Max: 22m 58s
🟩 ctk
  🟩 12.9               Pass: 100%/12  | Total:  1h 57m | Avg:  9m 49s | Max: 22m 58s
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/12  | Total:  1h 57m | Avg:  9m 49s | Max: 22m 58s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/12  | Total:  1h 57m | Avg:  9m 49s | Max: 22m 58s
🟩 cxx
  🟩 GCC13              Pass: 100%/12  | Total:  1h 57m | Avg:  9m 49s | Max: 22m 58s
🟩 cxx_family
  🟩 GCC                Pass: 100%/12  | Total:  1h 57m | Avg:  9m 49s | Max: 22m 58s
🟩 gpu
  🟩 rtxa6000           Pass: 100%/12  | Total:  1h 57m | Avg:  9m 49s | Max: 22m 58s
🟩 jobs
  🟩 Build cuda.cccl    Pass: 100%/2   | Total:  7m 12s | Avg:  3m 36s | Max:  3m 38s
  🟩 Build cuda.cooperative Pass: 100%/2   | Total:  7m 11s | Avg:  3m 35s | Max:  3m 41s
  🟩 Build cuda.parallel Pass: 100%/2   | Total: 16m 02s | Avg:  8m 01s | Max:  8m 06s
  🟩 Test cuda.cccl     Pass: 100%/2   | Total:  9m 19s | Avg:  4m 39s | Max:  4m 41s
  🟩 Test cuda.cooperative Pass: 100%/2   | Total: 45m 41s | Avg: 22m 50s | Max: 22m 58s
  🟩 Test cuda.parallel Pass: 100%/2   | Total: 32m 26s | Avg: 16m 13s | Max: 16m 51s
🟩 py_version
  🟩 3.10               Pass: 100%/6   | Total: 58m 20s | Avg:  9m 43s | Max: 22m 43s
  🟩 3.13               Pass: 100%/6   | Total: 59m 31s | Avg:  9m 55s | Max: 22m 58s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 17m 41s | Avg: 8m 50s | Max: 14m 54s | Hits: 98%/328

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 17m 41s | Avg:  8m 50s | Max: 14m 54s | Hits:  98%/328   
🟩 ctk
  🟩 12.9               Pass: 100%/2   | Total: 17m 41s | Avg:  8m 50s | Max: 14m 54s | Hits:  98%/328   
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/2   | Total: 17m 41s | Avg:  8m 50s | Max: 14m 54s | Hits:  98%/328   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 17m 41s | Avg:  8m 50s | Max: 14m 54s | Hits:  98%/328   
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 17m 41s | Avg:  8m 50s | Max: 14m 54s | Hits:  98%/328   
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 17m 41s | Avg:  8m 50s | Max: 14m 54s | Hits:  98%/328   
🟩 gpu
  🟩 rtx2080            Pass: 100%/2   | Total: 17m 41s | Avg:  8m 50s | Max: 14m 54s | Hits:  98%/328   
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 47s | Avg:  2m 47s | Max:  2m 47s | Hits:  98%/164   
  🟩 Test               Pass: 100%/1   | Total: 14m 54s | Avg: 14m 54s | Max: 14m 54s | Hits:  98%/164

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	stdpar
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	stdpar
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 183)

#	Runner
129	`linux-amd64-cpu16`
15	`windows-amd64-cpu16`
12	`linux-arm64-cpu16`
12	`linux-amd64-gpu-rtxa6000-latest-1`
7	`linux-amd64-gpu-rtx2080-latest-1`
5	`linux-amd64-gpu-h100-latest-1`
3	`linux-amd64-gpu-rtx4090-latest-1`

github-actions · 2025-05-30T01:42:48Z

🟩 CI finished in 1h 35m: Pass: 100%/187 | Total: 1d 07h | Avg: 10m 13s | Max: 57m 39s | Hits: 97%/292133

🟩 cub: Pass: 100%/47 | Total: 11h 27m | Avg: 14m 37s | Max: 57m 39s | Hits: 99%/57328

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total: 11h 12m | Avg: 14m 57s | Max: 57m 39s | Hits:  99%/54834 
  🟩 arm64              Pass: 100%/2   | Total: 14m 44s | Avg:  7m 22s | Max:  8m 26s | Hits:  99%/2494  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 55m 01s | Avg: 11m 00s | Max: 24m 49s | Hits:  99%/6054  
  🟩 12.9               Pass: 100%/42  | Total: 10h 32m | Avg: 15m 03s | Max: 57m 39s | Hits:  98%/51274 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 11m 04s | Avg:  5m 32s | Max:  5m 33s | Hits:  99%/2151  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 55m 01s | Avg: 11m 00s | Max: 24m 49s | Hits:  99%/6054  
  🟩 nvcc12.9           Pass: 100%/40  | Total: 10h 21m | Avg: 15m 32s | Max: 57m 39s | Hits:  98%/49123 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 11m 04s | Avg:  5m 32s | Max:  5m 33s | Hits:  99%/2151  
  🟩 nvcc               Pass: 100%/45  | Total: 11h 16m | Avg: 15m 02s | Max: 57m 39s | Hits:  99%/55177 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 28m 00s | Avg:  7m 00s | Max:  7m 06s | Hits:  99%/4990  
  🟩 Clang15            Pass: 100%/2   | Total: 14m 39s | Avg:  7m 19s | Max:  7m 35s | Hits:  99%/2491  
  🟩 Clang16            Pass: 100%/2   | Total: 14m 28s | Avg:  7m 14s | Max:  7m 25s | Hits:  99%/2491  
  🟩 Clang17            Pass: 100%/2   | Total: 14m 06s | Avg:  7m 03s | Max:  7m 07s | Hits:  99%/2491  
  🟩 Clang18            Pass: 100%/2   | Total: 14m 10s | Avg:  7m 05s | Max:  7m 08s | Hits:  99%/2491  
  🟩 Clang19            Pass: 100%/7   | Total:  1h 25m | Avg: 12m 10s | Max: 30m 17s | Hits:  99%/8380  
  🟩 GCC7               Pass: 100%/2   | Total: 16m 34s | Avg:  8m 17s | Max:  8m 38s | Hits:  99%/2494  
  🟩 GCC8               Pass: 100%/1   | Total:  8m 41s | Avg:  8m 41s | Max:  8m 41s | Hits:  99%/1247  
  🟩 GCC9               Pass: 100%/2   | Total: 17m 31s | Avg:  8m 45s | Max:  9m 04s | Hits:  99%/2494  
  🟩 GCC10              Pass: 100%/2   | Total: 18m 11s | Avg:  9m 05s | Max:  9m 06s | Hits:  99%/2495  
  🟩 GCC11              Pass: 100%/2   | Total: 18m 09s | Avg:  9m 04s | Max:  9m 08s | Hits:  99%/2491  
  🟩 GCC12              Pass: 100%/2   | Total: 19m 16s | Avg:  9m 38s | Max:  9m 51s | Hits:  99%/2491  
  🟩 GCC13              Pass: 100%/11  | Total:  4h 40m | Avg: 25m 27s | Max: 57m 39s | Hits:  96%/13725 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 53m 05s | Avg: 26m 32s | Max: 28m 16s | Hits:  99%/2130  
  🟩 MSVC14.43          Pass: 100%/2   | Total: 54m 46s | Avg: 27m 23s | Max: 27m 40s | Hits:  99%/2130  
  🟩 NVHPC25.5          Pass: 100%/2   | Total: 30m 41s | Avg: 15m 20s | Max: 15m 29s | Hits:  98%/2297  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 50m | Avg:  8m 58s | Max: 30m 17s | Hits:  99%/23334 
  🟩 GCC                Pass: 100%/22  | Total:  6h 18m | Avg: 17m 12s | Max: 57m 39s | Hits:  98%/27437 
  🟩 MSVC               Pass: 100%/4   | Total:  1h 47m | Avg: 26m 57s | Max: 28m 16s | Hits:  99%/4260  
  🟩 NVHPC              Pass: 100%/2   | Total: 30m 41s | Avg: 15m 20s | Max: 15m 29s | Hits:  98%/2297  
🟩 gpu
  🟩 h100               Pass: 100%/3   | Total:  1h 00m | Avg: 20m 11s | Max: 29m 50s | Hits:  99%/3744  
  🟩 rtx2080            Pass: 100%/36  | Total:  7h 02m | Avg: 11m 43s | Max: 57m 39s | Hits:  98%/43606 
  🟩 rtxa6000           Pass: 100%/8   | Total:  3h 24m | Avg: 25m 36s | Max: 38m 16s | Hits:  99%/9978  
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total:  7h 25m | Avg: 11m 24s | Max: 57m 39s | Hits:  98%/47348 
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 34m 55s | Avg: 34m 55s | Max: 34m 55s | Hits:  99%/1248  
  🟩 GraphCapture       Pass: 100%/1   | Total: 27m 08s | Avg: 27m 08s | Max: 27m 08s | Hits:  99%/1248  
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 38m | Avg: 32m 47s | Max: 38m 16s | Hits:  99%/3742  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 22m | Avg: 27m 20s | Max: 34m 15s | Hits:  99%/3742  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total:  1h 00m | Avg: 20m 11s | Max: 29m 50s | Hits:  99%/3744  
  🟩 90;90a;100         Pass: 100%/1   | Total:  9m 24s | Avg:  9m 24s | Max:  9m 24s | Hits:  99%/1248  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  4h 40m | Avg: 13m 20s | Max: 57m 39s | Hits:  98%/25354 
  🟩 20                 Pass: 100%/26  | Total:  6h 47m | Avg: 15m 40s | Max: 38m 16s | Hits:  99%/31974

🟩 thrust: Pass: 100%/47 | Total: 8h 15m | Avg: 10m 33s | Max: 32m 04s | Hits: 99%/89754

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 21m 43s | Avg: 10m 51s | Max: 13m 37s | Hits:  99%/3822  
🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  8h 03m | Avg: 10m 44s | Max: 32m 04s | Hits:  99%/85933 
  🟩 arm64              Pass: 100%/2   | Total: 12m 14s | Avg:  6m 07s | Max:  6m 52s | Hits:  99%/3821  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 51m 17s | Avg: 10m 15s | Max: 27m 06s | Hits:  99%/9545  
  🟩 12.9               Pass: 100%/42  | Total:  7h 24m | Avg: 10m 35s | Max: 32m 04s | Hits:  99%/80209 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 11m 58s | Avg:  5m 59s | Max:  6m 06s | Hits: 100%/3820  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 51m 17s | Avg: 10m 15s | Max: 27m 06s | Hits:  99%/9545  
  🟩 nvcc12.9           Pass: 100%/40  | Total:  7h 12m | Avg: 10m 49s | Max: 32m 04s | Hits:  99%/76389 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 11m 58s | Avg:  5m 59s | Max:  6m 06s | Hits: 100%/3820  
  🟩 nvcc               Pass: 100%/45  | Total:  8h 03m | Avg: 10m 45s | Max: 32m 04s | Hits:  99%/85934 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 23m 53s | Avg:  5m 58s | Max:  6m 35s | Hits: 100%/7640  
  🟩 Clang15            Pass: 100%/2   | Total: 12m 30s | Avg:  6m 15s | Max:  6m 29s | Hits: 100%/3820  
  🟩 Clang16            Pass: 100%/2   | Total: 12m 41s | Avg:  6m 20s | Max:  6m 27s | Hits: 100%/3820  
  🟩 Clang17            Pass: 100%/2   | Total: 11m 58s | Avg:  5m 59s | Max:  6m 02s | Hits: 100%/3820  
  🟩 Clang18            Pass: 100%/2   | Total: 11m 43s | Avg:  5m 51s | Max:  5m 57s | Hits: 100%/3820  
  🟩 Clang19            Pass: 100%/7   | Total: 48m 35s | Avg:  6m 56s | Max: 10m 42s | Hits: 100%/13370 
  🟩 GCC7               Pass: 100%/2   | Total: 13m 38s | Avg:  6m 49s | Max:  7m 11s | Hits:  99%/3822  
  🟩 GCC8               Pass: 100%/1   | Total:  6m 58s | Avg:  6m 58s | Max:  6m 58s | Hits:  99%/1911  
  🟩 GCC9               Pass: 100%/2   | Total: 13m 55s | Avg:  6m 57s | Max:  7m 15s | Hits:  99%/3822  
  🟩 GCC10              Pass: 100%/2   | Total: 15m 16s | Avg:  7m 38s | Max:  8m 01s | Hits:  99%/3822  
  🟩 GCC11              Pass: 100%/2   | Total: 15m 34s | Avg:  7m 47s | Max:  7m 49s | Hits:  99%/3822  
  🟩 GCC12              Pass: 100%/2   | Total: 16m 42s | Avg:  8m 21s | Max:  8m 44s | Hits:  99%/3822  
  🟩 GCC13              Pass: 100%/10  | Total:  1h 35m | Avg:  9m 34s | Max: 13m 46s | Hits:  99%/19110 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 53m 21s | Avg: 26m 40s | Max: 27m 06s | Hits:  99%/3806  
  🟩 MSVC14.43          Pass: 100%/3   | Total:  1h 25m | Avg: 28m 29s | Max: 32m 04s | Hits:  99%/5709  
  🟩 NVHPC25.5          Pass: 100%/2   | Total: 57m 54s | Avg: 28m 57s | Max: 29m 29s | Hits:  99%/3818  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 01m | Avg:  6m 23s | Max: 10m 42s | Hits: 100%/36290 
  🟩 GCC                Pass: 100%/21  | Total:  2h 57m | Avg:  8m 28s | Max: 13m 46s | Hits:  99%/40131 
  🟩 MSVC               Pass: 100%/5   | Total:  2h 18m | Avg: 27m 46s | Max: 32m 04s | Hits:  99%/9515  
  🟩 NVHPC              Pass: 100%/2   | Total: 57m 54s | Avg: 28m 57s | Max: 29m 29s | Hits:  99%/3818  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 19m 42s | Avg:  9m 51s | Max: 13m 46s | Hits:  99%/3822  
  🟩 rtx2080            Pass: 100%/35  | Total:  5h 39m | Avg:  9m 41s | Max: 29m 29s | Hits:  99%/66841 
  🟩 rtx4090            Pass: 100%/10  | Total:  2h 17m | Avg: 13m 42s | Max: 32m 04s | Hits:  99%/19091 
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  6h 33m | Avg:  9m 50s | Max: 29m 29s | Hits:  99%/76387 
  🟩 TestCPU            Pass: 100%/3   | Total: 50m 31s | Avg: 16m 50s | Max: 32m 04s | Hits:  99%/5724  
  🟩 TestGPU            Pass: 100%/4   | Total: 51m 37s | Avg: 12m 54s | Max: 13m 46s | Hits:  99%/7643  
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 19m 42s | Avg:  9m 51s | Max: 13m 46s | Hits:  99%/3822  
  🟩 90;90a;100         Pass: 100%/1   | Total:  7m 55s | Avg:  7m 55s | Max:  7m 55s | Hits:  99%/1911  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  3h 44m | Avg: 10m 40s | Max: 28m 25s | Hits:  99%/40097 
  🟩 20                 Pass: 100%/24  | Total:  4h 09m | Avg: 10m 24s | Max: 32m 04s | Hits:  99%/45835

🟩 libcudacxx: Pass: 100%/45 | Total: 7h 07m | Avg: 9m 29s | Max: 27m 51s | Hits: 94%/129951

🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total:  6h 57m | Avg:  9m 42s | Max: 27m 51s | Hits:  94%/123222
  🟩 arm64              Pass: 100%/2   | Total:  9m 36s | Avg:  4m 48s | Max:  4m 50s | Hits:  98%/6729  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 44m 17s | Avg:  8m 51s | Max: 25m 41s | Hits:  98%/16459 
  🟩 12.9               Pass: 100%/40  | Total:  6h 22m | Avg:  9m 34s | Max: 27m 51s | Hits:  94%/113492
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 51m 17s | Avg: 25m 38s | Max: 27m 38s | Hits:  26%/6693  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 44m 17s | Avg:  8m 51s | Max: 25m 41s | Hits:  98%/16459 
  🟩 nvcc12.9           Pass: 100%/38  | Total:  5h 31m | Avg:  8m 43s | Max: 27m 51s | Hits:  98%/106799
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 51m 17s | Avg: 25m 38s | Max: 27m 38s | Hits:  26%/6693  
  🟩 nvcc               Pass: 100%/43  | Total:  6h 15m | Avg:  8m 44s | Max: 27m 51s | Hits:  98%/123258
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 20m 09s | Avg:  5m 02s | Max:  5m 30s | Hits:  98%/13342 
  🟩 Clang15            Pass: 100%/2   | Total: 11m 13s | Avg:  5m 36s | Max:  5m 41s | Hits:  98%/6689  
  🟩 Clang16            Pass: 100%/2   | Total: 11m 06s | Avg:  5m 33s | Max:  5m 43s | Hits:  97%/6689  
  🟩 Clang17            Pass: 100%/2   | Total: 10m 24s | Avg:  5m 12s | Max:  5m 13s | Hits:  98%/6689  
  🟩 Clang18            Pass: 100%/2   | Total: 10m 26s | Avg:  5m 13s | Max:  5m 15s | Hits:  98%/6689  
  🟩 Clang19            Pass: 100%/6   | Total:  1h 17m | Avg: 12m 58s | Max: 27m 38s | Hits:  69%/16746 
  🟩 GCC7               Pass: 100%/2   | Total:  9m 25s | Avg:  4m 42s | Max:  4m 44s | Hits:  98%/6625  
  🟩 GCC8               Pass: 100%/1   | Total:  4m 49s | Avg:  4m 49s | Max:  4m 49s | Hits:  99%/3323  
  🟩 GCC9               Pass: 100%/2   | Total:  9m 47s | Avg:  4m 53s | Max:  5m 05s | Hits:  98%/6637  
  🟩 GCC10              Pass: 100%/2   | Total: 10m 26s | Avg:  5m 13s | Max:  5m 15s | Hits:  98%/6691  
  🟩 GCC11              Pass: 100%/2   | Total: 10m 12s | Avg:  5m 06s | Max:  5m 13s | Hits:  98%/6687  
  🟩 GCC12              Pass: 100%/2   | Total: 10m 34s | Avg:  5m 17s | Max:  5m 22s | Hits:  98%/6691  
  🟩 GCC13              Pass: 100%/10  | Total:  1h 37m | Avg:  9m 45s | Max: 23m 48s | Hits:  98%/16992 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 52m 29s | Avg: 26m 14s | Max: 26m 48s | Hits:  98%/6365  
  🟩 MSVC14.43          Pass: 100%/2   | Total: 55m 28s | Avg: 27m 44s | Max: 27m 51s | Hits:  98%/6417  
  🟩 NVHPC25.5          Pass: 100%/2   | Total: 25m 20s | Avg: 12m 40s | Max: 12m 48s | Hits:  97%/6679  
🟩 cxx_family
  🟩 Clang              Pass: 100%/18  | Total:  2h 21m | Avg:  7m 50s | Max: 27m 38s | Hits:  90%/56844 
  🟩 GCC                Pass: 100%/21  | Total:  2h 32m | Avg:  7m 16s | Max: 23m 48s | Hits:  98%/53646 
  🟩 MSVC               Pass: 100%/4   | Total:  1h 47m | Avg: 26m 59s | Max: 27m 51s | Hits:  98%/12782 
  🟩 NVHPC              Pass: 100%/2   | Total: 25m 20s | Avg: 12m 40s | Max: 12m 48s | Hits:  97%/6679  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 18m 52s | Avg:  9m 26s | Max: 13m 35s | Hits:  99%/3448  
  🟩 rtx2080            Pass: 100%/43  | Total:  6h 48m | Avg:  9m 29s | Max: 27m 51s | Hits:  94%/126503
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total:  5h 44m | Avg:  8m 50s | Max: 27m 51s | Hits:  94%/129911
  🟩 NVRTC              Pass: 100%/2   | Total: 43m 45s | Avg: 21m 52s | Max: 23m 48s | Hits:  90%/40    
  🟩 Test               Pass: 100%/3   | Total: 36m 37s | Avg: 12m 12s | Max: 13m 35s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 15s | Avg:  2m 15s | Max:  2m 15s
🟩 sm
  🟩 75                 Pass: 100%/2   | Total: 43m 45s | Avg: 21m 52s | Max: 23m 48s | Hits:  90%/40    
  🟩 90                 Pass: 100%/2   | Total: 18m 52s | Avg:  9m 26s | Max: 13m 35s | Hits:  99%/3448  
  🟩 90;90a;100         Pass: 100%/1   | Total:  5m 35s | Avg:  5m 35s | Max:  5m 35s | Hits:  99%/3448  
🟩 std
  🟩 17                 Pass: 100%/22  | Total:  3h 38m | Avg:  9m 55s | Max: 27m 37s | Hits:  95%/69365 
  🟩 20                 Pass: 100%/22  | Total:  3h 26m | Avg:  9m 23s | Max: 27m 51s | Hits:  94%/60586

🟩 cudax: Pass: 100%/26 | Total: 2h 18m | Avg: 5m 19s | Max: 11m 06s | Hits: 99%/14772

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 04m | Avg:  5m 39s | Max: 11m 06s | Hits:  99%/12408 
  🟩 arm64              Pass: 100%/4   | Total: 13m 53s | Avg:  3m 28s | Max:  3m 44s | Hits:  99%/2364  
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 17m 38s | Avg:  5m 52s | Max: 10m 26s | Hits:  98%/1478  
  🟩 12.9               Pass: 100%/23  | Total:  2h 00m | Avg:  5m 15s | Max: 11m 06s | Hits:  99%/13294 
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 17m 38s | Avg:  5m 52s | Max: 10m 26s | Hits:  98%/1478  
  🟩 nvcc12.9           Pass: 100%/23  | Total:  2h 00m | Avg:  5m 15s | Max: 11m 06s | Hits:  99%/13294 
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 18m | Avg:  5m 19s | Max: 11m 06s | Hits:  99%/14772 
🟩 cxx
  🟩 Clang14            Pass: 100%/2   | Total:  7m 08s | Avg:  3m 34s | Max:  3m 37s | Hits: 100%/1186  
  🟩 Clang15            Pass: 100%/1   | Total:  3m 42s | Avg:  3m 42s | Max:  3m 42s | Hits: 100%/591   
  🟩 Clang16            Pass: 100%/1   | Total:  3m 48s | Avg:  3m 48s | Max:  3m 48s | Hits: 100%/591   
  🟩 Clang17            Pass: 100%/1   | Total:  3m 56s | Avg:  3m 56s | Max:  3m 56s | Hits: 100%/591   
  🟩 Clang18            Pass: 100%/1   | Total:  3m 51s | Avg:  3m 51s | Max:  3m 51s | Hits: 100%/591   
  🟩 Clang19            Pass: 100%/4   | Total: 19m 38s | Avg:  4m 54s | Max:  9m 20s | Hits: 100%/2364  
  🟩 GCC10              Pass: 100%/2   | Total:  7m 36s | Avg:  3m 48s | Max:  3m 55s | Hits:  99%/1186  
  🟩 GCC11              Pass: 100%/1   | Total:  4m 04s | Avg:  4m 04s | Max:  4m 04s | Hits:  99%/591   
  🟩 GCC12              Pass: 100%/1   | Total:  4m 22s | Avg:  4m 22s | Max:  4m 22s | Hits:  99%/591   
  🟩 GCC13              Pass: 100%/8   | Total: 41m 44s | Avg:  5m 13s | Max: 11m 06s | Hits:  99%/4728  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 10m 26s | Avg: 10m 26s | Max: 10m 26s | Hits:  95%/292   
  🟩 MSVC14.43          Pass: 100%/1   | Total: 10m 53s | Avg: 10m 53s | Max: 10m 53s | Hits:  95%/292   
  🟩 NVHPC25.5          Pass: 100%/2   | Total: 17m 18s | Avg:  8m 39s | Max:  8m 44s | Hits:  97%/1178  
🟩 cxx_family
  🟩 Clang              Pass: 100%/10  | Total: 42m 03s | Avg:  4m 12s | Max:  9m 20s | Hits: 100%/5914  
  🟩 GCC                Pass: 100%/12  | Total: 57m 46s | Avg:  4m 48s | Max: 11m 06s | Hits:  99%/7096  
  🟩 MSVC               Pass: 100%/2   | Total: 21m 19s | Avg: 10m 39s | Max: 10m 53s | Hits:  95%/584   
  🟩 NVHPC              Pass: 100%/2   | Total: 17m 18s | Avg:  8m 39s | Max:  8m 44s | Hits:  97%/1178  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 11m 48s | Avg:  5m 54s | Max:  8m 09s | Hits:  99%/1182  
  🟩 rtx2080            Pass: 100%/24  | Total:  2h 06m | Avg:  5m 16s | Max: 11m 06s | Hits:  99%/13590 
🟩 jobs
  🟩 Build              Pass: 100%/23  | Total:  1h 49m | Avg:  4m 46s | Max: 10m 53s | Hits:  99%/12999 
  🟩 Test               Pass: 100%/3   | Total: 28m 35s | Avg:  9m 31s | Max: 11m 06s | Hits:  99%/1773  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total: 15m 24s | Avg:  5m 08s | Max:  8m 09s | Hits:  99%/1773  
  🟩 90a                Pass: 100%/1   | Total:  3m 22s | Avg:  3m 22s | Max:  3m 22s | Hits:  99%/591   
🟩 std
  🟩 17                 Pass: 100%/4   | Total: 19m 08s | Avg:  4m 47s | Max:  8m 34s | Hits:  99%/2362  
  🟩 20                 Pass: 100%/22  | Total:  1h 59m | Avg:  5m 25s | Max: 11m 06s | Hits:  99%/12410

🟩 python: Pass: 100%/12 | Total: 1h 46m | Avg: 8m 50s | Max: 18m 13s

🟩 cpu
  🟩 amd64              Pass: 100%/12  | Total:  1h 46m | Avg:  8m 50s | Max: 18m 13s
🟩 ctk
  🟩 12.9               Pass: 100%/12  | Total:  1h 46m | Avg:  8m 50s | Max: 18m 13s
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/12  | Total:  1h 46m | Avg:  8m 50s | Max: 18m 13s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/12  | Total:  1h 46m | Avg:  8m 50s | Max: 18m 13s
🟩 cxx
  🟩 GCC13              Pass: 100%/12  | Total:  1h 46m | Avg:  8m 50s | Max: 18m 13s
🟩 cxx_family
  🟩 GCC                Pass: 100%/12  | Total:  1h 46m | Avg:  8m 50s | Max: 18m 13s
🟩 gpu
  🟩 rtxa6000           Pass: 100%/12  | Total:  1h 46m | Avg:  8m 50s | Max: 18m 13s
🟩 jobs
  🟩 Build cuda.cccl    Pass: 100%/2   | Total:  6m 50s | Avg:  3m 25s | Max:  3m 27s
  🟩 Build cuda.cooperative Pass: 100%/2   | Total:  6m 56s | Avg:  3m 28s | Max:  3m 28s
  🟩 Build cuda.parallel Pass: 100%/2   | Total: 15m 45s | Avg:  7m 52s | Max:  7m 55s
  🟩 Test cuda.cccl     Pass: 100%/2   | Total:  8m 15s | Avg:  4m 07s | Max:  4m 08s
  🟩 Test cuda.cooperative Pass: 100%/2   | Total: 35m 40s | Avg: 17m 50s | Max: 18m 13s
  🟩 Test cuda.parallel Pass: 100%/2   | Total: 32m 37s | Avg: 16m 18s | Max: 16m 28s
🟩 py_version
  🟩 3.10               Pass: 100%/6   | Total: 52m 25s | Avg:  8m 44s | Max: 17m 27s
  🟩 3.13               Pass: 100%/6   | Total: 53m 38s | Avg:  8m 56s | Max: 18m 13s

🟩 cccl: Pass: 100%/4 | Total: 17m 19s | Avg: 4m 19s | Max: 5m 37s

🟩 cpu
  🟩 amd64              Pass: 100%/4   | Total: 17m 19s | Avg:  4m 19s | Max:  5m 37s
🟩 ctk
  🟩 12.0               Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  5m 37s
  🟩 12.9               Pass: 100%/2   | Total:  7m 57s | Avg:  3m 58s | Max:  4m 10s
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  5m 37s
  🟩 nvcc12.9           Pass: 100%/2   | Total:  7m 57s | Avg:  3m 58s | Max:  4m 10s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 17m 19s | Avg:  4m 19s | Max:  5m 37s
🟩 cxx
  🟩 Clang14            Pass: 100%/1   | Total:  3m 45s | Avg:  3m 45s | Max:  3m 45s
  🟩 Clang19            Pass: 100%/1   | Total:  4m 10s | Avg:  4m 10s | Max:  4m 10s
  🟩 GCC12              Pass: 100%/1   | Total:  5m 37s | Avg:  5m 37s | Max:  5m 37s
  🟩 GCC13              Pass: 100%/1   | Total:  3m 47s | Avg:  3m 47s | Max:  3m 47s
🟩 cxx_family
  🟩 Clang              Pass: 100%/2   | Total:  7m 55s | Avg:  3m 57s | Max:  4m 10s
  🟩 GCC                Pass: 100%/2   | Total:  9m 24s | Avg:  4m 42s | Max:  5m 37s
🟩 gpu
  🟩 rtx2080            Pass: 100%/4   | Total: 17m 19s | Avg:  4m 19s | Max:  5m 37s
🟩 jobs
  🟩 Infra              Pass: 100%/4   | Total: 17m 19s | Avg:  4m 19s | Max:  5m 37s

🟩 stdpar: Pass: 100%/4 | Total: 21m 39s | Avg: 5m 24s | Max: 6m 16s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 12m 16s | Avg:  6m 08s | Max:  6m 16s
  🟩 arm64              Pass: 100%/2   | Total:  9m 23s | Avg:  4m 41s | Max:  4m 44s
🟩 ctk
  🟩 12.9               Pass: 100%/4   | Total: 21m 39s | Avg:  5m 24s | Max:  6m 16s
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/4   | Total: 21m 39s | Avg:  5m 24s | Max:  6m 16s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 21m 39s | Avg:  5m 24s | Max:  6m 16s
🟩 cxx
  🟩 NVHPC25.5          Pass: 100%/4   | Total: 21m 39s | Avg:  5m 24s | Max:  6m 16s
🟩 cxx_family
  🟩 NVHPC              Pass: 100%/4   | Total: 21m 39s | Avg:  5m 24s | Max:  6m 16s
🟩 gpu
  🟩 rtx2080            Pass: 100%/4   | Total: 21m 39s | Avg:  5m 24s | Max:  6m 16s
🟩 jobs
  🟩 Build              Pass: 100%/4   | Total: 21m 39s | Avg:  5m 24s | Max:  6m 16s
🟩 std
  🟩 17                 Pass: 100%/2   | Total: 10m 44s | Avg:  5m 22s | Max:  6m 00s
  🟩 20                 Pass: 100%/2   | Total: 10m 55s | Avg:  5m 27s | Max:  6m 16s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 17m 50s | Avg: 8m 55s | Max: 15m 08s | Hits: 98%/328

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 17m 50s | Avg:  8m 55s | Max: 15m 08s | Hits:  98%/328   
🟩 ctk
  🟩 12.9               Pass: 100%/2   | Total: 17m 50s | Avg:  8m 55s | Max: 15m 08s | Hits:  98%/328   
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/2   | Total: 17m 50s | Avg:  8m 55s | Max: 15m 08s | Hits:  98%/328   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 17m 50s | Avg:  8m 55s | Max: 15m 08s | Hits:  98%/328   
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 17m 50s | Avg:  8m 55s | Max: 15m 08s | Hits:  98%/328   
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 17m 50s | Avg:  8m 55s | Max: 15m 08s | Hits:  98%/328   
🟩 gpu
  🟩 rtx2080            Pass: 100%/2   | Total: 17m 50s | Avg:  8m 55s | Max: 15m 08s | Hits:  98%/328   
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 42s | Avg:  2m 42s | Max:  2m 42s | Hits:  98%/164   
  🟩 Test               Pass: 100%/1   | Total: 15m 08s | Avg: 15m 08s | Max: 15m 08s | Hits:  98%/164

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	stdpar
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	stdpar
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 187)

#	Runner
129	`linux-amd64-cpu16`
15	`windows-amd64-cpu16`
12	`linux-arm64-cpu16`
12	`linux-amd64-gpu-rtxa6000-latest-1`
11	`linux-amd64-gpu-rtx2080-latest-1`
5	`linux-amd64-gpu-h100-latest-1`
3	`linux-amd64-gpu-rtx4090-latest-1`

github-actions · 2025-05-30T17:44:53Z

🟩 CI finished in 1h 07m: Pass: 100%/187 | Total: 1d 07h | Avg: 10m 00s | Max: 33m 52s | Hits: 97%/292133

🟩 cub: Pass: 100%/47 | Total: 10h 33m | Avg: 13m 29s | Max: 33m 50s | Hits: 99%/57328

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total: 10h 19m | Avg: 13m 45s | Max: 33m 50s | Hits:  99%/54834 
  🟩 arm64              Pass: 100%/2   | Total: 14m 44s | Avg:  7m 22s | Max:  8m 25s | Hits:  99%/2494  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 55m 59s | Avg: 11m 11s | Max: 26m 28s | Hits:  99%/6054  
  🟩 12.9               Pass: 100%/42  | Total:  9h 37m | Avg: 13m 45s | Max: 33m 50s | Hits:  99%/51274 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 11m 09s | Avg:  5m 34s | Max:  5m 42s | Hits:  99%/2151  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 55m 59s | Avg: 11m 11s | Max: 26m 28s | Hits:  99%/6054  
  🟩 nvcc12.9           Pass: 100%/40  | Total:  9h 26m | Avg: 14m 10s | Max: 33m 50s | Hits:  99%/49123 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 11m 09s | Avg:  5m 34s | Max:  5m 42s | Hits:  99%/2151  
  🟩 nvcc               Pass: 100%/45  | Total: 10h 22m | Avg: 13m 50s | Max: 33m 50s | Hits:  99%/55177 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 26m 58s | Avg:  6m 44s | Max:  7m 09s | Hits:  99%/4990  
  🟩 Clang15            Pass: 100%/2   | Total: 14m 50s | Avg:  7m 25s | Max:  7m 34s | Hits:  99%/2491  
  🟩 Clang16            Pass: 100%/2   | Total: 14m 49s | Avg:  7m 24s | Max:  7m 36s | Hits:  99%/2491  
  🟩 Clang17            Pass: 100%/2   | Total: 14m 31s | Avg:  7m 15s | Max:  7m 38s | Hits:  99%/2491  
  🟩 Clang18            Pass: 100%/2   | Total: 14m 22s | Avg:  7m 11s | Max:  7m 12s | Hits:  99%/2491  
  🟩 Clang19            Pass: 100%/7   | Total:  1h 27m | Avg: 12m 32s | Max: 29m 19s | Hits:  99%/8380  
  🟩 GCC7               Pass: 100%/2   | Total: 16m 43s | Avg:  8m 21s | Max:  8m 26s | Hits:  99%/2494  
  🟩 GCC8               Pass: 100%/1   | Total:  8m 30s | Avg:  8m 30s | Max:  8m 30s | Hits:  99%/1247  
  🟩 GCC9               Pass: 100%/2   | Total: 17m 38s | Avg:  8m 49s | Max:  9m 09s | Hits:  99%/2494  
  🟩 GCC10              Pass: 100%/2   | Total: 18m 11s | Avg:  9m 05s | Max:  9m 10s | Hits:  99%/2495  
  🟩 GCC11              Pass: 100%/2   | Total: 19m 32s | Avg:  9m 46s | Max: 10m 14s | Hits:  99%/2491  
  🟩 GCC12              Pass: 100%/2   | Total: 19m 46s | Avg:  9m 53s | Max: 10m 03s | Hits:  99%/2491  
  🟩 GCC13              Pass: 100%/11  | Total:  3h 38m | Avg: 19m 50s | Max: 33m 50s | Hits:  99%/13725 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 55m 05s | Avg: 27m 32s | Max: 28m 37s | Hits:  99%/2130  
  🟩 MSVC14.43          Pass: 100%/2   | Total: 57m 50s | Avg: 28m 55s | Max: 29m 58s | Hits:  99%/2130  
  🟩 NVHPC25.5          Pass: 100%/2   | Total: 29m 00s | Avg: 14m 30s | Max: 15m 03s | Hits:  98%/2297  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 53m | Avg:  9m 07s | Max: 29m 19s | Hits:  99%/23334 
  🟩 GCC                Pass: 100%/22  | Total:  5h 18m | Avg: 14m 29s | Max: 33m 50s | Hits:  99%/27437 
  🟩 MSVC               Pass: 100%/4   | Total:  1h 52m | Avg: 28m 13s | Max: 29m 58s | Hits:  99%/4260  
  🟩 NVHPC              Pass: 100%/2   | Total: 29m 00s | Avg: 14m 30s | Max: 15m 03s | Hits:  98%/2297  
🟩 gpu
  🟩 h100               Pass: 100%/3   | Total:  1h 00m | Avg: 20m 15s | Max: 28m 13s | Hits:  99%/3744  
  🟩 rtx2080            Pass: 100%/36  | Total:  6h 21m | Avg: 10m 35s | Max: 29m 58s | Hits:  99%/43606 
  🟩 rtxa6000           Pass: 100%/8   | Total:  3h 11m | Avg: 23m 56s | Max: 33m 50s | Hits:  99%/9978  
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total:  6h 45m | Avg: 10m 23s | Max: 29m 58s | Hits:  99%/47348 
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 33m 50s | Avg: 33m 50s | Max: 33m 50s | Hits:  99%/1248  
  🟩 GraphCapture       Pass: 100%/1   | Total: 27m 20s | Avg: 27m 20s | Max: 27m 20s | Hits:  99%/1248  
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 28m | Avg: 29m 32s | Max: 31m 04s | Hits:  99%/3742  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 18m | Avg: 26m 19s | Max: 27m 19s | Hits:  99%/3742  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total:  1h 00m | Avg: 20m 15s | Max: 28m 13s | Hits:  99%/3744  
  🟩 90;90a;100         Pass: 100%/1   | Total: 10m 11s | Avg: 10m 11s | Max: 10m 11s | Hits:  99%/1248  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  3h 57m | Avg: 11m 19s | Max: 29m 58s | Hits:  99%/25354 
  🟩 20                 Pass: 100%/26  | Total:  6h 36m | Avg: 15m 14s | Max: 33m 50s | Hits:  99%/31974

🟩 thrust: Pass: 100%/47 | Total: 8h 23m | Avg: 10m 42s | Max: 33m 52s | Hits: 99%/89754

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 21m 08s | Avg: 10m 34s | Max: 13m 28s | Hits:  99%/3822  
🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  8h 10m | Avg: 10m 54s | Max: 33m 52s | Hits:  99%/85933 
  🟩 arm64              Pass: 100%/2   | Total: 12m 10s | Avg:  6m 05s | Max:  6m 53s | Hits:  99%/3821  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 53m 21s | Avg: 10m 40s | Max: 27m 55s | Hits:  99%/9545  
  🟩 12.9               Pass: 100%/42  | Total:  7h 29m | Avg: 10m 42s | Max: 33m 52s | Hits:  99%/80209 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 11m 18s | Avg:  5m 39s | Max:  5m 49s | Hits: 100%/3820  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 53m 21s | Avg: 10m 40s | Max: 27m 55s | Hits:  99%/9545  
  🟩 nvcc12.9           Pass: 100%/40  | Total:  7h 18m | Avg: 10m 57s | Max: 33m 52s | Hits:  99%/76389 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 11m 18s | Avg:  5m 39s | Max:  5m 49s | Hits: 100%/3820  
  🟩 nvcc               Pass: 100%/45  | Total:  8h 11m | Avg: 10m 55s | Max: 33m 52s | Hits:  99%/85934 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 24m 13s | Avg:  6m 03s | Max:  6m 31s | Hits: 100%/7640  
  🟩 Clang15            Pass: 100%/2   | Total: 12m 01s | Avg:  6m 00s | Max:  6m 02s | Hits:  99%/3820  
  🟩 Clang16            Pass: 100%/2   | Total: 11m 52s | Avg:  5m 56s | Max:  6m 00s | Hits:  99%/3820  
  🟩 Clang17            Pass: 100%/2   | Total: 12m 02s | Avg:  6m 01s | Max:  6m 09s | Hits: 100%/3820  
  🟩 Clang18            Pass: 100%/2   | Total: 12m 59s | Avg:  6m 29s | Max:  6m 36s | Hits: 100%/3820  
  🟩 Clang19            Pass: 100%/7   | Total: 47m 22s | Avg:  6m 46s | Max: 10m 41s | Hits: 100%/13370 
  🟩 GCC7               Pass: 100%/2   | Total: 13m 52s | Avg:  6m 56s | Max:  6m 59s | Hits:  99%/3822  
  🟩 GCC8               Pass: 100%/1   | Total:  7m 25s | Avg:  7m 25s | Max:  7m 25s | Hits:  99%/1911  
  🟩 GCC9               Pass: 100%/2   | Total: 15m 19s | Avg:  7m 39s | Max:  8m 02s | Hits:  99%/3822  
  🟩 GCC10              Pass: 100%/2   | Total: 14m 48s | Avg:  7m 24s | Max:  7m 46s | Hits:  99%/3822  
  🟩 GCC11              Pass: 100%/2   | Total: 15m 21s | Avg:  7m 40s | Max:  7m 43s | Hits:  99%/3822  
  🟩 GCC12              Pass: 100%/2   | Total: 15m 52s | Avg:  7m 56s | Max:  8m 02s | Hits:  99%/3822  
  🟩 GCC13              Pass: 100%/10  | Total:  1h 34m | Avg:  9m 24s | Max: 13m 46s | Hits:  99%/19110 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 54m 28s | Avg: 27m 14s | Max: 27m 55s | Hits:  99%/3806  
  🟩 MSVC14.43          Pass: 100%/3   | Total:  1h 30m | Avg: 30m 12s | Max: 33m 52s | Hits:  99%/5709  
  🟩 NVHPC25.5          Pass: 100%/2   | Total:  1h 00m | Avg: 30m 23s | Max: 33m 15s | Hits:  99%/3818  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 00m | Avg:  6m 20s | Max: 10m 41s | Hits:  99%/36290 
  🟩 GCC                Pass: 100%/21  | Total:  2h 56m | Avg:  8m 24s | Max: 13m 46s | Hits:  99%/40131 
  🟩 MSVC               Pass: 100%/5   | Total:  2h 25m | Avg: 29m 01s | Max: 33m 52s | Hits:  99%/9515  
  🟩 NVHPC              Pass: 100%/2   | Total:  1h 00m | Avg: 30m 23s | Max: 33m 15s | Hits:  99%/3818  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 19m 11s | Avg:  9m 35s | Max: 13m 13s | Hits:  99%/3822  
  🟩 rtx2080            Pass: 100%/35  | Total:  5h 43m | Avg:  9m 48s | Max: 33m 15s | Hits:  99%/66841 
  🟩 rtx4090            Pass: 100%/10  | Total:  2h 20m | Avg: 14m 03s | Max: 33m 52s | Hits:  99%/19091 
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  6h 40m | Avg: 10m 00s | Max: 33m 15s | Hits:  99%/76387 
  🟩 TestCPU            Pass: 100%/3   | Total: 51m 17s | Avg: 17m 05s | Max: 33m 52s | Hits:  99%/5724  
  🟩 TestGPU            Pass: 100%/4   | Total: 51m 08s | Avg: 12m 47s | Max: 13m 46s | Hits:  99%/7643  
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 19m 11s | Avg:  9m 35s | Max: 13m 13s | Hits:  99%/3822  
  🟩 90;90a;100         Pass: 100%/1   | Total:  8m 12s | Avg:  8m 12s | Max:  8m 12s | Hits:  99%/1911  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  3h 50m | Avg: 10m 58s | Max: 33m 15s | Hits:  99%/40097 
  🟩 20                 Pass: 100%/24  | Total:  4h 11m | Avg: 10m 28s | Max: 33m 52s | Hits:  99%/45835

🟩 libcudacxx: Pass: 100%/45 | Total: 6h 58m | Avg: 9m 17s | Max: 28m 47s | Hits: 95%/129951

🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total:  6h 49m | Avg:  9m 30s | Max: 28m 47s | Hits:  94%/123222
  🟩 arm64              Pass: 100%/2   | Total:  9m 24s | Avg:  4m 42s | Max:  4m 48s | Hits:  98%/6729  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 44m 34s | Avg:  8m 54s | Max: 25m 58s | Hits:  98%/16459 
  🟩 12.9               Pass: 100%/40  | Total:  6h 13m | Avg:  9m 20s | Max: 28m 47s | Hits:  94%/113492
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 50m 27s | Avg: 25m 13s | Max: 25m 53s | Hits:  26%/6693  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 44m 34s | Avg:  8m 54s | Max: 25m 58s | Hits:  98%/16459 
  🟩 nvcc12.9           Pass: 100%/38  | Total:  5h 23m | Avg:  8m 30s | Max: 28m 47s | Hits:  98%/106799
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 50m 27s | Avg: 25m 13s | Max: 25m 53s | Hits:  26%/6693  
  🟩 nvcc               Pass: 100%/43  | Total:  6h 07m | Avg:  8m 33s | Max: 28m 47s | Hits:  98%/123258
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 19m 35s | Avg:  4m 53s | Max:  5m 15s | Hits:  98%/13342 
  🟩 Clang15            Pass: 100%/2   | Total: 10m 50s | Avg:  5m 25s | Max:  5m 50s | Hits:  98%/6689  
  🟩 Clang16            Pass: 100%/2   | Total: 10m 38s | Avg:  5m 19s | Max:  5m 34s | Hits:  98%/6689  
  🟩 Clang17            Pass: 100%/2   | Total: 10m 08s | Avg:  5m 04s | Max:  5m 08s | Hits:  98%/6689  
  🟩 Clang18            Pass: 100%/2   | Total: 10m 10s | Avg:  5m 05s | Max:  5m 13s | Hits:  98%/6689  
  🟩 Clang19            Pass: 100%/6   | Total:  1h 16m | Avg: 12m 44s | Max: 25m 53s | Hits:  69%/16746 
  🟩 GCC7               Pass: 100%/2   | Total:  9m 15s | Avg:  4m 37s | Max:  4m 47s | Hits:  99%/6625  
  🟩 GCC8               Pass: 100%/1   | Total:  4m 34s | Avg:  4m 34s | Max:  4m 34s | Hits:  99%/3323  
  🟩 GCC9               Pass: 100%/2   | Total: 10m 01s | Avg:  5m 00s | Max:  5m 11s | Hits:  98%/6637  
  🟩 GCC10              Pass: 100%/2   | Total:  9m 46s | Avg:  4m 53s | Max:  5m 02s | Hits:  99%/6691  
  🟩 GCC11              Pass: 100%/2   | Total: 10m 11s | Avg:  5m 05s | Max:  5m 11s | Hits:  99%/6687  
  🟩 GCC12              Pass: 100%/2   | Total: 10m 14s | Avg:  5m 07s | Max:  5m 17s | Hits:  99%/6691  
  🟩 GCC13              Pass: 100%/10  | Total:  1h 33m | Avg:  9m 23s | Max: 21m 11s | Hits:  98%/16992 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 52m 24s | Avg: 26m 12s | Max: 26m 26s | Hits:  98%/6365  
  🟩 MSVC14.43          Pass: 100%/2   | Total: 56m 09s | Avg: 28m 04s | Max: 28m 47s | Hits:  98%/6417  
  🟩 NVHPC25.5          Pass: 100%/2   | Total: 24m 07s | Avg: 12m 03s | Max: 12m 20s | Hits:  98%/6679  
🟩 cxx_family
  🟩 Clang              Pass: 100%/18  | Total:  2h 17m | Avg:  7m 39s | Max: 25m 53s | Hits:  90%/56844 
  🟩 GCC                Pass: 100%/21  | Total:  2h 27m | Avg:  7m 02s | Max: 21m 11s | Hits:  99%/53646 
  🟩 MSVC               Pass: 100%/4   | Total:  1h 48m | Avg: 27m 08s | Max: 28m 47s | Hits:  98%/12782 
  🟩 NVHPC              Pass: 100%/2   | Total: 24m 07s | Avg: 12m 03s | Max: 12m 20s | Hits:  98%/6679  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 20m 31s | Avg: 10m 15s | Max: 15m 39s | Hits:  99%/3448  
  🟩 rtx2080            Pass: 100%/43  | Total:  6h 37m | Avg:  9m 15s | Max: 28m 47s | Hits:  95%/126503
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total:  5h 38m | Avg:  8m 41s | Max: 28m 47s | Hits:  95%/129911
  🟩 NVRTC              Pass: 100%/2   | Total: 39m 30s | Avg: 19m 45s | Max: 21m 11s | Hits:  90%/40    
  🟩 Test               Pass: 100%/3   | Total: 37m 56s | Avg: 12m 38s | Max: 15m 39s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 15s | Avg:  2m 15s | Max:  2m 15s
🟩 sm
  🟩 75                 Pass: 100%/2   | Total: 39m 30s | Avg: 19m 45s | Max: 21m 11s | Hits:  90%/40    
  🟩 90                 Pass: 100%/2   | Total: 20m 31s | Avg: 10m 15s | Max: 15m 39s | Hits:  99%/3448  
  🟩 90;90a;100         Pass: 100%/1   | Total:  5m 28s | Avg:  5m 28s | Max:  5m 28s | Hits:  98%/3448  
🟩 std
  🟩 17                 Pass: 100%/22  | Total:  3h 34m | Avg:  9m 45s | Max: 27m 22s | Hits:  95%/69365 
  🟩 20                 Pass: 100%/22  | Total:  3h 21m | Avg:  9m 09s | Max: 28m 47s | Hits:  94%/60586

🟩 cudax: Pass: 100%/26 | Total: 2h 22m | Avg: 5m 29s | Max: 11m 44s | Hits: 99%/14772

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 09m | Avg:  5m 52s | Max: 11m 44s | Hits:  99%/12408 
  🟩 arm64              Pass: 100%/4   | Total: 13m 40s | Avg:  3m 25s | Max:  3m 42s | Hits:  99%/2364  
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 18m 34s | Avg:  6m 11s | Max: 11m 23s | Hits:  98%/1478  
  🟩 12.9               Pass: 100%/23  | Total:  2h 04m | Avg:  5m 23s | Max: 11m 44s | Hits:  99%/13294 
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 18m 34s | Avg:  6m 11s | Max: 11m 23s | Hits:  98%/1478  
  🟩 nvcc12.9           Pass: 100%/23  | Total:  2h 04m | Avg:  5m 23s | Max: 11m 44s | Hits:  99%/13294 
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 22m | Avg:  5m 29s | Max: 11m 44s | Hits:  99%/14772 
🟩 cxx
  🟩 Clang14            Pass: 100%/2   | Total:  7m 23s | Avg:  3m 41s | Max:  3m 55s | Hits: 100%/1186  
  🟩 Clang15            Pass: 100%/1   | Total:  3m 45s | Avg:  3m 45s | Max:  3m 45s | Hits: 100%/591   
  🟩 Clang16            Pass: 100%/1   | Total:  3m 39s | Avg:  3m 39s | Max:  3m 39s | Hits:  99%/591   
  🟩 Clang17            Pass: 100%/1   | Total:  3m 57s | Avg:  3m 57s | Max:  3m 57s | Hits: 100%/591   
  🟩 Clang18            Pass: 100%/1   | Total:  3m 42s | Avg:  3m 42s | Max:  3m 42s | Hits: 100%/591   
  🟩 Clang19            Pass: 100%/4   | Total: 19m 47s | Avg:  4m 56s | Max:  9m 33s | Hits: 100%/2364  
  🟩 GCC10              Pass: 100%/2   | Total:  7m 35s | Avg:  3m 47s | Max:  3m 52s | Hits:  99%/1186  
  🟩 GCC11              Pass: 100%/1   | Total:  3m 56s | Avg:  3m 56s | Max:  3m 56s | Hits:  99%/591   
  🟩 GCC12              Pass: 100%/1   | Total:  4m 10s | Avg:  4m 10s | Max:  4m 10s | Hits:  99%/591   
  🟩 GCC13              Pass: 100%/8   | Total: 42m 40s | Avg:  5m 20s | Max: 11m 03s | Hits:  99%/4728  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 11m 23s | Avg: 11m 23s | Max: 11m 23s | Hits:  95%/292   
  🟩 MSVC14.43          Pass: 100%/1   | Total: 11m 44s | Avg: 11m 44s | Max: 11m 44s | Hits:  95%/292   
  🟩 NVHPC25.5          Pass: 100%/2   | Total: 19m 04s | Avg:  9m 32s | Max:  9m 48s | Hits:  97%/1178  
🟩 cxx_family
  🟩 Clang              Pass: 100%/10  | Total: 42m 13s | Avg:  4m 13s | Max:  9m 33s | Hits:  99%/5914  
  🟩 GCC                Pass: 100%/12  | Total: 58m 21s | Avg:  4m 51s | Max: 11m 03s | Hits:  99%/7096  
  🟩 MSVC               Pass: 100%/2   | Total: 23m 07s | Avg: 11m 33s | Max: 11m 44s | Hits:  95%/584   
  🟩 NVHPC              Pass: 100%/2   | Total: 19m 04s | Avg:  9m 32s | Max:  9m 48s | Hits:  97%/1178  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 12m 37s | Avg:  6m 18s | Max:  8m 46s | Hits:  99%/1182  
  🟩 rtx2080            Pass: 100%/24  | Total:  2h 10m | Avg:  5m 25s | Max: 11m 44s | Hits:  99%/13590 
🟩 jobs
  🟩 Build              Pass: 100%/23  | Total:  1h 53m | Avg:  4m 55s | Max: 11m 44s | Hits:  99%/12999 
  🟩 Test               Pass: 100%/3   | Total: 29m 22s | Avg:  9m 47s | Max: 11m 03s | Hits:  99%/1773  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total: 16m 17s | Avg:  5m 25s | Max:  8m 46s | Hits:  99%/1773  
  🟩 90a                Pass: 100%/1   | Total:  3m 40s | Avg:  3m 40s | Max:  3m 40s | Hits:  99%/591   
🟩 std
  🟩 17                 Pass: 100%/4   | Total: 20m 20s | Avg:  5m 05s | Max:  9m 48s | Hits:  99%/2362  
  🟩 20                 Pass: 100%/22  | Total:  2h 02m | Avg:  5m 33s | Max: 11m 44s | Hits:  99%/12410

🟩 python: Pass: 100%/12 | Total: 2h 00m | Avg: 10m 02s | Max: 23m 49s

🟩 cpu
  🟩 amd64              Pass: 100%/12  | Total:  2h 00m | Avg: 10m 02s | Max: 23m 49s
🟩 ctk
  🟩 12.9               Pass: 100%/12  | Total:  2h 00m | Avg: 10m 02s | Max: 23m 49s
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/12  | Total:  2h 00m | Avg: 10m 02s | Max: 23m 49s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/12  | Total:  2h 00m | Avg: 10m 02s | Max: 23m 49s
🟩 cxx
  🟩 GCC13              Pass: 100%/12  | Total:  2h 00m | Avg: 10m 02s | Max: 23m 49s
🟩 cxx_family
  🟩 GCC                Pass: 100%/12  | Total:  2h 00m | Avg: 10m 02s | Max: 23m 49s
🟩 gpu
  🟩 rtxa6000           Pass: 100%/12  | Total:  2h 00m | Avg: 10m 02s | Max: 23m 49s
🟩 jobs
  🟩 Build cuda.cccl    Pass: 100%/2   | Total:  6m 40s | Avg:  3m 20s | Max:  3m 28s
  🟩 Build cuda.cooperative Pass: 100%/2   | Total:  6m 45s | Avg:  3m 22s | Max:  3m 32s
  🟩 Build cuda.parallel Pass: 100%/2   | Total: 16m 10s | Avg:  8m 05s | Max:  8m 07s
  🟩 Test cuda.cccl     Pass: 100%/2   | Total:  8m 14s | Avg:  4m 07s | Max:  4m 12s
  🟩 Test cuda.cooperative Pass: 100%/2   | Total: 47m 32s | Avg: 23m 46s | Max: 23m 49s
  🟩 Test cuda.parallel Pass: 100%/2   | Total: 35m 09s | Avg: 17m 34s | Max: 17m 47s
🟩 py_version
  🟩 3.10               Pass: 100%/6   | Total:  1h 00m | Avg: 10m 02s | Max: 23m 43s
  🟩 3.13               Pass: 100%/6   | Total:  1h 00m | Avg: 10m 02s | Max: 23m 49s

🟩 packaging: Pass: 100%/4 | Total: 16m 45s | Avg: 4m 11s | Max: 5m 33s

🟩 cpu
  🟩 amd64              Pass: 100%/4   | Total: 16m 45s | Avg:  4m 11s | Max:  5m 33s
🟩 ctk
  🟩 12.0               Pass: 100%/2   | Total:  7m 11s | Avg:  3m 35s | Max:  3m 43s
  🟩 12.9               Pass: 100%/2   | Total:  9m 34s | Avg:  4m 47s | Max:  5m 33s
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/2   | Total:  7m 11s | Avg:  3m 35s | Max:  3m 43s
  🟩 nvcc12.9           Pass: 100%/2   | Total:  9m 34s | Avg:  4m 47s | Max:  5m 33s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 16m 45s | Avg:  4m 11s | Max:  5m 33s
🟩 cxx
  🟩 Clang14            Pass: 100%/1   | Total:  3m 43s | Avg:  3m 43s | Max:  3m 43s
  🟩 Clang19            Pass: 100%/1   | Total:  5m 33s | Avg:  5m 33s | Max:  5m 33s
  🟩 GCC12              Pass: 100%/1   | Total:  3m 28s | Avg:  3m 28s | Max:  3m 28s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 01s | Avg:  4m 01s | Max:  4m 01s
🟩 cxx_family
  🟩 Clang              Pass: 100%/2   | Total:  9m 16s | Avg:  4m 38s | Max:  5m 33s
  🟩 GCC                Pass: 100%/2   | Total:  7m 29s | Avg:  3m 44s | Max:  4m 01s
🟩 gpu
  🟩 rtx2080            Pass: 100%/4   | Total: 16m 45s | Avg:  4m 11s | Max:  5m 33s
🟩 jobs
  🟩 Test               Pass: 100%/4   | Total: 16m 45s | Avg:  4m 11s | Max:  5m 33s

🟩 stdpar: Pass: 100%/4 | Total: 21m 32s | Avg: 5m 23s | Max: 5m 56s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 11m 36s | Avg:  5m 48s | Max:  5m 56s
  🟩 arm64              Pass: 100%/2   | Total:  9m 56s | Avg:  4m 58s | Max:  5m 08s
🟩 ctk
  🟩 12.9               Pass: 100%/4   | Total: 21m 32s | Avg:  5m 23s | Max:  5m 56s
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/4   | Total: 21m 32s | Avg:  5m 23s | Max:  5m 56s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 21m 32s | Avg:  5m 23s | Max:  5m 56s
🟩 cxx
  🟩 NVHPC25.5          Pass: 100%/4   | Total: 21m 32s | Avg:  5m 23s | Max:  5m 56s
🟩 cxx_family
  🟩 NVHPC              Pass: 100%/4   | Total: 21m 32s | Avg:  5m 23s | Max:  5m 56s
🟩 gpu
  🟩 rtx2080            Pass: 100%/4   | Total: 21m 32s | Avg:  5m 23s | Max:  5m 56s
🟩 jobs
  🟩 Build              Pass: 100%/4   | Total: 21m 32s | Avg:  5m 23s | Max:  5m 56s
🟩 std
  🟩 17                 Pass: 100%/2   | Total: 10m 44s | Avg:  5m 22s | Max:  5m 56s
  🟩 20                 Pass: 100%/2   | Total: 10m 48s | Avg:  5m 24s | Max:  5m 40s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 16m 06s | Avg: 8m 03s | Max: 13m 35s | Hits: 98%/328

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 16m 06s | Avg:  8m 03s | Max: 13m 35s | Hits:  98%/328   
🟩 ctk
  🟩 12.9               Pass: 100%/2   | Total: 16m 06s | Avg:  8m 03s | Max: 13m 35s | Hits:  98%/328   
🟩 cudacxx
  🟩 nvcc12.9           Pass: 100%/2   | Total: 16m 06s | Avg:  8m 03s | Max: 13m 35s | Hits:  98%/328   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 16m 06s | Avg:  8m 03s | Max: 13m 35s | Hits:  98%/328   
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 16m 06s | Avg:  8m 03s | Max: 13m 35s | Hits:  98%/328   
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 16m 06s | Avg:  8m 03s | Max: 13m 35s | Hits:  98%/328   
🟩 gpu
  🟩 rtx2080            Pass: 100%/2   | Total: 16m 06s | Avg:  8m 03s | Max: 13m 35s | Hits:  98%/328   
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 31s | Avg:  2m 31s | Max:  2m 31s | Hits:  98%/164   
  🟩 Test               Pass: 100%/1   | Total: 13m 35s | Avg: 13m 35s | Max: 13m 35s | Hits:  98%/164

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
	CCCL Packaging
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	stdpar
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	CCCL Packaging
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	stdpar
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 187)

#	Runner
129	`linux-amd64-cpu16`
15	`windows-amd64-cpu16`
12	`linux-arm64-cpu16`
12	`linux-amd64-gpu-rtxa6000-latest-1`
11	`linux-amd64-gpu-rtx2080-latest-1`
5	`linux-amd64-gpu-h100-latest-1`
3	`linux-amd64-gpu-rtx4090-latest-1`

gonzalobg · 2025-08-25T23:04:47Z

libcudacxx/include/cuda/__warp/warp_match_all.h

+  _CCCL_ASSERT(__lane_mask != lane_mask::none(), "lane_mask must be non-zero");
+  constexpr int __ratio = ::cuda::ceil_div(sizeof(_Up), sizeof(uint32_t));
+  uint32_t __array[__ratio];
+  _CUDA_VSTD::memcpy(__array, _CUDA_VSTD::addressof(__data), sizeof(_Up));


I believe this implementation exhibits undefined behavior if _Tp has padding, because this memcpy will copy the entire object representation, including padding, into the array, which will result in padding bytes being compared by the __match_all_sync. Depending on compiler optimizations, or the values these padding bytes take at runtime (e.g. depending on divergence, etc.), this implementation will non-deterministically produce different results for types with padding.

A compiler intrinsic should be able to properly implement this API, because the compiler knows which bytes of _Tp are padding bytes and can handle those appropriately.

If there is a way to static_assert that _Tp has no padding bytes, we could restrict this API to types without padding. Otherwise, a good library implementation seems challenging (passing this API a type with padding seems like an easy mistake to make), and we should at least update the documentation to call this out.

fbusato added 2 commits May 19, 2025 15:50

add warp_match_all

9b664f9

slightly improve warp_shuffle

9d4b640

fbusato self-assigned this May 19, 2025

fbusato requested review from a team as code owners May 19, 2025 22:56

fbusato added this to CCCL May 19, 2025

fbusato added the 3.1.0 Targeted for 3.1 release label May 19, 2025

fbusato requested review from ericniebler and gonidelis May 19, 2025 22:56

github-project-automation bot moved this to Todo in CCCL May 19, 2025

cccl-authenticator-app bot moved this from Todo to In Review in CCCL May 19, 2025

fbusato added 3 commits May 20, 2025 10:29

fix header

c86d7f6

add missing header

e5c89c4

fix documentation inclusion

f28e98a

Merge branch 'main' into warp-match

198c502

miscco reviewed May 23, 2025

View reviewed changes

libcudacxx/include/cuda/__warp/warp_match_all.h Outdated Show resolved Hide resolved

miscco requested changes May 23, 2025

View reviewed changes

github-project-automation bot moved this from In Review to In Progress in CCCL May 23, 2025

fbusato added 4 commits May 23, 2025 10:32

revert warp_shuffle.h

a8580d1

Add SM70 preconditions

96f279d

use _CCCL_CUDA_COMPILATION and fix headers

a39fc4c

use _CUDA_VSTD::memcpy

3f1bef7

fbusato requested a review from miscco May 23, 2025 17:42

fbusato and others added 2 commits May 23, 2025 10:46

Merge branch 'main' into warp-match

189966f

revert warp_shuffle.rst

c0ae1b2

fbusato enabled auto-merge (squash) May 23, 2025 21:23

fbusato moved this from In Progress to In Review in CCCL May 23, 2025

fbusato added the CI 100% All CI tests passed label May 23, 2025

davebayer requested changes May 25, 2025

View reviewed changes

github-project-automation bot moved this from In Review to In Progress in CCCL May 25, 2025

fbusato and others added 4 commits May 27, 2025 10:10

Update docs/libcudacxx/extended_api/warp/warp_match_all.rst

55b2afc

Co-authored-by: David Bayer <48736217+davebayer@users.noreply.github.com>

Update docs/libcudacxx/extended_api/warp/warp_match_all.rst

5ad952a

Co-authored-by: David Bayer <48736217+davebayer@users.noreply.github.com>

Update libcudacxx/include/cuda/__warp/warp_match_all.h

58628b8

Co-authored-by: David Bayer <48736217+davebayer@users.noreply.github.com>

Update libcudacxx/include/cuda/__warp/warp_match_all.h

64b29a4

Co-authored-by: David Bayer <48736217+davebayer@users.noreply.github.com>

fbusato requested a review from davebayer May 27, 2025 17:21

fbusato moved this from In Progress to In Review in CCCL May 27, 2025

fbusato and others added 4 commits May 29, 2025 16:15

Merge branch 'main' into warp-match

1618778

add lane_mask

d6789a0

minor fix in doc

ad09608

fix formatting

57ae076

Merge branch 'main' into warp-match

17d916d

miscco approved these changes Jun 2, 2025

View reviewed changes

fbusato merged commit 5c5226e into NVIDIA:main Jun 2, 2025
197 checks passed

github-project-automation bot moved this from In Review to Done in CCCL Jun 2, 2025

gonzalobg reviewed Aug 25, 2025

View reviewed changes

Add cuda::device::warp_match_all #4746

Add cuda::device::warp_match_all #4746

Uh oh!

Conversation

fbusato commented May 19, 2025

Description

Uh oh!

github-actions bot commented May 21, 2025

🟨 cudax: Pass: 92%/26 | Total: 2h 24m | Avg: 5m 34s | Max: 14m 26s | Hits: 99%/13662

🟨 stdpar: Pass: 50%/4 | Total: 18m 59s | Avg: 4m 44s | Max: 5m 38s

🟩 cub: Pass: 100%/47 | Total: 10h 47m | Avg: 13m 46s | Max: 35m 42s | Hits: 99%/57218

🟩 thrust: Pass: 100%/47 | Total: 8h 33m | Avg: 10m 55s | Max: 34m 09s | Hits: 99%/84074

🟩 libcudacxx: Pass: 100%/45 | Total: 8h 10m | Avg: 10m 54s | Max: 33m 06s | Hits: 93%/126714

🟩 python: Pass: 100%/12 | Total: 1h 36m | Avg: 8m 03s | Max: 20m 02s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 15m 24s | Avg: 7m 42s | Max: 12m 45s | Hits: 98%/328

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 183)

Uh oh!

github-actions bot commented May 21, 2025

🟩 cub: Pass: 100%/47 | Total: 10h 42m | Avg: 13m 40s | Max: 34m 17s | Hits: 99%/57406

🟩 thrust: Pass: 100%/47 | Total: 8h 29m | Avg: 10m 50s | Max: 33m 58s | Hits: 99%/89096

🟩 libcudacxx: Pass: 100%/45 | Total: 10h 43m | Avg: 14m 18s | Max: 48m 11s | Hits: 84%/127884

🟩 cudax: Pass: 100%/26 | Total: 2h 47m | Avg: 6m 27s | Max: 30m 24s | Hits: 99%/14746

🟩 python: Pass: 100%/12 | Total: 2h 00m | Avg: 10m 03s | Max: 22m 17s

🟩 stdpar: Pass: 100%/4 | Total: 19m 56s | Avg: 4m 59s | Max: 5m 35s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 1h 27m | Avg: 43m 36s | Max: 1h 24m | Hits: 98%/328

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 183)

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

github-actions bot commented May 23, 2025

🟩 cub: Pass: 100%/47 | Total: 1d 22h | Avg: 59m 14s | Max: 1h 33m | Hits: 30%/57406

🟩 thrust: Pass: 100%/47 | Total: 1d 08h | Avg: 41m 51s | Max: 1h 37m | Hits: 60%/89613

🟩 libcudacxx: Pass: 100%/45 | Total: 16h 14m | Avg: 21m 39s | Max: 54m 13s | Hits: 66%/128664

🟩 cudax: Pass: 100%/26 | Total: 3h 21m | Avg: 7m 45s | Max: 14m 28s | Hits: 86%/14772

🟩 python: Pass: 100%/12 | Total: 1h 54m | Avg: 9m 32s | Max: 19m 15s

🟩 stdpar: Pass: 100%/4 | Total: 23m 25s | Avg: 5m 51s | Max: 6m 36s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 18m 34s | Avg: 9m 17s | Max: 14m 29s | Hits: 92%/328

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 183)

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

davebayer commented May 26, 2025

Uh oh!

fbusato commented May 27, 2025

Uh oh!

github-actions bot commented May 27, 2025

🟨 libcudacxx: Pass: 97%/45 | Total: 7h 13m | Avg: 9m 37s | Max: 28m 31s | Hits: 95%/125332

🟨 stdpar: Pass: 75%/4 | Total: 22m 41s | Avg: 5m 40s | Max: 6m 18s

🟩 cub: Pass: 100%/47 | Total: 10h 48m | Avg: 13m 47s | Max: 33m 33s | Hits: 99%/57406

🟩 thrust: Pass: 100%/47 | Total: 8h 35m | Avg: 10m 57s | Max: 33m 57s | Hits: 99%/89613

🟩 cudax: Pass: 100%/26 | Total: 2h 26m | Avg: 5m 38s | Max: 11m 52s | Hits: 99%/14772

🟩 python: Pass: 100%/12 | Total: 1h 57m | Avg: 9m 49s | Max: 22m 58s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 17m 41s | Avg: 8m 50s | Max: 14m 54s | Hits: 98%/328

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 183)

Uh oh!

github-actions bot commented May 30, 2025

🟩 cub: Pass: 100%/47 | Total: 11h 27m | Avg: 14m 37s | Max: 57m 39s | Hits: 99%/57328

🟩 thrust: Pass: 100%/47 | Total: 8h 15m | Avg: 10m 33s | Max: 32m 04s | Hits: 99%/89754

🟩 libcudacxx: Pass: 100%/45 | Total: 7h 07m | Avg: 9m 29s | Max: 27m 51s | Hits: 94%/129951

🟩 cudax: Pass: 100%/26 | Total: 2h 18m | Avg: 5m 19s | Max: 11m 06s | Hits: 99%/14772

Add `cuda::device::warp_match_all` #4746

Add `cuda::device::warp_match_all` #4746