CUDA Visual Profiler.

Uno strumento CUDA utile da NVIDIA
Scarica ora

CUDA Visual Profiler. Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • Freeware
  • Nome editore:
  • Nvidia
  • Sistemi operativi:
  • Windows XP / Vista / XP X64 / Vista64
  • Dimensione del file:
  • 5.6 MB

CUDA Visual Profiler. Tag


CUDA Visual Profiler. Descrizione

CUDA Visual Profiler è uno strumento dedicato per lavorare con le schede GPU NVIDIA e con il toolkit dedicato. Caratteristiche principali: Esegui un programma CUDA con profilazione abilitato e visualizzando l'output del profiler come tabella. La tabella ha le seguenti colonne per ogni metodo GPU: Timestamp: Timbro di inizio Metodo: nome del metodo GPU. Questa è "MemCopy" per copie di memoria o il nome di un kernel GPU. GPU Time Tempo della CPU ID stream: numero di identificazione per il flusso Colonne solo per i metodi del kernel: Occupazione Contatori Profiler: GLD Uncoalesced: Numero di carichi di memoria globali non coalescati GLD Coalescò: Numero di carichi di memoria globale coalescati GST Uncoalesced: Numero di negozi di memoria globali non coalescati GST Coalested: Numero di negozi di memoria globali coalescati Carico locale: numero di carichi di memoria locale Negozio locale: numero di negozi di memoria locali Branch: Numero di eventi di filiale (istruzione e / o pila di sincronizzazione) ramo divergente: numero di rami divergenti all'interno di un warp Istruzioni: Numero di istruzioni dinamiche (in recupero) Warp serializzato: numero di fili in un serializzazione di ordito in base all'indirizzo (GRF o costante) Avviato CTA: Numero di CTA è stato lanciato sul PM TPC Griglia Dimensioni X: Numero di blocchi nella griglia lungo la dimensione x Grid Size Y: Numero di blocchi nella griglia lungo la dimensione Y Dimensione blocco X: numero di fili in un blocco lungo la dimensione x Block Dimensione y: numero di fili in un blocco lungo la dimensione Y Dimensione blocco z: numero di fili in un blocco lungo la dimensione Z DYN SMEM per blocco: Diminamica Dimensioni della memoria condivisa per blocco in byte STA SMEM per blocco: dimensione della memoria condivisa statica per blocco in byte Reg per filo: numero di registri per filo Colonne solo per Mezione Metodi: Mem Trasferimento Dir: Direzione del trasferimento della memoria, 0: host to Device, 1: Dispositivo per ospitare Dimensione del trasferimento MEM: Dimensione del trasferimento della memoria in Bytes Si prega di fare riferimento alla sezione "Interpretazione dei contatori Profiler" di seguito per ulteriori informazioni sui contatori Profiler. Si noti che i contatori Profiler sono anche indicati come segnali profiler. Visualizza la tabella dei profiler di riepilogo. Ha le seguenti colonne per ogni metodo GPU: Metodo: nome del metodo #Calls: Numero di chiamate GPU USEC: Total GPU Time in Micro Seconds CPU USEC: Total CPU Time in Micro Seconds % GPU Time: Percentuale GPU Time Conta totale per ciascun contatore Profiler Visualizza vari tipi di grafici: Sommario Profiling Data Bar Plot GPU Time Altezza Plot GPU Time Width Plot Profiler Counter Bar Plot PROFILER OUTPUT TABLE COLONCING BARCH PLOCK Confronto Summary Plot Analisi dell'uscita Profiler Elenca il metodo con il numero elevato di: negozi incoerenti carichi incoerenti Serializations warp Confronta l'uscita Profiler per più esecuzioni di programmi dello stesso programma o per diversi programmi. Ogni esecuzione del programma viene definita una sessione. Salva i dati di profilazione per più sessioni. Un gruppo di sessioni è indicato come un progetto. Importa / Esporta i dati del formato CSV CUDA Profiler.


CUDA Visual Profiler. Software correlato