Abstrakt
The paper presents benchmarking a multi-stream application processing a set of input data arrays. Tests have been performed and execution times measured for various numbers of streams and various compute intensities measured as the ratio of kernel compute time and data transfer time. As such, the application and benchmarking is representative of frequently used operations such as vector weighted sum, matrix multiplication etc. The paper shows benefits of using multiple data streams for various compute intensities compared to one stream, benchmarked for 4 GPUs: professional NVIDIA Tesla V100, Tesla K20m, desktop GTX 1060 and mobile GeForce 940MX. Additionally, relative performances are shown for various numbers of kernel computations for these GPUs.
Cytowania
-
4
CrossRef
-
0
Web of Science
-
0
Scopus
Autor (1)
Cytuj jako
Pełna treść
- Wersja publikacji
- Accepted albo Published Version
- DOI:
- Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.15439/2018F17
- Licencja
- otwiera się w nowej karcie
Słowa kluczowe
Informacje szczegółowe
- Kategoria:
- Publikacja w czasopiśmie
- Typ:
- artykuły w czasopismach
- Opublikowano w:
-
Annals of Computer Science and Information Systems
nr 17,
strony 105 - 110,
ISSN: 2300-5963 - ISSN:
- 2300-5963
- Język:
- angielski
- Rok wydania:
- 2018
- Opis bibliograficzny:
- Czarnul P.: Benchmarking overlapping communication and computations with multiple streams for modern GPUs// Annals of Computer Science and Information Systems -Vol. 17, (2018), s.105-110
- DOI:
- Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.15439/2018f17
- Weryfikacja:
- Politechnika Gdańska
wyświetlono 170 razy