Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "CUDA" wg kryterium: Temat


Tytuł:
Accelerating SELECT WHERE and SELECT JOIN queries on a GPU
Autorzy:
Pietroń, M.
Russek, P.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/305797.pdf
Data publikacji:
2013
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
SQL
CUDA
relational databases
GPU
Opis:
This paper presents implementations of a few selected SQL operations using the CUDA programming framework on the GPU platform. Nowadays, the GPU’s parallel architectures give a high speed-up on certain problems. Therefore, the number of non-graphical problems that can be run and sped-up on the GPU still increases. Especially, there has been a lot of research in data mining on GPUs. In many cases it proves the advantage of offloading processing from the CPU to the GPU. At the beginning of our project we chose the set of SELECT WHERE and SELECT JOIN instructions as the most common operations used in databases. We parallelized these SQL operations using three main mechanisms in CUDA: thread group hierarchy, shared memories, and barrier synchronization. Our results show that the implemented highly parallel SELECT WHERE and SELECT JOIN operations on the GPU platform can be significantly faster than the sequential one in a database system run on the CPU.
Źródło:
Computer Science; 2013, 14 (2); 243-252
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Fetal state evaluation with fuzzy analysis of newborn attributes using CUDA architecture
Autorzy:
Czabański, R.
Wróbel, J.
Jeżewski, J.
Powiązania:
https://bibliotekanauki.pl/articles/333255.pdf
Data publikacji:
2013
Wydawca:
Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:
fuzzy systems
fetal monitoring
support vector machines
CUDA architecture
systemy rozmyte
monitorowanie płodu
architektura CUDA
Opis:
Cardiotocography is a biophysical method of fetal state evaluation involving the recording and analysis of the fetal heart rate (FHR). Since a proper interpretation of the signal is relatively difficult, an automatic classification is often based on computational intelligence methods. The quality of classifiers based on supervised learning algorithms depends on a proper selection of learning data. In case of the fetal state evaluation, the learning is usually based on a set of quantitative parameters of FHR signal and the corresponding reference information determined on the basis of the retrospective analysis of newborn attributes. Values of the single attribute have been used so far as a reference. As a result, a part of information on the actual neonatal outcome has always been lost. The following paper presents a method of the fuzzy reasoning leading to an evaluation of neonatal outcome as a function of three newborn attributes. The fuzzy system was used in the process of a qualitative evaluation of the fetal state based on quantitative analysis of FHR signal using a support vector machine (SVM). In order to improve computational effectiveness, the learning algorithm was implemented in Compute Unified Device Architecture (CUDA). The results of these studies confirm the effectiveness of the proposed method and indicate the possibility of practical usage of the fuzzy system in supervised learning algorithms for the qualitative evaluation of the fetal state.
Źródło:
Journal of Medical Informatics & Technologies; 2013, 22; 125-133
1642-6037
Pojawia się w:
Journal of Medical Informatics & Technologies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Interpretacje cudów Jezusa
Interpretation Jesus’ miracles
Autorzy:
Paciorek, Antoni
Powiązania:
https://bibliotekanauki.pl/articles/611923.pdf
Data publikacji:
2008
Wydawca:
Katolicki Uniwersytet Lubelski Jana Pawła II
Tematy:
cuda Jezusa
cud
Jesus’ miracles
miracle
Opis:
The author presents two directions of interpreting the Biblical relations of miracles which are represented by great figures of the past, namely St. Augustin and St. Thomas, as well as two directions which clearly marked their existence in our contemporary times. These are the interpretation based on depth psychology (Drewermann) and the interpretation of miracles as images and signs of hope (Theissen, Langner, Metz).
Źródło:
Vox Patrum; 2008, 52, 2; 807-818
0860-9411
2719-3586
Pojawia się w:
Vox Patrum
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykorzystanie procesorów graficznych do szybkiego renderingu krajobrazu sferycznego
Efficient GPU-based approach to a spherical terrain rendering
Autorzy:
Tomaszewska, A.
Osobniak, O.
Powiązania:
https://bibliotekanauki.pl/articles/154799.pdf
Data publikacji:
2010
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
generowanie terenu
programowalny procesor graficzny
technologia CUDA
geometry clipmaps
terrain generation
graphics processing unit
CUDA technology
Opis:
W artykule zaprezentowano sposób generowania w czasie rzeczywistym planety o dużej powierzchni oraz wysokim poziomie szczegółowości. Algorytm opracowano na podstawie techniki wykorzystującej mapy obcięcia geometrii, umożliwiając generowanie na bieżąco dowolnego wycinka terenu na podstawie parametrów ustawienia kamery. Algorytm zaprojektowano pod kątem implementacji sprzętowej z wykorzystaniem programowalnego procesora graficznego oraz technologii CUDA.
In the paper there is presented a fast method for large and detailed spherical terrain rendering. Rendering terrain with a high degree of realism is an ongoing need in real-time computer graphics applications. To render scenes of increased sizes and complexity, several terrain rendering algorithms have been proposed in the literature. One of the recent techniques called geometry clipmaps relies on the position of the viewpoint to create multi-resolution representation of the terrain, using nested meshes. In [1] there is proposed very efficient, GPU based approach of this technique for large terrain models. In the paper there are presented techniques which combine procedural approach and geometry clipmaps together. It enables rendering an arbitrary piece of terrain on fly based on the camera parameters. To improve the algorithm efficience most computations were performed on GPU with use of vertex and pixel shaders and CUDA technology. The paper is organized as follows: Section 2 discusses the previous works, Section 3 presents the application of procedural terrein generetion based on the clipmaps and its hardware implementation, whereas the results obtained are given in Section 4. Thge conclusions are presented at the end of the paper.
Źródło:
Pomiary Automatyka Kontrola; 2010, R. 56, nr 7, 7; 790-792
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Zastosowanie bibliotek numerycznych w obliczeniach MEB
Numerical library usage in BEM
Autorzy:
Król, K.
Pańczyk, M.
Powiązania:
https://bibliotekanauki.pl/articles/408740.pdf
Data publikacji:
2014
Wydawca:
Politechnika Lubelska. Wydawnictwo Politechniki Lubelskiej
Tematy:
MEB
biblioteki numeryczne
CUDA
OpenCL
numerical libraries
Opis:
Zastosowanie bibliotek numerycznych pozwala na znaczne skrócenie czasu obliczeń i ułatwienie pisania kodu programu. Popularne biblioteki BLAS i LAPACK doczekały się dojrzałych implementacji pozwalających na wykorzystanie procesorów wielordzeniowych i środowisk obliczeń rozproszonych w postaci odpowiednio PBLAS i SCALAPACK. Aktualnie podobny proces rozwoju dotyczy środowisk związanych z obliczeniami wykonywanymi na procesorach GPU w dwóch głównych implementacjach GPGPU: NVIDIA CUDA i Kronos/ATI OpenCL. Równolegle z rozwojem tych ostatnich toczą się prace nad mieszanymi CPU-GPU wersjami tych bibliotek czego doskonałym przykładem jest MAGMA. W artykule przedstawione zostaną efekty implementacji kilku wybranych bibliotek z tego zakresu zastosowanych do rozwiązania dwuwymiarowego modelu kondensatora płaskiego metodą elementów brzegowych wykorzystującą stałe elementy brzegowe.
Numerical library usage effectively reduce computation time and facilitate code programming. There are modified versions of popular BLAS and LAPACK libraries, dedicated to multi-core and distributed programming respectively PBLAS and SCALAPACK. Currently, a similar development applies to the GPU programming in two major implementations of GPGPU: NVIDIA CUDA and Kronos / ATI OpenCL. In the same time hybrid CPU-GPU versions of these libraries are intensively developed, a good example of that is MAGMA. This paper will present the effects of some of those libraries implementation used to solve the two-dimensional planar capacitor model by the boundary element method with constant boundary elements.
Źródło:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska; 2014, 3; 46-49
2083-0157
2391-6761
Pojawia się w:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Java profiler based on byte code analysis and instrumentation for many-core hardware accelerators
Autorzy:
Pietroń, M.
Karwatowski, M.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/114614.pdf
Data publikacji:
2015
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
virtual machine
CUDA
GPU
profiling
parallel computing
Opis:
One of the most challenging issues in the case of many and multi-core architectures is how to exploit their potential computing power in legacy systems without a deep knowledge of their architecture. The analysis of static dependence and dynamic data dependences of a program run, can help to identify independent paths that could have been computed by individual parallel threads. The statistics of reusing the data and its size is also crucial in adapting the application in GPU many-core hardware architecture because of specific memory hierarchies. The proposed profiling system accomplishes static data analysis and computes dynamic dependencies for Java programs as well as recommends parts of source code with the highest potential for parallelization in GPU. Such an analysis can also provide starting point for automatic parallelization.
Źródło:
Measurement Automation Monitoring; 2015, 61, 7; 385-387
2450-2855
Pojawia się w:
Measurement Automation Monitoring
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
GPU - Accelerated fluid flow approximation of the Active Queues Management algorithms
Aproksymacja płynna algorytmów AQM - wspomagana przez GPU
Autorzy:
Domański, A.
Domańska, J.
Czachórski, T.
Powiązania:
https://bibliotekanauki.pl/articles/375722.pdf
Data publikacji:
2013
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
computer networks
active queue management
CUDA environment
Opis:
In the article we study a model of TCP connection with Active Queue Management in an intermediate IP router. We use the fluid flow approximation technique to model the interactions between the set of TCP flows and AQM algoithms. Computations for fluid flow approximation model are performed in the CUDA environment.
Artykuł opisuje zastosowanie aproksymacji płynnej do modelowania interakcji pomiędzy zbiorem strumieni TCP, a mechanizmami aktywnego zarządzania buforami (AQM). Obliczenia zostały przeprowadzone w środowisku GPU. Wyniki przedstawione w artykule potwierdzają przewagę algorytmu CHOKe nad standardowym algorytmem AQM: mechanizmem RED.
Źródło:
Theoretical and Applied Informatics; 2013, 25, 2; 93-104
1896-5334
Pojawia się w:
Theoretical and Applied Informatics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Performance enhancement of CUDA applications by overlapping data transfer and Kernel execution
Autorzy:
Raju, K.
Chiplunkar, Niranjan N
Powiązania:
https://bibliotekanauki.pl/articles/1956064.pdf
Data publikacji:
2021
Wydawca:
Polskie Towarzystwo Promocji Wiedzy
Tematy:
CPU-GPU
high-performance computing
kernel
data transfer
CUDA streams
obliczenia wysokiej wydajności
jądro
transfer danych
strumienie CUDA
Opis:
The CPU-GPU combination is a widely used heterogeneous computing system in which the CPU and GPU have different address spaces. Since the GPU cannot directly access the CPU memory, prior to invoking the GPU function the input data must be available on the GPU memory. On completion of GPU function, the results of computation are transferred to CPU memory. The CPU-GPU data transfer happens through PCIExpress bus. The PCI-E bandwidth is much lesser than that of GPU memory. The speed at which the data is transferred is limited by the PCI-E bandwidth. Hence, the PCI-E acts as a performance bottleneck. In this paper two approaches are discussed to minimize the overhead of data transfer, namely, performing the data transfer while the GPU function is being executed and reducing the amount of data to be transferred to GPU. The effectiveness of these approaches on the execution time of a set of CUDA applications is realized using CUDA streams. The results of our experiments show that the execution time of applications can be minimized with the proposed approaches.
Źródło:
Applied Computer Science; 2021, 17, 3; 5-18
1895-3735
Pojawia się w:
Applied Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Use of the CUDA Architecture to Increase the Computing Effectiveness of the Simulation Module of a Ceramic Mould Quality Forecasting System
Autorzy:
Hojny, M.
Żaba, K.
Dębiński, T.
Porada, J.
Powiązania:
https://bibliotekanauki.pl/articles/1840904.pdf
Data publikacji:
2020
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
ceramic mould
quality forecasting
computer simulation
casting
CUDA architecture
smoothing
forma ceramiczna
prognozowanie jakości
symulacja komputerowa
odlew
architektura CUDA
Opis:
This paper presents practical capabilities of a system for ceramic mould quality forecasting implemented in an industrial plant (foundry). The main assumption of the developed solution is the possibility of eliminating a faulty mould from a production line just before the casting operation. It allows relative savings to be achieved, and faulty moulds, and thus faulty castings occurrence in the production cycle to be minimized. The numerical computing module (the DEFFEM 3D package), based on the smoothed particle hydrodynamics (SPH) is one of key solutions of the system implemented. Due to very long computing times, the developed numerical module cannot be effectively used to carry out multi-variant simulations of mould filling and solidification of castings. To utilize the benefits from application of the CUDA architecture to improve the computing effectiveness, the most time consuming procedure of looking for neighbours was parallelized (cell-linked list method). The study is complemented by examples of results of performance tests and their analysis.
Źródło:
Archives of Foundry Engineering; 2020, 20, 4; 5-12
1897-3310
2299-2944
Pojawia się w:
Archives of Foundry Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
CUDA accelerated Medical Segmentation metrics with MedEval3D
Autorzy:
Mitura, Jakub
Chrapko, Beata E.
Powiązania:
https://bibliotekanauki.pl/articles/2082265.pdf
Data publikacji:
2022-08
Wydawca:
Warszawska Wyższa Szkoła Informatyki
Tematy:
CUDA
Computer Tomagraphy
PET/CT
medical image segmentation
Opis:
Medical segmentation metrics are crucial for development of correct segmentation algorithms in medical imaging domain. In case of three dimensional large arrays representing studies like CT, PET/CT or MRI of critical importance is availability of library implementing high performance metrics. MedEval3D is created in order to fulfill this need thanks to implementation of CUDA acceleration. Most of implemented metrics like Dice coefficient, Jacard coefficient etc. are based on confusion matrix, what enable effective reuse of calculations across multiple metrics improving performance in such use case. Additionally algorithms like interclass correlation and Mahalanobis distance are also introduced. In both cases their implementations are significantly faster then their counterparts from other available libraries. Lastly programming interface to all of the metrics was created in Julia programming language.
Źródło:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki; 2022, 16, 26; 7-19
1896-396X
2082-8349
Pojawia się w:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Passive Radar Parallel Processing Using General-Purpose Computing on Graphics Processing Units
Autorzy:
Szczepankiewicz, K.
Malanowski, M.
Szczepankiewicz, M.
Powiązania:
https://bibliotekanauki.pl/articles/226475.pdf
Data publikacji:
2015
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
PCL
passive coherent location
parallel implementation
NVIDIA CUDA
Opis:
In the paper an implementation of signal processing chain for a passive radar is presented. The passive radar which was developed at the Warsaw University of Technology, uses FM radio and DVB-T television transmitters as ”illuminators of opportunity”. As the computational load associated with passive radar processing is very high, NVIDIA CUDA technology has been employed for effective implementation using parallel processing. The paper contains the description of the algorithms implementation and the performance results analysis.
Źródło:
International Journal of Electronics and Telecommunications; 2015, 61, 4; 357-363
2300-1933
Pojawia się w:
International Journal of Electronics and Telecommunications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Stereoscopic video chroma key processing using NVIDIA CUDA
Autorzy:
Sagan, J.
Powiązania:
https://bibliotekanauki.pl/articles/106272.pdf
Data publikacji:
2013
Wydawca:
Uniwersytet Marii Curie-Skłodowskiej. Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej
Tematy:
NVIDIA CUDA
chroma key processing
GPU
CPU
stereoscopic images
Opis:
In this paper, I use the NVIDIA CUDA technology to perform the chroma key algorithm on stereoscopic images. NVIDIA CUDA allows to process parallel algorithms on GPU. Input data are stereoscopic images with the monochromatic background and the destination background image. Output data is the combination of inputs by using the chroma key. I compare the algorithm efficiency between the GPU and CPU execution.
Źródło:
Annales Universitatis Mariae Curie-Skłodowska. Sectio AI, Informatica; 2013, 13, 1; 81-87
1732-1360
2083-3628
Pojawia się w:
Annales Universitatis Mariae Curie-Skłodowska. Sectio AI, Informatica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Digital image correlation - universal tools versus custom solutions
Cyfrowa Korelacja Obrazu - Uniwersalne narzędzia a rozwiązania użytkownika
Autorzy:
Marciniak, T.
Bujnowski, S.
Lutowski, Z.
Boroński, D.
Giesko, T.
Powiązania:
https://bibliotekanauki.pl/articles/257990.pdf
Data publikacji:
2010
Wydawca:
Sieć Badawcza Łukasiewicz - Instytut Technologii Eksploatacji - Państwowy Instytut Badawczy
Tematy:
metody korelacji
DIC
GPU
CUDA
wielowątkowość
correlation methods
multithreading
Opis:
The development of optoelectronics and increasing the processing speed of processors encourage the use of different measurement methods with the use of data obtained from the digital cameras. The article presents the test results of the time consumption of the normalised 2D-correlation function. The correlation is one of most commonly used functions in image processing. It searches for a correlation between the two images and requires quite a lot of calculation operations. The speed of this function was examined in a variety of tools, such as MatLab, MatLab with tools Parallel Computing, library OpenCV and OpenCV wer.2.2 with the CUDA platform extension. During tests, the speeds of image processing were determined, especially for images acquired with high-resolution cameras. Conclusions presented concern with application possibilities of correlation methods, including multithreaded processing.
Rozwój optoelektroniki i rosnąca szybkość przetwarzania procesorów zachęca do stosowania różnorodnych metod pomiarowych wykorzystujących dane pozyskane z kamer cyfrowych. W artykule zaprezentowano wyniki badań szybkości działania funkcji korelacji wykorzystywanych przy obróbce obrazów. Jedną z najczęściej wykorzystywanych funkcji w przetwarzaniu obrazów jest funkcja korelacji. Polega ona na poszukiwaniu współzależności pomiędzy dwoma obrazami i wymaga stosunkowo dużego nakładu obliczeniowego. Szybkość działania funkcji sprawdzono podczas wykorzystania różnych narzędziach takich, jak MatLab, MatLab z biblioteką Parallel Computing, biblioteka OpenCV oraz OpenCV wer.2.2 z możliwością wykorzystania technologii CUDA. W trakcie testów wyznaczono uzyskiwane prędkości przetwarzania obrazów, zwłaszcza w przypadku obrazów rejestrowanych za pomocą kamer wysokiej rozdzielczości. Przedstawiono wnioski dotyczące możliwości zastosowania funkcji korelacji, w tym z wykorzystaniem mechanizmu wielowątkowości.
Źródło:
Problemy Eksploatacji; 2010, 4; 19-28
1232-9312
Pojawia się w:
Problemy Eksploatacji
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The comparison of parallel sorting algorithms implemented on different hardware platforms
Autorzy:
Żurek, D.
Pietroń, M.
Wielgosz, M.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/305317.pdf
Data publikacji:
2013
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
parallel algorithms
GPU
OpenMP
CUDA
sorting networks
merge-sort
Opis:
Sorting is a common problem in computer science. There are a lot of well-known sorting algorithms created for sequential execution on a single processor. Recently, many-core and multi-core platforms have enabled the creation of wide parallel algorithms. We have standard processors that consist of multiple cores and hardware accelerators, like the GPU. Graphic cards, with their parallel architecture, provide new opportunities to speed up many algorithms. In this paper, we describe the results from the implementation of a few different parallel sorting algorithms on GPU cards and multi-core processors. Then, a hybrid algorithm will be presented, consisting of parts executed on both platforms (a standard CPU and GPU). In recent literature about the implementation of sorting algorithms in the GPU, a fair comparison between many core and multi-core platforms is lacking. In most cases, these describe the resulting time of sorting algorithm executions on the GPU platform and a single CPU core.
Źródło:
Computer Science; 2013, 14 (4); 679-691
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Sequential Classification of Palm Gestures Based on A* Algorithm and MLP Neural Network for Quadrocopter Control
Autorzy:
Wodziński, M.
Krzyżanowska, A.
Powiązania:
https://bibliotekanauki.pl/articles/221525.pdf
Data publikacji:
2017
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
machine learning
shortest path
sequential data
quadrocopter
GPU
CUDA
Opis:
This paper presents an alternative approach to the sequential data classification, based on traditional machine learning algorithms (neural networks, principal component analysis, multivariate Gaussian anomaly detector) and finding the shortest path in a directed acyclic graph, using A* algorithm with a regression-based heuristic. Palm gestures were used as an example of the sequential data and a quadrocopter was the controlled object. The study includes creation of a conceptual model and practical construction of a system using the GPU to ensure the realtime operation. The results present the classification accuracy of chosen gestures and comparison of the computation time between the CPU- and GPU-based solutions.
Źródło:
Metrology and Measurement Systems; 2017, 24, 2; 265-276
0860-8229
Pojawia się w:
Metrology and Measurement Systems
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies