Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "GPU" wg kryterium: Wszystkie pola


Wyświetlanie 1-98 z 98
Tytuł:
GPU enhanced simulation of angiogenesis
Autorzy:
Worecki, M.
Wcisło, R.
Powiązania:
https://bibliotekanauki.pl/articles/305573.pdf
Data publikacji:
2012
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
GPU
angiogenesis
tumor
Opis:
In the paper we present the use of graphic processor units to accelerate the most time-consuming stages of a simulation of angiogenesis and tumor growth. By the use of advanced CUDA mechanisms such as shared memory, textures and atomic operations, we managed to speed up the CUDA kernels by a factor of 57x. However, in our simulation we used the GPU as a co-processor and data from CPU was copied back and forth in each phase. It decreased the speedup of rewritten stages by 40%. We showed that the performance of the entire simulation can be improved by a factor of 10 up to 20.
Źródło:
Computer Science; 2012, 13 (1); 35-48
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykorzystanie CPU i GPU do obliczeń w Matlabie
The use of CPU and GPU for calculations in Matlab
Autorzy:
Woźniak, Jarosław
Powiązania:
https://bibliotekanauki.pl/articles/98264.pdf
Data publikacji:
2019
Wydawca:
Politechnika Lubelska. Instytut Informatyki
Tematy:
CPU
GPU
Matlab
Opis:
W artykule zostały przedstawione wybrane rozwiązania wykorzystujące procesory CPU oraz procesory graficzne GPU do obliczeń w środowisku Matlab. Porównywano różne metody wykonywania obliczeń na CPU, jak i na GPU. Zostały wskazane różnice, wady, zalety oraz skutki stosowania wybranych sposobów obliczeń.
The article presents selected solutions using CPU processors and GPUs for calculations in the Matlab environment. Various methods of performing calculations on the CPU as well as on the GPU were compared. Differences, disadvantages, advantages and effects of using selected calculation methods have been indicated.
Źródło:
Journal of Computer Sciences Institute; 2019, 10; 32-35
2544-0764
Pojawia się w:
Journal of Computer Sciences Institute
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykorzystanie GPU do określenia obszaru płomienia w wizyjnym systemie diagnostycznym
Використання gpu для визначення області полумя у візуальній діагностичній системі GPU
Using the GPU to determining the area the flame in the vision diagnostic system
Autorzy:
Sawicki, D.
Powiązania:
https://bibliotekanauki.pl/articles/408442.pdf
Data publikacji:
2015
Wydawca:
Politechnika Lubelska. Wydawnictwo Politechniki Lubelskiej
Tematy:
wykrywanie brzegu obszaru
płomień
spalanie
GPU
виявлення краю області
полум'я
спалення
edge detection
flame
combustion
Opis:
W pracy przedstawiono możliwości zastosowania jednostki GPU do wyznaczenia krawędzi dla obrazów spalania pyłu węglowego. Porównano czas wykonywania operacji oraz dokładność detekcji brzegu obszaru płomienia. Wykorzystano metodę opartą o model konturu aktywnego Chan-Vese. Wyniki badań pokazują, że nastąpiło znaczne przyśpieszenie wykonywania operacji (ok. 400%).
У статті представлені можливості використання пристрою GPU для визначення країв зображення при спалюванні вугільного пилу. Порівняно час виконання і точність виявлення краю області полум'я. Використовується метод, заснований на моделі активного контуру Chan-Vese. Результати досліджень показують, що відбулося істотне прискорення операцій (прибл. 400%).
This paper presents possibility of using GPU to determine the edge of the image pulverized combustion coal. Compared are the operation time and the accuracy of edge detection area of the flame. Used a method based on the active contour model Chan-Vese. The results show that there was a significant acceleration of the operation (up to 400%).
Źródło:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska; 2015, 1; 80-85
2083-0157
2391-6761
Pojawia się w:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
GPU implementation of atomic fluid MD simulation.
Autorzy:
Dawid, Aleksander
Powiązania:
https://bibliotekanauki.pl/articles/2197547.pdf
Data publikacji:
2022
Wydawca:
Politechnika Gdańska
Tematy:
MD simulabon
GPU
atomic fluid
MD parallel algorithm
Opis:
A computer simulation of an atomic fluid on a GPU was implemented using the CUDA architecture. It was shown that the programming model for efficient numerical computing applications was changing with the development of the CUDA architecture. The introduction of the L2 cache decreased the latency between the global GPU memory and the registers. The performed MD simulation using the global memory and registers showed that the average acceleration relative to the CPU reached 80 times for single-precision calculations. Usually, the shared block memory gives much better results for this kind of calculation. We have found that using the shared memory gives acceleration over 116 times in comparison to the CPU. It is about 49% faster than using the global memory and registers. It is shown here that the performance of generally available graphics cards for double-precision calculations is significantly lower than for single-precision calculations. The recorded double-precision acceleration relative to the CPU in our experiment averaged 6 and 7 times for the global and shared memory, respectively. We performed these calculations on two different CUDA enable device systems.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2022, 26, 1; 25-37
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Accelerating SELECT WHERE and SELECT JOIN queries on a GPU
Autorzy:
Pietroń, M.
Russek, P.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/305797.pdf
Data publikacji:
2013
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
SQL
CUDA
relational databases
GPU
Opis:
This paper presents implementations of a few selected SQL operations using the CUDA programming framework on the GPU platform. Nowadays, the GPU’s parallel architectures give a high speed-up on certain problems. Therefore, the number of non-graphical problems that can be run and sped-up on the GPU still increases. Especially, there has been a lot of research in data mining on GPUs. In many cases it proves the advantage of offloading processing from the CPU to the GPU. At the beginning of our project we chose the set of SELECT WHERE and SELECT JOIN instructions as the most common operations used in databases. We parallelized these SQL operations using three main mechanisms in CUDA: thread group hierarchy, shared memories, and barrier synchronization. Our results show that the implemented highly parallel SELECT WHERE and SELECT JOIN operations on the GPU platform can be significantly faster than the sequential one in a database system run on the CPU.
Źródło:
Computer Science; 2013, 14 (2); 243-252
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Równoległa realizacja przykładowego algorytmu genetycznego z wykorzystaniem akceleratorów GPU
Autorzy:
Ratuszniak, P.
Stasiak, A.
Łańcucki, R.
Powiązania:
https://bibliotekanauki.pl/articles/118416.pdf
Data publikacji:
2018
Wydawca:
Politechnika Koszalińska. Wydawnictwo Uczelniane
Tematy:
algorytm genetyczny
programowanie równoległe
akceleracja obliczeń
akceleratory GPU
CUDA
problem komiwojażera
genetic algorithm
parallel programming
computing acceleration
GPU
travelling salesman problem
Opis:
W artykule zaprezentowano praktyczną implementację aplikacji rozwiązującej przykładowy algorytm genetyczny z wykorzystaniem akceleratorów GPU. W tym przypadku zdecydowano się na rozwiązanie za pomocą algorytmu genetycznego typowego problemu optymalizacyjnego, jakim jest problem komiwojażera. Dodatkowo w celu wykorzystania mocy karty graficznej w tworzonej aplikacji wykorzystano technologię programowania na karcie graficznej – technologię Nvidia CUDA.
The paper presents a practical implementation of a local desktop application that solves exemplary genetic algorithm with the use of GPU accelerators. In this case decided with the use of genetic algorithm to solve typical optimization problem which is travelling salesman problem. Additionally used Nvidia CUDA programming technology in order to use power of GPU in created application.
Źródło:
Zeszyty Naukowe Wydziału Elektroniki i Informatyki Politechniki Koszalińskiej; 2018, 13; 63-78
1897-7421
Pojawia się w:
Zeszyty Naukowe Wydziału Elektroniki i Informatyki Politechniki Koszalińskiej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Novel GPU-Enabled Simulator for Large Scale Spiking Neural Networks
Autorzy:
Szynkiewicz, P.
Powiązania:
https://bibliotekanauki.pl/articles/307680.pdf
Data publikacji:
2016
Wydawca:
Instytut Łączności - Państwowy Instytut Badawczy
Tematy:
GPU computing
OpenCL programming technology
parallel simulation
spiking neural networks
Opis:
The understanding of the structural and dynamic complexity of neural networks is greatly facilitated by computer simulations. An ongoing challenge for simulating realistic models is, however, computational speed. In this paper a framework for modeling and parallel simulation of biological-inspired large scale spiking neural networks on high-performance graphics processors is described. This tool is implemented in the OpenCL programming technology. It enables simulation study with three models: Integrate-andfire, Hodgkin-Huxley and Izhikevich neuron model. The results of extensive simulations are provided to illustrate the operation and performance of the presented software framework. The particular attention is focused on the computational speed-up factor.
Źródło:
Journal of Telecommunications and Information Technology; 2016, 2; 34-42
1509-4553
1899-8852
Pojawia się w:
Journal of Telecommunications and Information Technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Modus operandi GPU na przykładzie operacji „Trust” opisanej w Trioch stolicach W.W. Szulgina. Próba analizy
The GPU modus operandi based upon the analysis of the GPU operation codenamed “Trust” described in W.W. Shulgin’s book under the title “Tri stolicy”. The analytical attempt
Autorzy:
Świerczek, Marek
Powiązania:
https://bibliotekanauki.pl/articles/501872.pdf
Data publikacji:
2015
Wydawca:
Agencja Bezpieczeństwa Wewnętrznego
Tematy:
dezinformacja
WCzk/GPU
manipulacja
socjohistoria
MOCR-Trust
disinformation
manipulation
socio-history
Opis:
Artykuł ukazuje metody manipulowania jednostką stosowane przez WCzK/GPU podczas przeprowadzania operacji dezinformacyjnej, zwanej w literaturze aferą MOCR- Trust. Ponieważ archiwa rosyjskie do dnia dzisiejszego nie odtajniły materiałów operacyjnych dotyczących powyższego zagadnienia, w artykule poddano analizie wspomnienia Wasylija Witaljewicza Szulgina – jednej z ofiar manipulacji, autora książki Tri stolicy. Dzięki wsparciu analizy historycznej dorobkiem naukowym psychologii społecznej odtworzono modus operandi stosowany przez sowieckie służby specjalne podczas prowadzenia działań operacyjnych wobec wybranych jednostek.
The article depicts manipulation methods used by the Soviet intelligence organization WCzK/GPU during the disinformation operation known as MOCR-Trust affair. Due to the missing data from the Russian archives, the only possible analytical approach was the analysis of memoires of one of the manipulation objects published in 1927 as a book titled Tri stolicy. By application of the social psychology to the historical analysis, the modus operandi used by the Soviets during the operation named above was reconstructed.
Źródło:
Przegląd Bezpieczeństwa Wewnętrznego; 2015, 7, 12; 211-223
2080-1335
2720-0841
Pojawia się w:
Przegląd Bezpieczeństwa Wewnętrznego
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
GPU-PLWAH: GPU-based implementation of the PLWAH algorithm for compressing bitmaps
Autorzy:
Andrzejewski, W.
Wrembel, R.
Powiązania:
https://bibliotekanauki.pl/articles/206057.pdf
Data publikacji:
2011
Wydawca:
Polska Akademia Nauk. Instytut Badań Systemowych PAN
Tematy:
data warehouse
GPGPU
bitmap index
bitmap index compression
PLWAH
WAH
Opis:
Bitmap indexes are data structures applied to index- ing attributes in databases and data warehouses. A drawback of a bitmap index is that its size increases when the domain of an indexed attribute increases. As a consequence, for wide domains, the size of a bitmap index is too large to be efficiently processed. Hence, various techniques of compressing bitmap indexes have been proposed. A compression technique incurs some system overhead (mainly CPU) for compression and decompression operations. For this reason, we propose to use additional processing power of graphical processing units (GPUs). In this paper, we present the GPU-PLWAH algorithm that is a parallel implementation of the recently developed PLWAH compression algorithm. GPU-PLWAH was experimentally compared to its traditional CPU version as well as to our previously developed parallel GPU implementation of the WAH compression algorithm. The experiments show that applying GPUs significantly reduces compression/decompression time.
Źródło:
Control and Cybernetics; 2011, 40, 3; 627-650
0324-8569
Pojawia się w:
Control and Cybernetics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A new CUDA-based GPU implementation of the two-dimensional Athena code
Autorzy:
Wasilijew, A.
Murawski, K.
Powiązania:
https://bibliotekanauki.pl/articles/201940.pdf
Data publikacji:
2013
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
CUDA-based GPU implementation
two-dimensional Athena code
magnetohydrodynamic equations
Opis:
We present a new version of the Athena code, which solves magnetohydrodynamic equations in two-dimensional space. This new implementation, which we have named Athena-GPU, uses CUDA architecture to allow the code execution on Graphical Processor Unit (GPU). The Athena-GPU code is an unofficial, modified version of the Athena code which was originally designed for Central Processor Unit (CPU) architecture. We perform numerical tests based on the original Athena-CPU code and its GPU counterpart to make a performance analysis, which includes execution time, precision differences and accuracy. We narrowed our tests and analysis only to double precision floating point operations and two-dimensional test cases. Our comparison shows that results are similar for both two versions of the code, which confirms correctness of our CUDA-based implementation. Our tests reveal that the Athena-GPU code can be 2 to 15-times faster than the Athena-CPU code, depending on test cases, the size of a problem and hardware configuration.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2013, 61, 1; 239-250
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Computational aspects of GPU - accelerated sparse matrix - vector multiplication for solving Markov models
Obliczeniowe aspekty mnożenia macierzy rzadkiej przez wektor dla rozwiązywania modeli Markowa przyspieszanego przez karty GPU
Autorzy:
Bylina, B.
Bylina, J.
Karwacki, M.
Powiązania:
https://bibliotekanauki.pl/articles/375696.pdf
Data publikacji:
2011
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
Markovian models
wireless network models
GPU
matrix-vector multiplication
sparse matrices
Opis:
In this article we investigate some computational aspects of GPU-accelerated matrix-vector multiplication where matrix is sparse. Particularly, we deal with sparse matrices appearing in modelling with Markovian queuing models. The model we use for research is a Markovian queuing model of a wireless device. This model describes the device’s behavior during possible channel occupation by other devices. We study the efficiency of multiplication of a sparse matrix by a dense vector with the use of an appropriate, ready-to-use GPU-accelerated mathematical library, namely CUSP. For the CUSP library we discuss data structures and their impact on the CUDA platform for the fine-grained parallel architecture of the GPU. Our aim is to find the best format for storing a sparse matrix for GPU-computation (especially one associated with the Markovian model of a wireless device). We compare the time, the performance and the speed-up for the card NVIDIA Tesla C2050 (with ECC ON). For unstructured matrices (as our Markovian matrices), we observe speed-ups (in respect to CPU-only computations) of over 8 times.
Łańcuchy Markowa są przydatnym narzędziem do modelowania systemów złożonych, takich jak systemy i sieci komputerowe. W ostatnich latach łańcuchy Markowa zostały z powodzeniem wykorzystane do oceny pracy sieci bezprzewodowych. Jednym z problemów jaki się pojawia przy wykorzystywaniu łańcuchów Markowa w modelowaniu sieci są problemy natury obliczeniowej. W artykule zajmiemy się badaniem mnożenia macierzy rzadkiej przez wektor, które jest jedną z głównych operacji podczas numerycznego rozwiązywania modeli Markowowskich. Aby, przyspieszyć czas obliczeń mnożenia macierz rzadkiej przez wektor wykorzystano funkcje z biblioteki CUSP. Biblioteka jest zbiorem funkcji wykonywanych na GPU (ang.Graphics Processing Unit) celem skrócenia czasu obliczeń. Do testowania operacji mnożenia macierzy rzadkiej przez wektor badano macierze z Markowowskiego modelu pracy sieci bezprzewodowej. Model ten opisuje zachowanie urządzenia, gdy kanał transmisyjnych może być zajęty przez inne urządzenia. Macierz przejść wspomnianego modelu jest macierzą rzadką i potrzeba specialnej struktury danych do jej przechowywania, dlatego w artykule dyskutowane są różne struktury danych dla macierzy rzadkich i ich przydatność do obliczen na kartach graficznych. W pracy porównano czas, wydajność i przyspieszenie jakie otrzymano podczas testowania biblioteki CUSP na karcie NVIDIA Tesla C2050 dla niestrukturalnych macierzy rzadkich opisujących model zajętości węzła w sieciach bezprzewodowych przy różnych formatach przechowywania macierzy rzadkich. Dla testowanych macierzy zauważono ośmiokrotne przyspieszenie obliczeń przy wykorzystaniu karty graficznej.
Źródło:
Theoretical and Applied Informatics; 2011, 23, 2; 127-145
1896-5334
Pojawia się w:
Theoretical and Applied Informatics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Novel FE/MC-based Mathematical Model of Mushy Steel Deformation with GPU Support
Autorzy:
Hojny, Marcin
Dębiński, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/2106557.pdf
Data publikacji:
2022
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
FEM
Monte Carlo
extra-high temperatures
soft-reduction
GPU
Opis:
The paper presents the results of work leading to the construction of a spatial hybrid model based on finite element (FE) and Monte Carlo (MC) methods allowing the computer simulation of physical phenomena accompanying the steel sample testing at temperatures that are characteristic for soft-reduction process. The proposed solution includes local density variations at the level of mechanical solution (the incompressibility condition was replaced with the condition of mass conservation), and at the same time simulates the grain growth in a comprehensive resistance heating process combined with a local remelting followed by free/controlled cooling of the sample tested. Simulation of grain growth in the entire computing domain would not be possible without the support of GPU processors. There was a 59-fold increase in the computing speed on the GPU compared to single-threaded computing on the CPU. The study was complemented by examples of experimental and computer simulation results, showing the correctness of the adopted model assumptions.
Źródło:
Archives of Metallurgy and Materials; 2022, 67, 2; 735--742
1733-3490
Pojawia się w:
Archives of Metallurgy and Materials
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Assessment of various GPU acceleration strategies in text categorization processing flow
Autorzy:
Korduła, Ł.
Wielgosz, M.
Karwatowski, M.
Pietroń, M.
Żurek, D.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/114132.pdf
Data publikacji:
2017
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
GPU
NLP
text categorization
OpenCL
Opis:
Automatic text categorization presents many difficulties. Modern algorithms are getting better in extracting meaningful information from human language. However, they often significantly increase complexity of computations. This increased demand for computational capabilities can be facilitated by the usage of hardware accelerators like general purpose graphic cards. In this paper we present a full processing flow for document categorization system. Gram-Schmidt process signatures calculation up to 12 fold decrease in computing time of system components.
Źródło:
Measurement Automation Monitoring; 2017, 63, 6; 203-205
2450-2855
Pojawia się w:
Measurement Automation Monitoring
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Heterogeneous GPU&CPU cluster for High Performance Computing in cryptography
Autorzy:
Marks, M.
Jantura, J.
Niewiadomska-Szynkiewicz, E.
Strzelczyk, P.
Góźdź, K.
Powiązania:
https://bibliotekanauki.pl/articles/305288.pdf
Data publikacji:
2012
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
parallel computing
HPC
clusters
GPU computing
OpenCL
cryptography
cryptanalysis
Opis:
This paper addresses issues associated with distributed computing systems and the application of mixed GPU&CPU technology to data encryption and decryption algorithms. We describe a heterogenous cluster HGCC formed by two types of nodes: Intel processor with NVIDIA graphics processing unit and AMD processor with AMD graphics processing unit (formerly ATI), and a novel software framework that hides the heterogeneity of our cluster and provides tools for solving complex scientific and engineering problems. Finally, we present the results of numerical experiments. The considered case study is concerned with parallel implementations of selected cryptanalysis algorithms. The main goal of the paper is to show the wide applicability of the GPU&CPU technology to large scale computation and data processing.
Źródło:
Computer Science; 2012, 13 (2); 63-79
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
G-DNA – a highly efficient multi-GPU/MPI tool for aligning nucleotide reads
Autorzy:
Frohmberg, W.
Kierzynka, M.
Blazewicz, J.
Gawron, P.
Wojciechowski, P.
Powiązania:
https://bibliotekanauki.pl/articles/200827.pdf
Data publikacji:
2013
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
DNA assembly preprocessing
sequence alignment
GPU computing
Opis:
DNA/RNA sequencing has recently become a primary way researchers generate biological data for further analysis. Assembling algorithms are an integral part of this process. However, some of them require pairwise alignment to be applied to a great deal of reads. Although several efficient alignment tools have been released over the past few years, including those taking advantage of GPUs (Graphics Processing Units), none of them directly targets high-throughput sequencing data. As a result, a need arose to create software that could handle such data as effectively as possible. G-DNA (GPU-based DNA aligner) is the first highly parallel solution that has been optimized to process nucleotide reads (DNA/RNA) from modern sequencing machines. Results show that the software reaches up to 89 GCUPS (Giga Cell Updates Per Second) on a single GPU and as a result it is the fastest tool in its class. Moreover, it scales up well on multiple GPUs systems, including MPI-based computational clusters, where its performance is counted in TCUPS (Tera CUPS).
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2013, 61, 4; 989-992
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
GPU - Accelerated fluid flow approximation of the Active Queues Management algorithms
Aproksymacja płynna algorytmów AQM - wspomagana przez GPU
Autorzy:
Domański, A.
Domańska, J.
Czachórski, T.
Powiązania:
https://bibliotekanauki.pl/articles/375722.pdf
Data publikacji:
2013
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
computer networks
active queue management
CUDA environment
Opis:
In the article we study a model of TCP connection with Active Queue Management in an intermediate IP router. We use the fluid flow approximation technique to model the interactions between the set of TCP flows and AQM algoithms. Computations for fluid flow approximation model are performed in the CUDA environment.
Artykuł opisuje zastosowanie aproksymacji płynnej do modelowania interakcji pomiędzy zbiorem strumieni TCP, a mechanizmami aktywnego zarządzania buforami (AQM). Obliczenia zostały przeprowadzone w środowisku GPU. Wyniki przedstawione w artykule potwierdzają przewagę algorytmu CHOKe nad standardowym algorytmem AQM: mechanizmem RED.
Źródło:
Theoretical and Applied Informatics; 2013, 25, 2; 93-104
1896-5334
Pojawia się w:
Theoretical and Applied Informatics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Akceleracja obliczeń kryptograficznych z wykorzystaniem procesorów GPU
Powiązania:
Studia Bezpieczeństwa Narodowego 2014, nr 6, s. 341-357
Współwytwórcy:
Bęza, Patryk. Autor
Gocławski, Jakub. Autor
Mral, Paweł. Autor
Sapiecha, Piotr. Autor
Buda, Michał. Autor
Data publikacji:
2014
Tematy:
Kryptologia
Szyfry
Procesor graficzny (GPU)
Artykuł z czasopisma naukowego
Opis:
Bibliografia, netografia na stronach 355-357.
Dostawca treści:
Bibliografia CBW
Artykuł
Tytuł:
GPU-based multi-layer perceptron as efficient method for approximation complex light models in per-vertex lighting
Autorzy:
Pietras, K.
Rudnicki, M.
Powiązania:
https://bibliotekanauki.pl/articles/92844.pdf
Data publikacji:
2005
Wydawca:
Uniwersytet Przyrodniczo-Humanistyczny w Siedlcach
Tematy:
sky color
lighting model
GeForce FX
neural network
GPU
graphics processing unit
Opis:
This paper describes a display method of the sky color on GeForce FX hardware. Lighting model used here is taken from “Display of the Earth taking into account atmospheric scattering” by Tomoyuki Nishita et.al., however this model is not the only suitable one in the proposed method.
Źródło:
Studia Informatica : systems and information technology; 2005, 2(6); 53-63
1731-2264
Pojawia się w:
Studia Informatica : systems and information technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Szybka metoda estymacji położenia końcówki bronchofiberoskopu – implementacja w GPU
Fast estimation of bronchofiberoskope ego-motion – GPU based implementation
Autorzy:
Socha, M.
Powiązania:
https://bibliotekanauki.pl/articles/153549.pdf
Data publikacji:
2013
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
przetwarzanie obrazów
nawigacja
bronchoskopia
wspomaganie zabiegów
akceleracja obliczeń
GPGPU
image processing
navigation
bronchoscopy
Opis:
W pracy przedstawiono szybką metodę szacowania położenia końcówki bronchofiberoskopu, będącej ważnym fragmentem prototypowego systemu do wspomagania zabiegów bronchoskopowych. Omówiono sposób działania algorytmu śledzenia ruchu endoskopu oraz przedstawiono szczegóły nowej implementacji algorytmu, która wykorzystuje możliwości obliczeniowe procesorów kart graficznych. Zastosowanie wielordzeniowych procesorów graficznych GPU do przetwarzania obrazów z endoskopu zaowocowało ponad 25. krotym przyśpieszeniem algorytmu.
In this work a new implementation of fast approximation of bronchofibero-scopy ego-motion is presented. This algorithm is an important part of a prototype system to support bronchofiberoscopic treatment. Its goal is to help a doctor to take a sample of a pathological lesion (found in computed tomography scan) by means of needle aspiration, performed from a bronchial tree interior [3, 4]. The approach is based on real-time registration of the 2D endoscopic images and virtual ones generated by a virtual camera located inside a 3D CT-based model of the bronchial tree. To speed up ego-motion estimation [5] in bronchial environment there is used a simplified model of geometric relations based on the cylindrical shape accompanied by the fixation on a carina [6], which reduces the number of degrees of freedom of the motion to four. It is achieved by continuous tracking of the carina (stationary point) illuminated by the camera light source, and by analyzing bronchial wall radial moves relative to the fixed point by correlation in the polar coordinates. Fig. 1 shows estimation of rotation steps, Fig. 2 estimation of translation. Use of the multi-core graphics processing unit (GPU) to process the images from the endoscope allowed reducing the computation time more than 25 times.
Źródło:
Pomiary Automatyka Kontrola; 2013, R. 59, nr 3, 3; 216-219
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Using GPU acceleration in solving selected kinetic coal gasification models
Użycie akceleracji GPU do rozwiązywania wybranych modeli kinetycznych gazyfikacji węgla
Autorzy:
Iwaszenko, S.
Powiązania:
https://bibliotekanauki.pl/articles/1361009.pdf
Data publikacji:
2016
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
GPGPU
modelowanie gazyfikacji węgla
obliczenia równoległe
coal gasification modeling
parallel calculations
Opis:
Coal gasification is recognized as one of clean coal technologies. Though it has been known for a relatively long time, its complexity still challenges scientists all over the world. One of the tools used in the research is simulation. The presented work investigates the capabilities of using GPGPU in modeling coal gasification. The selected set of models is used (volumetric, non-reactive core and Johnson’s). The models as well as numeric solution methods were implemented as a sequential and parallel code. The execution time for both methods was investigated and the speedup for the parallel code determined. The influence of mathematical function call in the GPU code was also checked. The results show that for all models the parallel code gives significant speedup over the serial counterpart, as long as a reasonably large equation set is used. Therefore, using a dedicated GPU code for coal gasification simulations is highly recommended, whenever big systems of ODE have to be solved.
Gazyfikacja węgla uznawana jest za jedną z tzw. czystych technologii węglowych. Chociaż jest znana już względnie długo, jej złożoność wciąż pozostaje wyzwaniem dla naukowców na całym świecie. Jednym z narzędzi używanych w badaniach jest symulacja. W pracy zbadano możliwości użycia GPGPU w modelowaniu gazyfikacji węgla. Użyto wybranego zbioru modeli (objętościowego, rdzenia bezreaktacyjnego i Johnsona). Modele oraz metody rozwiązań numerycznych zaimplementowano, jako kod szeregowy i równoległy. Zbadano czas realizacji obydwu metod oraz określono przyspieszenie kodu równoległego. Sprawdzono również wpływ wywołania funkcji matematycznej w kodzie GPU. Wyniki wskazują, że dla wszystkich modeli kod równoległy powoduje znaczne przyspieszenie obliczeń w stosunku do odpowiednika szeregowego, pod warunkiem, że użyje się wystarczająco dużego zbioru równań. Dlatego zaleca się użycie dedykowanego kodu GPU do symulacji gazyfikacji węgla w każdym przypadku, gdy wymagane jest rozwiązanie dużych systemów ODE.
Źródło:
Mining – Informatics, Automation and Electrical Engineering; 2016, 54, 2; 14-22
2450-7326
2449-6421
Pojawia się w:
Mining – Informatics, Automation and Electrical Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Hybrid CPU/GPU Cluster for Encryption and Decryption of Large Amounts of Data
Autorzy:
Niewiadomska-Szynkiewicz, E.
Marks, M.
Jantura, J.
Podbielski, M.
Powiązania:
https://bibliotekanauki.pl/articles/309363.pdf
Data publikacji:
2012
Wydawca:
Instytut Łączności - Państwowy Instytut Badawczy
Tematy:
AES
computer clusters
cryptography
DES
GPU computing
parallel calculation
software systems
Opis:
The main advantage of a distributed computing system over standalone computer is an ability to share the workload between cores, processors and computers. In our paper we present a hybrid cluster system - a novel computing architecture with multi-core CPUs working together with many-core GPUs. It integrates two types of CPU, i.e., Intel and AMD processor with advanced graphics processing units, adequately, Nvidia Tesla and AMD FirePro (formerly ATI). Our CPU/GPU cluster is dedicated to perform massive parallel computations which is a common approach in cryptanalysis and cryptography. The efficiency of parallel implementations of selected data encryption and decryption algorithms are presented to illustrate the performance of our system.
Źródło:
Journal of Telecommunications and Information Technology; 2012, 3; 32-39
1509-4553
1899-8852
Pojawia się w:
Journal of Telecommunications and Information Technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Exploiting multi-core and many-core parallelism for subspace clustering
Autorzy:
Datta, Amitava
Kaur, Amardeep
Lauer, Tobias
Chabbouh, Sami
Powiązania:
https://bibliotekanauki.pl/articles/331126.pdf
Data publikacji:
2019
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
data mining
subspace clustering
multicore processor
many core processor
GPU computing
eksploracja danych
procesor wielordzeniowy
obliczenia GPU
Opis:
Finding clusters in high dimensional data is a challenging research problem. Subspace clustering algorithms aim to find clusters in all possible subspaces of the dataset, where a subspace is a subset of dimensions of the data. But the exponential increase in the number of subspaces with the dimensionality of data renders most of the algorithms inefficient as well as ineffective. Moreover, these algorithms have ingrained data dependency in the clustering process, which means that parallelization becomes difficult and inefficient. SUBSCALE is a recent subspace clustering algorithm which is scalable with the dimensions and contains independent processing steps which can be exploited through parallelism. In this paper, we aim to leverage the computational power of widely available multi-core processors to improve the runtime performance of the SUBSCALE algorithm. The experimental evaluation shows linear speedup. Moreover, we develop an approach using graphics processing units (GPUs) for fine-grained data parallelism to accelerate the computation further. First tests of the GPU implementation show very promising results.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2019, 29, 1; 81-91
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Small Targets Subpixel Position Estimation using GPU
Estymacja położenia obiektów o bardzo małych rozmiarach z rozdzielczością subpikselową z wykorzystaniem GPU
Autorzy:
Mazurek, P.
Powiązania:
https://bibliotekanauki.pl/articles/154007.pdf
Data publikacji:
2009
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
estymacja
śledzenie ruchu
detekcja
równoległe przetwarzanie obrazów
estimation
motion tracking
detection
parallel image processing
Opis:
Position estimation of small targets occurs in numerous applications and for pixel-size targets subpixel resolution can be obtained using advanced image processing algorithms. Subpixel estimation using Center-of-Gravity (Center-of-Mass) give ability of position estimation with magnitude higher resolution in comparison to the conventional, maxima based search method. Application of COG algorithm [3] needs prior detection of targets using morphological filters. In this article is assumed 3x3 window and up to 2x2 pixels excitation by target. Proposed detection method and COG estimation can be processed in parallel what is important for CPU and GPU (Graphics Processing Unit) implementations due to single-pass image processing. Different implementations are compared (full processing of both algorithms; COG calculation driven by detection; full and prefilled results data storage; two implementations of divide operations in COG) for 1024x1024 input images. For GPU implementation CUDA (Compute Unified Device Architecture) is used.
Konieczność detekcji położenia obiektów o małym rozmiarze, rzędu rozmiaru piksela występuje w wielu praktycznych zastosowaniach cyfrowego przetwarzania obrazów. Dla obiektów o tych rozmiarach występują pobudzenia zwykle większej liczby pikseli, co pozwala na estymację położenia z rozdzielczością subpikselową (podpikselową). Możliwe jest wyznaczanie położenia obiektu w takim przypadku z precyzją kilka, kilkanaście razy większą niż w przypadku estymacji opartej na poszukiwaniu położenia maksymalnej wartości sygnału. W tym celu konieczne jest zastosowanie algorytmu estymacji, takiego jak algorytm środka ciężkości wyliczającego estymaty wokół maksymalnej wartości wykrytej za pomocą filtru morfologicznego. Dla obiektów o rozmiarze rzędu piksela (na przetworniku) pobudzenie dotyczy od jednego do czterech pikseli, jednak konieczne jest uwzględnienie niezbędnej separacji pomiędzy potencjalnymi sąsiednimi obiektami. Jeśli nie występuje nałożenie lub stykanie się obiektów, to za pomocą zaproponowanego detektora morfologicznego dla obrazów w odcieniach szarości możliwe jest wykrycie obiektu. Do precyzyjnego wyznaczania położenia wykorzystano zoptymalizowany algorytm środka ciężkości, w którym zmieniono sposób indeksacji wartości pikseli, tak by zmniejszyć ilość operacji arytmetycznych, zarówno mnożeń jak i dodawań. Ponieważ istotna jest efektywna obliczeniowo realizacja algorytmu porównano dwie zasadnicze implementacje w oparciu o CPU i GPU (Graphical Processing Unit). Kluczowym zagadnieniem jest minimalizacja ilości przesyłanych danych w obu implementacjach, między jednostką przetwarzającą a pamięcią przechowującą obraz wejściowy i wyniki (położenia obiektów). Rozwiązanie bazujące na zoptymalizowanym algorytmie detekcji i estymacji położenia pozwala na jednoprzebiegowe przetwarzanie obrazu, bez konieczności magazynowania wyników pośrednich w stosunkowo wolnej pamięci. Zbadano i porównano różne warianty implementacji, wykorzystujące pełne przetwarzanie wszystkich danych za pomocą obu algorytmów, warunkowe przetwarzanie algorytmu środka ciężkości sterowane detekcją, wstępne wypełnianie pamięci wyników oraz dwa warianty implementacji operacji dzielenia wymaganej przez algorytm środka ciężkości. Uzyskane wyniki pokazują, że implementacja z wykorzystaniem GPU była co najmniej o rząd wielkości szybsza w stosunku do CPU. W badaniach wykorzystano pojedynczy rdzeń CPU Q6600 oraz GPU G80 (Geforce 8800 GTS). Zaproponowane rozwiązania pozwalają na implementację w czasie rzeczywistym, gwarantując maksymalny czas przetwarzania. Dla implementacji z warunkowym przetwarzaniem i wstępnym wypełnianiem pamięci wyników uzyskano statystyczne skrócenie czasu przetwarzania. Oba rozwiązania dzielenia dla GPU były tak samo efektywne, ponieważ zasadniczym ograniczeniem systemu jest przepustowość pamięci. Dla obrazów o rozmiarze 1024x1024 pikseli uzyskano przetwarzanie z szybkością ponad 400 klatek na sekundę, a w wariantach bardziej zoptymalizowanych ponad 800 klatek na sekundę, co pozwala to na wykorzystanie GPU także do innych celów, przy systemach pracujących z mniejszą liczbą klatek na sekundę. Abstract: Position estimation of small targets occurs in numerous applications and for pixel-size targets subpixel resolution can be obtained using advanced image processing algorithms. Subpixel estimation using Center-of-Gravity (Center-of-Mass) give ability of position estimation with magnitude higher resolution in comparison to the conventional, maxima based search method. Application of COG algorithm [3] needs prior detection of targets using morphological filters. In this article is assumed 3x3 window and up to 2x2 pixels excitation by target. Proposed detection method and COG estimation can be processed in parallel what is important for CPU and GPU (Graphics Processing Unit) implementations due to single-pass image processing. Different implementations are compared (full processing of both algorithms; COG calculation driven by detection; full and prefilled results data storage; two implementations of divide operations in COG) for 1024x1024 input images. For GPU implementation
Źródło:
Pomiary Automatyka Kontrola; 2009, R. 55, nr 8, 8; 651-653
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Using GPU to improve performance of calculating recurrence plot
Użycie GPU w celu zwiększenia wydajności obliczania recurrence plot
Autorzy:
Rybak, T.
Powiązania:
https://bibliotekanauki.pl/articles/341073.pdf
Data publikacji:
2010
Wydawca:
Politechnika Białostocka. Oficyna Wydawnicza Politechniki Białostockiej
Tematy:
recurrence plot
analiza fraktalna
optymalizacja
obliczenia równoległe
GPGPU
CUDA
non-linear analysis
fractal analysis
optimisation
parallel computations
Opis:
Simulation and analysis of sophisticated systems require much computations. Moore’s law, although still allows for increasing number of transistors on the die, does not lead to increase of performance of single chip — instead it leads to increased parallelism of entire system. This allows for improving performance of those algorithms that can be parallelised; recurrence plot is one of such algorithms. Graphical Processing Units (GPU) show the largest increase of parallel computations capabilities. At the same time they do not behave as traditional CPUs and require different style of programming to fully utilise their capabilities. Article shows techniques that can be used to increase performance of computing of recurrence plot on GPGPU.
Analiza skomplikowanych systemów wymaga przeprowadzenia wielu obliczeń. Prawo Moore’a, choć wciąż˙ pozostaje w mocy, nie pozwala na zwiększanie wydajności pojedynczego procesora, ale pomaga w tworzeniu wydajnych równoległych systemów. Pozwala to na zwiększanie wydajności dla algorytmów które można zrównoleglić; recurrence plot należy do takich algorytmów. Procesory graficzne (GPU) oferują największą ilość równoległych jednostek obliczeniowych, jednocześnie jednak ich wydajne wykorzystanie wymaga innego podejścia programistycznego. Artykuł opisuje w jaki sposób wykorzystano technologię CUDA do przyśpieszania obliczania recurrence plot.
Źródło:
Zeszyty Naukowe Politechniki Białostockiej. Informatyka; 2010, 6; 77-94
1644-0331
Pojawia się w:
Zeszyty Naukowe Politechniki Białostockiej. Informatyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Application of GPU in the development of 3D hydrodynamics simulators for oil recovery prediction
Zastosowanie procesorów graficznych GPU w rozwoju trójwymiarowych symulatorów hydrodynamicznych w planowaniu wtórnego wydobycia ropy naftowej
Autorzy:
Beisembetov, I. K.
Bekibaev, T. T.
Assilbekov, B. K.
Zhapbasbayev, U. K.
Kenzhaliev, B. K.
Powiązania:
https://bibliotekanauki.pl/articles/299217.pdf
Data publikacji:
2012
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
GPU
CPU
NVIDIA
trójwymiarowe symulatory hydrodynamiczne
planowanie wtórnego wydobycia ropy
3D hydrodynamics simulators
prediction of oil recovery
Opis:
In this article computer's graphics card application in prediction of oil recovery using the CUDA architecture is studied. CUDA is architecture of parallel computing made by NVIDIA Company. It allows increasing dramatically the calculating performance due to GPU (graphical processors) usage. Calculations were executed on field models with 3 million grid blocks. Material balance equation approximated with IMPES method. As the result of numerical modeling of oil recovery prediction with GPU, dozens of times acceleration of calculations comparing with CPU has been taken.
Artykuł przedstawia badania nad programem graficznym wykorzystywanym w planowaniu wtórnego wydobycia ropy naftowej z wykorzystaniem równoległego systemu obliczeniowego CUDA. CUDA jest systemem stworzonym przez firmę NVIDIA. Pozwala on na ogromne zwiększenie mocy obliczeniowej poprzez zastosowanie procesorów graficznych GPU. Porównane zostały wyniki osiągnięte od roku 2003 obliczone z wykorzystaniem zwykłego procesora CPU oraz procesora graficznego GPU. Obliczenia zostały wykonane na modelu złożowym wykonanym na siatce przestrzennej złożonej z 3 milionów komórek. Równanie bilansu masowego w przybliżeniu opisuje metoda przepływu dwufazowego w ośrodku porowatym typu IMPES. W rezultacie modelowania numerycznego wtórnego wydobycia ropy naftowej z wykorzystaniem procesora graficznego GPU, wyniki obliczeń uzyskano wielokrotnie szybciej niż w przypadku stosowania procesora typu CPU.
Źródło:
AGH Drilling, Oil, Gas; 2012, 29, 1; 75-88
2299-4157
2300-7052
Pojawia się w:
AGH Drilling, Oil, Gas
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The GPU performance in coordination of parallel tasks in access to resource groups without conflicts
Autorzy:
Smoliński, M.
Powiązania:
https://bibliotekanauki.pl/articles/94883.pdf
Data publikacji:
2017
Wydawca:
Szkoła Główna Gospodarstwa Wiejskiego w Warszawie. Wydawnictwo Szkoły Głównej Gospodarstwa Wiejskiego w Warszawie
Tematy:
resource conflict elimination
conflict free task execution
mutual exclusion
deadlock avoidance
cooperative concurrency control
GPU massively parallel processing
SIMD control SISD
GPGPU using OpenCL
Opis:
In high contention environments, with limited number of shared resources, elimination of resource conflicts between tasks processed in parallel is required. Execution of all tasks without resource conflicts can be achieved by preparing a proper overall schedule for all of them. The effective calculation of conflict-free execution plan for tasks provides the conflictless scheduling algorithm that is dedicated to GPU massively parallel processing. The conflictless scheduling algorithm base on rapid resource conflict detection to mutual exclusion of conflicted tasks in access to global resources and is an alternative to other task synchronization methods. This article presents the performance of modern GPU in calculations of adaptive conflictless task schedule. The performance analysis also takes into account all data transfers to and from the GPU memory in various phases of the conflictless task scheduling algorithm.
Źródło:
Information Systems in Management; 2017, 6, 2; 143-153
2084-5537
2544-1728
Pojawia się w:
Information Systems in Management
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Fast displacement analysis by digital image correlation (DIC) based on multi-processor graphic cards (GPU)
Szybka analiza przemieszczeń z wykorzystaniem cyfrowej korelacji obrazu (DIC) oraz wieloprocesorowych kart graficznych (GPU)
Autorzy:
Marciniak, T.
Lutowski, Z.
Bujnowski, S.
Boroński, D.
Giesko, T.
Powiązania:
https://bibliotekanauki.pl/articles/257197.pdf
Data publikacji:
2012
Wydawca:
Sieć Badawcza Łukasiewicz - Instytut Technologii Eksploatacji - Państwowy Instytut Badawczy
Tematy:
cyfrowa korelacja obrazu
DIC
wieloprocesorowa karta graficzna
GPU
analiza przemieszczeń i naprężeń
pełne pole obserwacji
digital image correlation
multi-processor graphic cards
whole-field displacement and strain analysis
Opis:
The paper presents a method of fast displacement and strain analysis based on digital image correlation (DIC) and multi-processor graphic cards (GPU). The basic assumption for the discussed displacement and strain measurement method under time variable loads was that high measurement sensitivity by simultaneously minimising measurement time consumption was possible. For this purpose special computing procedures based on multi-processor graphic cards (GPU) were developed that significantly reduced the total time of displacement and strain analysis.
W artykule zaprezentowano metodę szybkiej analizy przemieszczeń i naprężeń z wykorzystaniem cyfrowej korelacji obrazu (DIC) oraz wieloprocesorowych kart graficznych (GPU). Podstawowym założeniem omawianej metody pomiarów przemieszczeń i naprężeń w warunkach zmiennych obciążeń było osiągnięcie wysokiej czułości pomiarowej przez minimalizację czasu pomiaru. W tym celu opracowano specjalne procedury przetwarzania wykorzystujące wieloprocesorową kartę graficzną (GPU), w znaczącym stopniu redukujące całkowity czas procesu analizy przemieszczeń i naprężeń.
Źródło:
Problemy Eksploatacji; 2012, 3; 79-90
1232-9312
Pojawia się w:
Problemy Eksploatacji
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykorzystanie procesorów graficznych do szybkiego przetwarzania obrazów HDR
Fast Processing of HDR Images Based on GPU acceleration
Autorzy:
Mantiuk, R.
Tomaszewska, A.
Pająk, D.
Powiązania:
https://bibliotekanauki.pl/articles/155654.pdf
Data publikacji:
2007
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
obrazy HDR
GPU
przetwarzanie obrazów
analiza obrazów
grafika komputerowa
HDR images
image processing
image analysis
computer graphics
Opis:
Zdjęcia HDR umożliwiają rejestrację jasności sceny, w zakresie widzia-nym przez człowieka. W celu poprawnego odwzorowania luminancji, obrazy HDR zapisywane są za pomocą 4-bajtowych liczb zmiennoprzecinkowych. Pomimo dużej wydajności obecne procesory CPU nie są w stanie przetworzyć w sposób interaktywny tak dużej liczby danych. W artykule zaprezentowano architekturę oraz implementację autorskiej biblioteki do przetwarzania i analizy obrazów HDR, wykorzystując procesor graficzny w charakterze jednostki wspomagającej obliczenia. Poprawność działania biblioteki przetestowano na przykładzie algorytmu kompresji tonów obrazów HDR.
High Dynamic Range imaging technology allows to capture a full range of luminance visible by a human. To achieve accurate reproduction of a luminance, HDR images are stored based on 4-bytes floating-point representation of pixel. Despite growing efficiency current CPU processors are not able to interactively process so huge amount of data. In the paper we present architecture and implementation of a novel library for processing and analysis of HDR images. The architecture of the HDR library is based on a programmable GPU (Graphics Processor Unit) hardware acceleration. We tested accuracy and efficiently of the library for the implementation of HDR tone compression algorithm.
Źródło:
Pomiary Automatyka Kontrola; 2007, R. 53, nr 7, 7; 106-108
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Implementation of Spatio-Temporal Track-Before-Detect Algorithm using GPU
Implementacja przestrzenno-czasowego algorytmu śledzenia przed detekcją z wykorzystaniem GPU
Autorzy:
Mazurek, P.
Powiązania:
https://bibliotekanauki.pl/articles/154011.pdf
Data publikacji:
2009
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
estymacja
śledzenie przed detekcją
cyfrowe przetwarzanie obrazów
przetwarzanie równoległe obrazów
estimation
Track-Before-Detect
digital image processing
parallel image processing
Opis:
Track-Before-Detect (TBD) Algorithms are especially suitable for tracking low-observable targets. For low signal-to-noise ratio (SNR <1) cases tracking of such target is possible using TBD approach. Using accumulative approach and more than single measurements a noise level can be reduced in algorithm way, and gives SNR value enhancement. Due to the target's dynamic the possible motion vectors should be considered. In this article in parallel processing approach based on GPU (Graphics Processing Unit) and CUDA (a software platform for GPU programming) is discussed. GPU gives ability of using high number of stream processors and high clocking frequency for parallel algorithms. Because TBD algorithms have abilities of processing in parallel way they are well suited for GPU implementations and real-time processing. Using sparse characteristic of Markov's matrix the Spatio-Temporal TBD algorithm is considered and different implementations schemes (texture, global memory, global with shared memory) for state space access are compared and real-time processing for typical image sizes are obtained.
Algorytmy śledzenia przed detekcją (TBD - Track-Before-Detect) umożliwiają realizacje systemów estymacji parametrów kinematycznych obiektów także przy warunku SNR<1 (Signal-to-Noise Ratio), co pozwala na śledzenie obiektów, których sygnał jest poniżej wartości szumów. Wykorzystując podejście akumulacyjne oraz więcej niż jeden pomiar możliwe jest zmniejszenie poziomu szumów, a przez to zwiększenie wartości SNR. Z uwagi na dynamikę obiektu konieczne jest uwzględnienie możliwych wektorów ruchu obiektu. Wymagania te powodują, że algorytmy te mają olbrzymi koszt obliczeniowy niezależny od ilości śledzonych obiektów. W artykule zaproponowano rozwiązanie przetwarzania równoległego w czasie rzeczywistym dla obrazów, z wykorzystaniem GPU (Graphical Processing Unit) i platformy programowej CUDA. Zaletą wykorzystania GPU jest możliwość użycia bardzo dużej liczby procesorów strumieniowych, charakteryzujących się prostą budową i wysoką częstotliwością taktowania, co pozwala na efektywną czasowo realizację algorytmów przetwarzania równoległego. Ponieważ algorytmy śledzenia przed detekcją mają cechy predysponujące je do przetwarzania równoległego, więc wykorzystanie GPU jest rozwiązaniem pozwalającym na przetwarzanie w czasie rzeczywistym. W artykule rozpatrywane jest zastosowanie algorytmu rekurencyjnego: przestrzenno-czasowego śledzenia przed detekcją, ze szczególnym uwzględnieniem możliwości redukcji ilości obliczeń dla rzadkich macierzy Markowa. Porównano różne warianty implementacji dla dostępu do wielowymiarowej przestrzeni stanów, która jest przechowywana w pamięci karty graficznej. Dane wejściowe także przechowywane są w pamięci karty graficznej, a dostęp realizowany za pomocą odczytu tekstury, co pozwala na realizację także ułamkowych wektorów ruchu, dzięki wbudowanej interpolacji dwuliniowej. Przestrzeń stanów jest czterowymiarowa i dostęp do niej obciąża znacząco magistralę pamięci. Przetestowano warianty: odczytu z wykorzystaniem tekstur oraz zwykłego dostępu do pamięci, oraz zapisu bezpośredniego i z synchronizowanym buforowaniem w pamięci współdzielonej, uzyskując zbliżone wyniki czasu przetwarzania. Ponieważ w architekturze CUDA nie jest możliwy zapis do tekstury, dlatego konieczne jest dodatkowe kopiowanie wyników przestrzeni stanów do obszaru tekstury, co jednak nie powoduje znaczącego obciążenia w systemie. Wykazano, że możliwa jest realizacja systemów śledzenie przed detekcją z wykorzystaniem GPU pracującym w czasie rzeczywistym. Dla obrazów o rozmiarze 256x256 pikseli osiągnięto ponad 200 klatek na sekundę przy 13 wektorach ruchu, a dla 1024x1024 osiągnięto 15 klatek na sekundę, przy wykorzystaniu procesora G80 (GeForce 8800 GTS).
Źródło:
Pomiary Automatyka Kontrola; 2009, R. 55, nr 8, 8; 657-659
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Hipoteza tłumacząca sposób zainicjowania przez GPU gry operacyjnej z Oddziałem II SG WP w czasie afery „MOCR-Trust” – czyli zagadka Wiktora Tomira Drymmera.
A hypothetical approach to explain the modus operandi used by the Soviet counterintelligence GPU during the initialization of the disinformation operation under the code name MOCR-Trust. The mystery of Victor Tomir Drymmer.
Autorzy:
Świerczek, Marek
Powiązania:
https://bibliotekanauki.pl/articles/501912.pdf
Data publikacji:
2015-11-15
Wydawca:
Agencja Bezpieczeństwa Wewnętrznego
Tematy:
dezinformacja
gra operacyjna
GPU
wywiad, prowokacja
disinformation
operational game
intelligence
prowokacja
Opis:
Artykuł jest próbą wyjaśnienia użycia przez sowiecki kontrwywiad (KRO GPU) w grze operacyjnej prowadzonej w ramach akcji dezinformacyjnej krypt. „Trust” osoby znanej osobiście jednemu z polskich oficerów będących ofiarami sowieckiej prowokacji. Autor wysuwa hipotezę o jakimś rodzaju związku między polskim oficerem a agentem GPU używanym w operacji jako kontakt polskiego wywiadu, tłumaczący brak poinformowania centrali o zakładanym rozpoznaniu sowieckiego agenta. Autor unika jakichkolwiek definitywnych rozstrzygnięć co do charakteru wspomnianej relacji, poprzestając na hipotetycznym założeniu jego prawdopodobnego istnienia.
The article is an attempt to explain, why the Soviet counterintelligence (KRO GPU) used in the operational game – conducted during the famous disinformation operation known under a code name “Trust” – a person known personally to one of Polish officers being victims of the Soviet provocation. The author hypothesizes that there should be some sort of link between the Polish officer and the GPU agent, which would explain the lack of the officer’s report about the assumed recognition of the Soviet provocateur. The author avoids any definitive explanation of that assumed link being satisfied with merely ascertaining of its hypothetical existence.
Źródło:
Przegląd Bezpieczeństwa Wewnętrznego; 2015, 7, 13; 60-85
2080-1335
2720-0841
Pojawia się w:
Przegląd Bezpieczeństwa Wewnętrznego
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Zasady ewidencji operacyjnej „elementu politycznie niepewnego” w sowieckich organach WUCzK–GPU–OGPU w latach 1918–1934
Autorzy:
Laskowska, Switłana
Powiązania:
https://bibliotekanauki.pl/articles/545626.pdf
Data publikacji:
2014
Wydawca:
Instytut Pamięci Narodowej, Komisja Ścigania Zbrodni przeciwko Narodowi Polskiemu
Źródło:
Przegląd Archiwalny Instytutu Pamięci Narodowej; 2014, 7; 71-93
1899-1254
Pojawia się w:
Przegląd Archiwalny Instytutu Pamięci Narodowej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Metoda usuwania duchów na przykładzie akwizycji obrazów HDR z wykorzystaniem wspomagania sprzętowego GPU
Ghosts removal approach for high dynamic range images acquisition based on GPU
Autorzy:
Tomaszewska, A.
Markowski, M.
Powiązania:
https://bibliotekanauki.pl/articles/154035.pdf
Data publikacji:
2009
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
usuwanie duchów
programowalny procesor graficzny
akwizycja obrazów HDR
ghosts removal
graphics processing unit
HDR images acquisition
Opis:
W artykule zaprezentowano szybką i w pełni automatyczną technikę wykrywania i usuwania duchów, powstających w wyniku składania sekwencji zdjęć danej sceny. Prezentowane podejście umożliwia rejestrację sceny bez konieczności wykorzystania specjalistycznego sprzętu. Działanie algorytmu zaprojektowanego pod kątem implementacji sprzętowej z wykorzystaniem procesora GPU oraz zaprezentowano na przykładzie algorytmu akwizycji obrazów o szerokim zakresie dynamiki, weryfikując jego poprawność za pomocą algorytmu HDR VDP.
In the paper we present the method for fast and full automatic approach for ghosts removal on programmable graphics hardware. The technique is based on probability maps that are calculated with comparison function from sequences of hand-held photographs. In practice, several basic problems occur when taking an image sequence. First, the camera is moving which causes images to misalign. This results in a blurry image. Secondly, objects are in movement causing ghost artifacts. In the paper we present a technique for acquisition of non-static scenes. The algorithm we implement as a part of system for acquisition of hand-held high dynamic range (HDR) images. Our application of this technique allows to create correct HDR image based on a simple sequence of the LDR (Low Dynamic Range) photographs with overlapped ghost regions. Additionally, the application aligns photographs and provides image de-noising. Most of computations are efficiently performed on GPU with the use of vertex and pixel shaders. We compare the performance of GPU-based implementation with standard approach and validated our results via HDR VDP (ang. High Dynamic Range Visual Difference Predicator) algorithm. The paper is organized as follows. In section 2 previous works are discussed. In section 3, the application of our HDR acquisition technique and its hardware implementation are presented. Section 4 shows achieved results. Finally we have concluded the paper.
Źródło:
Pomiary Automatyka Kontrola; 2009, R. 55, nr 8, 8; 678-680
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Powieść dokumentalna Franciszka Alachnowicza „7 lat w szponach GPU”: geneza utworu, cztery wersje
“7 years in the clutches of GPU” by Franciszek Alachnowcz’s: oeuvre as a testimony of the epoch
Autorzy:
Moskwin, Andriej
Powiązania:
https://bibliotekanauki.pl/articles/2117790.pdf
Data publikacji:
2019
Wydawca:
Uniwersytet w Białymstoku. Wydawnictwo Uniwersytetu w Białymstoku
Tematy:
Belarus
Belarusian literature
documentary prose
Gulag
the Solovetsky Islands
Franciszek Alachnowicz
Opis:
“7 Years in the Clutches of the GPU” by Franciszek Alachnowicz is a very important book in Belarusian literature. Using his own experience Alachnowicz showed how the Gulag and the process of humiliating a man functioned. In the article its author demonstrates the way Alachnowicz returned to his text four times and each time he supplemented it by adding new details. The book was published in Polish in 1935 and in 1937, and in Belarusian in 1937 and in 1942.
Źródło:
Białorutenistyka Białostocka; 2019; 47-88
2081-2515
Pojawia się w:
Białorutenistyka Białostocka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Execution time prediction model for parallel GPU realizations of discrete transforms computation algorithms
Autorzy:
Puchala, Dariusz
Stokfiszewski, Kamil
Wieloch, Kamil
Powiązania:
https://bibliotekanauki.pl/articles/2173530.pdf
Data publikacji:
2022
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
graphics processing unit
GPU
execution time prediction model
discrete wavelet transform
DWT
lattice structure
convolution-based approach
orthogonal transform
orthogonal filter banks
time effectiveness
prediction accuracy
Opis:
Parallel realizations of discrete transforms (DTs) computation algorithms (DTCAs) performed on graphics processing units (GPUs) play a significant role in many modern data processing methods utilized in numerous areas of human activity. In this paper the authors propose a novel execution time prediction model, which allows for accurate and rapid estimation of execution times of various kinds of structurally different DTCAs performed on GPUs of distinct architectures, without the necessity of conducting the actual experiments on physical hardware. The model can serve as a guide for the system analyst in making the optimal choice of the GPU hardware solution for a given computational task involving particular DT calculation, or can help in choosing the best appropriate parallel implementation of the selected DT, given the limitations imposed by available hardware. Restricting the model to exhaustively adhere only to the key common features of DTCAs enables the authors to significantly simplify its structure, leading consequently to its design as a hybrid, analytically–simulational method, exploiting jointly the main advantages of both of the mentioned techniques, namely: time-effectiveness and high prediction accuracy, while, at the same time, causing mutual elimination of the major weaknesses of both of the specified approaches within the proposed solution. The model is validated experimentally on two structurally different parallel methods of discrete wavelet transform (DWT) computation, i.e. the direct convolutionbased and lattice structure-based schemes, by comparing its prediction results with the actual measurements taken for 6 different graphics cards, representing a fairly broad spectrum of GPUs compute architectures. Experimental results reveal the overall average execution time and prediction accuracy of the model to be at a level of 97.2%, with global maximum prediction error of 14.5%, recorded throughout all the conducted experiments, maintaining at the same time high average evaluation speed of 3.5 ms for single simulation duration. The results facilitate inferring the model generality and possibility of extrapolation to other DTCAs and different GPU architectures, which along with the proposed model straightforwardness, time-effectiveness and ease of practical application, makes it, in the authors’ opinion, a very interesting alternative to the related existing solutions.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2022, 70, 1; e139393, 1--30
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Oskarżenie o współpracę z wywiadem polskim jako narzędzie GPU/NKWD USRS w czystkach w Armii Sowieckiej w latach dwudziestych i trzydziestych XX wieku. Przypadek Henryka Wieczffińskiego i polski wątek sprawy kryptonim „Wiesna”
Accusation of Collaboration with Polish Intelligence as a Tool of the GPU/NKVD of the Ukrainian SSR in the Soviet Army Purges in the 1920s and 1930s. The Case of Henryk Wieczffiński and a Polish Theme in the "Vesna" Case
Autorzy:
Kokin, Serhii
Powiązania:
https://bibliotekanauki.pl/articles/20265847.pdf
Data publikacji:
2022
Wydawca:
Instytut Pamięci Narodowej, Komisja Ścigania Zbrodni przeciwko Narodowi Polskiemu
Tematy:
Henryk Wieczffiński
Józef Piłsudski
Ukrainian Soviet Socialist Republic
OGPU
GPU of Ukraine
"Vesna" case
Ukraińska Socjalistyczna Republika Sowiecka
GPU Ukrainy
sprawa „Wiesna”
Opis:
Porażka Sowietów w wojnie polsko-bolszewickiej w 1920 r. oznaczała upadek ich nadziei na szybki i udany eksport rewolucji proletariackiej do Europy Środkowej i Zachodniej. Symbolem tej ciężkiej klęski geopolitycznej na wiele lat stał się dla bolszewików Józef Piłsudski, toteż walka z jego dziedzictwem w Ukraińskiej Socjalistycznej Republice Sowieckiej (USRS) należała do najważniejszych zadań komunistycznych służb bezpieczeństwa w latach dwudziestych i trzydziestych XX w. Pokazowe pod tym względem były liczne rozpracowania operacyjne i duże grupowe sprawy karne wszczęte w tym okresie przez organy OGPU, w taki czy inny sposób zawsze bowiem był w nich obecny „polski ślad”. Przykładem takiej działalności jest likwidacja przez GPU Ukrainy Wszechzwiązkowej Wojskowo-Oficerskiej Organizacji Kontrrewolucyjnej (sprawa „Wiesna”), w której ramach został aresztowany, a następnie rozstrzelany (12 lipca 1931 r. w Charkowie) por. Henryk Wieczffiński, lotnik obserwator, szef sztabu 20 Brygady Lotniczej Ukraińskiego Okręgu Wojskowego.
The defeat of the Soviets in the Polish-Bolshevik War in 1920 marked the collapse of their hopes for the rapid and successful export of the proletarian revolution to Central and Western Europe. Józef Piłsudski became a long-time symbol of this grave geopolitical defeat for the Bolsheviks, so the fight against his legacy in the Ukrainian Soviet Socialist Republic (USSR) was one of the most important tasks of the Communist security services in the 1920s and 1930s. Demonstrative in this respect were the numerous operational examinations and large collective criminal cases initiated during this period by the OGPU authorities, for in one way or another there was always a "Polish trace" present. An example of such activity is the liquidation of the All-Union Military-Officer Counterrevolutionary Organisation by the GPU of Ukraine (the "Vesna" case), as part of which Lt. Henryk Wieczffiński, an observer pilot, chief of staff of the 20th Aviation Brigade of the Ukrainian Military District, was arrested and subsequently executed (12 July 1931 in Kharkov).
Źródło:
Aparat Represji w Polsce Ludowej 1944–1989; 2022, 20; 375-392
1733-6996
Pojawia się w:
Aparat Represji w Polsce Ludowej 1944–1989
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Smoothed particle hydrodynamics simulations using graphics processing units
Autorzy:
Szewc, K.
Powiązania:
https://bibliotekanauki.pl/articles/1954445.pdf
Data publikacji:
2014
Wydawca:
Politechnika Gdańska
Tematy:
fluid dynamics
CFD
particle methods
SPH
GPU calculations
Opis:
Smoothed Particle Hydrodynamics (SPH) is a fully Lagrangian, particle-based technique for fluid-flow modeling. As a gridless method, it appears to be a natural approach to simulate multi-phase flow with complex geometries. Since SPH involves a large set of short-range particle-particle interactions, numerical implementations present a high degree of spatial data locality and a significant number of independent computations. Therefore, the numerical code can be easily written in a massively parallel manner. The main purpose of this study is to discuss the issues related to the implementation of the SPH method for computation using Graphics Processing Units (GPU). The study is supported by two-dimensional validation cases: the lid-driven cavity and oscillation of a droplet. The obtained results show a good accuracy of the method, as well as, high numerical efficiency of its GPU implementation.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2014, 18, 1; 67-80
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
GPU software and architecture comparison for numerical simulation of partial deferential equations
Autorzy:
May, Jon B.
Pera, Donato
Powiązania:
https://bibliotekanauki.pl/articles/1955286.pdf
Data publikacji:
2018
Wydawca:
Politechnika Gdańska
Tematy:
GPGPU
PDE
Opis:
This paper will show a comparison between the Kepler, Maxwell and Pascal GPU architectures using CUDA-Fortran, with and without dynamic calls, to efficiently solve partial differential equations. The target is to show the possibility of using affordable hardware, such astheGTX670,GTX970 andGTX1080 NVIDIA GPUs, which are commonly found in personal and portable computers, for scientific applications. For simplicity we consider a standard wave equation where we use a second order finite difference method for the spatial and time discretizations to obtain the numerical solution. We found that, as we increase the spatialre solution of the domain we also increase the performance difference between the GPU and the Central Processing Unit (CPU).
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2018, 22, 1; 85-100
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Stereoscopic video chroma key processing using NVIDIA CUDA
Autorzy:
Sagan, J.
Powiązania:
https://bibliotekanauki.pl/articles/106272.pdf
Data publikacji:
2013
Wydawca:
Uniwersytet Marii Curie-Skłodowskiej. Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej
Tematy:
NVIDIA CUDA
chroma key processing
GPU
CPU
stereoscopic images
Opis:
In this paper, I use the NVIDIA CUDA technology to perform the chroma key algorithm on stereoscopic images. NVIDIA CUDA allows to process parallel algorithms on GPU. Input data are stereoscopic images with the monochromatic background and the destination background image. Output data is the combination of inputs by using the chroma key. I compare the algorithm efficiency between the GPU and CPU execution.
Źródło:
Annales Universitatis Mariae Curie-Skłodowska. Sectio AI, Informatica; 2013, 13, 1; 81-87
1732-1360
2083-3628
Pojawia się w:
Annales Universitatis Mariae Curie-Skłodowska. Sectio AI, Informatica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Real Time Processing of Networked Passive Coherent Location Radar System
Autorzy:
John, M.
Inggs, M.
Petri, D.
Powiązania:
https://bibliotekanauki.pl/articles/226268.pdf
Data publikacji:
2011
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
passive
PCL
real-time
GPU
Opis:
A Passive Coherent Location (PCL) Radar system, consisting of spatially distributed transmitters and receivers is currently being integrated at the University of Cape Town (UCT). The paper investigates the feasibility of real-time processing of PCL system signals using Graphic Processing Units (GPUs), specifically a study of two distinct clutter cancellation algorithms: ECA (Extensive Cancellation Algorithm) and NLMS (Normalised Least Mean Square). Clutter cancellation is the most computationally demanding part of PCL signal processing. This investigation compares the processing speed-up achieved by GPU over CPU implementations, with very encouraging results.
Źródło:
International Journal of Electronics and Telecommunications; 2011, 57, 3; 363-368
2300-1933
Pojawia się w:
International Journal of Electronics and Telecommunications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Modeling and rendering of convective cumulus clouds for real-time graphics purposes
Autorzy:
Kobak, P.
Alda, W.
Powiązania:
https://bibliotekanauki.pl/articles/305238.pdf
Data publikacji:
2017
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
computer graphics
natural phenomena
GPU programming
Opis:
The paper presents a simulation and rendering model of three dimensional covective cloud evolution. The model is physically based, however its purpose is graphical. The main stress is put on balancing two parts of a model: the atmsphere simulation with convective motion of air and water vapor combined with rendering of semi-transparent and light-scattering clouds, in order to achieve realistic animation in real-time. We examine and compare two algorithmic approaches based on CPU and GPU computations.
Źródło:
Computer Science; 2017, 18 (3); 241-268
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Symulacja metody kwantowych trajektorii dla problemów optyki kwantowej oraz informatyki kwantowej
Simulating the quantum trajectories method for problems related to quantum optics and quantum computing
Autorzy:
Wiśniewska, J.
Sawerwain, M.
Powiązania:
https://bibliotekanauki.pl/articles/404272.pdf
Data publikacji:
2015
Wydawca:
Polskie Towarzystwo Symulacji Komputerowej
Tematy:
metoda kwantowych trajektorii
symulacja kwantowych systemów otwartych
obliczenia numeryczne
technologia CUDA
obliczenia GPU
quantum trajectories method
simulation of open quantum systems
numerical computations
CUDA technology
GPU computation
Opis:
W artykule została przedstawiona równoległa implementacja odmiany metody Monte Carlo do symulacji dynamiki kwantowych systemów otwartych – jest to tzw. metoda kwantowych trajektorii (QTM). Implementacja została wykonana za pomocą technologii CUDA i obejmuje ona realizację procedury numerycznej odpowiedzialnej za algorytm QTM. W artykule została też pokazana wydajność otrzymanych metod numerycznych dla QTM w stosunku do innych znanych implementacji.
The chapter contains a parallel implementation of Monte Carlo method for simulating the open quantum systems’ dynamics. The mentioned approach is the Quantum Trajectories Method (QTM). The implementation is carried out with use of CUDA technology and it is based on a numerical procedure realizing QTM algorithm. The chapter presents also a comparison of elaborated numerical methods’ performance in comparison to other existing implementations.
Źródło:
Symulacja w Badaniach i Rozwoju; 2015, 6, 1; 67-75
2081-6154
Pojawia się w:
Symulacja w Badaniach i Rozwoju
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
MPI-GPU/CUDA implementation of TVDLF method for the two-dimensional advection equation
Autorzy:
Murawski, K.
Stpiczyński, P.
Powiązania:
https://bibliotekanauki.pl/articles/206329.pdf
Data publikacji:
2014
Wydawca:
Polska Akademia Nauk. Instytut Badań Systemowych PAN
Tematy:
computer science
modelling
numerical methods
hyperbolic equations
Opis:
We implement Total Variation Diminishing Lax Friedrichs (TVDLF, or Rusanov) method to obtain numerical solutions of the two-dimensional advection equation. Despite the simplicity of this equation, solving it numerically is a formidable task. Based on the use of the original C++ MPI-GPU/CUDA code we present results of numerical tests we performed. These tests show that our code represents well the square wave profiles, leading to up to 60- times faster calculations with the use of MPI than with its serial counter-part.
Źródło:
Control and Cybernetics; 2014, 43, 2; 307-320
0324-8569
Pojawia się w:
Control and Cybernetics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
GPU-based parallel algorithm of interaction induced light scatering simulation in fluids
Autorzy:
Dawid, Aleksander
Powiązania:
https://bibliotekanauki.pl/articles/1954464.pdf
Data publikacji:
2019
Wydawca:
Politechnika Gdańska
Tematy:
GPGPU
CUDA
interaction induced phenomena
many body correlation function
parallel algorithm
Opis:
We parallelized the sequential algorithm of the four-body correlation function if eachcombination of two pairs(i, j)and(k, l) was averaged over the time in a separate calculation thread. The generator of pairs used as the input for this algorithm was also parallelized and connected with the 4-body correlation function calculations. We used our algorithm to accelerate extremely intensive calculations of the 4-body polarizability anisotropy correlation functions,which were very important to estimate the interaction induced light scattering spectrum. The resulting C code was used to test our algorithm on Graphics Processing Units (GPUs) with the Compute Unified Device Architecture (CUDA) technology from NVIDIA®Corporation. Asa result, we achieved 12 times the acceleration of the 4-body correlation function calculations in comparison to the Central Processing Unit (CPU) core. The peak performance of the GPU calculations was registered at the level of 19 times faster than the CPU core. We also found thatacceleration depended on the memory consumption. In the single precision mode, the relative error between the CPU and GPU calculations was found to be within 0.1%
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2019, 23, 1; 5-17
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Flexible job shop problem - parallel tabu search algorithm for multi-GPU
Autorzy:
Bożejko, W.
Uchroński, M.
Wodecki, M.
Powiązania:
https://bibliotekanauki.pl/articles/229502.pdf
Data publikacji:
2012
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
jobs scheduling
flexible manufacturing
parallel algorithm
discrete optimization
Opis:
In the paper we propose a new framework for the distributed tabu search algorithm designed to be executed with the use of a multi-GPU cluster, in which cluster of nodes are equipped with multicore GPU computing units. The proposed methodology is designed specially to solve difficult discrete optimization problems, such as a flexible job shop scheduling problem, which we introduce as a case study used to analyze the efficiency of the designed synchronous algorithm.
Źródło:
Archives of Control Sciences; 2012, 22, 4; 389-397
1230-2384
Pojawia się w:
Archives of Control Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A framework for cost based optimization of hybrid CPU/GPU query plans in database systems
Autorzy:
Bress, S.
Geist, I.
Schallehn, E.
Mory, M.
Saake, G.
Powiązania:
https://bibliotekanauki.pl/articles/205723.pdf
Data publikacji:
2012
Wydawca:
Polska Akademia Nauk. Instytut Badań Systemowych PAN
Opis:
Current database research identified the use of computational power of GPUs as a way to increase the performance of database systems. As GPU algorithms are not necessarily faster than their CPU counterparts, it is important to use the GPU only if it is beneficial for query processing. In a general database context, only few research projects address hybrid query processing, i.e., using a mix of CPU- and GPU-based processing to achieve optimal performance. In this paper, we extend our CPU/GPU scheduling framework to support hybrid query processing in database systems. We point out fundamental problems and propose an algorithm to create a hybrid query plan for a query using our scheduling framework. Additionally, we provide cost metrics, accounting for the possible overlapping of data transfers and computation on the GPU. Furthermore, we present algorithms to create hybrid query plans for query sequences and query trees.
Źródło:
Control and Cybernetics; 2012, 41, 4; 715-742
0324-8569
Pojawia się w:
Control and Cybernetics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Very Fast Non-Dominated Sorting
Autorzy:
Smutnicki, C.
Rudy, J.
Żelazny, D.
Powiązania:
https://bibliotekanauki.pl/articles/375948.pdf
Data publikacji:
2014
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
parallel algorithms
Pareto sorting
computational complexity
GPU computing
multiple criteria decision analysis
NSGA-II
Opis:
A new and very efficient parallel algorithm for the Fast Non-dominated Sorting of Pareto fronts is proposed. By decreasing its computational complexity, the application of the proposed method allows us to increase the speedup of the best up to now Fast and Elitist Multi-Objective Genetic Algorithm (NSGA-II) more than two orders of magnitude. Formal proofs of time complexities of basic as well as improved versions of the procedure are presented. The provided experimental results fully confirm theoretical findings.
Źródło:
Decision Making in Manufacturing and Services; 2014, 8, 1-2; 13-23
1896-8325
2300-7087
Pojawia się w:
Decision Making in Manufacturing and Services
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Using shared memory as a cache in cellular automata water flow simulations on GPUs
Autorzy:
Topa, P.
Młocek, P.
Powiązania:
https://bibliotekanauki.pl/articles/305529.pdf
Data publikacji:
2013
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
cellular automata
GPU computation
modelling physical phenomena
Opis:
Graphics processors (GPU – Graphic Processor Units) recently have gained a lot of interest as an efficient platform for general-purpose computation. Cellular Automata approach which is inherently parallel gives the opportunity to implement high performance simulations. This paper presents how shared memory in GPU can be used to improve performance for Cellular Automata models. In our previous works, we proposed algorithms for Cellular Automata model that use only a GPU global memory. Using a profiling tool, we found bottlenecks in our approach. With this paper, we will introduce modifications that takes an advantage of fast shared memory. The modified algorithm is presented in details, and the results of profiling and performance test are demonstrated. Our unique achievement is comparing the efficiency of the same algorithm working with a global and shared memory.
Źródło:
Computer Science; 2013, 14 (3); 385-401
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Acceleration of image reconstruction process in the electrical capacitance tomography 3D in heterogeneous, Multi-GPU system
Przyspieszanie procesu rekonstrukcji obrazu w elektrycznej tomografii pojemnościowej 3D z wykorzystaniem heterogenicznego systemu Multi-GPU
Autorzy:
Majchrowicz, M.
Kapusta, P.
Jackowska-Strumiłło, L.
Sankowski, D.
Powiązania:
https://bibliotekanauki.pl/articles/408191.pdf
Data publikacji:
2017
Wydawca:
Politechnika Lubelska. Wydawnictwo Politechniki Lubelskiej
Tematy:
electrical capacitance tomography
reconstruction algorithms
matrix computation
distributed system
elektryczna tomografia pojemnościowa
algorytm rekonstrukcji
obliczenia macierzowe
system rozproszony
Opis:
Electrical capacitance tomography is an innovative method for visualization of industrial processes. One of its main advantages is it’s high time resolution that allows to the usage of ECT in systems with high volatility. In recent years there has been significant development of electrical capacitance tomography 3D, which however, has significantly reduced industrial it’s applications due to the complicated process of image reconstruction. The authors propose the use of multi-node, multi-GPU system to accelerate the process of image reconstruction in ECT 3D.
Elektryczna tomografia pojemnościowa jest innowacyjną metodą wizualizacji procesów przemysłowych. Jedną z jej głównych zalet jest duża rozdzielczość czasowa pozwalająca na zastosowanie ECT w instalacjach o dużej zmienności. W ostatnich latach nastąpił znaczący rozwój elektrycznej tomografii pojemnościowej 3D, która jednakże ma znacznie ograniczone zastosowanie przemysłowe ze względu na skomplikowany proces rekonstrukcji obrazu. Autorzy artykułu proponują zastosowanie wielowęzłowego systemu Multi-GPU do przyspieszenia procesu rekonstrukcji obrazu w ECT 3D.
Źródło:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska; 2017, 7, 1; 37-41
2083-0157
2391-6761
Pojawia się w:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Application of the Lattice Boltzmann Method to the flow past a sphere
Autorzy:
Kajzer, A.
Pozorski, J.
Powiązania:
https://bibliotekanauki.pl/articles/281895.pdf
Data publikacji:
2017
Wydawca:
Polskie Towarzystwo Mechaniki Teoretycznej i Stosowanej
Tematy:
bluff-body flow
Lattice Boltzmann Method
Large Eddy Simulation
GPU computing
Opis:
The results of fully resolved simulations and large eddy simulations of bluff-body flows obtained by means of the Lattice Boltzmann Method (LBM) are reported. A selection of Reynolds numbers has been investigated in unsteady laminar and transient flow regimes. Computed drag coefficients of a cube have been compared with the available data for validation purposes. Then, a more detailed analysis of the flow past a sphere is presented, including also the determination of vortex shedding frequency and the resulting Strouhal numbers. Advantages and drawbacks of the chosen geometry implementation technique, so called “staircase geometry”, are discussed. For the quest of maximum computational effi- ciency, all simulations have been carried out with the use of in-house code executed on GPU.
Źródło:
Journal of Theoretical and Applied Mechanics; 2017, 55, 3; 1091-1099
1429-2955
Pojawia się w:
Journal of Theoretical and Applied Mechanics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Java profiler based on byte code analysis and instrumentation for many-core hardware accelerators
Autorzy:
Pietroń, M.
Karwatowski, M.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/114614.pdf
Data publikacji:
2015
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
virtual machine
CUDA
GPU
profiling
parallel computing
Opis:
One of the most challenging issues in the case of many and multi-core architectures is how to exploit their potential computing power in legacy systems without a deep knowledge of their architecture. The analysis of static dependence and dynamic data dependences of a program run, can help to identify independent paths that could have been computed by individual parallel threads. The statistics of reusing the data and its size is also crucial in adapting the application in GPU many-core hardware architecture because of specific memory hierarchies. The proposed profiling system accomplishes static data analysis and computes dynamic dependencies for Java programs as well as recommends parts of source code with the highest potential for parallelization in GPU. Such an analysis can also provide starting point for automatic parallelization.
Źródło:
Measurement Automation Monitoring; 2015, 61, 7; 385-387
2450-2855
Pojawia się w:
Measurement Automation Monitoring
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The comparison of parallel sorting algorithms implemented on different hardware platforms
Autorzy:
Żurek, D.
Pietroń, M.
Wielgosz, M.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/305317.pdf
Data publikacji:
2013
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
parallel algorithms
GPU
OpenMP
CUDA
sorting networks
merge-sort
Opis:
Sorting is a common problem in computer science. There are a lot of well-known sorting algorithms created for sequential execution on a single processor. Recently, many-core and multi-core platforms have enabled the creation of wide parallel algorithms. We have standard processors that consist of multiple cores and hardware accelerators, like the GPU. Graphic cards, with their parallel architecture, provide new opportunities to speed up many algorithms. In this paper, we describe the results from the implementation of a few different parallel sorting algorithms on GPU cards and multi-core processors. Then, a hybrid algorithm will be presented, consisting of parts executed on both platforms (a standard CPU and GPU). In recent literature about the implementation of sorting algorithms in the GPU, a fair comparison between many core and multi-core platforms is lacking. In most cases, these describe the resulting time of sorting algorithm executions on the GPU platform and a single CPU core.
Źródło:
Computer Science; 2013, 14 (4); 679-691
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Grammar based multi-frontal solver for isogeometric analysis in 1d
Autorzy:
Kuźnik, K.
Paszyński, M
Calo, V.
Powiązania:
https://bibliotekanauki.pl/articles/305531.pdf
Data publikacji:
2013
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
graph grammar
direct solver
isogeometric finite element method
NVIDIA CUDA GPU
Opis:
In this paper, we present a multi-frontal direct solver for one-dimensional iso-geometric finite element method. The solver implementation is based on the graph grammar (GG) model. The GG model allows us to express the entire solver algorithm, including generation of frontal matrices, merging, and eliminations as a set of basic undividable tasks called graph grammar productions. Having the solver algorithm expressed as GG productions, we can find the partial order of execution and create a dependency graph, allowing for scheduling of tasks into shared memory parallel machine. We focus on the implementation of the solver with NVIDIA CUDA on the graphic processing unit (GPU). The solver has been tested for linear, quadratic, cubic, and higher-order B-splines, resulting in logarithmic scalability.
Źródło:
Computer Science; 2013, 14 (4); 589-613
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
GPU-based tuning of quantum-inspired genetic algorithm for a combinatorial optimization problem
Autorzy:
Nowotniak, R.
Kucharski, J.
Powiązania:
https://bibliotekanauki.pl/articles/201268.pdf
Data publikacji:
2012
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
quantum-inspired genetic algorithm
evolutionary computing
meta-optimization
parallel algorithms
GPGPU
Opis:
This paper concerns efficient parameters tuning (meta-optimization) of a state-of-the-art metaheuristic, Quantum-Inspired Genetic Algorithm (QIGA), in a GPU-based massively parallel computing environment (NVidia CUDATMtechnology). A novel approach to parallel implementation of the algorithm has been presented. In a block of threads, each thread transforms a separate quantum individual or different quantum gene; In each block, a separate experiment with different population is conducted. The computations have been distributed to eight GPU devices, and over 400× speedup has been gained in comparison to Intel Core i7 2.93GHz CPU. This approach allows efficient meta-optimization of the algorithm parameters. Two criteria for the meta-optimization of the rotation angles in quantum genes state space have been considered. Performance comparison has been performed on combinatorial optimization (knapsack problem), and it has been presented that the tuned algorithm is superior to Simple Genetic Algorithm and to original QIGA algorithm.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2012, 60, 2; 323-330
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Telegramy Jekatieriny Pieszkowej do Polskiej Sekcji GPU z interwencjami w bieżących sprawach wymiany : 1924, sierpień 28, Moskwa.
Autorzy:
Peškova, Ekaterina.
Powiązania:
Wymiana więźniów politycznych pomiędzy II Rzecząpospolitą a Sowietami w okresie międzywojennym : dokumenty i materiały Warszawa, 2000 S. 171-172
Współwytwórcy:
Materski, Wojciech. Opracowanie
Data publikacji:
2000
Tematy:
Wymiana więźniów politycznych sierpień 1924 r.
Opis:
Tekst w jęz. ros.
Indeks.
Dostawca treści:
Bibliografia CBW
Artykuł
Tytuł:
Real-time motion tracking using optical flow on multiple GPUs
Autorzy:
Mahmoudi, S. A.
Kierzynka, M.
Manneback, P.
Kurowski, K.
Powiązania:
https://bibliotekanauki.pl/articles/200476.pdf
Data publikacji:
2014
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
Lucas-Kanade method
sparse optical flow
multiple GPU computations
Opis:
Motion tracking algorithms are widely used in computer vision related research. However, the new video standards, especially those in high resolutions, cause that current implementations, even running on modern hardware, no longer meet the needs of real-time processing. To overcome this challenge several GPU (Graphics Processing Unit) computing approaches have recently been proposed. Although they present a great potential of a GPU platform, hardly any is able to process high definition video sequences efficiently. Thus, a need arose to develop a tool being able to address the outlined problem. In this paper we present software that implements optical flow motion tracking using the Lucas-Kanade algorithm. It is also integrated with the Harris corner detector and therefore the algorithm may perform sparse tracking, i.e. tracking of the meaningful pixels only. This allows to substantially lower the computational burden of the method. Moreover, both parts of the algorithm, i.e. corner selection and tracking, are implemented on GPU and, as a result, the software is immensely fast, allowing for real-time motion tracking on videos in Full HD or even 4K format. In order to deliver the highest performance, it also supports multiple GPU systems, where it scales up very well.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2014, 62, 1; 139-150
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Sequential Classification of Palm Gestures Based on A* Algorithm and MLP Neural Network for Quadrocopter Control
Autorzy:
Wodziński, M.
Krzyżanowska, A.
Powiązania:
https://bibliotekanauki.pl/articles/221525.pdf
Data publikacji:
2017
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
machine learning
shortest path
sequential data
quadrocopter
GPU
CUDA
Opis:
This paper presents an alternative approach to the sequential data classification, based on traditional machine learning algorithms (neural networks, principal component analysis, multivariate Gaussian anomaly detector) and finding the shortest path in a directed acyclic graph, using A* algorithm with a regression-based heuristic. Palm gestures were used as an example of the sequential data and a quadrocopter was the controlled object. The study includes creation of a conceptual model and practical construction of a system using the GPU to ensure the realtime operation. The results present the classification accuracy of chosen gestures and comparison of the computation time between the CPU- and GPU-based solutions.
Źródło:
Metrology and Measurement Systems; 2017, 24, 2; 265-276
0860-8229
Pojawia się w:
Metrology and Measurement Systems
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Hypergrammar-based parallel multi-frontal solver for grids with point singularities
Autorzy:
Gurgul, P.
Paszyński, M.
Paszyńska, A.
Powiązania:
https://bibliotekanauki.pl/articles/305343.pdf
Data publikacji:
2015
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
hypergraph grammar
direct solver
h-adaptive finite element method
NVIDIA CUDA GPU
Opis:
This paper describes the application of hypergraph grammars to drive a linear computational cost solver for grids with point singularities. Such graph grammar productions are the first mathematical formalisms used to describe solver algorithms, and each indicates the smallest atomic task that can be executed in parallel, which is very useful in the case of parallel execution. In particular,the partial order of execution of graph grammar productions can be found, and the sets of independent graph grammar productions can be localized. They can be scheduled set by set into a shared memory parallel machine. The graph-grammar-based solver has been implemented with NVIDIA CUDA for GPU. Graph grammar productions are accompanied by numerical results for a 2D case. We show that our graph-grammar-based solver with a GPU accelerator is, by order of magnitude, faster than the state-of-the-art MUMPS solver.
Źródło:
Computer Science; 2015, 16 (1); 75-102
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Depesza Jekatieriny Pieszkowej do Sekcji Polskiej GPU w sprawie śmierci Antoniego Huka : 1925 listopad 10, Moskwa.
Autorzy:
Peškova, Ekaterina.
Powiązania:
Wymiana więźniów politycznych pomiędzy II Rzecząpospolitą a Sowietami w okresie międzywojennym : dokumenty i materiały Warszawa, 2000 S. 212
Współwytwórcy:
Materski, Wojciech. Opracowanie
Data publikacji:
2000
Tematy:
Huk, Antoni
Wymiana więźniów politycznych listopad 1925 r.
Opis:
Tekst w jęz. ros.
Indeks.
Dostawca treści:
Bibliografia CBW
Artykuł
Tytuł:
Kierownictwo Wydziału Kontrwywiadu GPU do Sekcji Polskiej Kominternu w sprawie ewentualnej wymiany Janusza Migacza : 1924, czerwiec 14, Moskwa.
Powiązania:
Wymiana więźniów politycznych pomiędzy II Rzecząpospolitą a Sowietami w okresie międzywojennym : dokumenty i materiały Warszawa, 2000 S. 157
Współwytwórcy:
Materski, Wojciech. Opracowanie
Data publikacji:
2000
Tematy:
Migacz, Janusz
Wymiana więźniów politycznych czerwiec 1924 r.
Opis:
Tekst w jęz. ros.
Indeks.
Dostawca treści:
Bibliografia CBW
Artykuł
Tytuł:
Telegram Jekatieriny Pieszkowej do Polskiej Sekcji GPU w sprawie wymiany ks. Piotra Zielińskiego : 1924, wrzesień 22, Moskwa.
Autorzy:
Peškova, Ekaterina.
Powiązania:
Wymiana więźniów politycznych pomiędzy II Rzecząpospolitą a Sowietami w okresie międzywojennym : dokumenty i materiały Warszawa, 2000 S. 195-196
Współwytwórcy:
Materski, Wojciech. Opracowanie
Data publikacji:
2000
Tematy:
Zieliński, Piotr
Wymiana więźniów politycznych wrzesień 1924 r.
Opis:
Tekst w jęz. ros.
Indeks.
Dostawca treści:
Bibliografia CBW
Artykuł
Tytuł:
Execution time prediction model for parallel GPU realizations of discrete transforms computation algorithms
Autorzy:
Puchala, Dariusz
Stokfiszewski, Kamil
Wieloch, Kamil
Powiązania:
https://bibliotekanauki.pl/articles/2173636.pdf
Data publikacji:
2022
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
graphics processing unit
GPU
execution time prediction model
discrete wavelet transform
DWT
lattice structure
convolution-based approach
orthogonal transform
orthogonal filter banks
time effectiveness
prediction accuracy
procesor graficzny
model przewidywania czasu wykonania
dyskretna transformata falkowa
struktura sieciowa
podejście oparte na splotach
przekształcenia ortogonalne
ortogonalne banki filtrów
efektywność czasowa
dokładność przewidywania
Opis:
Parallel realizations of discrete transforms (DTs) computation algorithms (DTCAs) performed on graphics processing units (GPUs) play a significant role in many modern data processing methods utilized in numerous areas of human activity. In this paper the authors propose a novel execution time prediction model, which allows for accurate and rapid estimation of execution times of various kinds of structurally different DTCAs performed on GPUs of distinct architectures, without the necessity of conducting the actual experiments on physical hardware. The model can serve as a guide for the system analyst in making the optimal choice of the GPU hardware solution for a given computational task involving particular DT calculation, or can help in choosing the best appropriate parallel implementation of the selected DT, given the limitations imposed by available hardware. Restricting the model to exhaustively adhere only to the key common features of DTCAs enables the authors to significantly simplify its structure, leading consequently to its design as a hybrid, analytically–simulational method, exploiting jointly the main advantages of both of the mentioned techniques, namely: time-effectiveness and high prediction accuracy, while, at the same time, causing mutual elimination of the major weaknesses of both of the specified approaches within the proposed solution. The model is validated experimentally on two structurally different parallel methods of discrete wavelet transform (DWT) computation, i.e. the direct convolutionbased and lattice structure-based schemes, by comparing its prediction results with the actual measurements taken for 6 different graphics cards, representing a fairly broad spectrum of GPUs compute architectures. Experimental results reveal the overall average execution time and prediction accuracy of the model to be at a level of 97.2%, with global maximum prediction error of 14.5%, recorded throughout all the conducted experiments, maintaining at the same time high average evaluation speed of 3.5 ms for single simulation duration. The results facilitate inferring the model generality and possibility of extrapolation to other DTCAs and different GPU architectures, which along with the proposed model straightforwardness, time-effectiveness and ease of practical application, makes it, in the authors’ opinion, a very interesting alternative to the related existing solutions.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2022, 70, 1; art. no. e139393
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Modele szacowania czasów wykonywania się pętli programowych z wykorzystaniem programowania równoległego na CPU oraz z wykorzystaniem obliczeń na GPU przy użyciu OpenCl
Models for estimating the time of program loop execution in parallel on a CPU and with the use of OpenCL computation on a GPU
Autorzy:
Nozdrzykowski, Ł.
Nozdrzykowska, M.
Powiązania:
https://bibliotekanauki.pl/articles/315191.pdf
Data publikacji:
2018
Wydawca:
Instytut Naukowo-Wydawniczy "SPATIUM"
Tematy:
pętle programowe
szacowanie czasu wykonania pętli
programowanie CPU
programowanie GPGPU
programming loop
estimating time of loop
programming CPU
programming GPGPU
Opis:
W artykule autorzy przedstawiają modele szacowania czasów wykonywania się pętli programowych zgodnych z modelem FAN nieposiadającym zależności lub posiadającym zależności, ale tylko w ciele pętli, które wykonywane mogą być przez centralne jednostki obliczeniowe CPU jak i multiprocesory strumieniowe zwane rdzeniami kart graficznych GPU. Zaprezentowane w niniejszym artykule modele szacowania czasów wykonywania tych pętli pozwolą na określanie tego, czy obliczenia w zastanym środowisku obliczeniowym warto wykonywać z użyciem posiadanego procesora CPU czy korzystniejsze będzie wykorzystanie do obliczeń posiadanej, często nowoczesnej, karty graficznej z wydajną jednostką GPU i bardzo szybką pamięcią stosowaną we współczesnych kartach graficznych. Wraz z zaprezentowanymi modelami przedstawiono także testy potwierdzające poprawność opracowanych modeli szacowania czasu. Celem powstania tych modeli jest dostarczenie metod przyspieszania działania aplikacji realizujących różne zadania, w tym zadania transportowe, takie jak przyspieszone przeszukiwanie rozwiązań, przeszukiwanie ścieżek w grafach, czy przyspieszanie algorytmów przetwarzania obrazów w systemach wizyjnych pojazdów autonomicznych i semiautonomicznych, przy czym modele te pozwalają na zbudowanie systemu automatycznego rozdzielania zadań pomiędzy CPU i GPU przy zmienności zasobów obliczeniowych.
The authors present models for estimating the time of execution of program loops compliant with the FAN model with no data dependencies or with data dependencies only within the body programming loop, which can be executed either by CPUs or by stream multiprocessors referred to as GPU cores. The models presented will make it possible to determine whether it would be more efficient to execute computation in the existing environment using the CPU (Central Processing Unit) or a state-of-the-art graphics card with a high-performance GPU (Graphics Processing Unit) and super-fast memory, often implemented in modern graphics cards. Validity checks confirming the developed time estimation model for GPU are presented. The purpose of these models is to provide methods for accelerating the performance of applications performing various tasks, including transport tasks, such as accelerated solution searching, searching paths in graphs, or accelerating image processing algorithms in vision systems of autonomous and semiautonomous vehicles, where these models allow to build an automatic task distribution system between the CPU and the GPU with the variability of computing resources.
Źródło:
Autobusy : technika, eksploatacja, systemy transportowe; 2018, 19, 12; 802-807
1509-5878
2450-7725
Pojawia się w:
Autobusy : technika, eksploatacja, systemy transportowe
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Execution time prediction model for parallel GPU realizations of discrete transforms computation algorithms
Autorzy:
Puchala, Dariusz
Stokfiszewski, Kamil
Wieloch, Kamil
Powiązania:
https://bibliotekanauki.pl/articles/2173537.pdf
Data publikacji:
2022
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
graphics processing unit
GPU
execution time prediction model
discrete wavelet transform
DWT
lattice structure
convolution-based approach
orthogonal transform
orthogonal filter banks
time effectiveness
prediction accuracy
procesor graficzny
model przewidywania czasu wykonania
dyskretna transformata falkowa
struktura sieciowa
podejście oparte na splotach
przekształcenia ortogonalne
ortogonalne banki filtrów
efektywność czasowa
dokładność przewidywania
Opis:
Parallel realizations of discrete transforms (DTs) computation algorithms (DTCAs) performed on graphics processing units (GPUs) play a significant role in many modern data processing methods utilized in numerous areas of human activity. In this paper the authors propose a novel execution time prediction model, which allows for accurate and rapid estimation of execution times of various kinds of structurally different DTCAs performed on GPUs of distinct architectures, without the necessity of conducting the actual experiments on physical hardware. The model can serve as a guide for the system analyst in making the optimal choice of the GPU hardware solution for a given computational task involving particular DT calculation, or can help in choosing the best appropriate parallel implementation of the selected DT, given the limitations imposed by available hardware. Restricting the model to exhaustively adhere only to the key common features of DTCAs enables the authors to significantly simplify its structure, leading consequently to its design as a hybrid, analytically–simulational method, exploiting jointly the main advantages of both of the mentioned techniques, namely: time-effectiveness and high prediction accuracy, while, at the same time, causing mutual elimination of the major weaknesses of both of the specified approaches within the proposed solution. The model is validated experimentally on two structurally different parallel methods of discrete wavelet transform (DWT) computation, i.e. the direct convolutionbased and lattice structure-based schemes, by comparing its prediction results with the actual measurements taken for 6 different graphics cards, representing a fairly broad spectrum of GPUs compute architectures. Experimental results reveal the overall average execution time and prediction accuracy of the model to be at a level of 97.2%, with global maximum prediction error of 14.5%, recorded throughout all the conducted experiments, maintaining at the same time high average evaluation speed of 3.5 ms for single simulation duration. The results facilitate inferring the model generality and possibility of extrapolation to other DTCAs and different GPU architectures, which along with the proposed model straightforwardness, time-effectiveness and ease of practical application, makes it, in the authors’ opinion, a very interesting alternative to the related existing solutions.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2022, 70, 1; e139393, 1--30
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Execution time prediction model for parallel GPU realizations of discrete transforms computation algorithms
Autorzy:
Puchala, Dariusz
Stokfiszewski, Kamil
Wieloch, Kamil
Powiązania:
https://bibliotekanauki.pl/articles/2173635.pdf
Data publikacji:
2022
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
graphics processing unit
GPU
execution time prediction model
discrete wavelet transform
DWT
lattice structure
convolution-based approach
orthogonal transform
orthogonal filter banks
time effectiveness
prediction accuracy
procesor graficzny
model przewidywania czasu wykonania
dyskretna transformata falkowa
struktura sieciowa
podejście oparte na splotach
przekształcenia ortogonalne
ortogonalne banki filtrów
efektywność czasowa
dokładność przewidywania
Opis:
Parallel realizations of discrete transforms (DTs) computation algorithms (DTCAs) performed on graphics processing units (GPUs) play a significant role in many modern data processing methods utilized in numerous areas of human activity. In this paper the authors propose a novel execution time prediction model, which allows for accurate and rapid estimation of execution times of various kinds of structurally different DTCAs performed on GPUs of distinct architectures, without the necessity of conducting the actual experiments on physical hardware. The model can serve as a guide for the system analyst in making the optimal choice of the GPU hardware solution for a given computational task involving particular DT calculation, or can help in choosing the best appropriate parallel implementation of the selected DT, given the limitations imposed by available hardware. Restricting the model to exhaustively adhere only to the key common features of DTCAs enables the authors to significantly simplify its structure, leading consequently to its design as a hybrid, analytically–simulational method, exploiting jointly the main advantages of both of the mentioned techniques, namely: time-effectiveness and high prediction accuracy, while, at the same time, causing mutual elimination of the major weaknesses of both of the specified approaches within the proposed solution. The model is validated experimentally on two structurally different parallel methods of discrete wavelet transform (DWT) computation, i.e. the direct convolutionbased and lattice structure-based schemes, by comparing its prediction results with the actual measurements taken for 6 different graphics cards, representing a fairly broad spectrum of GPUs compute architectures. Experimental results reveal the overall average execution time and prediction accuracy of the model to be at a level of 97.2%, with global maximum prediction error of 14.5%, recorded throughout all the conducted experiments, maintaining at the same time high average evaluation speed of 3.5 ms for single simulation duration. The results facilitate inferring the model generality and possibility of extrapolation to other DTCAs and different GPU architectures, which along with the proposed model straightforwardness, time-effectiveness and ease of practical application, makes it, in the authors’ opinion, a very interesting alternative to the related existing solutions.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2022, 70, 1; art. no. e139393
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Accelerating computation of a reduced order model of a structural system resulting from Craig–Bampton reduction using GPU programming
Autorzy:
Górecki, Piotr
Kalinowski, Miłosz
Jeziorek, Łukasz
Broniszewski, Jakub
Koziara, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/38706110.pdf
Data publikacji:
2024
Wydawca:
Instytut Podstawowych Problemów Techniki PAN
Tematy:
GPU
CPU
reduced order model
structural model
CuPy array library
model zredukowanego zamówienia
model strukturalny
CuPy
Opis:
The Craig–Bampton (CB) method is a well-known substructuring technique that reduces the size of a finite element model (FEM) using a set of vibration modes. For large FEA models, the reduction process could be computationally expensive since it requires algebra operations on FEM mode shapes and FEM system sparse matrices. In this paper, we investigate the potential of usage of GPU parallel processing to speed up solving the system of linear equations that results from the CB reduction process made for a model of cyclic structures. A Python based high-level approach, employing the CuPy, GinkGo and STRUMPACK libraries on the GPU, is compared with an optimized Fortran code. In side-to-side comparisons, employing the same inputs, the Python-GPU code is run on a single GPU device and the Fortran code is run on a multi-core compute node. The CB reduction process was split into several parts, each dealing with different kind of algebraic formulation of the problem. Performance comparisons were focused on the sparse system linear solver, since it turned out to be the most time-consuming part. The results suggest that the current GPU-based linear sparse solvers do not surpass the state-of-the-art CPU-based MKL PARDISO solver (at least up to 1M DOFs).
Źródło:
Computer Assisted Methods in Engineering and Science; 2024, 31, 1; 51-66
2299-3649
Pojawia się w:
Computer Assisted Methods in Engineering and Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Pismo interwencyjne Jekatieriny Pieszkowej do Sekcji Polskiej GPU w sprawie wymiany ks. Piotra Zielińskiego : 1925, luty 12, Moskwa.
Autorzy:
Peškova, Ekaterina.
Powiązania:
Wymiana więźniów politycznych pomiędzy II Rzecząpospolitą a Sowietami w okresie międzywojennym : dokumenty i materiały Warszawa, 2000 S. 207
Współwytwórcy:
Materski, Wojciech. Opracowanie
Data publikacji:
2000
Tematy:
Zieliński, Piotr
Wymiana więźniów politycznych luty 1925 r.
Opis:
Tekst w jęz. ros.
Indeks.
Dostawca treści:
Bibliografia CBW
Artykuł
Tytuł:
Preconditioned Conjugate Gradient Method for Solution of Large Finite Element Problems on CPU and GPU
Autorzy:
Fialko, S. Y.
Zeglen, F.
Powiązania:
https://bibliotekanauki.pl/articles/307602.pdf
Data publikacji:
2016
Wydawca:
Instytut Łączności - Państwowy Instytut Badawczy
Tematy:
conjugate gradient
incomplete Cholesky factorization
iterative solvers
NVIDIA CUDA
preconditioned conjugate gradient
Opis:
In this article the preconditioned conjugate gradient (PCG) method, realized on GPU and intended to solution of large finite element problems of structural mechanics, is considered. The mathematical formulation of problem results in solution of linear equation sets with sparse symmetrical positive definite matrices. The authors use incomplete Cholesky factorization by value approach, based on technique of sparse matrices, for creation of efficient preconditioning, which ensures a stable convergence for weakly conditioned problems mentioned above. The research focuses on realization of PCG solver on GPU with using of CUBLAS and CUSPARSE libraries. Taking into account a restricted amount of GPU core memory, the efficiency and reliability of GPU PCG solver are checked and these factors are compared with data obtained with using of CPU version of this solver, working on large amount of RAM. The real-life large problems, taken from SCAD Soft collection, are considered for such a comparison.
Źródło:
Journal of Telecommunications and Information Technology; 2016, 2; 26-33
1509-4553
1899-8852
Pojawia się w:
Journal of Telecommunications and Information Technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza efektywności sprzętowych implementacji algorytmów detekcji twarzy w obrazach cyfrowych
Effectiveness analysis of hardware implementations of face detection algorithms in digital images
Autorzy:
Wujek, P.
Pełka, R.
Powiązania:
https://bibliotekanauki.pl/articles/156623.pdf
Data publikacji:
2012
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
detekcja twarzy
FPGA
GPU
GPGPU
face detection
Opis:
W artykule przedstawiono i porównano wyniki implementacji przykładowego algorytmu detekcji twarzy w obrazach cyfrowych na trzech platformach sprzętowych: z użyciem CPU (Matlab), w strukturze programowalnej FPGA z procesorem sprzętowym PowerPC [1], oraz z wykorzystaniem CPU z akceleracją GPU. Powyższe implementacje przebadano eksperymentalnie pod względem złożoności implementacji i szybkości działania poszczególnych fragmentów algorytmu. Porównano je ze sobą oraz przedstawiono najlepsze obszary zastosowań poszczególnych z nich.
This paper describes comparison of hardware implementations of a face detection algorithm using three different platforms: (1) classic CPU implementation (Matlab), (2) implementation with use of programmable logic - FPGA with hardware processor PowerPC [1], and (3) CPU based version with GPU acceleration. These tree versions have been experimentally tested and compared in terms of the required hardware resources and operating speed, which is of great importance in most practical applications. We also discuss advantages and drawbacks of these three approaches to hardware implementation of face detection algorithms. In particular, we formulate some important conditions that the analyzed image must meet to obtain the optimum effectiveness of the face detection algorithm implemented on each platform. Finally, we show that use of GPU acceleration can take advantage of the classic CPU and parallel computing accessible to FPGA. The proposed solution of skin color detection time for the CPU with GPU acceleration is over 100 times shorter than that for the solution with the classical CPU. As a programmable device we have used FPGA Virtex-4 chip from Xilinx, and as a GPU accelerator we have utilized graphic card nVidia GeForce 8600 GT.
Źródło:
Pomiary Automatyka Kontrola; 2012, R. 58, nr 7, 7; 581-583
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Pismo Jekatieriny Pieszkowej do Sekcji Polskiej GPU w sprawie zgody na wymianę Maurice'a Marre'a : 1924, listopad 13, Moskwa.
Autorzy:
Peškova, Ekaterina.
Powiązania:
Wymiana więźniów politycznych pomiędzy II Rzecząpospolitą a Sowietami w okresie międzywojennym : dokumenty i materiały Warszawa, 2000 S. 196
Współwytwórcy:
Materski, Wojciech. Opracowanie
Data publikacji:
2000
Tematy:
Marre, Maurice
Wymiana więźniów politycznych listopad 1924 r.
Opis:
Tekst w jęz. ros.
Indeks.
Dostawca treści:
Bibliografia CBW
Artykuł
Tytuł:
Efekt rozpraszania podpowierzchniowego z wykorzystaniem programowalnego procesora graficznego
GPU based subsurface scattering effect
Autorzy:
Tomaszewska, A.
Stefanowski, K.
Powiązania:
https://bibliotekanauki.pl/articles/155016.pdf
Data publikacji:
2011
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
podpowierzchniowe rozpraszanie światła
percepcja
programowalny procesor graficzny
grafika komputerowa
subsurface scattering
perception
graphics processing unit
computer graphics
Opis:
W artykule zaprezentowano sposób obliczania w czasie rzeczywistym efektu podpowierzchniowego rozpraszania światła w obiektach częściowo przeźroczystych przy zwróceniu szczególnej uwagi na wydajność obliczeniową algorytmu. Algorytm zaprojektowanego pod kątem implementacji sprzętowej realizowanej na programowalnym procesorze graficznym. Dane przekazywane są do GPU w postaci zmiennych (uniform i attribute), gdzie wykorzystywane są do dalszych obliczeń. Porównanie wydajności prezentowanego podejścia z innymi algorytmami przedstawiono w podsumowaniu artykułu.
In the paper there is presented the spherical harmonics (SH) based method for subsurface scattering and its GPU-based implementation. The described approach is modification of the Green's algorithm [1]. The 3D model thickness was encoded for each vertex in every possible direction. The algorithm is divided into two parts: the preprocessing executed on CPU and the visualization stage designed for GPU. The tests were carried out and described. They revealed the effectiveness of the obtained results. To verify the results, they were compared with those obtained from other algorithms. The results show efficiency benefits of the authors' algorithm in comparison with the comparable quality approaches. Moreover, the modification of the Green`s algorithm improves the quality of the subsurface scattering effect, as the unnatural effect of sharp curves visible on the final images is reduced. It is possible because in this approach the way the light goes through an object depends on the model thickness. The paper is organized as follows. In Section 2 the previous works are discussed. In Section 3 the application of subsurface scattering based on the spherical harmonics and its hardware implementation are presented. Section 5 shows the obtained results. At the end of the paper there are given some concluding remarks.
Źródło:
Pomiary Automatyka Kontrola; 2011, R. 57, nr 8, 8; 930-932
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Digital image correlation - universal tools versus custom solutions
Cyfrowa Korelacja Obrazu - Uniwersalne narzędzia a rozwiązania użytkownika
Autorzy:
Marciniak, T.
Bujnowski, S.
Lutowski, Z.
Boroński, D.
Giesko, T.
Powiązania:
https://bibliotekanauki.pl/articles/257990.pdf
Data publikacji:
2010
Wydawca:
Sieć Badawcza Łukasiewicz - Instytut Technologii Eksploatacji - Państwowy Instytut Badawczy
Tematy:
metody korelacji
DIC
GPU
CUDA
wielowątkowość
correlation methods
multithreading
Opis:
The development of optoelectronics and increasing the processing speed of processors encourage the use of different measurement methods with the use of data obtained from the digital cameras. The article presents the test results of the time consumption of the normalised 2D-correlation function. The correlation is one of most commonly used functions in image processing. It searches for a correlation between the two images and requires quite a lot of calculation operations. The speed of this function was examined in a variety of tools, such as MatLab, MatLab with tools Parallel Computing, library OpenCV and OpenCV wer.2.2 with the CUDA platform extension. During tests, the speeds of image processing were determined, especially for images acquired with high-resolution cameras. Conclusions presented concern with application possibilities of correlation methods, including multithreaded processing.
Rozwój optoelektroniki i rosnąca szybkość przetwarzania procesorów zachęca do stosowania różnorodnych metod pomiarowych wykorzystujących dane pozyskane z kamer cyfrowych. W artykule zaprezentowano wyniki badań szybkości działania funkcji korelacji wykorzystywanych przy obróbce obrazów. Jedną z najczęściej wykorzystywanych funkcji w przetwarzaniu obrazów jest funkcja korelacji. Polega ona na poszukiwaniu współzależności pomiędzy dwoma obrazami i wymaga stosunkowo dużego nakładu obliczeniowego. Szybkość działania funkcji sprawdzono podczas wykorzystania różnych narzędziach takich, jak MatLab, MatLab z biblioteką Parallel Computing, biblioteka OpenCV oraz OpenCV wer.2.2 z możliwością wykorzystania technologii CUDA. W trakcie testów wyznaczono uzyskiwane prędkości przetwarzania obrazów, zwłaszcza w przypadku obrazów rejestrowanych za pomocą kamer wysokiej rozdzielczości. Przedstawiono wnioski dotyczące możliwości zastosowania funkcji korelacji, w tym z wykorzystaniem mechanizmu wielowątkowości.
Źródło:
Problemy Eksploatacji; 2010, 4; 19-28
1232-9312
Pojawia się w:
Problemy Eksploatacji
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Performance enhancement of CUDA applications by overlapping data transfer and Kernel execution
Autorzy:
Raju, K.
Chiplunkar, Niranjan N
Powiązania:
https://bibliotekanauki.pl/articles/1956064.pdf
Data publikacji:
2021
Wydawca:
Polskie Towarzystwo Promocji Wiedzy
Tematy:
CPU-GPU
high-performance computing
kernel
data transfer
CUDA streams
obliczenia wysokiej wydajności
jądro
transfer danych
strumienie CUDA
Opis:
The CPU-GPU combination is a widely used heterogeneous computing system in which the CPU and GPU have different address spaces. Since the GPU cannot directly access the CPU memory, prior to invoking the GPU function the input data must be available on the GPU memory. On completion of GPU function, the results of computation are transferred to CPU memory. The CPU-GPU data transfer happens through PCIExpress bus. The PCI-E bandwidth is much lesser than that of GPU memory. The speed at which the data is transferred is limited by the PCI-E bandwidth. Hence, the PCI-E acts as a performance bottleneck. In this paper two approaches are discussed to minimize the overhead of data transfer, namely, performing the data transfer while the GPU function is being executed and reducing the amount of data to be transferred to GPU. The effectiveness of these approaches on the execution time of a set of CUDA applications is realized using CUDA streams. The results of our experiments show that the execution time of applications can be minimized with the proposed approaches.
Źródło:
Applied Computer Science; 2021, 17, 3; 5-18
1895-3735
Pojawia się w:
Applied Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
G-PAS 2.0 - an improved version of protein alignment tool with an efficient backtracking routine on multiple GPUs
Autorzy:
Frohmberg, W.
Kierzynka, M.
Blazewicz, J.
Wojciechowski, P.
Powiązania:
https://bibliotekanauki.pl/articles/201593.pdf
Data publikacji:
2012
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
pairwise alignment
GPU computing
alignment with backtracking procedure
Opis:
Several highly efficient alignment tools have been released over the past few years, including those taking advantage of GPUs (Graphics Processing Units). G-PAS (GPU-based Pairwise Alignment Software) was one of them, however, with a couple of interesting features that made it unique. Nevertheless, in order to adapt it to a new computational architecture some changes had to be introduced. In this paper we present G-PAS 2.0 - a new version of the software for performing high-throughput alignment. Results show, that the new version is faster nearly by a fourth on the same hardware, reaching over 20 GCUPS (Giga Cell Updates Per Second).
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2012, 60, 3; 491-494
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wspomaganie sprzętowe do wyznaczenia statystyk obrazów naturalnych wyższego rzędu
GPU-based natural images statistics calculation
Autorzy:
Tomaszewska, A.
Powiązania:
https://bibliotekanauki.pl/articles/155066.pdf
Data publikacji:
2011
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
statystyki obrazów naturalnych
system wizualny człowieka
programowalny procesor graficzny
GPGPU
natural image statistics
human visual system
graphics processing unit
Opis:
Statystyki obrazów naturalnych, definiowanych jako nieprzetworzone obrazy rejestrowane przez człowieka, charakteryzują się dużą regularnością. Ich cechy wykorzystywane są w wielu aplikacjach grafiki komputerowej takich jak usuwanie szumu, czy kompresja. W artykule przedstawiono algorytm do szybkiego obliczenia statystyk wyższego rzędu na podstawie współczynników falek z wykorzystaniem programowalnego procsora graficznego. W rezultatach przedstawiono wyniki przyspieszenia uzyskanego przy wykorzystaniu GPU w porównaniu z implementacją na CPU.
A natural image is unprocessed reproduction of a natural scene observed by a human. The Human Visual System (HVS), during its evolution, has been adjusted to the information encoded in natural images. Computer images are interpreted best by a human when they fit natural image statistics that can model the information in natural images. The main requirement of such statistics is their striking regularity. It hepls separate the information from noise, reconstruct information which is not avaiable in an image, or only partially avaiable. Other applications of statistics is compression, texture synthesis or finding distortion model in image like blur kernel. The statistics are translation and scale invariant, therefore a distribution of statistics does not depend on the object position in the image and on its size. In this paper there are presented higher order natural image statistics calculations based on GPU. The characteristic of the statistics is that they are independent of the scale and rotation transformations. Therefore, they are suitable for many graphic applications. To analyze images there is used statistics computed in the wavelet domain and there is considered the image contrast. The computation speedup is presented in the results. The paper is organized as follows: the overview of natural images sta-tistics is introduced in Section 2. In Section 3 the GPU-based implementation is described. The obtained results are given in Section 4. Finally, there are presented the concluding remarks.
Źródło:
Pomiary Automatyka Kontrola; 2011, R. 57, nr 8, 8; 899-901
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wykorzystanie procesorów graficznych do szybkiego renderingu krajobrazu sferycznego
Efficient GPU-based approach to a spherical terrain rendering
Autorzy:
Tomaszewska, A.
Osobniak, O.
Powiązania:
https://bibliotekanauki.pl/articles/154799.pdf
Data publikacji:
2010
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
generowanie terenu
programowalny procesor graficzny
technologia CUDA
geometry clipmaps
terrain generation
graphics processing unit
CUDA technology
Opis:
W artykule zaprezentowano sposób generowania w czasie rzeczywistym planety o dużej powierzchni oraz wysokim poziomie szczegółowości. Algorytm opracowano na podstawie techniki wykorzystującej mapy obcięcia geometrii, umożliwiając generowanie na bieżąco dowolnego wycinka terenu na podstawie parametrów ustawienia kamery. Algorytm zaprojektowano pod kątem implementacji sprzętowej z wykorzystaniem programowalnego procesora graficznego oraz technologii CUDA.
In the paper there is presented a fast method for large and detailed spherical terrain rendering. Rendering terrain with a high degree of realism is an ongoing need in real-time computer graphics applications. To render scenes of increased sizes and complexity, several terrain rendering algorithms have been proposed in the literature. One of the recent techniques called geometry clipmaps relies on the position of the viewpoint to create multi-resolution representation of the terrain, using nested meshes. In [1] there is proposed very efficient, GPU based approach of this technique for large terrain models. In the paper there are presented techniques which combine procedural approach and geometry clipmaps together. It enables rendering an arbitrary piece of terrain on fly based on the camera parameters. To improve the algorithm efficience most computations were performed on GPU with use of vertex and pixel shaders and CUDA technology. The paper is organized as follows: Section 2 discusses the previous works, Section 3 presents the application of procedural terrein generetion based on the clipmaps and its hardware implementation, whereas the results obtained are given in Section 4. Thge conclusions are presented at the end of the paper.
Źródło:
Pomiary Automatyka Kontrola; 2010, R. 56, nr 7, 7; 790-792
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Fenomen sowieckich służb specjalnych
The phenomens of the soviet special services
Autorzy:
Świerczek, Marek
Powiązania:
https://bibliotekanauki.pl/articles/121538.pdf
Data publikacji:
2020
Wydawca:
Towarzystwo Wiedzy Obronnej
Tematy:
sowieckie służby specjalne
WCzK
GPU
OGPU
Ochrana
instrumentarium pracy operacyjnej
terror
infiltracja
prowokacja
dezinformacja
Soviet special services
VChK
Okhrana
operational work instruments
infiltration
provocation
disinformation
Opis:
Autor artykułu, analizując fenomen skuteczności sowieckich służb specjalnych, wysuwa hipotezę, że była ona skutkiem splotu kilku czynników. Wśród głównych elementów składających się na niebywałą sprawność służb sowieckich w pierwszej dekadzie po przewrocie październikowym, zdaniem autora znajdują się: fuzja doświadczeń instytucjonalnych Ochrany z wiedzą środowisk kryminalno-rewolucyjnych tworzących WCzK oraz rozwiązania operacyjne niespotykane wśród cywilizowanych społeczeństw. Zdaniem autora, sowieckie służby zostały de facto wyjęte spod prawa i nakazów moralności (uznawanych za przeżytek burżuazyjny), co umożliwiło stosowanie metod i form pracy niemożliwych w Europie Zachodniej. Tak rozumiane instrumentarium sowieckich służb składało się z mieszanki terroru, infiltracji, prowokacji i dezinformacji.
The article author, analyzing the phenomenon of the effectiveness of the Soviet special services, puts forward the hypothesis that it was the result of a combination of several factors. Among the main elements that made up the incredible efficiency of the Soviet services in the first decade after the October coup, according to the author there were: a fusion of institutional experiences of the Okhrana with the knowledge of criminal-revolutionary environments creating the VChK and operational solutions unheard of in civilized societies. According to the author, the Soviet services acted under no law and moral obligations (considered by revolutionaries as bourgeois remnant), which allowed the use of methods and forms of operational work unthinkable in Western Europe. The instruments of the Soviet services consisted of a mixture of terror, infiltration, provocation and disinformation.
Źródło:
Wiedza Obronna; 2020, 2; 63-74
0209-0031
2658-0829
Pojawia się w:
Wiedza Obronna
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wyjaśnienie Pilara w sprawie kompetencji GPU proponowania osób na listy wymiany personalnej z Polską : 1923, maj 23, Moskwa.
Autorzy:
Pilar-Pilchau-von, Roman.
Powiązania:
Wymiana więźniów politycznych pomiędzy II Rzecząpospolitą a Sowietami w okresie międzywojennym : dokumenty i materiały Warszawa, 2000 S. 97
Współwytwórcy:
Materski, Wojciech. Opracowanie
Data publikacji:
2000
Tematy:
Główny Zarząd Polityczny (ZSRR) maj 1923 r.
Wymiana więźniów politycznych maj 1923 r.
Opis:
Indeks.
Dostawca treści:
Bibliografia CBW
Artykuł
Tytuł:
Wyznaczanie równoległości pętli programowych w aplikacjach dedykowanych dla procesorów graficznych
Parallelizing program loops for graphics processing in general purpose computing
Autorzy:
Bielecki, W.
Pałkowski, M.
Powiązania:
https://bibliotekanauki.pl/articles/155271.pdf
Data publikacji:
2011
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
automatyczne zrównoleglanie pętli
fragmenty kodu
GPU
CUDA
OpenCL
obliczenia wysokiej wydajności
loop parallelization
slices
Opis:
Ekstrakcja równoległości w postaci niezależnych fragmentów kodu pozwala wygenerować równoległe pętle programowe w sposób automatyczny. Kod taki umożliwia wykorzystanie mocy obliczeniowej maszyn równoległych, w tym wieloprocesorowych kart graficznych. W niniejszym artykule poddano analizie zastosowanie algorytmów wyznaczania fragmentów kodu dla aplikacji dedykowanych dla procesorów graficznych. Zbadano przyspieszenie i efektywność obliczeń oraz skalowalność wygenerowanego kodu równoległego.
Extracting synchronization-free slices allows automatically generating parallel loops. The code can be executed on multi-processors machines in a reduced period of time. Slicing techniques enable also generating parallel code for graphics processing in general purpose computing. Nowadays, graphic cards support executing multi-threaded applications. GPU systems consist of tens or hundreds of processors. CUDA (an acronym for Compute Unified Device Architecture) is a parallel computing architecture developed by NVIDIA. Graphics processing units (GPUs) are accessible to software developers through variants of industry standard programming languages. Using CUDA, the latest NVIDIA GPUs become accessible for computation like CPUs. The model for GPU computing is to use a CPU and GPU together in a heterogeneous co-processing computing model. The sequential part of the application runs on the CPU and the computationally-intensive part is accelerated by the GPU. From the user's perspective, the application just runs faster because it uses the high-performance of the GPU to boost performance. In this paper slicing algorithms are examined for generating a parallel code for graphic cards are examined. A short example of the code is presented. CUDA statements and technique are explained. Memory cost and transfer data is considered. Speed-up, efficiency and scalability of the code are analyzed.
Źródło:
Pomiary Automatyka Kontrola; 2011, R. 57, nr 8, 8; 963-965
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Informacja Wydziału Tajnego GPU o osobach postulowanych do wymiany przez stronę polską, co do wydania których ma on obiekcje : 1925, styczeń 30, Moskwa.
Powiązania:
Wymiana więźniów politycznych pomiędzy II Rzecząpospolitą a Sowietami w okresie międzywojennym : dokumenty i materiały Warszawa, 2000 S. 205
Współwytwórcy:
Materski, Wojciech. Opracowanie
Data publikacji:
2000
Tematy:
Wymiana więźniów politycznych styczeń 1925 r.
Służba bezpieczeństwa ZSRR styczeń 1925 r.
Opis:
Tekst w jęz. ros.
Indeks.
Dostawca treści:
Bibliografia CBW
Artykuł
Tytuł:
Akceleracja obliczeń komputerowych za pomocą układów graficznych z wykorzystaniem technologii CUDA
Computing acceleration based on application of the CUDA technology
Autorzy:
Stefanowicz, Ł.
Wiśniewski, R.
Wiśniewska, M.
Powiązania:
https://bibliotekanauki.pl/articles/155246.pdf
Data publikacji:
2011
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
procesor
obliczenia
równoległość
CPU
GPU
CUDA
multimedia
iteracja
wielowątkowość
processor
computing acceleration
parallelism
iteration
multithreading
Opis:
W artykule zaprezentowano możliwość zastosowania układów graficznych celem przyspieszenia obliczeń komputerowych. Przedstawiono technologię oraz architekturę CUDA firmy nVidia, a także podstawowe rozszerzenia względem standardów języka C. W referacie omówiono autorskie algorytmy testowe oraz metodykę badań, które przeprowadzono w celu określenia skuteczności akceleracji obliczeń komputerowych z wykorzystaniem procesorów graficznych GPU w porównaniu do rozwiązań tradycyjnych, opartych o CPU.
The paper deals with application of the graphic processor units (GPUs) to acceleration of computer operations and computations. The traditional computation methods are based on the Central Processor Unit (CPU), which ought to handle all computer operations and tasks. Such a solution is especially not effective in case of distributed systems where some sub-tasks can be performed in parallel. Many parallel threads can accelerate computing, which results in a shorter execution time. In the paper a new CUDA technology and architecture is shown. The presented idea of CUDA technology bases on application of the GPU processors to compu-tation to achieve better performance in comparison with the traditional methods, where CPUs are used. The GPU processors may perform multi-thread calculation. Therefore, especially in case of tasks where concurrency can be applied, CUDA may highly speed-up the computation process. The effectiveness of CUDA technology was verified experimentally. To perform investigations and experiments, the own test modules were used. The library of benchmarks consists of various algorithms, from simple iteration scripts to video processing methods. The results obtained from calculations performed via CPU and via GPU are compared and discussed.
Źródło:
Pomiary Automatyka Kontrola; 2011, R. 57, nr 8, 8; 954-956
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
An optimized parallel implementation of non-iteratively trained recurrent neural networks
Autorzy:
El Zini, Julia
Rizk, Yara
Awad, Mariette
Powiązania:
https://bibliotekanauki.pl/articles/2031147.pdf
Data publikacji:
2021
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
GPU implementation
parallelization
Recurrent Neural Network
RNN
Long-short Term Memory
LSTM
Gated Recurrent Unit
GRU
Extreme Learning Machines
ELM
non-iterative training
Opis:
Recurrent neural networks (RNN) have been successfully applied to various sequential decision-making tasks, natural language processing applications, and time-series predictions. Such networks are usually trained through back-propagation through time (BPTT) which is prohibitively expensive, especially when the length of the time dependencies and the number of hidden neurons increase. To reduce the training time, extreme learning machines (ELMs) have been recently applied to RNN training, reaching a 99% speedup on some applications. Due to its non-iterative nature, ELM training, when parallelized, has the potential to reach higher speedups than BPTT. In this work, we present Opt-PR-ELM, an optimized parallel RNN training algorithm based on ELM that takes advantage of the GPU shared memory and of parallel QR factorization algorithms to efficiently reach optimal solutions. The theoretical analysis of the proposed algorithm is presented on six RNN architectures, including LSTM and GRU, and its performance is empirically tested on ten time-series prediction applications. Opt- PR-ELM is shown to reach up to 461 times speedup over its sequential counterpart and to require up to 20x less time to train than parallel BPTT. Such high speedups over new generation CPUs are extremely crucial in real-time applications and IoT environments.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2021, 11, 1; 33-50
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Adaptive partition-based logic simulation using GPGPU
Autorzy:
Zhang, M.
Zhang, Y
Yang, W.
Kai, Y.
Wei, T.
Fan, X.
Powiązania:
https://bibliotekanauki.pl/articles/398148.pdf
Data publikacji:
2011
Wydawca:
Politechnika Łódzka. Wydział Mikroelektroniki i Informatyki
Tematy:
symulacja logiczna
obliczenia strumieniowe
GPGPU
obliczenia ogólnego przeznaczenia na układach GPU
CUDA
EDA
Automatyzacja procesu projektowania systemów elektronicznych
logic simulation
stream computing
Opis:
With the improvement of the gate complexity, the verification overhead becomes more decisive for VLSI design cost In order to reduce the simulation time, a adaptive partition based parallel method of VLSI logic simulation with GPGPU is addressed in this paper. The numerous arithmetic blocks of GPGPU is utilized simultaneously for disparate circuit macros. The partition strategy we proposed shows a sufficient flexibility to balance the different work load in parallel threads and fit the feature of GPU architecture. To explore the parallelism and locality of logic simulation further, the circuit macro is organized as stream data. The data dependency between the input and output nets in one individual logical path is handled with the shared memory of GPGPU. As for different logical paths, the dependency is processed by threads synchronization. To illustrate the performance, a serial experiments is implemented in Intel CoreDuo workstation with Nvidia GTX465 GPU board. Four typical digital circuits (LDPC, DES3, OpenRISC 1200 and OpenSPARCPARC T1) are considered as the benchmark. The result of experiments demonstrate a significant speed-up is achieved by using GPGPU parallel method, comparing with the CPU serial logic simulation. In maximal case (OpenS T1), the GPGPU parallel acceleration computes 21 times faster than serial program.
Źródło:
International Journal of Microelectronics and Computer Science; 2011, 2, 4; 121-128
2080-8755
2353-9607
Pojawia się w:
International Journal of Microelectronics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Równoległa implementacja algorytmu winnowing dla operacji strumieniowej analizy tekstu
Parallel Winnowing Implementation for text stream analysis
Autorzy:
Wielgosz, M.
Żurek, D.
Pietroń, M.
Dąbrowska-Boruch, A.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/154404.pdf
Data publikacji:
2014
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
n-gramowy model
eksploracja danych
przetwarzanie strumieniowe
GPGPU
n-gram-based model
document comparison
GPU
information retrieval
Opis:
W ramach praca przeprowadzona została analiza możliwości wykorzystania algorytmu winnowing do strumieniowego przetwarzania informacji tekstowej. W szczególności nacisk został położony na operacje generacji odcisku jako jej zredukowanej reprezentacji wiadomości tekstowej. Autorzy przeprowadzili szereg eksperymentów, w celu określenia efektywności działania algorytmu oraz możliwego do uzyskania przyspieszenia obliczeń, z wykorzy-staniem węzła procesorów Intel Xeon E5645 2.40GHz oraz karty GPU Nvidia Tesla m2090.
There are several models available for information retrieval and text analysis but the two are considered to be the dominant ones, namely Boolean and the vector space model (VSM). A model maps the existing words or text into a new representation space. This paper presents a boolean n-gram-based algorithm - winnowing for fast text search and comparison of documents with main focus on its implementation and performance analysis. The algorithm is used to generate fingerprints (i.e. a set of hashes) of the analyzed documents. A dedicated test framework was designed and implemented to handle the task of the algorithm evaluation which utilizes PAN test corpus and programming environment. Several tests were conducted in order to determine the comparison quality of the obfuscated and not obfuscated text for the winnowing algorithm and different window and n-gram size. The tests revealed interesting properties of the algorithms with respect to comparison of documents as well as defied the limits of their applicability. The n-gram-based algorithms due to their simplicity are well suited for hardware implementation. Thus, the authors implemented compu-tationally demanding part of both fingerprint generation both on CPU and GPU. Performance measurements for Intel Xeon E5645, 2.40GHz and Nvidia Tesla m2090 implementation of Ngram-based algorithm show approximately 14x computational speedup.
Źródło:
Pomiary Automatyka Kontrola; 2014, R. 60, nr 5, 5; 309-312
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Demonstrator przenośnego systemu Phased-Array z funkcją Full-Matrix Capture
A portable Phased-Array system demonstrator with Full-Matrix Capture function
Autorzy:
Lewandowski, M.
Walczak, M.
Witek, B.
Rozbicki, J.
Steifer, T.
Powiązania:
https://bibliotekanauki.pl/articles/107726.pdf
Data publikacji:
2018
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
UT
Phased-Array
akwizycja pełnej macierzy
GPU
NDT UT
Full-Matix Capture (FMC)
Opis:
Ultradźwiękowe systemy Phased-Array (PA) umożliwiają detekcję i ocenę wad za pomocą wieloelementowych głowic ze skanowaniem elektronicznym. Zaawansowane metody kierowania wiązki oraz wizualizacji znacznie ułatwiają badania obiektów o skomplikowanej geometrii. Należy jednak pamiętać, że klasyczna metoda PA bazuje na tych samych zasadach fizycznych, co skanowanie standardowymi głowicami jednoelementowymi i posiada te same ograniczenia. W naszym laboratorium pracujemy nad implementacją nowej klasy metod obrazowania UT, które wykorzystują technikę Full-Matrix Capture (FMC) oraz Total Focusing Method (TFM). Metody te dają zupełnie nowe możliwości rekonstrukcji obrazów wad i pozwalają na uzyskanie jednorodnej rozdzielczości poprzecznej w całej głębokości badania. W tym celu zbudowaliśmy demonstrator przenośnego systemu PA wyposażony w funkcje FMC i TFM. Akwizycja pełnej macierzy ech oraz przetwarzanie softwarowe na wbudowanym procesorze GPU (Nvidia® Tegra) zapewniają duże możliwości przetwarzania i analizy sygnałów. Demonstrator jest wyposażony w 32-kanały akwizycji w konfiguracji 32:128 i współpracuje ze standardowymi głowicami PA firmy Olympus®.
Phased-Array (PA) ultrasonic systems enable the detection and evaluation of defects with multi-element electronic scanning heads. Advanced beam steering and visualization make it easy to explore complex geometries. However, it should be remembered that the classic PA method is based on the same physical principles as standard single-element probes and has the very same limitations. In our laboratory we are working on the implementation of a new class of UT imaging methods, namely Full-Matrix Capture (FMC) and Total Focusing Method (TFM) techniques. These methods provide completely new possibilities for the reconstruction of defect images and allow to obtain a uniform lateral resolution throughout the depth of the test. For this purpose, we have built a portable PA system demonstrator equipped with FMC and TFM functions. Acquisition of a full array of echoes and software processing on the built-in GPU (Nvidia® Tegra) provide great opportunities for signal processing and analysis. The demonstrator is equipped with 32 RX channels in a 32:128 configuration and is compatible with standard Olympus® PA probes.
Źródło:
Badania Nieniszczące i Diagnostyka; 2018, 3; 70-71
2451-4462
2543-7755
Pojawia się w:
Badania Nieniszczące i Diagnostyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Working methods of the Russian secret services in the light of the Oleg Kulinich case
Metody działania rosyjskich służb specjalnych w świetle afery Olega Kulinicza
Autorzy:
Świerczek, Marek
Powiązania:
https://bibliotekanauki.pl/articles/23378895.pdf
Data publikacji:
2023-12-06
Wydawca:
Agencja Bezpieczeństwa Wewnętrznego
Tematy:
FSB
SBU
VChK
GPU
oefnsive counterintelligence
disorganisation
infiltration
Russian-Ukrainian conflict
WCzK
kontrwywiad ofensywny
dezorganizacja
infiltracja
konflikt rosyjsko-ukraiński
Opis:
The author analyses the case of the detention of Ukrainian Security Service oficer Oleg Kulinich on suspicion of espionage for the Federal Security Service of the Russian Federation. On the basis of the analysis of the tasks posed to this Russian agent, he concludes that the modus operandi of Russian counterintelligence is diametrically opposed to the methods of Western services. The main diefrence is the shifting of the centre of gravity of operational activities from reconnaissance-information work to attempts at agentic seizure of control over enemy institutions, mainly civilian and military special services, and the realisation of intelligence infiltration by people with the same habitus as recruitment candidates. Drawing on the achievements of cognitive psychology and research in recent history, the author demonstrates that the Russian services have been using and refining these methods for more than 100 years.
Autor dokonuje analizy przypadku zatrzymania oficera Służby Bezpieczeństwa Ukrainy Olega Kulinicza pod zarzutem szpiegostwa na rzecz Federalnej Służby Bezpieczeństwa Federacji Rosyjskiej. Na podstawie analizy zadań stawianych temu rosyjskiemu agentowi dochodzi do wniosku, że sposób działania rosyjskiego kontrwywiadu diametralnie różni się od metod zachodnich służb. Główną różnicą jest przeniesienie środka ciężkości działań operacyjnych z pracy rozpoznawczo-informacyjnej na próby agenturalnego przejęcia kontroli nad instytucjami przeciwnika, głównie cywilnymi i wojskowymi służbami specjalnymi, oraz na realizację infiltracji wywiadowczej przez ludzi dysponujących tym samym habitusem co kandydaci do werbunku. Korzystając z dorobku psychologii po-znawczej oraz badań z zakresu historii najnowszej, autor udowadnia, że od ponad 100 lat rosyjskie służby wykorzystują i udoskonalają te metody.
Źródło:
Przegląd Bezpieczeństwa Wewnętrznego; 2023, 15, 29; 291-322
2080-1335
2720-0841
Pojawia się w:
Przegląd Bezpieczeństwa Wewnętrznego
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Metody działania rosyjskich służb specjalnych w świetle afery Olega Kulinicza
Working methods of the Russian secret services in the light of the Oleg Kulinich case
Autorzy:
Świerczek, Marek
Powiązania:
https://bibliotekanauki.pl/articles/23379226.pdf
Data publikacji:
2023-12-06
Wydawca:
Agencja Bezpieczeństwa Wewnętrznego
Tematy:
FSB
SBU
WCzK
GPU
kontrwywiad ofensywny
dezorganizacja
infiltracja
konflikt rosyjsko-ukraiński
VChK
offensive counterintelligence
disorganisation
infiltration
Russian-Ukrainian conflict
Opis:
Autor dokonuje analizy przypadku zatrzymania oficera Służby Bezpieczeństwa Ukrainy Olega Kulinicza pod zarzutem szpiegostwa na rzecz Federalnej Służby Bezpieczeństwa Federacji Rosyjskiej. Na podstawie analizy zadań stawianych temu rosyjskiemu agentowi dochodzi do wniosku, że sposób działania rosyjskiego kontrwywiadu diametralnie różni się od metod zachodnich służb. Główną różnicą jest przeniesienie środka ciężkości działań operacyjnych z pracy rozpoznawczo-informacyjnej na próby agenturalnego przejęcia kontroli nad instytucjami przeciwnika, głównie cywilnymi i wojskowymi służbami specjalnymi, oraz na realizację infiltracji wywiadowczej przez ludzi dysponujących tym samym habitusem co kandydaci do werbunku. Korzystając z dorobku psychologii poznawczej oraz badań z zakresu historii najnowszej, autor udowadnia, że od ponad 100 lat rosyjskie służby wykorzystują i udoskonalają te metody.
The author analyses the case of the detention of Ukrainian Security Service officer Oleg Kulinich on suspicion of espionage for the Federal Security Service of the Russian Federation. On the basis of the analysis of the tasks posed to this Russian agent, he concludes that the modus operandi of Russian counterintelligence is diametrically opposed to the methods of Western services. The main difference is the shifting of the centre of gravity of operational activities from reconnaissance-information work to attempts at agentic seizure of control over enemy institutions, mainly civilian and military special services, and the realisation of intelligence infiltration by people with the same habitus as recruitment candidates. Drawing on the achievements of cognitive psychology and research in recent history, the author demonstrates that the Russian services have been using and refining these methods for more than 100 years.
Źródło:
Przegląd Bezpieczeństwa Wewnętrznego; 2023, 15, 29; 63-93
2080-1335
2720-0841
Pojawia się w:
Przegląd Bezpieczeństwa Wewnętrznego
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Notatka pracownika 3. Oddziału Wydziału Kontrwywiadu Głównego Zarządu Politycznego (GPU) Nauiokajtisa dla zastępcy szefa Wydziału Pilara w sprawie wymiany Ostapa Dłuskiego : 1923, maj 21, Moskwa.
Autorzy:
Nauiokajtis.
Powiązania:
Wymiana więźniów politycznych pomiędzy II Rzecząpospolitą a Sowietami w okresie międzywojennym : dokumenty i materiały Warszawa, 2000 S. 96
Współwytwórcy:
Materski, Wojciech. Opracowanie
Data publikacji:
2000
Tematy:
Dłuski, Ostap
Pilar, von Pilchau Roman
Główny Zarząd Polityczny (ZSRR) maj 1923 r.
Wymiana więźniów politycznych maj 1923 r.
Opis:
Tekst w jęz. ros.
Indeks.
Dostawca treści:
Bibliografia CBW
Artykuł
Tytuł:
Robust and efficient finite-difference-time-domain modelling of the propagation of nonlinear elastic waves
Niezawodne i wydajne modelowanie propagacji nieliniowych fal sprężystych metodą różnic skończonych w dziedzinie czasu
Autorzy:
Pandala, A.
Shivaprasad, S.
Krishnamurthy, C. V.
Balasubramaniam, K.
Powiązania:
https://bibliotekanauki.pl/articles/107732.pdf
Data publikacji:
2018
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
Finite Difference Time Domain
Rotated Staggered Grid
Parsimonious Scheme
Nonlinear elastic waves
CUDA
GPU
metoda różnic skończonych w dziedzinie czasu
rotowane siatki przestawne
schemat redukcji oszczędnej
nieliniowe fale sprężyste
Opis:
A robust finite-difference-time-domain (FDTD ) scheme to model the non-linear elastic wave propagation in a homogeneous isotropic material is presented. A formulation based on rotated staggered grid scheme in a displacement-velocity-stress configuration incorporating both geometric and material nonlinearities is proposed. By adopting a Parsimonious algorithm, the computational memory requirement is reduced by 50%. Simulations are accelerated by exploiting massive data parallelism innate to the FDTD approach using parallel computation on Graphical Processing Units with NVIDIA CUDA ’s API. For the proposed numerical scheme, the grid convergence criterion and accuracy over propagating distances are investigated. The study is also extended to determine the contribution from geometric and material models at various input amplitude levels. The time and frequency domain signals obtained from the proposed scheme are verified with a commercial finite element solver. The simulation runtimes for an Aluminium sample of dimensions 20 mm x 10 mm using a 5 MHz pulse is of the order of one minute, which makes the proposed numerical scheme attractive to model nonlinear elastic waves in large domains.
W artykule przedstawiono odporny schemat metody różnic skończonych w dziedzinie czasu (FDTD ) do modelowania propagacji nieliniowych fal sprężystych w jednorodnym materiale izotropowym. Zaproponowano podejście oparte na rotowanych siatkach przestawnych w układzie przemieszczenie- prędkość-naprężenie obejmującym zarówno nieliniowość geometryczną, jak i materiałową. Zastosowanie algorytmu redukcji oszczędnej, zmniejszyło zapotrzebowanie na pamięć obliczeniową o 50%. Symulacje są przyspieszane przez wykorzystanie olbrzymiego paralelizmu danych wbudowanego w podejście FDTD z wykorzystaniem obliczeń równoległych na jednostkach przetwarzania graficznego (GPU) wyposażonych w interfejs API NVIDIA CUDA . Dla proponowanego schematu numerycznego badane jest kryterium zbieżności siatki i dokładność w funkcji odległości propagacji. Badanie rozszerzono również w celu określenia wkładu modeli geometrycznych i materiałowych na różnych poziomach amplitudy wejściowej. Sygnały w dziedzinie czasu i częstotliwości uzyskane z proponowanego schematu są weryfikowane za pomocą komercyjnego oprogramowania wykorzystującego metodę elementów skończonych. Czasy pracy dla symulacji propagacji impulsu o częstotliwości 5 MHz w próbce aluminium o wymiarach 20 mm x 10 mm są rzędu jednej minuty, co sprawia, że proponowany schemat liczbowy jest atrakcyjny dla modelowania nieliniowych fal sprężystych w dużych domenach.
Źródło:
Badania Nieniszczące i Diagnostyka; 2018, 2; 11-21
2451-4462
2543-7755
Pojawia się w:
Badania Nieniszczące i Diagnostyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
„Płonąca granica”. Działalność szpiegowska w kontekście nielegalnych migracji na wschodniej granicy II Rzeczypospolitej (na przykładzie województwa tarnopolskiego)
“A Border in Flames”. Espionage in the Context of Illegal Migrations along the Eastern Border of the Second Republic of Poland (Based on the Example of the Tarnopolskie Voivodeship)
Autorzy:
Humennyi, Serhii
Powiązania:
https://bibliotekanauki.pl/articles/478484.pdf
Data publikacji:
2019
Wydawca:
Instytut Pamięci Narodowej, Komisja Ścigania Zbrodni przeciwko Narodowi Polskiemu
Tematy:
spying and sabotage activities
illegal migration
smuggling
USRR
Second Republic of Poland
Tarnopolskie Voivodeship
Soviet and Polish border
State Political Board (GPU)
Border Protection Corps (BPC)
Opis:
Z jawisko działalności szpiegowskiej w kontekście nielegalnych migracji na terenach przygranicznych II Rzeczypospolitej pozostaje nadal mało zbadane. Celem niniejszego artykułu jest analiza procederu nielegalnego przekraczania granicy państwowej i wyjaś- nienie wpływu tego zjawiska na sytuację polityczną i gospodarczą w przygranicznym pasie województwa tarnopolskiego, a ściślej w jego powiatach: borszczowskim, czortkow- skim, kopyczynieckim, skałackim i zbaraskim, w latach 1921–1939. Najprawdopodobniej jest to pierwsza próba przybliżenia zależności między stanem ochrony granicy pań- stwowej, konfliktem ukraińsko-polskim w warunkach istnienia państwa polskiego i działalnością dywersyjno-wywiadowczą władz radzieckich na obszarze jednego ze wschodnich województw ІІ Rzeczypospolitej.
T he phenomenon of espionage in the context of illegal migrations in the borderlands of the Second Republic of Poland has not been thoroughly examined so far. This article aims to analyse the procedure of crossing the state border illegally and explaining the impact of the phenomenon on the political and economic situation in the borderlands of the Tarnopolskie Voivodeship, specifically in the Poviats of Borszczów, Czortków, Kopyczyńce, Skałat and Zbaraż in the years 1921–1939. This it most probably the first attempt to explain the relationship between the status of the protection of the state bor- der, the Ukrainian and Polish conflict during the existence of the Polish state and the sabotage and intelligence activities of the Soviet authorities in the territories of one of the Eastern voivodeships of the Second Republic of Poland.
Źródło:
Pamięć i Sprawiedliwość; 2019, 33; 327-344
1427-7476
Pojawia się w:
Pamięć i Sprawiedliwość
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
GPU Accelerated Image Reconstruction in a Two-Strip J-PET Tomograph
Autorzy:
Białas, P.
Kowal, J.
Strzelecki, A.
Bednarski, T.
Czerwiński, E.
Gajos, A.
Kamińska, D.
Kapłon, Ł.
Kochanowski, A.
Korcyl, G.
Kowalski, P.
Kozik, T.
Krzemień, W.
Kubicz, E.
Moskal, P.
Niedźwiecki, Sz.
Pałka, M.
Raczyński, L.
Rudy, Z.
Rundel, O.
Salabura, P.
Sharma, N.
Silarski, M.
Słomski, A.
Smyrski, J.
Wieczorek, A.
Wiślicki, W.
Zieliński, M.
Zoń, N.
Powiązania:
https://bibliotekanauki.pl/articles/1402623.pdf
Data publikacji:
2015-05
Wydawca:
Polska Akademia Nauk. Instytut Fizyki PAN
Tematy:
87.57.nf
87.57.uk
Opis:
We present a fast GPU implementation of the image reconstruction routine, for a novel two strip PET detector that relies solely on the time of flight measurements.
Źródło:
Acta Physica Polonica A; 2015, 127, 5; 1500-1504
0587-4246
1898-794X
Pojawia się w:
Acta Physica Polonica A
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Działania wobec Attachatu Wojskowego przy Poselstwie RP w Moskwie w początkach jego funkcjonowania jako egzemplifikacja kontrwywiadowczego modus operandi stosowanego przez służby rosyjskie.
Soviet CI activities against the Military Attaché of the Polish Republic in Moscow at the beginning of its functioning in the early twenties as an exemplification of the Russian counter-espionage modus operandi.
Autorzy:
Świerczek, Marek
Powiązania:
https://bibliotekanauki.pl/articles/1062552.pdf
Data publikacji:
2017-11-15
Wydawca:
Agencja Bezpieczeństwa Wewnętrznego
Tematy:
kontrwywiad ofensywny
GPU
Oddział II SG WP
sowieckie służby specjalne
dezinformacja
attachat wojskowy w Moskwie
gry kontrwywiadowcze
podwójni agenci
offensive
counterintelligence
II Division of the Polish General Staff
Soviet special services
disinformation
military attaché in Moscow
counterintelligence games
double agents
Opis:
Autor artykułu analizuje modus operandi sowieckiego GPU w zakresie operacji dezinformacyjnych prowadzonych wobec placówek wywiadowczych na przykładzie polskich służb ulokowanych na terytorium Rosji Sowieckiej w pierwszej połowie lat 20. XX w. Autor wysunął tezę, że sowieckie służby dzięki zastosowanym metodom operacyjnym zdołały całkowicie przejąć kontrolę nad źródłami informacji polskiego wywiadu. Mechanizm takich operacji wytworzony przez Sowietów, w powiązaniu z błędami popełnionymi przez Oddział II SG WP, odcinał polski wywiad od prawdziwych informacji, a jednocześnie umożliwiał podsuwanie im podwójnej agentury i kontrolowanie kanałów informacji płynących z ZSRR na Zachód. Autor analizuje konkretne przypadki historyczne, aby udowodnić tezę o kompleksowości operacji prowadzonej przez sowiecki kontrwywiad, mającej na celu dezinformację o charakterze strategicznym, i na ich podstawie pokusił się o odtworzenie metodyki stosowanej przez sowieckie służby.
The author analyses modus operandi of the Soviet GPU in terms of disinformation operations carried out against intelligence posts by the example of Polish services located in Soviet Russia in the first half of 1920s. The author has put forward a thesis that Soviet services, thanks to applied operational methods, managed to take a total control over Polish intelligence sources of information. The mechanism of such operations created by Soviets in connection with some mistakes by the II. Division of the General Staff of the Polish Armed Forces (further II D) cut Polish intelligence from genuine information, and, at the same time, it enabled to get them double agents and control channels of information from the USSR to the West. The author examines some concrete historical cases to prove a thesis about the complexity of the Soviet CI operation carried out to strategic disinformation, and on the basis of such cases he tries to reconstruct the methodology of Soviet services.
Źródło:
Przegląd Bezpieczeństwa Wewnętrznego; 2017, 9, 17; 167-183
2080-1335
2720-0841
Pojawia się w:
Przegląd Bezpieczeństwa Wewnętrznego
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Soviet CI activities against the Military Attaché of the Polish Republic in Moscow at the beginning of its functioning in the early twenties as an exemplification of the Russian counter-espionage modus operandi.
Działania wobec Attachatu Wojskowego przy Poselstwie RP w Moskwie w początkach jego funkcjonowania jako egzemplifikacja kontrwywiadowczego modus operandi stosowanego przez służby rosyjskie.
Autorzy:
Świerczek, Marek
Powiązania:
https://bibliotekanauki.pl/articles/501633.pdf
Data publikacji:
2017-11-15
Wydawca:
Agencja Bezpieczeństwa Wewnętrznego
Tematy:
offensive
counterintelligence
GPU
II Division of the Polish General Staff
Soviet special services
disinformation
military attaché in Moscow
counterintelligence games
double agents
kontrwywiad ofensywny
Oddział II SG WP
sowieckie służby specjalne
dezinformacja
attachat wojskowy w Moskwie
gry kontrwywiadowcze
podwójni agenci
Opis:
The author analyses modus operandi of the Soviet GPU in terms of disinformation operations carried out against intelligence posts by the example of Polish services located in Soviet Russia in the first half of 1920s. The author has put forward a thesis that Soviet services, thanks to applied operational methods, managed to take a total control over Polish intelligence sources of information. The mechanism of such operations created by Soviets in connection with some mistakes by the II. Division of the General Staff of the Polish Armed Forces (further II D) cut Polish intelligence from genuine information, and, at the same time, it enabled to get them double agents and control channels of information from the USSR to the West. The author examines some concrete historical cases to prove a thesis about the complexity of the Soviet CI operation carried out to strategic disinformation, and on the basis of such cases he tries to reconstruct the methodology of Soviet services.
Autor artykułu analizuje modus operandi sowieckiego GPU w zakresie operacji dezinformacyjnych prowadzonych wobec placówek wywiadowczych na przykładzie polskich służb ulokowanych na terytorium Rosji Sowieckiej w pierwszej połowie lat 20. XX w. Autor wysunął tezę, że sowieckie służby dzięki zastosowanym metodom operacyjnym zdołały całkowicie przejąć kontrolę nad źródłami informacji polskiego wywiadu. Mechanizm takich operacji wytworzony przez Sowietów, w powiązaniu z błędami popełnionymi przez Oddział II SG WP, odcinał polski wywiad od prawdziwych informacji, a jednocześnie umożliwiał podsuwanie im podwójnej agentury i kontrolowanie kanałów informacji płynących z ZSRR na Zachód. Autor analizuje konkretne przypadki historyczne, aby udowodnić tezę o kompleksowości operacji prowadzonej przez sowiecki kontrwywiad, mającej na celu dezinformację o charakterze strategicznym, i na ich podstawie pokusił się o odtworzenie metodyki stosowanej przez sowieckie służby
Źródło:
Przegląd Bezpieczeństwa Wewnętrznego; 2017, 9, 17; 393-406
2080-1335
2720-0841
Pojawia się w:
Przegląd Bezpieczeństwa Wewnętrznego
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-98 z 98

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies