Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "GPU" wg kryterium: Temat


Tytuł:
Application of GPU in the development of 3D hydrodynamics simulators for oil recovery prediction
Zastosowanie procesorów graficznych GPU w rozwoju trójwymiarowych symulatorów hydrodynamicznych w planowaniu wtórnego wydobycia ropy naftowej
Autorzy:
Beisembetov, I. K.
Bekibaev, T. T.
Assilbekov, B. K.
Zhapbasbayev, U. K.
Kenzhaliev, B. K.
Powiązania:
https://bibliotekanauki.pl/articles/299217.pdf
Data publikacji:
2012
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
GPU
CPU
NVIDIA
trójwymiarowe symulatory hydrodynamiczne
planowanie wtórnego wydobycia ropy
3D hydrodynamics simulators
prediction of oil recovery
Opis:
In this article computer's graphics card application in prediction of oil recovery using the CUDA architecture is studied. CUDA is architecture of parallel computing made by NVIDIA Company. It allows increasing dramatically the calculating performance due to GPU (graphical processors) usage. Calculations were executed on field models with 3 million grid blocks. Material balance equation approximated with IMPES method. As the result of numerical modeling of oil recovery prediction with GPU, dozens of times acceleration of calculations comparing with CPU has been taken.
Artykuł przedstawia badania nad programem graficznym wykorzystywanym w planowaniu wtórnego wydobycia ropy naftowej z wykorzystaniem równoległego systemu obliczeniowego CUDA. CUDA jest systemem stworzonym przez firmę NVIDIA. Pozwala on na ogromne zwiększenie mocy obliczeniowej poprzez zastosowanie procesorów graficznych GPU. Porównane zostały wyniki osiągnięte od roku 2003 obliczone z wykorzystaniem zwykłego procesora CPU oraz procesora graficznego GPU. Obliczenia zostały wykonane na modelu złożowym wykonanym na siatce przestrzennej złożonej z 3 milionów komórek. Równanie bilansu masowego w przybliżeniu opisuje metoda przepływu dwufazowego w ośrodku porowatym typu IMPES. W rezultacie modelowania numerycznego wtórnego wydobycia ropy naftowej z wykorzystaniem procesora graficznego GPU, wyniki obliczeń uzyskano wielokrotnie szybciej niż w przypadku stosowania procesora typu CPU.
Źródło:
AGH Drilling, Oil, Gas; 2012, 29, 1; 75-88
2299-4157
2300-7052
Pojawia się w:
AGH Drilling, Oil, Gas
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wyznaczanie równoległości pętli programowych w aplikacjach dedykowanych dla procesorów graficznych
Parallelizing program loops for graphics processing in general purpose computing
Autorzy:
Bielecki, W.
Pałkowski, M.
Powiązania:
https://bibliotekanauki.pl/articles/155271.pdf
Data publikacji:
2011
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
automatyczne zrównoleglanie pętli
fragmenty kodu
GPU
CUDA
OpenCL
obliczenia wysokiej wydajności
loop parallelization
slices
Opis:
Ekstrakcja równoległości w postaci niezależnych fragmentów kodu pozwala wygenerować równoległe pętle programowe w sposób automatyczny. Kod taki umożliwia wykorzystanie mocy obliczeniowej maszyn równoległych, w tym wieloprocesorowych kart graficznych. W niniejszym artykule poddano analizie zastosowanie algorytmów wyznaczania fragmentów kodu dla aplikacji dedykowanych dla procesorów graficznych. Zbadano przyspieszenie i efektywność obliczeń oraz skalowalność wygenerowanego kodu równoległego.
Extracting synchronization-free slices allows automatically generating parallel loops. The code can be executed on multi-processors machines in a reduced period of time. Slicing techniques enable also generating parallel code for graphics processing in general purpose computing. Nowadays, graphic cards support executing multi-threaded applications. GPU systems consist of tens or hundreds of processors. CUDA (an acronym for Compute Unified Device Architecture) is a parallel computing architecture developed by NVIDIA. Graphics processing units (GPUs) are accessible to software developers through variants of industry standard programming languages. Using CUDA, the latest NVIDIA GPUs become accessible for computation like CPUs. The model for GPU computing is to use a CPU and GPU together in a heterogeneous co-processing computing model. The sequential part of the application runs on the CPU and the computationally-intensive part is accelerated by the GPU. From the user's perspective, the application just runs faster because it uses the high-performance of the GPU to boost performance. In this paper slicing algorithms are examined for generating a parallel code for graphic cards are examined. A short example of the code is presented. CUDA statements and technique are explained. Memory cost and transfer data is considered. Speed-up, efficiency and scalability of the code are analyzed.
Źródło:
Pomiary Automatyka Kontrola; 2011, R. 57, nr 8, 8; 963-965
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Computational aspects of GPU - accelerated sparse matrix - vector multiplication for solving Markov models
Obliczeniowe aspekty mnożenia macierzy rzadkiej przez wektor dla rozwiązywania modeli Markowa przyspieszanego przez karty GPU
Autorzy:
Bylina, B.
Bylina, J.
Karwacki, M.
Powiązania:
https://bibliotekanauki.pl/articles/375696.pdf
Data publikacji:
2011
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
Markovian models
wireless network models
GPU
matrix-vector multiplication
sparse matrices
Opis:
In this article we investigate some computational aspects of GPU-accelerated matrix-vector multiplication where matrix is sparse. Particularly, we deal with sparse matrices appearing in modelling with Markovian queuing models. The model we use for research is a Markovian queuing model of a wireless device. This model describes the device’s behavior during possible channel occupation by other devices. We study the efficiency of multiplication of a sparse matrix by a dense vector with the use of an appropriate, ready-to-use GPU-accelerated mathematical library, namely CUSP. For the CUSP library we discuss data structures and their impact on the CUDA platform for the fine-grained parallel architecture of the GPU. Our aim is to find the best format for storing a sparse matrix for GPU-computation (especially one associated with the Markovian model of a wireless device). We compare the time, the performance and the speed-up for the card NVIDIA Tesla C2050 (with ECC ON). For unstructured matrices (as our Markovian matrices), we observe speed-ups (in respect to CPU-only computations) of over 8 times.
Łańcuchy Markowa są przydatnym narzędziem do modelowania systemów złożonych, takich jak systemy i sieci komputerowe. W ostatnich latach łańcuchy Markowa zostały z powodzeniem wykorzystane do oceny pracy sieci bezprzewodowych. Jednym z problemów jaki się pojawia przy wykorzystywaniu łańcuchów Markowa w modelowaniu sieci są problemy natury obliczeniowej. W artykule zajmiemy się badaniem mnożenia macierzy rzadkiej przez wektor, które jest jedną z głównych operacji podczas numerycznego rozwiązywania modeli Markowowskich. Aby, przyspieszyć czas obliczeń mnożenia macierz rzadkiej przez wektor wykorzystano funkcje z biblioteki CUSP. Biblioteka jest zbiorem funkcji wykonywanych na GPU (ang.Graphics Processing Unit) celem skrócenia czasu obliczeń. Do testowania operacji mnożenia macierzy rzadkiej przez wektor badano macierze z Markowowskiego modelu pracy sieci bezprzewodowej. Model ten opisuje zachowanie urządzenia, gdy kanał transmisyjnych może być zajęty przez inne urządzenia. Macierz przejść wspomnianego modelu jest macierzą rzadką i potrzeba specialnej struktury danych do jej przechowywania, dlatego w artykule dyskutowane są różne struktury danych dla macierzy rzadkich i ich przydatność do obliczen na kartach graficznych. W pracy porównano czas, wydajność i przyspieszenie jakie otrzymano podczas testowania biblioteki CUSP na karcie NVIDIA Tesla C2050 dla niestrukturalnych macierzy rzadkich opisujących model zajętości węzła w sieciach bezprzewodowych przy różnych formatach przechowywania macierzy rzadkich. Dla testowanych macierzy zauważono ośmiokrotne przyspieszenie obliczeń przy wykorzystaniu karty graficznej.
Źródło:
Theoretical and Applied Informatics; 2011, 23, 2; 127-145
1896-5334
Pojawia się w:
Theoretical and Applied Informatics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Exploiting multi-core and many-core parallelism for subspace clustering
Autorzy:
Datta, Amitava
Kaur, Amardeep
Lauer, Tobias
Chabbouh, Sami
Powiązania:
https://bibliotekanauki.pl/articles/331126.pdf
Data publikacji:
2019
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
data mining
subspace clustering
multicore processor
many core processor
GPU computing
eksploracja danych
procesor wielordzeniowy
obliczenia GPU
Opis:
Finding clusters in high dimensional data is a challenging research problem. Subspace clustering algorithms aim to find clusters in all possible subspaces of the dataset, where a subspace is a subset of dimensions of the data. But the exponential increase in the number of subspaces with the dimensionality of data renders most of the algorithms inefficient as well as ineffective. Moreover, these algorithms have ingrained data dependency in the clustering process, which means that parallelization becomes difficult and inefficient. SUBSCALE is a recent subspace clustering algorithm which is scalable with the dimensions and contains independent processing steps which can be exploited through parallelism. In this paper, we aim to leverage the computational power of widely available multi-core processors to improve the runtime performance of the SUBSCALE algorithm. The experimental evaluation shows linear speedup. Moreover, we develop an approach using graphics processing units (GPUs) for fine-grained data parallelism to accelerate the computation further. First tests of the GPU implementation show very promising results.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2019, 29, 1; 81-91
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
GPU implementation of atomic fluid MD simulation.
Autorzy:
Dawid, Aleksander
Powiązania:
https://bibliotekanauki.pl/articles/2197547.pdf
Data publikacji:
2022
Wydawca:
Politechnika Gdańska
Tematy:
MD simulabon
GPU
atomic fluid
MD parallel algorithm
Opis:
A computer simulation of an atomic fluid on a GPU was implemented using the CUDA architecture. It was shown that the programming model for efficient numerical computing applications was changing with the development of the CUDA architecture. The introduction of the L2 cache decreased the latency between the global GPU memory and the registers. The performed MD simulation using the global memory and registers showed that the average acceleration relative to the CPU reached 80 times for single-precision calculations. Usually, the shared block memory gives much better results for this kind of calculation. We have found that using the shared memory gives acceleration over 116 times in comparison to the CPU. It is about 49% faster than using the global memory and registers. It is shown here that the performance of generally available graphics cards for double-precision calculations is significantly lower than for single-precision calculations. The recorded double-precision acceleration relative to the CPU in our experiment averaged 6 and 7 times for the global and shared memory, respectively. We performed these calculations on two different CUDA enable device systems.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2022, 26, 1; 25-37
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
An optimized parallel implementation of non-iteratively trained recurrent neural networks
Autorzy:
El Zini, Julia
Rizk, Yara
Awad, Mariette
Powiązania:
https://bibliotekanauki.pl/articles/2031147.pdf
Data publikacji:
2021
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
GPU implementation
parallelization
Recurrent Neural Network
RNN
Long-short Term Memory
LSTM
Gated Recurrent Unit
GRU
Extreme Learning Machines
ELM
non-iterative training
Opis:
Recurrent neural networks (RNN) have been successfully applied to various sequential decision-making tasks, natural language processing applications, and time-series predictions. Such networks are usually trained through back-propagation through time (BPTT) which is prohibitively expensive, especially when the length of the time dependencies and the number of hidden neurons increase. To reduce the training time, extreme learning machines (ELMs) have been recently applied to RNN training, reaching a 99% speedup on some applications. Due to its non-iterative nature, ELM training, when parallelized, has the potential to reach higher speedups than BPTT. In this work, we present Opt-PR-ELM, an optimized parallel RNN training algorithm based on ELM that takes advantage of the GPU shared memory and of parallel QR factorization algorithms to efficiently reach optimal solutions. The theoretical analysis of the proposed algorithm is presented on six RNN architectures, including LSTM and GRU, and its performance is empirically tested on ten time-series prediction applications. Opt- PR-ELM is shown to reach up to 461 times speedup over its sequential counterpart and to require up to 20x less time to train than parallel BPTT. Such high speedups over new generation CPUs are extremely crucial in real-time applications and IoT environments.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2021, 11, 1; 33-50
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
G-DNA – a highly efficient multi-GPU/MPI tool for aligning nucleotide reads
Autorzy:
Frohmberg, W.
Kierzynka, M.
Blazewicz, J.
Gawron, P.
Wojciechowski, P.
Powiązania:
https://bibliotekanauki.pl/articles/200827.pdf
Data publikacji:
2013
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
DNA assembly preprocessing
sequence alignment
GPU computing
Opis:
DNA/RNA sequencing has recently become a primary way researchers generate biological data for further analysis. Assembling algorithms are an integral part of this process. However, some of them require pairwise alignment to be applied to a great deal of reads. Although several efficient alignment tools have been released over the past few years, including those taking advantage of GPUs (Graphics Processing Units), none of them directly targets high-throughput sequencing data. As a result, a need arose to create software that could handle such data as effectively as possible. G-DNA (GPU-based DNA aligner) is the first highly parallel solution that has been optimized to process nucleotide reads (DNA/RNA) from modern sequencing machines. Results show that the software reaches up to 89 GCUPS (Giga Cell Updates Per Second) on a single GPU and as a result it is the fastest tool in its class. Moreover, it scales up well on multiple GPUs systems, including MPI-based computational clusters, where its performance is counted in TCUPS (Tera CUPS).
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2013, 61, 4; 989-992
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
G-PAS 2.0 - an improved version of protein alignment tool with an efficient backtracking routine on multiple GPUs
Autorzy:
Frohmberg, W.
Kierzynka, M.
Blazewicz, J.
Wojciechowski, P.
Powiązania:
https://bibliotekanauki.pl/articles/201593.pdf
Data publikacji:
2012
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
pairwise alignment
GPU computing
alignment with backtracking procedure
Opis:
Several highly efficient alignment tools have been released over the past few years, including those taking advantage of GPUs (Graphics Processing Units). G-PAS (GPU-based Pairwise Alignment Software) was one of them, however, with a couple of interesting features that made it unique. Nevertheless, in order to adapt it to a new computational architecture some changes had to be introduced. In this paper we present G-PAS 2.0 - a new version of the software for performing high-throughput alignment. Results show, that the new version is faster nearly by a fourth on the same hardware, reaching over 20 GCUPS (Giga Cell Updates Per Second).
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2012, 60, 3; 491-494
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Accelerating computation of a reduced order model of a structural system resulting from Craig–Bampton reduction using GPU programming
Autorzy:
Górecki, Piotr
Kalinowski, Miłosz
Jeziorek, Łukasz
Broniszewski, Jakub
Koziara, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/38706110.pdf
Data publikacji:
2024
Wydawca:
Instytut Podstawowych Problemów Techniki PAN
Tematy:
GPU
CPU
reduced order model
structural model
CuPy array library
model zredukowanego zamówienia
model strukturalny
CuPy
Opis:
The Craig–Bampton (CB) method is a well-known substructuring technique that reduces the size of a finite element model (FEM) using a set of vibration modes. For large FEA models, the reduction process could be computationally expensive since it requires algebra operations on FEM mode shapes and FEM system sparse matrices. In this paper, we investigate the potential of usage of GPU parallel processing to speed up solving the system of linear equations that results from the CB reduction process made for a model of cyclic structures. A Python based high-level approach, employing the CuPy, GinkGo and STRUMPACK libraries on the GPU, is compared with an optimized Fortran code. In side-to-side comparisons, employing the same inputs, the Python-GPU code is run on a single GPU device and the Fortran code is run on a multi-core compute node. The CB reduction process was split into several parts, each dealing with different kind of algebraic formulation of the problem. Performance comparisons were focused on the sparse system linear solver, since it turned out to be the most time-consuming part. The results suggest that the current GPU-based linear sparse solvers do not surpass the state-of-the-art CPU-based MKL PARDISO solver (at least up to 1M DOFs).
Źródło:
Computer Assisted Methods in Engineering and Science; 2024, 31, 1; 51-66
2299-3649
Pojawia się w:
Computer Assisted Methods in Engineering and Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Hypergrammar-based parallel multi-frontal solver for grids with point singularities
Autorzy:
Gurgul, P.
Paszyński, M.
Paszyńska, A.
Powiązania:
https://bibliotekanauki.pl/articles/305343.pdf
Data publikacji:
2015
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
hypergraph grammar
direct solver
h-adaptive finite element method
NVIDIA CUDA GPU
Opis:
This paper describes the application of hypergraph grammars to drive a linear computational cost solver for grids with point singularities. Such graph grammar productions are the first mathematical formalisms used to describe solver algorithms, and each indicates the smallest atomic task that can be executed in parallel, which is very useful in the case of parallel execution. In particular,the partial order of execution of graph grammar productions can be found, and the sets of independent graph grammar productions can be localized. They can be scheduled set by set into a shared memory parallel machine. The graph-grammar-based solver has been implemented with NVIDIA CUDA for GPU. Graph grammar productions are accompanied by numerical results for a 2D case. We show that our graph-grammar-based solver with a GPU accelerator is, by order of magnitude, faster than the state-of-the-art MUMPS solver.
Źródło:
Computer Science; 2015, 16 (1); 75-102
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Novel FE/MC-based Mathematical Model of Mushy Steel Deformation with GPU Support
Autorzy:
Hojny, Marcin
Dębiński, Tomasz
Powiązania:
https://bibliotekanauki.pl/articles/2106557.pdf
Data publikacji:
2022
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
FEM
Monte Carlo
extra-high temperatures
soft-reduction
GPU
Opis:
The paper presents the results of work leading to the construction of a spatial hybrid model based on finite element (FE) and Monte Carlo (MC) methods allowing the computer simulation of physical phenomena accompanying the steel sample testing at temperatures that are characteristic for soft-reduction process. The proposed solution includes local density variations at the level of mechanical solution (the incompressibility condition was replaced with the condition of mass conservation), and at the same time simulates the grain growth in a comprehensive resistance heating process combined with a local remelting followed by free/controlled cooling of the sample tested. Simulation of grain growth in the entire computing domain would not be possible without the support of GPU processors. There was a 59-fold increase in the computing speed on the GPU compared to single-threaded computing on the CPU. The study was complemented by examples of experimental and computer simulation results, showing the correctness of the adopted model assumptions.
Źródło:
Archives of Metallurgy and Materials; 2022, 67, 2; 735--742
1733-3490
Pojawia się w:
Archives of Metallurgy and Materials
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
„Płonąca granica”. Działalność szpiegowska w kontekście nielegalnych migracji na wschodniej granicy II Rzeczypospolitej (na przykładzie województwa tarnopolskiego)
“A Border in Flames”. Espionage in the Context of Illegal Migrations along the Eastern Border of the Second Republic of Poland (Based on the Example of the Tarnopolskie Voivodeship)
Autorzy:
Humennyi, Serhii
Powiązania:
https://bibliotekanauki.pl/articles/478484.pdf
Data publikacji:
2019
Wydawca:
Instytut Pamięci Narodowej, Komisja Ścigania Zbrodni przeciwko Narodowi Polskiemu
Tematy:
spying and sabotage activities
illegal migration
smuggling
USRR
Second Republic of Poland
Tarnopolskie Voivodeship
Soviet and Polish border
State Political Board (GPU)
Border Protection Corps (BPC)
Opis:
Z jawisko działalności szpiegowskiej w kontekście nielegalnych migracji na terenach przygranicznych II Rzeczypospolitej pozostaje nadal mało zbadane. Celem niniejszego artykułu jest analiza procederu nielegalnego przekraczania granicy państwowej i wyjaś- nienie wpływu tego zjawiska na sytuację polityczną i gospodarczą w przygranicznym pasie województwa tarnopolskiego, a ściślej w jego powiatach: borszczowskim, czortkow- skim, kopyczynieckim, skałackim i zbaraskim, w latach 1921–1939. Najprawdopodobniej jest to pierwsza próba przybliżenia zależności między stanem ochrony granicy pań- stwowej, konfliktem ukraińsko-polskim w warunkach istnienia państwa polskiego i działalnością dywersyjno-wywiadowczą władz radzieckich na obszarze jednego ze wschodnich województw ІІ Rzeczypospolitej.
T he phenomenon of espionage in the context of illegal migrations in the borderlands of the Second Republic of Poland has not been thoroughly examined so far. This article aims to analyse the procedure of crossing the state border illegally and explaining the impact of the phenomenon on the political and economic situation in the borderlands of the Tarnopolskie Voivodeship, specifically in the Poviats of Borszczów, Czortków, Kopyczyńce, Skałat and Zbaraż in the years 1921–1939. This it most probably the first attempt to explain the relationship between the status of the protection of the state bor- der, the Ukrainian and Polish conflict during the existence of the Polish state and the sabotage and intelligence activities of the Soviet authorities in the territories of one of the Eastern voivodeships of the Second Republic of Poland.
Źródło:
Pamięć i Sprawiedliwość; 2019, 33; 327-344
1427-7476
Pojawia się w:
Pamięć i Sprawiedliwość
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Real Time Processing of Networked Passive Coherent Location Radar System
Autorzy:
John, M.
Inggs, M.
Petri, D.
Powiązania:
https://bibliotekanauki.pl/articles/226268.pdf
Data publikacji:
2011
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
passive
PCL
real-time
GPU
Opis:
A Passive Coherent Location (PCL) Radar system, consisting of spatially distributed transmitters and receivers is currently being integrated at the University of Cape Town (UCT). The paper investigates the feasibility of real-time processing of PCL system signals using Graphic Processing Units (GPUs), specifically a study of two distinct clutter cancellation algorithms: ECA (Extensive Cancellation Algorithm) and NLMS (Normalised Least Mean Square). Clutter cancellation is the most computationally demanding part of PCL signal processing. This investigation compares the processing speed-up achieved by GPU over CPU implementations, with very encouraging results.
Źródło:
International Journal of Electronics and Telecommunications; 2011, 57, 3; 363-368
2300-1933
Pojawia się w:
International Journal of Electronics and Telecommunications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Application of the Lattice Boltzmann Method to the flow past a sphere
Autorzy:
Kajzer, A.
Pozorski, J.
Powiązania:
https://bibliotekanauki.pl/articles/281895.pdf
Data publikacji:
2017
Wydawca:
Polskie Towarzystwo Mechaniki Teoretycznej i Stosowanej
Tematy:
bluff-body flow
Lattice Boltzmann Method
Large Eddy Simulation
GPU computing
Opis:
The results of fully resolved simulations and large eddy simulations of bluff-body flows obtained by means of the Lattice Boltzmann Method (LBM) are reported. A selection of Reynolds numbers has been investigated in unsteady laminar and transient flow regimes. Computed drag coefficients of a cube have been compared with the available data for validation purposes. Then, a more detailed analysis of the flow past a sphere is presented, including also the determination of vortex shedding frequency and the resulting Strouhal numbers. Advantages and drawbacks of the chosen geometry implementation technique, so called “staircase geometry”, are discussed. For the quest of maximum computational effi- ciency, all simulations have been carried out with the use of in-house code executed on GPU.
Źródło:
Journal of Theoretical and Applied Mechanics; 2017, 55, 3; 1091-1099
1429-2955
Pojawia się w:
Journal of Theoretical and Applied Mechanics
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies