Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Parallel computing" wg kryterium: Temat


Tytuł:
Zastosowanie przetwarzania równoległego do analizy pola elektromagnetycznego wielkiej częstotliwości
Parallel processing applied to high frequency electromagnetic field analysis
Autorzy:
Walendziuk, W.
Powiązania:
https://bibliotekanauki.pl/articles/157259.pdf
Data publikacji:
2010
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
metoda FDTD
klaster
obliczenia równoległe
FDTD method
cluster system
parallel computing
Opis:
W artykule przedstawiono algorytmy równoległe, mające zastosowanie w metodzie FDTD (ang. Finite-Differences Time-Domain), będącej jedną z najpopularniejszych metod analizy pola elektromagnetycznego wielkiej częstotliwości. W pracy przedstawiono metodę dekompozycji analizowanej przestrzeni, jak również algorytmy dekompozycji programu na zespół współbieżnych wątków. Ze względu na szczególne zainteresowanie autora algorytmami mającymi zastosowanie w klastrach komputerowych, przedstawione będą wyniki doświadczeń, uzyskanych w czasie testów wydajności programu równoległego, opartego na dekompozycji przestrzeni w wersji podziału "plastrowego". Zdecydowano się na przedstawienie algorytmów zaimplementowanych w klastrze homogenicznym, jak również w heterogenicznym - przy wykorzystaniu dodatkowego algorytmu dynamicznego podziału obszaru analizy.
The paper contains parallel algorithms applied in the FDTD method, which is one of more popular ways of electromagnetic field of high frequency analysis. The work shows algorithms which decompose a program into a group of parallel threads, and a method of the analyzed area decomposition. The first type of algorithms enables achieving good speedups and makes it possible to use e.g. graphic cards in computations conducted with the use of the FDTD method. Whereas space decomposing algorithms help enlarge the analyzed area represented by a grid of elements built of electromagnetic field components presented in a differential form. Thanks to that it is possible to compute areas of great capacity, greater than the com-putational abilities of a single PC unit. The work focuses on presenting the results of efficiency examination of the parallel program based on this method. The author decided to show algorithms implemented on a homogeneous cluster, as well as in a heterogeneous one-with the use of an additional dynamic decomposition of the analyzed area.
Źródło:
Pomiary Automatyka Kontrola; 2010, R. 56, nr 2, 2; 111-114
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Zastosowanie obliczeń równoległych do klasyfikacji punktów overlap
Application of parallel computing for classification of overlapping points
Autorzy:
Bratuś, R.
Musialik, P.
Pióro, P.
Prochaska, M.
Rzonca, A.
Powiązania:
https://bibliotekanauki.pl/articles/131194.pdf
Data publikacji:
2017
Wydawca:
Stowarzyszenie Geodetów Polskich
Tematy:
punkty typu overlap
przetwarzanie równoległe
klasyfikacja punktów
kąt skanowania
overlapping points
parallel computing
points classification
scan angle
Opis:
Publikacja omawia nowatorskie metody rozwiązania ważnego technologicznie zagadnienia, jakim jest klasyfikacji punktów overlap, czyli punktów w pasie podwójnego pokrycia pomiędzy sąsiednimi szeregami skanowania. Prezentowane podejście oparte jest na wydajnej metodzie obliczeń równoległych na procesorach graficznych GPU, pozwalającej na zastosowanie bardziej zaawansowanego algorytmu podczas analizy i przetwarzania danych. Celem sprawdzenia wydajności przeprowadzono testy badanego narzędzia do klasyfikacji punktów overlap, a wyniki odniesiono do możliwości powszechnie stosowanego programu Terrascan firmy Terrasolid. Proponowane innowacje obliczeniowe mają na celu poprawę jakości danych skaningowych pozyskiwanych przy pomocy latających platform takich jak lekkie samoloty czy wiatrakowce. Podniesienie jakości procesu klasyfikacji punktów typu overlap, wymaga dwóch wstępnych etapów przetwarzania. Pierwszy polega na obcięciu brzegów szeregu ściśle według zadanego kąta od pionu. Zastosowane podejście daje bardziej regularne wyniki niż inne metody. Z kolei drugi, oparty o algorytm rozgęszczenia punktów, prowadzi do usuwania nadmiarowych profili skanowania. Proponowane rozwiązanie to klasyfikacja punktów overlap według kąta padania promienia skanera na teren i obiekty terenowe. Reasumując, w ramach opisanych badań dotychczas stosowane metody klasyfikacji punktów overlap zostały poddane rewizji. Korzystając z praktycznych uwag oraz sugestii ze strony wykonawców, wprowadzono szereg udoskonaleń, których prezentacja i dyskusja jest przedmiotem niniejszej publikacji.
The paper presents innovative methods of solving important technological problem: the classification of LiDAR points located in the overlapping area between two parallel scan strips. The presented approach is based on an efficient method of parallel computation using graphic processors, allowing to apply more sophisticated algorithms for data analysis and processing. The tests of the algorithms were executed in order to verify correctness of the assumption that the innovative solutions presented in the paper might increase the efficiency and correctness of the data, referred to well known and popular technological solutions. The suggested computational innovations are applied to increase the quality of the LiDAR data acquired by light airplanes and gyrocopters. Two approaches to increase the quality of classification of overlapping points have bee, proposed. The first process is cutting-off the points of the strip borders strictly according to defined angle measured from vertical direction. The second process is dissolving of the points to get the regular density of the result point cloud. The title issue is the classification of overlapping points according to the angle of incidence to the terrain and other objects. The normal vectors calculation for each of the scan points is necessary for the analysis. Such solution increases the quality of overlaps classification and guarantees its high efficiency thanks to the parallel computation. In conclusion, during the research three innovative approaches were tested and reviewed against commonly used methods. Parallel computation can improve quality and reduce time of processing for overlap classification problem was confirmed.
Źródło:
Archiwum Fotogrametrii, Kartografii i Teledetekcji; 2017, 29; 11-26
2083-2214
2391-9477
Pojawia się w:
Archiwum Fotogrametrii, Kartografii i Teledetekcji
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wybrane zagadnienia przetwarzania równoległego i rozproszonego oraz klastrów komputerowych
Autorzy:
Chaładyniak, D.
Powiązania:
https://bibliotekanauki.pl/articles/91258.pdf
Data publikacji:
2010
Wydawca:
Warszawska Wyższa Szkoła Informatyki
Tematy:
klastry komputerowe
przetwarzanie równoległe
przetwarzanie rozproszone
cluster computing
parallel computing
telecommunications networks
Opis:
W artykule przedstawiono wprowadzenie do zagadnień przetwarzania równoległego. Wyjaśniono jego ideę oraz zaprezentowano najpopularniejsze klasyfikacje. Przybliżono pojęcie przetwarzania rozproszonego we współczesnych sieciach teleinformatycznych. Przedstawiono wybrane implementacje klastrów komputerowych.
The article presents the introduction to parallel computing. It explains the idea and presents the most popular classifications. It also explains the concept of distributed processing in today’s telecommunications networks. It presents selected cluster computing implementations.
Źródło:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki; 2010, 4, 4; 41-53
1896-396X
2082-8349
Pojawia się w:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wielkoskalowe i zautomatyzowane testowanie przypuszczenia Beala
Bigscale and automatized testing of Beal’s Conjecture
Autorzy:
Świerczewski, Ł.
Powiązania:
https://bibliotekanauki.pl/articles/131937.pdf
Data publikacji:
2016
Wydawca:
Wrocławska Wyższa Szkoła Informatyki Stosowanej Horyzont
Tematy:
przypuszczenie Beal'a
BOINC
obliczenia równoległe
Beal’s conjecture
parallel computing
Opis:
Praca prezentuje aspekt adaptacji oraz wykorzystywania algorytmów zaprezentowanych w publikacji [1] na platformie do obliczeń rozproszonych BOINC [2]. Dodatkowo wykonano testy skalowalności przyśpieszenia oprogramowania na takich platformach jak Intel Xeon Phi 5110P [3] oraz platformie wykorzystującej Versatile SMP Foundation Advanced Platform firmy ScaleMP (rozwiązanie klasy vSMP [4][5]). Dzięki długotrwałym obliczeniom udało się znaleźć 47 rozwiązań przystających prawidłowo modulo 264. Żadne z uzyskanych rozwiązań nie jest jednak prawidłowe w przestrzeni całego zbioru liczb naturalnych, a co za tym idzie nie odnaleziono poprawnego kontrprzykładu dla przypuszczenia Beal'a.
This paper presents adaptation aspect and use of algorithms presented in publication [1] on distributed computing platform BOINC. What is more, there were made some test of software acceleration scalability on such platforms like Intel Xeon Phi 5110P and platform that uses Versatile SMP Foundation Advanced Platform made by ScaleMP. Thanks to long-lasting computation 47 solutions correctly congruent modulo 264 were found. None of the solutions obtained is not correct in the space around the set of natural numbers and what’s connected to that, any correct counterexample for Beal’s Conjecture was not found.
Źródło:
Biuletyn Naukowy Wrocławskiej Wyższej Szkoły Informatyki Stosowanej. Informatyka; 2016, 16; 19-32
2082-9892
Pojawia się w:
Biuletyn Naukowy Wrocławskiej Wyższej Szkoły Informatyki Stosowanej. Informatyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Very Fast Non-Dominated Sorting
Autorzy:
Smutnicki, C.
Rudy, J.
Żelazny, D.
Powiązania:
https://bibliotekanauki.pl/articles/375948.pdf
Data publikacji:
2014
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
parallel algorithms
Pareto sorting
computational complexity
GPU computing
multiple criteria decision analysis
NSGA-II
Opis:
A new and very efficient parallel algorithm for the Fast Non-dominated Sorting of Pareto fronts is proposed. By decreasing its computational complexity, the application of the proposed method allows us to increase the speedup of the best up to now Fast and Elitist Multi-Objective Genetic Algorithm (NSGA-II) more than two orders of magnitude. Formal proofs of time complexities of basic as well as improved versions of the procedure are presented. The provided experimental results fully confirm theoretical findings.
Źródło:
Decision Making in Manufacturing and Services; 2014, 8, 1-2; 13-23
1896-8325
2300-7087
Pojawia się w:
Decision Making in Manufacturing and Services
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Use of parallel computing in mass processing of laser data
Zastosowanie obliczeń równoległych do masowego przetwarzania danych laserowych
Autorzy:
Będkowski, J.
Bratuś, R.
Prochaska, M.
Rzonca, A.
Powiązania:
https://bibliotekanauki.pl/articles/129799.pdf
Data publikacji:
2015
Wydawca:
Stowarzyszenie Geodetów Polskich
Tematy:
parallel computing
laser scanning
lidar
data processing
obliczenia równoległe
skanowanie laserowe
LiDAR
przetwarzanie danych
Opis:
The first part of the paper includes a description of the rules used to generate the algorithm needed for the purpose of parallel computing and also discusses the origins of the idea of research on the use of graphics processors in large scale processing of laser scanning data. The next part of the paper includes the results of an efficiency assessment performed for an array of different processing options, all of which were substantially accelerated with parallel computing. The processing options were divided into the generation of orthophotos using point clouds, coloring of point clouds, transformations, and the generation of a regular grid, as well as advanced processes such as the detection of planes and edges, point cloud classification, and the analysis of data for the purpose of quality control. Most algorithms had to be formulated from scratch in the context of the requirements of parallel computing. A few of the algorithms were based on existing technology developed by the Dephos Software Company and then adapted to parallel computing in the course of this research study. Processing time was determined for each process employed for a typical quantity of data processed, which helped confirm the high efficiency of the solutions proposed and the applicability of parallel computing to the processing of laser scanning data. The high efficiency of parallel computing yields new opportunities in the creation and organization of processing methods for laser scanning data.
Publikacja ma na celu przedstawienie części wyników badań, jakie zrealizował zespół badawczy firmy Dephos Software w ramach projektu finansowanego przez UE pt. "Badania nad masowym przechowywaniem, udostępnianiem i przetwarzaniem przestrzennych danych laserowych". Na wstępie publikacji autorzy przedstawiają zasady organizacji algorytmu spełniającego wymogi obliczeń równoległych oraz przybliżają genezę pomysłu prowadzenia badań nad zastosowaniem procesorów graficznych do masowego przetwarzania danych skaningowych. Następnie autorzy prezentują wyniki oceny wydajności działania szeregu różnych procesów przetwarzania danych laserowych, które udało się zasadniczo przyspieszyć dzięki obliczeniom równoległym. Procesy te dzielą się na procesy podstawowe (generowanie ortoobrazów z chmur punktów, kolorowanie chmur punktów, transformacja, generowanie siatki regularnej) oraz procesy zaawansowane (wykrywanie płaszczyzn i krawędzi, klasyfikacja chmur punktów, analiza danych w celu kontroli jakości danych). W większości przypadków algorytmy musiały zostać opracowane całkowicie od nowa pod kątem wymogów przetwarzania równoległego, część korzysta z wcześniejszego dorobku technologicznego firmy Dephos Software, będąc dostosowana do równoległej metody obliczeń w ramach przeprowadzonych badań. W każdym z tych procesów określono czas działania dla typowej ilości danych przetwarzanych, co potwierdziło wysoką wydajność rozwiązań i sens zastosowania obliczeń równoległych w odniesieniu do danych skaningowych. Obliczenia równoległe dzięki swojej wysokiej wydajności otwierają nowe możliwości w tworzeniu i organizacji procesów przetwarzania danych pochodzących ze skaningu laserowego.
Źródło:
Archiwum Fotogrametrii, Kartografii i Teledetekcji; 2015, 27; 45-59
2083-2214
2391-9477
Pojawia się w:
Archiwum Fotogrametrii, Kartografii i Teledetekcji
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Unsteady flow simulation in hydraulic machinery
Autorzy:
Ruprecht, A.
Powiązania:
https://bibliotekanauki.pl/articles/1986686.pdf
Data publikacji:
2002
Wydawca:
Politechnika Gdańska
Tematy:
unsteady RANS
parallel computing
hydro turbine
rotor-stator interaction
vortex rope
Opis:
In the field of hydraulic machinery Computational Fluid Dynamics (CFD) is routinely used today in research and development as well as in the daily design phase. Today in industry mostly steady state simulations are applied. In this paper, however, an overview of unsteady simulations is shown for different applications. The presented examples contain problems with self excited unsteadiness, vortex rope in the draft tube, as well as applications with externally forced unsteadiness by changing or moving geometries and rotor-stator interactions. For the shown applications the requirements, potential and limitations of unsteady flow analysis are assessed.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2002, 6, 1; 187-208
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The modular principles of parallel pipeline information processing
Modularne zasady równoległe potokowego przetwarzania informacji
Autorzy:
Selianinau, M.
Powiązania:
https://bibliotekanauki.pl/articles/103613.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Humanistyczno-Przyrodniczy im. Jana Długosza w Częstochowie. Wydawnictwo Uczelniane
Tematy:
modular number system
modular arithmetic
modular computing structures
parallel data processing
pipeline mode
modularne systemy liczbowe
arytmetyka modularna
modularne struktury obliczeniowe
równoległe przetwarzanie informacji
tryb potokowy
Opis:
In the present paper, we deal with the methodology of implementation of the modular arithmetic algorithms using the parallel-pipeline residues summation blocks with respect to the bases of modular number system. These summation blocks are the main structural elements of high-speed modular operating devices, they provide high throughput performance of input data sets and are oriented to the wide application of VLSI chips.
W niniejszym artykule omówiono metodologię implementacji algorytmów arytmetyki modularnej przy wykorzystaniu równolegle potokowych bloków sumowania reszt w odniesieniu do podstaw modularnego systemu liczbowego. Te bloki sumujące są głównymi elementami strukturalnymi wysokowydajnych modularnych urządzeń obliczeniowych, one również zapewniają wysoką wydajność przepustowości zestawów danych wejściowych i są zorientowane na szerokie zastosowanie układów scalonych VLSI.
Źródło:
Prace Naukowe Akademii im. Jana Długosza w Częstochowie. Technika, Informatyka, Inżynieria Bezpieczeństwa; 2017, T. 5; 147-153
2300-5343
Pojawia się w:
Prace Naukowe Akademii im. Jana Długosza w Częstochowie. Technika, Informatyka, Inżynieria Bezpieczeństwa
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Java profiler based on byte code analysis and instrumentation for many-core hardware accelerators
Autorzy:
Pietroń, M.
Karwatowski, M.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/114614.pdf
Data publikacji:
2015
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
virtual machine
CUDA
GPU
profiling
parallel computing
Opis:
One of the most challenging issues in the case of many and multi-core architectures is how to exploit their potential computing power in legacy systems without a deep knowledge of their architecture. The analysis of static dependence and dynamic data dependences of a program run, can help to identify independent paths that could have been computed by individual parallel threads. The statistics of reusing the data and its size is also crucial in adapting the application in GPU many-core hardware architecture because of specific memory hierarchies. The proposed profiling system accomplishes static data analysis and computes dynamic dependencies for Java programs as well as recommends parts of source code with the highest potential for parallelization in GPU. Such an analysis can also provide starting point for automatic parallelization.
Źródło:
Measurement Automation Monitoring; 2015, 61, 7; 385-387
2450-2855
Pojawia się w:
Measurement Automation Monitoring
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Analysis of OpenStack Cloud Computing Platform: Features and Performance
Autorzy:
Grzonka, D.
Powiązania:
https://bibliotekanauki.pl/articles/307878.pdf
Data publikacji:
2015
Wydawca:
Instytut Łączności - Państwowy Instytut Badawczy
Tematy:
cloud computing
high performance computing
OpenStack
parallel environments
resource utilization analysis
virtualization
Opis:
Over the decades the rapid development of broadly defined computer technologies, both software and hardware is observed. Unfortunately, software solutions are regularly behind in comparison to the hardware. On the other hand, the modern systems are characterized by a high demand for computing resources and the need for customization for the end users. As a result, the traditional way of system construction is too expensive, inflexible and it doesn’t have high resources utilization. Present article focuses on the problem of effective use of available physical and virtual resources based on the OpenStack cloud computing platform. A number of conducted experiments allowed to evaluate computing resources utility and to analyze performance depending on the allocated resources. Additionally, the paper includes structural and functional analysis of the OpenStack cloud platform.
Źródło:
Journal of Telecommunications and Information Technology; 2015, 3; 52-57
1509-4553
1899-8852
Pojawia się w:
Journal of Telecommunications and Information Technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Równoległa realizacja przykładowego algorytmu genetycznego z wykorzystaniem akceleratorów GPU
Autorzy:
Ratuszniak, P.
Stasiak, A.
Łańcucki, R.
Powiązania:
https://bibliotekanauki.pl/articles/118416.pdf
Data publikacji:
2018
Wydawca:
Politechnika Koszalińska. Wydawnictwo Uczelniane
Tematy:
algorytm genetyczny
programowanie równoległe
akceleracja obliczeń
akceleratory GPU
CUDA
problem komiwojażera
genetic algorithm
parallel programming
computing acceleration
GPU
travelling salesman problem
Opis:
W artykule zaprezentowano praktyczną implementację aplikacji rozwiązującej przykładowy algorytm genetyczny z wykorzystaniem akceleratorów GPU. W tym przypadku zdecydowano się na rozwiązanie za pomocą algorytmu genetycznego typowego problemu optymalizacyjnego, jakim jest problem komiwojażera. Dodatkowo w celu wykorzystania mocy karty graficznej w tworzonej aplikacji wykorzystano technologię programowania na karcie graficznej – technologię Nvidia CUDA.
The paper presents a practical implementation of a local desktop application that solves exemplary genetic algorithm with the use of GPU accelerators. In this case decided with the use of genetic algorithm to solve typical optimization problem which is travelling salesman problem. Additionally used Nvidia CUDA programming technology in order to use power of GPU in created application.
Źródło:
Zeszyty Naukowe Wydziału Elektroniki i Informatyki Politechniki Koszalińskiej; 2018, 13; 63-78
1897-7421
Pojawia się w:
Zeszyty Naukowe Wydziału Elektroniki i Informatyki Politechniki Koszalińskiej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Robust simulation method of complex technical transport systems
Autorzy:
Szpytko, Janusz
Salgado Duarte, Yorlandys
Powiązania:
https://bibliotekanauki.pl/articles/2098142.pdf
Data publikacji:
2021
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
overhead cranes
Monte Carlo simulation
variance reduction
parallel computing
suwnice
symulacja Monte Carlo
redukcja wariancji
obliczenia równoległe
Opis:
In the optimization of technical systems focused on a specific functional purpose (reliability, safety, and availability) with the use of simulation methods, an important parameter is the digital simulation time of the research subject. With the complexity of the issue, the digital simulation time increases. The aim of the article is to present a method (combination of parallel computing and variance reduction techniques) of reducing the computer simulation time of the research technical object. An example of the application of the developed method was presented as a result of an experiment conducted for decision making and control processes aimed at optimizing the process of operating overhead cranes in critical conditions. In this paper, selecting parallel batch jobs computation and stratified sampling, we exponentially decreased the simulation time, finding fast and practical solutions and eliminating the time constraint in the search of solutions.
Źródło:
Transport Problems; 2021, 16, 2; 101--112
1896-0596
2300-861X
Pojawia się w:
Transport Problems
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Projekt systemu Grid Computing klasy HPC pod kątem rozwiązania zdefiniowanych zagadnień optymalizacyjnych
The project of the Grid Computing system of HPC class in terms of solving defined optimization problems
Autorzy:
Różanowski, K.
Krej, M.
Powiązania:
https://bibliotekanauki.pl/articles/91425.pdf
Data publikacji:
2012
Wydawca:
Warszawska Wyższa Szkoła Informatyki
Tematy:
obliczenia rozproszone
C#
NET
klaster
optymalizacja
obliczenia równoległe
distributed computing
.NET
grid
optimization
parallel computing
Opis:
W artykule przedstawiono koncepcję projektu modelowania dedykowanej platformy programistycznej do zrównoleglonego rozwiązywania zagadnień optymalizacyjnych w środowisku .NET. Jest to równoważne z udostępnieniem techniki tworzenia oprogramowania rozproszonego w wielu językach programowania, między innymi w C#, Visual Basic, ale również Fortran, Pascal, Java, Ada. Ważnym aspektem projektu jest możliwość zestawiania komputerów biurowych w potężne, wirtualne, rozproszone maszyny obliczeniowe bez zmieniania podstawowego ich przeznaczenia oraz ograniczania zakresu zastosowań.
The paper presents the concept of modelling of development platform dedicated to parallelized solving of optimization problems in the Microsoft .NET environment. This concept is an equivalent to the provision of distributed software development techniques in many programming languages, including C#, Visual Basic, as well as Fortran, Pascal, Java, Ada. An important aspect of the project is its ability to compile the desktop computer into a powerful virtual, distributed computing machine without changing their basic purpose and limiting their range of application.
Źródło:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki; 2012, 6, 8; 91-98
1896-396X
2082-8349
Pojawia się w:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Programming synchronization-free parallelism using Intel Threading Building Blocks
Programowanie równoległości wolnej od synchronizacji przy użyciu Intel TBB
Autorzy:
Bielecki, W.
Palkowski, M.
Powiązania:
https://bibliotekanauki.pl/articles/153729.pdf
Data publikacji:
2011
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
fragmenty kodu pozbawione synchronizacji
równoległość
zadaniowość
Intel Threading Building Blocks
synchronization-free slices
parallel computing
tasking
Opis:
Extracting synchronization-free parallelism by means of the Iteration Space Slicing Framework results in parallel pseudo-code that is independent on a parallel computer architecture and API/library, hence it cannot be directly compiled. For producing parallel programs for shared memory multiprocessors, Threading Building Blocks (TBB) can be applied that is a library supporting scalable parallel programming based on the standard C++ language. In this paper, we present how to benefit from TBB in practice on the basis of pseudo-code representing synchronization-free slices produced by a tool using the Omega Library. Results of experiments with the NAS benchmarks suite are presented.
Zastosowanie techniki opartej na ekstrakcji równoległości pozbawionej synchronizacji w pętlach programowych pozwala na wygenerowanie pseudokodu, który jest niezależny od architektury komputera oraz języka lub biblioteki programowania. Taki kod nie może być wprost kompilowany. Jest wymagane przekształcenie takiego pseudokodu na rzeczywisty kod równoległy. W tym celu może być zastosowane narzędzie Intel Threading Building Blocks, które jest biblioteką wspierająca skalowalne programowanie równoległe w standardzie C++. Nie wymaga specjalnego języka programowania i specjalnych kompilatorów. Zaletą biblioteki Threading Building Blocks jest możliwość uruchomienia w dowolnym środowisku programowo-sprzętowym i systemie operacyjnym. W artykule przedstawiono korzyści wynikające z tworzenia aplikacji równoległych za pomocą TBB. Wyjaśniono sposób poszukiwania instancji instrukcji fragmentów kodu przy użyciu biblioteki Omega i tworzenie najpierw równoległego pseudo-kodu, a dalej transformacja pseudokodu na kod równoległy z wykorzystaniem TBB. Proponowane podejście zostało zweryfikowane za pomocą zbioru pętli testowych z benchmarku NAS. Zbadano przyspieszenie i efektywność kodu równoległego oraz skalowalność w aspekcie do zmiennego rozmiaru obliczeń badanych pętli.
Źródło:
Pomiary Automatyka Kontrola; 2011, R. 57, nr 11, 11; 1380-1383
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Productivity of a low-budget computer cluster applied to overcome the n-body problem
Autorzy:
Nowicki, Tomasz
Gregosiewicz, Adam
Łagodowski, Zbigniew
Powiązania:
https://bibliotekanauki.pl/articles/1956026.pdf
Data publikacji:
2021
Wydawca:
Polskie Towarzystwo Promocji Wiedzy
Tematy:
computer clusters
parallel computing
n-body problem
klastry komputerowe
obliczenia równoległe
problem n-body
Opis:
The classical n-body problem in physics addresses the prediction of individual motions of a group of celestial bodies under gravitational forces and has been studied since Isaac Newton formulated his laws. Nowadays the n-body problem has been recognized in many more fields of science and engineering. Each problem of mutual interaction between objects forming a dynamic group is called as the n-body problem. The cost of the direct algorithm for the problem is O(n2) and is not acceptable from the practical point of view. For this reason cheaper algorithms have been developed successfully reducing the cost to O(nln(n)) or even O(n). Because further improvement of the algorithms is unlikely to happen it is the hardware solutions which can still accelerate the calculations. The obvious answer here is a computer cluster that can preform the calculations in parallel. This paper focuses on the performance of a low-budget computer cluster created on ad hoc basis applied to n-body problem calculation. In order to maintain engineering valuable results a real technical issue was selected to study. It was Discrete Vortex Method that is used for simulating air flows. The pre-sented research included writing original computer code, building a computer cluster, preforming simulations and comparing the results.
Źródło:
Applied Computer Science; 2021, 17, 4; 100-109
1895-3735
Pojawia się w:
Applied Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies