Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Parallel computing" wg kryterium: Temat


Wyświetlanie 1-66 z 66
Tytuł:
Parallel computing in a network of workstations
Autorzy:
Ogrodowczyk, R.
Murawski, K.
Powiązania:
https://bibliotekanauki.pl/articles/1954092.pdf
Data publikacji:
2004
Wydawca:
Politechnika Gdańska
Tematy:
parallel computing
clusters
parallel-processing systems
Opis:
In this paper we describe a few architectures and software for parallel-processing computers. We have tested a cluster constructed with the use of MPI. All tests have been performed for one- and two-dimensional magneto-hydrodynamic plasma. We have concluded from the results of these tests that a simple problem should be run in a sequential node, as its execution time does not essentially decrease with the number of processors used. At the same time, the execution time of a complex problem decreases significantly with the number of processors. In the case of two-dimensional plasma the acceleration factor has reached the value of 3.7 with the use of 10 processors.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2004, 8, 3; 327-332
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A mobile robot navigation with use of CUDA parallel architecture
Autorzy:
Siemiątkowska, B.
Szklarski, J.
Gnatowski, M.
Borkowski, A.
Węclewski, P.
Powiązania:
https://bibliotekanauki.pl/articles/384808.pdf
Data publikacji:
2011
Wydawca:
Sieć Badawcza Łukasiewicz - Przemysłowy Instytut Automatyki i Pomiarów
Tematy:
navigation
neural network
parallel computing
Opis:
In this article we present a navigation system of a mobile robot based on parallel calculations. It is assumed that the robot is equipped with a 3D laser range scanner. The system is essentially based on a dual grid-object, where labels are attached to detected objects (such maps can be used in navigation based on semantic information). We use a classical SMPA (Sense - Model - Plan - Act) architecture for navigation, however, some steps concerning object detection, planning and localization are parallelized in order to speed up the entire process. The CUDA (Compute Unified Device Architecture) technology allows us to execute our algorithms on many processing units with use of a inexpensive graphics card which makes it possible to apply the proposed navigation system in a real time.
Źródło:
Journal of Automation Mobile Robotics and Intelligent Systems; 2011, 5, 3; 79-84
1897-8649
2080-2145
Pojawia się w:
Journal of Automation Mobile Robotics and Intelligent Systems
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
FPGA-based multi-core processor
Autorzy:
Wójcik, W.
Długopolski, J.
Powiązania:
https://bibliotekanauki.pl/articles/305333.pdf
Data publikacji:
2013
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
microprocessor
FPGA
parallel computing
block cipher
Opis:
The paper presents the results of investigations concerning the possibility of using programm able logic devices (FPGA) to build virtual multi-core processors dedicated specifically towards particular applications.The paper shows the designed architecture of amulti-core processor specialized to perform a particular task, and it discusses its computational efficiency depending on the number of cores used.An evaluation of the results is also discussed.
Źródło:
Computer Science; 2013, 14 (3); 459-474
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Obliczenia równoległe w MATLAB-ie
Parallel computing with MATLAB
Autorzy:
Mrozek, B.
Powiązania:
https://bibliotekanauki.pl/articles/276902.pdf
Data publikacji:
2011
Wydawca:
Sieć Badawcza Łukasiewicz - Przemysłowy Instytut Automatyki i Pomiarów
Tematy:
Matlab
obliczenia równoległe
MATLAB
parallel computing
Opis:
MATLAB jest językiem wysokiego poziomu do obliczeń technicznych oraz interaktywnym środowiskiem przeznaczonym do projektowania algorytmów, analizy i wizualizacji danych oraz obliczeń numerycznych. Do MATLAB-a wbudowano operacje na wektorach, macierzach i tablicach, które tworzą matematyczną podstawę do obliczeń naukowych i technicznych. Pozwala to na szybsze tworzenie i wykorzystywanie algorytmów obliczeniowych - niż przy użyciu tradycyjnych języków (C, Fortran), gdyż przy realizacji zadań na niskim poziomie nie ma potrzeby deklarowania zmiennych, ich typów i adresów. Obliczenia równoległe pozwalają realizować na komputerach wielordzeniowych, wieloprocesorowych i klastrach, zadania intensywne numerycznie i z dużą ilością danych. W artykule opisano możliwości wykonywania obliczeń równoległych w środowisku MATLAB v. 7.11 (R2010b) z wykorzystaniem jego bibliotek Parallel Computing Toolbox v.5.0 oraz MATLAB Distributed Computing Server v.5.0.
MATLAB is a high-level technical computing language and interactive environment for algorithm development, data visualization, data analysis, and numeric computation. The MATLAB language supports the vector and matrix operations that are fundamental to engineering and scientific problems. It enables faster development and execution of algorithms than with traditional languages (C, FORTRAN) because it do not needs to perform low-level administrative tasks, such as declaring variables, specifying data types, and allocating memory. Parallel computing lets solve computationally and data-intensive problems using multicore processors, GPUs, and computer clusters. In this paper, the application of the parallel computing in MATLAB v. 7.11 (R2010b) environments has been described with using Parallel Computing Toolbox v.5.0 and MATLAB Distributed Computing Server Version 5.0.
Źródło:
Pomiary Automatyka Robotyka; 2011, 15, 2; 285-294
1427-9126
Pojawia się w:
Pomiary Automatyka Robotyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Design and performance evaluation of a Linux HPC cluster
Autorzy:
Pera, Donato
Powiązania:
https://bibliotekanauki.pl/articles/1955283.pdf
Data publikacji:
2018
Wydawca:
Politechnika Gdańska
Tematy:
high performance computing
parallel computing
cluster design
HPL
Opis:
In this paper after a short theoretical introduction about modern techniques used inparallel computing, we report a case study related to the design and development of the Caliban Linux High Performance Computing cluster, carried out by the author in the High Performance Computing Laboratory of the University of L’Aquila. Finally we report some performance evaluation tests related to the Caliban cluster performed using HPL (High-Performance Linpack) benchmarks.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2018, 22, 2; 113-123
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Java profiler based on byte code analysis and instrumentation for many-core hardware accelerators
Autorzy:
Pietroń, M.
Karwatowski, M.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/114614.pdf
Data publikacji:
2015
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
virtual machine
CUDA
GPU
profiling
parallel computing
Opis:
One of the most challenging issues in the case of many and multi-core architectures is how to exploit their potential computing power in legacy systems without a deep knowledge of their architecture. The analysis of static dependence and dynamic data dependences of a program run, can help to identify independent paths that could have been computed by individual parallel threads. The statistics of reusing the data and its size is also crucial in adapting the application in GPU many-core hardware architecture because of specific memory hierarchies. The proposed profiling system accomplishes static data analysis and computes dynamic dependencies for Java programs as well as recommends parts of source code with the highest potential for parallelization in GPU. Such an analysis can also provide starting point for automatic parallelization.
Źródło:
Measurement Automation Monitoring; 2015, 61, 7; 385-387
2450-2855
Pojawia się w:
Measurement Automation Monitoring
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Heterogeneous GPU&CPU cluster for High Performance Computing in cryptography
Autorzy:
Marks, M.
Jantura, J.
Niewiadomska-Szynkiewicz, E.
Strzelczyk, P.
Góźdź, K.
Powiązania:
https://bibliotekanauki.pl/articles/305288.pdf
Data publikacji:
2012
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
parallel computing
HPC
clusters
GPU computing
OpenCL
cryptography
cryptanalysis
Opis:
This paper addresses issues associated with distributed computing systems and the application of mixed GPU&CPU technology to data encryption and decryption algorithms. We describe a heterogenous cluster HGCC formed by two types of nodes: Intel processor with NVIDIA graphics processing unit and AMD processor with AMD graphics processing unit (formerly ATI), and a novel software framework that hides the heterogeneity of our cluster and provides tools for solving complex scientific and engineering problems. Finally, we present the results of numerical experiments. The considered case study is concerned with parallel implementations of selected cryptanalysis algorithms. The main goal of the paper is to show the wide applicability of the GPU&CPU technology to large scale computation and data processing.
Źródło:
Computer Science; 2012, 13 (2); 63-79
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Development of LiDAR Data Classification Algorithms based on Parallel Computing using nVidia CUDA Technology
Autorzy:
Bratuś, R.
Musialik, P.
Prochaska, M.
Rzonca, A.
Powiązania:
https://bibliotekanauki.pl/articles/114693.pdf
Data publikacji:
2016
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
point cloud classification
parallel computing
normal vectors
Opis:
The paper presents an innovative data classification approach based on parallel computing performed on a GPGPU (General-Purpose Graphics Processing Unit). The results shown in this paper were obtained in the course of a European Commission-funded project: “Research on large-scale storage, sharing and processing of spatial laser data”, which concentrated on LIDAR data storage and sharing via databases and the application of parallel computing using nVidia CUDA technology. The paper describes the general requirements of nVidia CUDA technology application in massive LiDAR data processing. The studied point cloud data structure fulfills these requirements in most potential cases. A unique organization of the processing procedure is necessary. An innovative approach based on rapid parallel computing and analysis of each point’s normal vector to examine point cloud geometry within a classification process is described in this paper. The presented algorithm called LiMON classifies points into basic classes defined in LAS format: ground, buildings, vegetation, low points. The specific stages of the classification process are presented. The efficiency and correctness of LiMON were compared with popular program called Terrascan. The correctness of the results was tested in quantitive and qualitative ways. The test of quality was executed on specific objects, that are usually difficult for classification algorithms. The quantitive test used various environment types: forest, agricultural area, village, town. Reference clouds were obtained via two different methods: (1) automatic classification using Terrascan, (2) manually corrected clouds classified by Terrascan. The following coefficients for quantitive testing of classification correctness were calculated: Type 1 Error, Type 2 Error, Kappa, Total Error. The results shown in the paper present the use of parallel computing on a GPGPU as an attractive route for point cloud data processing.
Źródło:
Measurement Automation Monitoring; 2016, 62, 11; 387-393
2450-2855
Pojawia się w:
Measurement Automation Monitoring
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Graph centers used for stabilization of matrix factorizations
Autorzy:
Kabelíková, Pavla
Powiązania:
https://bibliotekanauki.pl/articles/744290.pdf
Data publikacji:
2010
Wydawca:
Uniwersytet Zielonogórski. Wydział Matematyki, Informatyki i Ekonometrii
Tematy:
FETI
parallel computing
generalised inverse
graph center
Opis:
Systems of consistent linear equations with symmetric positive semidefinite matrices arise naturally while solving many scientific and engineering problems. In case of a "floating" static structure, the boundary conditions are not sufficient to prevent its rigid body motions.
Traditional solvers based on Cholesky decomposition can be adapted to these systems by recognition of zero rows or columns and also by setting up a well conditioned regular submatrix of the problem that is used for implementation of a generalised inverse. Conditioning such a submatrix seems to be related with detection of so called fixing nodes such that the related boundary conditions make the structure as stiff as possible. We can consider the matrix of the problem as an unweighted non-oriented graph. Now we search for nodes that stabilize the solution well-fixing nodes (such nodes are sufficiently far away from each other and are not placed near any straight line). The set of such nodes corresponds to one type of graph center.
Źródło:
Discussiones Mathematicae Graph Theory; 2010, 30, 2; 249-259
2083-5892
Pojawia się w:
Discussiones Mathematicae Graph Theory
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Parallel solution of thermomechanical inverse problems for laser dieless drawing of ultra-thin wire
Autorzy:
Milenin, Andrij
Powiązania:
https://bibliotekanauki.pl/articles/38435900.pdf
Data publikacji:
2022
Wydawca:
Polskie Towarzystwo Promocji Wiedzy
Tematy:
FEM
parallel computing
dieless drawing
thin wire
Opis:
The paper discusses the solving of inverse thermomechanical problems requiring a large number of FEM tasks with various boundary conditions. The study examined the case when all tasks have the same number of nodes, finite elements, and nodal connections. In this study, the speedup of the solution of the inverse problem is achieved in two ways: 1. The solution of all FEM tasks in parallel mode. 2. The use by all FEM tasks a common matrix with addresses of nonzero elements in the stiffness matrices. These algorithms are implemented in the own FEM code, designed to solve inverse problems of the hot metal forming. The calculations showed that developed code in parallel mode is effective for the number of tasks late than 0,7-0,9 of the number of available processors. Thus, at some point, it becomes effective to use a sequential solution to all tasks and to use a common matrix of addresses of nonzero elements in the stiffness matrix. The achieved acceleration at the optimal choice of the algorithm is 2–10 times compared with the classical multivariate calculations in the FEM. The paper provides an example of the practical application of the developed code for calculating the allowable processing maps for laser dieless drawing of ultra-thin wire from copper alloy by solving the thermomechanical inverse problem. The achieved acceleration made it possible to use the developed parallel code in the control software of the laboratory setup for laser dieless drawing.
Źródło:
Applied Computer Science; 2022, 18, 3; 42-53
1895-3735
2353-6977
Pojawia się w:
Applied Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Mobile Cloud for Parallel and Distributed Green Computing
Autorzy:
Siwik, L.
Kala, D.
Godzik, M.
Turek, W.
Byrski, A.
Kisiel-Dorohinicki, M.
Powiązania:
https://bibliotekanauki.pl/articles/308894.pdf
Data publikacji:
2017
Wydawca:
Instytut Łączności - Państwowy Instytut Badawczy
Tematy:
distributed computing
green computing
mobile cloud
mobile computing
parallel computing
pervasive computing
Opis:
Mobile Computing and Mobile Cloud Computing are the areas where intensive research is observed. The “mobility” landscape (devices, technologies, apps, etc.) evolves so fast that definitions and taxonomies do not catch up with so dynamic changes and there is still an ambiguity in definitions and common understanding of basic ideas and models. This research focuses on Mobile Cloud understood as parallel and distributed system consisting of a collection of interconnected (and virtualized) mobile devices dynamically provisioned and presented as one unified computing resource. This paper focuses on the mobile green computing cloud applied for parallel and distributed computations and consisting of outdated, abandoned or no longer needed smartphones being able to set up a powerful computing cluster. Besides showing the general idea and background, an actual computing cluster is constructed and its scalability and efficiency is checked versus the results obtained from the virtualized set of smartphones. All the experiments are performed using a dedicated software framework constructed in order to leverage the nolonger-needed smartphones, creating a computing cloud.
Źródło:
Journal of Telecommunications and Information Technology; 2017, 4; 60-70
1509-4553
1899-8852
Pojawia się w:
Journal of Telecommunications and Information Technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Processing optimization with parallel computing for the J-PET scanner
Autorzy:
Krzemień, W.
Bała, M.
Bednarski, T.
Białas, P.
Czerwiński, E.
Gajos, A.
Gorgol, M.
Jasińska, B.
Kamińska, D.
Kapłon, Ł.
Korcyl, G.
Kowalski, P.
Kozik, T.
Kubicz, E.
Niedźwiecki, S.
Pałka, M.
Raczyński, L.
Rudy, Z.
Rundel, O.
Sharma, N. G.
Silarski, M.
Słomski, A.
Stola, K.
Strzelecki, A.
Trybek, D.
Wieczorek, A.
Wiślicki, W.
Zieliński, M.
Zgardzińska, B.
Moskal, P.
Powiązania:
https://bibliotekanauki.pl/articles/148285.pdf
Data publikacji:
2015
Wydawca:
Instytut Chemii i Techniki Jądrowej
Tematy:
data aquisition system (DAQ)
parallel computing
TOF-PET
Opis:
The Jagiellonian Positron Emission Tomograph (J-PET) collaboration is developing a prototype time of flight (TOF)-positron emission tomograph (PET) detector based on long polymer scintillators. This novel approach exploits the excellent time properties of the plastic scintillators, which permit very precise time measurements. The very fast fi eld programmable gate array (FPGA)-based front-end electronics and the data acquisition system, as well as low- and high-level reconstruction algorithms were specially developed to be used with the J-PET scanner. The TOF-PET data processing and reconstruction are time and resource demanding operations, especially in the case of a large acceptance detector that works in triggerless data acquisition mode. In this article, we discuss the parallel computing methods applied to optimize the data processing for the J-PET detector. We begin with general concepts of parallel computing and then we discuss several applications of those techniques in the J-PET data processing.
Źródło:
Nukleonika; 2015, 60, No. 4, part 1; 745-748
0029-5922
1508-5791
Pojawia się w:
Nukleonika
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Optimization of Machine Learning Process Using Parallel Computing
Autorzy:
Grzeszczyk, Michał K.
Powiązania:
https://bibliotekanauki.pl/articles/102525.pdf
Data publikacji:
2018
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
parallel computing
machine learning
perceptron
neural networks
OpenMP
Opis:
The aim of this paper is to discuss the use of parallel computing in the supervised machine learning processes in order to reduce the computation time. This way of computing has gained popularity because sequential computing is often insufficient for large scale problems like complex simulations or real time tasks. After presenting the foundations of machine learning and neural network algorithms as well as three types of parallel models, the author briefly characterized the development of the experiments carried out and the results obtained. The experiments on image recognition, ran on five sets of empirical data, prove a significant reduction in calculation time compared to classical algorithms. At the end, possible directions of further research concerning parallel optimization of calculation time in the supervised perceptron learning processes were shortly outlined.
Źródło:
Advances in Science and Technology. Research Journal; 2018, 12, 4; 81-87
2299-8624
Pojawia się w:
Advances in Science and Technology. Research Journal
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wybrane zagadnienia przetwarzania równoległego i rozproszonego oraz klastrów komputerowych
Autorzy:
Chaładyniak, D.
Powiązania:
https://bibliotekanauki.pl/articles/91258.pdf
Data publikacji:
2010
Wydawca:
Warszawska Wyższa Szkoła Informatyki
Tematy:
klastry komputerowe
przetwarzanie równoległe
przetwarzanie rozproszone
cluster computing
parallel computing
telecommunications networks
Opis:
W artykule przedstawiono wprowadzenie do zagadnień przetwarzania równoległego. Wyjaśniono jego ideę oraz zaprezentowano najpopularniejsze klasyfikacje. Przybliżono pojęcie przetwarzania rozproszonego we współczesnych sieciach teleinformatycznych. Przedstawiono wybrane implementacje klastrów komputerowych.
The article presents the introduction to parallel computing. It explains the idea and presents the most popular classifications. It also explains the concept of distributed processing in today’s telecommunications networks. It presents selected cluster computing implementations.
Źródło:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki; 2010, 4, 4; 41-53
1896-396X
2082-8349
Pojawia się w:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Parallel Graded-Mesh FDTD Algorithm for Human–Antenna Interaction Problems
Autorzy:
Catarinucci, L.
Tarricone, L.
Powiązania:
https://bibliotekanauki.pl/articles/89960.pdf
Data publikacji:
2009
Wydawca:
Centralny Instytut Ochrony Pracy
Tematy:
numerical dosimetry
FDTD
graded mesh
human–antenna exposure
parallel computing
Opis:
The finite difference time domain method (FDTD) is frequently used for the numerical solution of a wide variety of electromagnetic (EM) problems and, among them, those concerning human exposure to EM fields. In many practical cases related to the assessment of occupational EM exposure, large simulation domains are modeled and high space resolution adopted, so that strong memory and central processing unit power requirements have to be satisfied. To better afford the computational effort, the use of parallel computing is a winning approach; alternatively, subgridding techniques are often implemented. However, the simultaneous use of subgridding schemes and parallel algorithms is very new. In this paper, an easy-to-implement and highly-efficient parallel graded-mesh (GM) FDTD scheme is proposed and applied to human–antenna interaction problems, demonstrating its appropriateness in dealing with complex occupational tasks and showing its capability to guarantee the advantages of a traditional subgridding technique without affecting the parallel FDTD performance.
Źródło:
International Journal of Occupational Safety and Ergonomics; 2009, 15, 1; 45-52
1080-3548
Pojawia się w:
International Journal of Occupational Safety and Ergonomics
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Benchmarking Procedures for Continuous Optimization Algorithms
Autorzy:
Opara, K.
Arabas, J.
Powiązania:
https://bibliotekanauki.pl/articles/308400.pdf
Data publikacji:
2011
Wydawca:
Instytut Łączności - Państwowy Instytut Badawczy
Tematy:
black-box optimization
comparing optimization algorithms
evaluation criteria
parallel computing
Opis:
Reliable comparison of optimization algorithms requires the use of specialized benchmarking procedures. This paper highlights motivations which influence their structure, discusses evaluation criteria of algorithms, typical ways of presenting and interpreting results as well as related statistical procedures. Discussions are based on examples from CEC and BBOB benchmarks. Moreover, attention is drawn to these features of comparison procedures, which make them susceptible to manipulation. In particular, novel application of the weak axiom of revealed preferences to the field of benchmarking shows why it may be misleading to assess algorithms on basis of their ranks for each of test problems. Additionally, an idea is presented of developing massively parallel implementation of benchmarks. Not only would this provide faster computation but also open the door to improving reliability of benchmarking procedures and promoting research into parallel implementations of optimization algorithms.
Źródło:
Journal of Telecommunications and Information Technology; 2011, 4; 73-80
1509-4553
1899-8852
Pojawia się w:
Journal of Telecommunications and Information Technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
An introduction to high performance computing: technology, tools and applications
Autorzy:
Kowalik, J. S.
Powiązania:
https://bibliotekanauki.pl/articles/1953946.pdf
Data publikacji:
2000
Wydawca:
Politechnika Gdańska
Tematy:
supercomputers
client-server systems
enterprise data processing systems
performance
parallel computing
cluster computing
Opis:
Traditionally high performance was applied to very computationally demanding problems in science and engineering. They were known as the Grand Challenge Problems that required supercomputers equipped with very large computer memories and capable of high rates of computation measured by Megaflops (million floating point operations per second). In the last two decades the world of business and industry has recognized the enormous potential of large distributed computer systems for their business enterprise applications. Today most of the existing high performance computers are employed in the enterprise environments. A typical system has three layers of servers: user interface, applications and database. These client/server architectures are the work horse of large enterprise information processing. This introductory paper describes both areas of high performance computing applications that differ in the nature of workload, performance objectives, design methodology and scientific focus.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2000, 4, 2; 171-178
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Unsteady flow simulation in hydraulic machinery
Autorzy:
Ruprecht, A.
Powiązania:
https://bibliotekanauki.pl/articles/1986686.pdf
Data publikacji:
2002
Wydawca:
Politechnika Gdańska
Tematy:
unsteady RANS
parallel computing
hydro turbine
rotor-stator interaction
vortex rope
Opis:
In the field of hydraulic machinery Computational Fluid Dynamics (CFD) is routinely used today in research and development as well as in the daily design phase. Today in industry mostly steady state simulations are applied. In this paper, however, an overview of unsteady simulations is shown for different applications. The presented examples contain problems with self excited unsteadiness, vortex rope in the draft tube, as well as applications with externally forced unsteadiness by changing or moving geometries and rotor-stator interactions. For the shown applications the requirements, potential and limitations of unsteady flow analysis are assessed.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2002, 6, 1; 187-208
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Dynamic tile free scheduling for code with acyclic inter-tile dependence graphs
Autorzy:
Bielecki, W.
Skotnicki, P.
Powiązania:
https://bibliotekanauki.pl/articles/305409.pdf
Data publikacji:
2017
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
optimizing compilers
tiling
task scheduling
parallel computing
dependence graph
data locality
Opis:
Free scheduling is a task ordering technique under which instructions are executed as soon as their operands become available. Coarsening the grain of computations under the free schedule, by means of using groups of loop nest statement instances (tiles) in place of single statement instances, increases the locality of data accesses and reduces the number of synchronization events, and as a consequence improves program performance. The paper presents an approach for code generation that allows for the free schedule for tiles of arbitrarily nested affine loops at run-time. The scope of the applicability of the introduced algorithms is limited to tiled loop nests whose inter-tile dependence graphs are cycle-free. The approach is based on the polyhedral model. Results of experiments with the PolyBench benchmark suite, demonstrating significant tiled code speed-up, are discussed.
Źródło:
Computer Science; 2017, 18 (2); 195-216
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
One-dimensional fully automatic h-adaptive isogeometric finite element method package
Autorzy:
Lipski, P.
Paszyński, M
Powiązania:
https://bibliotekanauki.pl/articles/305563.pdf
Data publikacji:
2016
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
finite element method
isogeometric analysis
parallel computing
h-adaptivity
B-splines
Opis:
his paper deals with an adaptive finite element method originally developed by Prof. Leszek Demkowicz for hierarchical basis functions. In this paper, we investigate the extension of the adaptive algorithm for isogeometric analysis performed with B-spline basis functions. We restrict ourselves to h-adaptivity, since the polynomial order of approximation must be fixed in the isogeometric case. The classical variant of the adaptive FEM algorithm, as delivered by the group of Prof. Demkowicz, is based on a two-grid paradigm, with coarse and fine grids (the latter utilized as a reference solution). The problem is solved independently over a coarse mesh and a fine mesh. The fine-mesh solution is then utilized as a reference to estimate the relative error of the coarse-mesh solution and to decide which elements to refine. Prof. Demkowicz uses hierarchical basis functions, which (though locally providing Cp−1 continuity) ensure only C0 on the interfaces between elements. The CUDA C library described in this paper switches the basis to B-spline functions and proposes a one-dimensional isogeometric version of the h-adaptive FEM algorithm to achieve global Cp−1 continuity of the solution.
Źródło:
Computer Science; 2016, 17 (4); 439-459
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Implementacja oraz porównanie algorytmów tekstowych w środowiskach przetwarzania równoległego na przykładzie procesorów wielordzeniowych i kart graficznych
Multicore and GPGPU implementation of chosen text algorithms
Autorzy:
Pietroń, M.
Wielgosz, M.
Wiatr, K.
Powiązania:
https://bibliotekanauki.pl/articles/155953.pdf
Data publikacji:
2014
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
algorytmy tekstowe
GPGPU
obliczenia równoległe
text mining
text algorithms
parallel computing
Opis:
Artykuł przedstawia implementację algorytmów tekstowych w wybranych platformach przetwarzania równoległego. Dostępność procesorów wielordzeniowych oraz kart graficznych ogólnego przeznaczenia sprawia, iż badania nad równoległą implementacją algorytmów w celu ich akceleracji nabierają coraz większego znaczenia. Algorytmy tekstowe są niezwykle istotnym i często niezbędnym elementem zaawansowanych algorytmów analizy tekstu oraz są także składowymi funkcji wyszukiwania wzorców w tekście wielu języków programowania. W pracy dokonano analizy najpopularniejszych algorytmów tekstowych oraz dokonano ich analizy pod kątem ich zrównoleglenia w celu ich implementacji w procesorze wielordzeniowym oraz karcie graficznej ogólnego przeznaczenia. Analizowanymi algorytmami są: boyer-moore, algorytm naiwny oraz algorytm knuth-morris-pratt. Następnie dokonano porównania efektywności ich realizacji na wymienionych platformach sprzętowych.
This paper presents implementation of text algorithms in multicore CPU and GPGPU. The text algorithms are very common algorithms used in text analysis process and they are a part of functions used for text patterns recognition. The library functions for text searching implemented in many languages very often use most popular text-algorithms. The paper describes the analysis of these algorithms for parallel implementations in multicore processors and general purpose graphic cards. The research work presented in this paper shows that text algorithms can be partially parallelized. The process of acceleration can be done by appropriate dividing the input text between parallel threads (data parallelism). The comparative studies were performed for the following algorithms: boyer-moore (horspool) , naive and knuth-morris-pratt algorithm. The presented results show the efficiency of these algorithms in the case of different type and size of patterns. In the case of GPU the implementation was made in the CUDA framework. The OpenMP library was used for a multicore version.
Źródło:
Pomiary Automatyka Kontrola; 2014, R. 60, nr 5, 5; 301-304
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Zastosowanie przetwarzania równoległego do analizy pola elektromagnetycznego wielkiej częstotliwości
Parallel processing applied to high frequency electromagnetic field analysis
Autorzy:
Walendziuk, W.
Powiązania:
https://bibliotekanauki.pl/articles/157259.pdf
Data publikacji:
2010
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
metoda FDTD
klaster
obliczenia równoległe
FDTD method
cluster system
parallel computing
Opis:
W artykule przedstawiono algorytmy równoległe, mające zastosowanie w metodzie FDTD (ang. Finite-Differences Time-Domain), będącej jedną z najpopularniejszych metod analizy pola elektromagnetycznego wielkiej częstotliwości. W pracy przedstawiono metodę dekompozycji analizowanej przestrzeni, jak również algorytmy dekompozycji programu na zespół współbieżnych wątków. Ze względu na szczególne zainteresowanie autora algorytmami mającymi zastosowanie w klastrach komputerowych, przedstawione będą wyniki doświadczeń, uzyskanych w czasie testów wydajności programu równoległego, opartego na dekompozycji przestrzeni w wersji podziału "plastrowego". Zdecydowano się na przedstawienie algorytmów zaimplementowanych w klastrze homogenicznym, jak również w heterogenicznym - przy wykorzystaniu dodatkowego algorytmu dynamicznego podziału obszaru analizy.
The paper contains parallel algorithms applied in the FDTD method, which is one of more popular ways of electromagnetic field of high frequency analysis. The work shows algorithms which decompose a program into a group of parallel threads, and a method of the analyzed area decomposition. The first type of algorithms enables achieving good speedups and makes it possible to use e.g. graphic cards in computations conducted with the use of the FDTD method. Whereas space decomposing algorithms help enlarge the analyzed area represented by a grid of elements built of electromagnetic field components presented in a differential form. Thanks to that it is possible to compute areas of great capacity, greater than the com-putational abilities of a single PC unit. The work focuses on presenting the results of efficiency examination of the parallel program based on this method. The author decided to show algorithms implemented on a homogeneous cluster, as well as in a heterogeneous one-with the use of an additional dynamic decomposition of the analyzed area.
Źródło:
Pomiary Automatyka Kontrola; 2010, R. 56, nr 2, 2; 111-114
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Efficiency analysis of parallel computing applied to auto-tuning of state feedback speed controller for PMSM drive
Autorzy:
Szczepański, Rafał
Tarczewski, Tomasz
Grzesiak, Lech M.
Powiązania:
https://bibliotekanauki.pl/articles/376463.pdf
Data publikacji:
2019
Wydawca:
Politechnika Poznańska. Wydawnictwo Politechniki Poznańskiej
Tematy:
parallel computing
Artificial Bee Colony
PMSM
state feedback
controller
MATLAB/Simulink
Opis:
Nowadays the simulation is inseparable part of researcher's work. Its computation time may significantly exceed the experiment time. On the other hand, multi-core processors are common in personal computers. These processors can be used to reduce computation time by using parallel computing on multiple cores. The most popular software applied to simulate behavior of the plant is MATLAB/Simulink. A single simulation of Simulink model cannot be computed by multiple cores, but there are many engineering problems, that require a multiple simulation of the same model with different parameters. In these problems, the parallel computing can be employed to decrease the overall simulation time. In this paper the parallel computing is used to speed-up the auto-tuning process of state feedback speed controller for PMSM drive. In order to obtain the optimal coefficients of the controller, an Artificial Bee Colony optimization algorithm is employed.
Źródło:
Poznan University of Technology Academic Journals. Electrical Engineering; 2019, 100; 145-156
1897-0737
Pojawia się w:
Poznan University of Technology Academic Journals. Electrical Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Dirichlet/Dirichlet and Dirichlet/Dirichlet-Neumann/Neumann non-overlapping iterative domain decomposition methods
Autorzy:
Kubacki, S.
Bogusławski, A.
Powiązania:
https://bibliotekanauki.pl/articles/1933184.pdf
Data publikacji:
2008
Wydawca:
Politechnika Gdańska
Tematy:
non-overlapping domain decomposition method
parallel computing
spectral methods
Helmholtz equation
Opis:
A new iterative non-overlapping domain decomposition method is proposed for solving the one- and two-dimensional Helmholtz equation on parallel computers. The spectral collocation method is applied to solve the Helmholtz equation in each subdomain based on the Chebyshev approximation, while the patching conditions are imposed at the interfaces between subdomains through a correction, being a linear function of the space coordinates. Convergence analysis is performed for two applications of the proposed method (DDLC and DDNNLC algorithms - the meaning of these abbreviations is explained below) based on the works of Zanolli and Funaro et al. Numerical tests have been performed and results obtained using the proposed method and other iterative algorithms have been compared. Parallel performance of the multi-domain algorithms has been analyzed by decomposing the two-dimensional domain into a number of subdomains in one spatial direction. For the one-dimensional problem, convergence of the iteration process was quickly obtained using the proposed method, setting a small value of the ? constant in the Helmholtz equation. Another application of the proposed method may be an alternative to other iterative schemes when solving the two-dimensional Helmholtz equation.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2008, 12, 1-2; 85-104
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Algorithms optimization for the image processing and analysis by constructing parallel solutions
Autorzy:
Bartyzel, K.
Powiązania:
https://bibliotekanauki.pl/articles/92805.pdf
Data publikacji:
2015
Wydawca:
Uniwersytet Przyrodniczo-Humanistyczny w Siedlcach
Tematy:
parallel computing
image processing and analysis
Microsoft .NET Framework
multithread applications
Opis:
This paper presents a concept of parallel programming in the context of image analysis and processing algorithms. It demonstrates an exact implementation of the issue of image filtration using the Microsoft .NET framework and the C# language. All technical aspects were subject to analysis. Presented are both theoretical considerations and nuances of implementation. An experiment was also conducted which consisted in the creation of an appropriate program to demonstrate an example noise filter and the recording of performance time in the case of synchronous and parallel execution. The solution analysis was tested on a typical, average laptop and a server with high computing power. The results unanimously show that applying parallel algorithms can significantly improve the effectiveness of the hardware used.
Źródło:
Studia Informatica : systems and information technology; 2015, 1-2(19); 5-14
1731-2264
Pojawia się w:
Studia Informatica : systems and information technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Wielkoskalowe i zautomatyzowane testowanie przypuszczenia Beala
Bigscale and automatized testing of Beal’s Conjecture
Autorzy:
Świerczewski, Ł.
Powiązania:
https://bibliotekanauki.pl/articles/131937.pdf
Data publikacji:
2016
Wydawca:
Wrocławska Wyższa Szkoła Informatyki Stosowanej Horyzont
Tematy:
przypuszczenie Beal'a
BOINC
obliczenia równoległe
Beal’s conjecture
parallel computing
Opis:
Praca prezentuje aspekt adaptacji oraz wykorzystywania algorytmów zaprezentowanych w publikacji [1] na platformie do obliczeń rozproszonych BOINC [2]. Dodatkowo wykonano testy skalowalności przyśpieszenia oprogramowania na takich platformach jak Intel Xeon Phi 5110P [3] oraz platformie wykorzystującej Versatile SMP Foundation Advanced Platform firmy ScaleMP (rozwiązanie klasy vSMP [4][5]). Dzięki długotrwałym obliczeniom udało się znaleźć 47 rozwiązań przystających prawidłowo modulo 264. Żadne z uzyskanych rozwiązań nie jest jednak prawidłowe w przestrzeni całego zbioru liczb naturalnych, a co za tym idzie nie odnaleziono poprawnego kontrprzykładu dla przypuszczenia Beal'a.
This paper presents adaptation aspect and use of algorithms presented in publication [1] on distributed computing platform BOINC. What is more, there were made some test of software acceleration scalability on such platforms like Intel Xeon Phi 5110P and platform that uses Versatile SMP Foundation Advanced Platform made by ScaleMP. Thanks to long-lasting computation 47 solutions correctly congruent modulo 264 were found. None of the solutions obtained is not correct in the space around the set of natural numbers and what’s connected to that, any correct counterexample for Beal’s Conjecture was not found.
Źródło:
Biuletyn Naukowy Wrocławskiej Wyższej Szkoły Informatyki Stosowanej. Informatyka; 2016, 16; 19-32
2082-9892
Pojawia się w:
Biuletyn Naukowy Wrocławskiej Wyższej Szkoły Informatyki Stosowanej. Informatyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Parallel fuzzy clustering for linguistic summaries
Podsumowania lingwistyczne z równoległym grupowaniem rozmytym
Autorzy:
Smolińska, M. K.
Sosnowski, Z. A.
Powiązania:
https://bibliotekanauki.pl/articles/341097.pdf
Data publikacji:
2009
Wydawca:
Politechnika Białostocka. Oficyna Wydawnicza Politechniki Białostockiej
Tematy:
podsumowania lingwistyczne
grupowanie rozmyte
programowanie równoległe
linguistic summary
fuzzy clustering
parallel computing
Opis:
Z podsumowaniem lingwistycznym, jak i z predykatem rozmytym związana jest wartość prawdy. Możemy więc podsumowań lingwistycznych używać jako predykatów rozmytych. Podsumowanie postaci większość obiektów w populacji P jest podobna do obiektu oi wykorzystać możemy do znajdowania typowych wartości w populacji P, które to wykorzystuje rozmyty algorytm grupujący. Wadą tego algorytmu jest jego duża złożoność obliczeniowa. W celu przetwarzania dużej liczby danych zaimplementowaliśmy ten algorytm równolegle, korzystając ze standardu MPI do komunikacji między procesami działającymi na różnych procesorach. W tej pracy przedstawiamy algorytm równoległy i wyniki eksperymentów.
The linguistic summaries have the associated truth value so they can be used as predicates. We use summaries of the form ”most objects in population P are similar to oi” to find typical values in population P. Then typical values are used in fuzzy clustering algorithm. Disadvantage of this algorithm is its complexity. For the purpose of processing the huge number of data, we decided to use parallel computing mechanism to implement this algorithm, and run it on the cluster machine. We use MPI (Message Passing Interface) to communicate between processes, which work on different processors. This paper presents this parallel algorithm and some results of experiments.
Źródło:
Zeszyty Naukowe Politechniki Białostockiej. Informatyka; 2009, 4; 139-150
1644-0331
Pojawia się w:
Zeszyty Naukowe Politechniki Białostockiej. Informatyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Comparing parallel programming environments for the joint inversion of geoelectrical data
Porównanie równoległych środowisk obliczeniowych na przykładzie inwersji połączonej danych elektrycznych
Autorzy:
Pięta, A.
Bała, J.
Powiązania:
https://bibliotekanauki.pl/articles/305630.pdf
Data publikacji:
2009
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
obliczenia równoległe
zagadnienie odwrotne
metody geoelektryczne
parallel computing
inverse problem
geoelectrical methods
Opis:
The article presents the comparison of the implementation of the inverse problem in geoelectrical methods in two different parallel computational environments. Combination of Monte Carlo method and Multistart algorithm was applied in the inversion process. Parallelization was done by fine grain decomposition. Execution time, speed-up and efficiency received for parallel algorithms in both computational environments were presented and analyzed.
W artykule przedstawiono porównanie równoległej implementacji zagadnienia odwrotnego dla metod geoelektrycznych w dwóch różnych środowiskach obliczeniowych. Do rozwiązania zadania odwrotnego użyto algorytmu Monte Carlo – Multistart. W przypadku równoległej realizacji zastosowano drobnoziarnistą dekompozycję inwersji danych geoelektrycznych. Analizowano czas, przyśpieszenie i efektywność algorytmu równoległego w dwóch różnych środowiskach obliczeniowych.
Źródło:
Computer Science; 2009, 10; 85-95
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Projekt systemu Grid Computing klasy HPC pod kątem rozwiązania zdefiniowanych zagadnień optymalizacyjnych
The project of the Grid Computing system of HPC class in terms of solving defined optimization problems
Autorzy:
Różanowski, K.
Krej, M.
Powiązania:
https://bibliotekanauki.pl/articles/91425.pdf
Data publikacji:
2012
Wydawca:
Warszawska Wyższa Szkoła Informatyki
Tematy:
obliczenia rozproszone
C#
NET
klaster
optymalizacja
obliczenia równoległe
distributed computing
.NET
grid
optimization
parallel computing
Opis:
W artykule przedstawiono koncepcję projektu modelowania dedykowanej platformy programistycznej do zrównoleglonego rozwiązywania zagadnień optymalizacyjnych w środowisku .NET. Jest to równoważne z udostępnieniem techniki tworzenia oprogramowania rozproszonego w wielu językach programowania, między innymi w C#, Visual Basic, ale również Fortran, Pascal, Java, Ada. Ważnym aspektem projektu jest możliwość zestawiania komputerów biurowych w potężne, wirtualne, rozproszone maszyny obliczeniowe bez zmieniania podstawowego ich przeznaczenia oraz ograniczania zakresu zastosowań.
The paper presents the concept of modelling of development platform dedicated to parallelized solving of optimization problems in the Microsoft .NET environment. This concept is an equivalent to the provision of distributed software development techniques in many programming languages, including C#, Visual Basic, as well as Fortran, Pascal, Java, Ada. An important aspect of the project is its ability to compile the desktop computer into a powerful virtual, distributed computing machine without changing their basic purpose and limiting their range of application.
Źródło:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki; 2012, 6, 8; 91-98
1896-396X
2082-8349
Pojawia się w:
Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A parallel algorithm of icsym forcomplexsymmetric linear systems in quantum chemistry
Autorzy:
Zhang, Y.
Lv, Q.
Xiao, M.
Xie, G.
Breitkopf, P.
Powiązania:
https://bibliotekanauki.pl/articles/305677.pdf
Data publikacji:
2018
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
complex symmetric linear systems
parallel computing
improved conjugate gradient-type iterative algorithm (ICSYM)
Opis:
Computational effort is a common issue for solving large-scale complex symmetric linear systems, particularly in quantum chemistry applications. In order to alleviate this problem, we propose a parallel algorithm of improved conjugate gradient-type iterative (ICSYM). Using three-term recurrence relation and or- thogonal properties of residual vectors to replace the tridiagonalization process of classical CSYM, which allows to decrease the degree of the reduce-operator from two to one communication at each iteration and to reduce the amount of vector updates and vector multiplications. Several numerical examples are implemented to show that high performance of proposed improved version is obtained both in convergent rate and in parallel efficiency.
Źródło:
Computer Science; 2018, 19 (4); 385-401
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A parallel adaptive code for compressible Navier-Stokes simulations
Autorzy:
Banaś, K.
Powiązania:
https://bibliotekanauki.pl/articles/1954541.pdf
Data publikacji:
1999
Wydawca:
Politechnika Gdańska
Tematy:
numerical simulations
compressible flow
Navier-Stokes solver
finite element method
parallel computing
adaptive meshes
Opis:
The paper presents a finite element code for compressible flow simulations. The code has two important features: adaptivity to increase accuracy of computations by selectively refining a finite element mesh and efficient parallel performance due to a special implementation based on concept of patches of elements. The algorithm for approximating the compressible Navier-Stokes equations is a version of the stabilized finite element method. Three time integration strategies are implemented, explicit, linear implicit and nonlinear implicit, and the GMRES method is used to solve systems of linear equations. For parallel simulations the code uses a special algorithm for mesh partition. The performance of the code is tested for two examples of supersonic flows: one inviscid and one viscous.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 1999, 3, 1; 17-37
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Komputer równoległy ASGARD przeznaczony do obliczeń w geofizyce
Parallel computer ASGARD designed for computing in geophysics
Autorzy:
Mirek, J.
Powiązania:
https://bibliotekanauki.pl/articles/183704.pdf
Data publikacji:
2009
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
klaster komputerowy
obliczenia równoległe
modelowania w geofizyce
computer cluster
parallel computing
modeling in geophysics
Opis:
The new parallel computer ASGARD has been designed and built in Department of Geophysics of Faculty of Geology, Geophysics and Environmental Protection AGH University, which contains twenty dual-core processors. The computer is designed for numerical calculation and mathematical modeling. It works under Linux operating system with OpenSSI clustering system. User can find there installed software like compilators, Matlab, Octave, DORIS and other programs written for special purposes.
Źródło:
Geologia / Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie; 2009, 35, 2/1; 535-539
0138-0974
Pojawia się w:
Geologia / Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Optimization of linear functions on a cyclic permutation. Based on the random search
Autorzy:
Grebennik, I.
Baranov, O.
Chorna, A.
Gorbacheva, E.
Powiązania:
https://bibliotekanauki.pl/articles/411110.pdf
Data publikacji:
2016
Wydawca:
Polska Akademia Nauk. Oddział w Lublinie PAN
Tematy:
combinatorial optimization
linear function
cyclic permutations
random search
branch and bound algorithm
parallel computing
Opis:
For creating adequate mathematical models of combinatorial problems of constructing optimal cyclic routes, mathematical modeling and solving a number of planning and control tasks solutions of optimization problems on the set of cyclic permutations are required. Review of the publications on combinatorial optimization demonstrates that the optimization problem on the cyclic permutations have not been studied sufficiently. This paper is devoted to solving optimization problem of a linear function with linear constraints on the set of cyclic permutations. For solving problems of this class using of known methods, taking into account the properties of a combinatorial set of cyclic permutations, is proposed. For this purpose we propose a method based on the ideology of random search. Heuristic method based on the strategy of the branch and bound algorithm is proposed to solve auxiliary optimization problem of a linear function without constraints on the set of cyclic permutations. Since application of the branch and bound algorithm immediately leads to an exponential growth of the complexity with increasing the dimension of the problem a number of modifications are suggested. Modifications allow reducing computational expenses for solving higher dimension problems. The effectiveness of the proposed improvements is demonstrated by computational experiments.
Źródło:
ECONTECHMOD : An International Quarterly Journal on Economics of Technology and Modelling Processes; 2016, 5, 3; 211-216
2084-5715
Pojawia się w:
ECONTECHMOD : An International Quarterly Journal on Economics of Technology and Modelling Processes
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Improving the TSAB algorithm through parallel computing
Autorzy:
Rudy, Jarosław
Pempera, Jaroslaw
Smutnicki, Czesław
Powiązania:
https://bibliotekanauki.pl/articles/229535.pdf
Data publikacji:
2020
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
job shop scheduling
parallel computing
operations research
taboo search
TSAB algorithm
coarse-grained parallelization
Opis:
In this paper, a parallel multi-path variant of the well-known TSAB algorithm for the job shop scheduling problem is proposed. Coarse-grained parallelization method is employed, which allows for great scalability of the algorithm with accordance to Gustafon’s law. The resulting P-TSAB algorithm is tested using 162 well-known literature benchmarks. Results indicate that P-TSAB algorithm with a running time of one minute on a modern PC provides solutions comparable to the ones provided by the newest literature approaches to the job shop scheduling problem. Moreover, on average P-TSAB achieves two times smaller percentage relative deviation from the best known solutions than the standard variant of TSAB. The use of parallelization also relieves the user from having to fine-tune the algorithm. The P-TSAB algorithm can thus beused as module in real-life production planning systems or as a local search procedure in other algorithms. It can also provide the upper bound of minimal cycle time for certain problems of cyclic scheduling.
Źródło:
Archives of Control Sciences; 2020, 30, 3; 411-435
1230-2384
Pojawia się w:
Archives of Control Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Parallel analysis of transient states in electric motor
Równoległa analiza stanów nieustalonych w silniku elektrycznym
Autorzy:
Forenc, J.
Powiązania:
https://bibliotekanauki.pl/articles/157271.pdf
Data publikacji:
2010
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
równania różniczkowe zwyczajne
obliczenia równoległe
stany nieustalone
ordinary differential equations
parallel computing
transient states
Opis:
The analysis of transient states in asynchronous slip-ring motor with the application of the parallel method is presented in the paper. Transient states are described by a system of non-linear ordinary differential equations. Solving systems of such equations is a sequential process. The proposed parallel method converts sequential computations into intensively parallel ones. The general idea of this method is based on decomposition of the integration interval into sub-intervals. Computations in sub-intervals are done based on initial conditions determined on the basis of an approximation of the convergence graph by the exponential function.
W artykule przedstawiono zastosowanie oryginalnej metody równoległej analizy stanów nieustalonych do badania dynamiki modelu silnika asynchronicznego pierścieniowego. Metoda ta przeznaczona jest do analizy stanów nieustalonych występujących w obwodach elektrycznych w przypadku, gdy stan nieustalony opisany jest układem równań różniczkowych zwyczajnych, liniowych lub nieliniowych (równaniem stanu). Ogólna idea metody opiera się na dekompozycji przedziału całkowania (t0, tN) na podprzedziały (rys. 2). Obliczenia zmiennych stanu w poszczególnych podprzedziałach wykonywane są równolegle przy zastosowaniu jednej ze znanych sekwencyjnych, jednokrokowych metod numerycznych rozwiązywania układów równań różniczkowych zwyczajnych. Wykonanie równolegle obliczeń wymaga znajomości wartości zmiennych stanu na początku każdego podprzedziału (warunków początkowych). W chwili t0 wartości te znane są z założenia. W pozostałych podprzedziałach wartości zmiennych stanu wyznaczane są na podstawie przybliżenia wykresu zbieżności rozwiązania sekwencyjnego funkcją wykładniczą (3). Algorytm metody zaimplementowany został w strategii "Master-Slave" (rys. 1). Proces master wyznacza sekwencyjnie wartości zmiennych stanu na początku podprzedziałów i przesyła je do procesów slave. Wszystkie procesy (master i slave) wykonują równolegle obliczenia wartości zmiennych stanu w odpowiednich podprzedziałach przedziału całkowania. Po zakończeniu obliczeń proces master odbiera wyniki obliczeń od procesów slave i zapisuje rozwiązanie końcowe. Jako przykład zastosowania powyższej metody przedstawiona została analiza dynamiki modelu silnika asynchronicznego pierścieniowego. Stan nieustalony w silniku opisany jest układem pięciu nieliniowych równań różniczkowych zwyczajnych (5). Obliczenia przeprowadzone zostały przy zastosowaniu systemu klaster składającego się z 6 stacji roboczych. Podczas obliczeń otrzymano dobre przybliżenie wartości zmiennych stanu na początku każdego podprzedziału, co zapewniło dobrą dokładność rozwiązania końcowego.
Źródło:
Pomiary Automatyka Kontrola; 2010, R. 56, nr 2, 2; 125-128
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Use of parallel computing in mass processing of laser data
Zastosowanie obliczeń równoległych do masowego przetwarzania danych laserowych
Autorzy:
Będkowski, J.
Bratuś, R.
Prochaska, M.
Rzonca, A.
Powiązania:
https://bibliotekanauki.pl/articles/129799.pdf
Data publikacji:
2015
Wydawca:
Stowarzyszenie Geodetów Polskich
Tematy:
parallel computing
laser scanning
lidar
data processing
obliczenia równoległe
skanowanie laserowe
LiDAR
przetwarzanie danych
Opis:
The first part of the paper includes a description of the rules used to generate the algorithm needed for the purpose of parallel computing and also discusses the origins of the idea of research on the use of graphics processors in large scale processing of laser scanning data. The next part of the paper includes the results of an efficiency assessment performed for an array of different processing options, all of which were substantially accelerated with parallel computing. The processing options were divided into the generation of orthophotos using point clouds, coloring of point clouds, transformations, and the generation of a regular grid, as well as advanced processes such as the detection of planes and edges, point cloud classification, and the analysis of data for the purpose of quality control. Most algorithms had to be formulated from scratch in the context of the requirements of parallel computing. A few of the algorithms were based on existing technology developed by the Dephos Software Company and then adapted to parallel computing in the course of this research study. Processing time was determined for each process employed for a typical quantity of data processed, which helped confirm the high efficiency of the solutions proposed and the applicability of parallel computing to the processing of laser scanning data. The high efficiency of parallel computing yields new opportunities in the creation and organization of processing methods for laser scanning data.
Publikacja ma na celu przedstawienie części wyników badań, jakie zrealizował zespół badawczy firmy Dephos Software w ramach projektu finansowanego przez UE pt. "Badania nad masowym przechowywaniem, udostępnianiem i przetwarzaniem przestrzennych danych laserowych". Na wstępie publikacji autorzy przedstawiają zasady organizacji algorytmu spełniającego wymogi obliczeń równoległych oraz przybliżają genezę pomysłu prowadzenia badań nad zastosowaniem procesorów graficznych do masowego przetwarzania danych skaningowych. Następnie autorzy prezentują wyniki oceny wydajności działania szeregu różnych procesów przetwarzania danych laserowych, które udało się zasadniczo przyspieszyć dzięki obliczeniom równoległym. Procesy te dzielą się na procesy podstawowe (generowanie ortoobrazów z chmur punktów, kolorowanie chmur punktów, transformacja, generowanie siatki regularnej) oraz procesy zaawansowane (wykrywanie płaszczyzn i krawędzi, klasyfikacja chmur punktów, analiza danych w celu kontroli jakości danych). W większości przypadków algorytmy musiały zostać opracowane całkowicie od nowa pod kątem wymogów przetwarzania równoległego, część korzysta z wcześniejszego dorobku technologicznego firmy Dephos Software, będąc dostosowana do równoległej metody obliczeń w ramach przeprowadzonych badań. W każdym z tych procesów określono czas działania dla typowej ilości danych przetwarzanych, co potwierdziło wysoką wydajność rozwiązań i sens zastosowania obliczeń równoległych w odniesieniu do danych skaningowych. Obliczenia równoległe dzięki swojej wysokiej wydajności otwierają nowe możliwości w tworzeniu i organizacji procesów przetwarzania danych pochodzących ze skaningu laserowego.
Źródło:
Archiwum Fotogrametrii, Kartografii i Teledetekcji; 2015, 27; 45-59
2083-2214
2391-9477
Pojawia się w:
Archiwum Fotogrametrii, Kartografii i Teledetekcji
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Productivity of a low-budget computer cluster applied to overcome the n-body problem
Autorzy:
Nowicki, Tomasz
Gregosiewicz, Adam
Łagodowski, Zbigniew
Powiązania:
https://bibliotekanauki.pl/articles/1956026.pdf
Data publikacji:
2021
Wydawca:
Polskie Towarzystwo Promocji Wiedzy
Tematy:
computer clusters
parallel computing
n-body problem
klastry komputerowe
obliczenia równoległe
problem n-body
Opis:
The classical n-body problem in physics addresses the prediction of individual motions of a group of celestial bodies under gravitational forces and has been studied since Isaac Newton formulated his laws. Nowadays the n-body problem has been recognized in many more fields of science and engineering. Each problem of mutual interaction between objects forming a dynamic group is called as the n-body problem. The cost of the direct algorithm for the problem is O(n2) and is not acceptable from the practical point of view. For this reason cheaper algorithms have been developed successfully reducing the cost to O(nln(n)) or even O(n). Because further improvement of the algorithms is unlikely to happen it is the hardware solutions which can still accelerate the calculations. The obvious answer here is a computer cluster that can preform the calculations in parallel. This paper focuses on the performance of a low-budget computer cluster created on ad hoc basis applied to n-body problem calculation. In order to maintain engineering valuable results a real technical issue was selected to study. It was Discrete Vortex Method that is used for simulating air flows. The pre-sented research included writing original computer code, building a computer cluster, preforming simulations and comparing the results.
Źródło:
Applied Computer Science; 2021, 17, 4; 100-109
1895-3735
Pojawia się w:
Applied Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Evaluation of multimedia applications in a cluster-oriented environment
Autorzy:
Czarnul, P.
Dziubich, T.
Krawczyk, H.
Powiązania:
https://bibliotekanauki.pl/articles/220601.pdf
Data publikacji:
2012
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
quality measurements
software quality
quality model and measures
parallel computing
distributed middleware
multimedia applications
Opis:
In the age of Information and Communication Technology (ICT), Web and the Internet have changed significantly the way applications are developed, deployed and used. One of recent trends is modern design of web-applications based on SOA. This process is based on the composition of existing web services into a single scenario from the point of view of a particular user or client. This allows IT companies to shorten the producttime to market process. On the other hand, it raises questions about the quality of the application, trade-offs between quality factors and attributes and measurements of these. Services are usually hosted and executed in an environment managed by its provider that assures the quality attributes such as availability or throughput. Therefore, in this paper an attempt has been made to perform quality measurements towards the creation of efficient, dependable and user-oriented Web applications. First, the process of designing service-based applications is described. Next, metrics for subsequent measurements of efficiency, dependability and usability of distributed applications are presented. These metrics will assess the efforts and trade-offs in a Web-based application development. As examples, we describe a pair of multimedia applications which we have developed in our department and executed in a cluster-based environment. One of them runs in the BeesyCluster middleware and the second one in the Kaskada platform. For these applications we present results of measurements and conclude about relations between quality attributes in the presented application development model. This knowledge can be used to reason about such relations for new similar applications and be used in rapid and quality development of the latter.
Źródło:
Metrology and Measurement Systems; 2012, 19, 2; 177-190
0860-8229
Pojawia się w:
Metrology and Measurement Systems
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Parallel algorithm for sorting animal pedigrees
Aalgorytm w wersji współbieżnej do sortowania rodowodów zwierząt
Autorzy:
Gierdziewicz, M.
Powiązania:
https://bibliotekanauki.pl/articles/305589.pdf
Data publikacji:
2009
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
hodowla zwierząt
rodowód
porządek chronologiczny
przetwarzanie współbieżne
animal breeding
pedigree
chronological order
parallel computing
Opis:
In many analyses of animal genotype with the methods of quantitative genetics there is a need to account for relationships among individuals. Incorrectly calculated relationship coefficients may lead to biased estimates. The number of software packages exist which deal with that problem; however, in many of them it is assumed that pedigrees of the individuals are sorted chronologically, but in real data sets – containing information on traits and pedigrees – birth dates are often missing. In extreme cases, when (almost) no birth dates are present, the ordering must be made by comparing – at least once – each pair of individuals separately, since it is not sufficient to compare adjacent elements in order to check whether the data set is sorted. Two versions of parallel computer programs were compared, with constant or variable distance between elements of compared pairs. The results indicate that the second algorithm is more efficient.
Badając genotypy zwierząt metodami genetyki ilościowej, trzeba uwzględniać spokrewnienia między zwierzętami. Niepoprawnie obliczone współczynniki spokrewnienia mogą prowadzić do oszacowań obciążonych błędem. W wielu gotowych pakietach ten problem jest uwzględniony; jednak często wymagane jest chronologiczne uporządkowanie rodowodów, ale w danych doświadczalnych często brakuje daty urodzenia zwierzęcia. W przypadkach skrajnych dla ustalenia porządku należy porównać – przynajmniej raz – każdą parę osobników w celu ich posortowania. Porównano dwie wersje algorytmu – ze stałym albo zmiennym odstępem między elementami pary w obrębie iteracji. Wyniki wskazują, że druga wersja algorytmu działa szybciej.
Źródło:
Computer Science; 2009, 10; 57-64
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Multiblock parallel computation of an incompressible 3D flow in turbomachines
Autorzy:
Papierski, A.
Rabiega, M.
Powiązania:
https://bibliotekanauki.pl/articles/1954540.pdf
Data publikacji:
1999
Wydawca:
Politechnika Gdańska
Tematy:
numerical simulations
turbomachinery
incompressible flow
3D Navier-Stockes solver
Navier-Stokes solver
parallel computing
Opis:
A finite volume numerical method for the prediction of a fluid flow in complex geometries such as turbomachinery channels has been parallelized using a domain decomposition approach. A mathematical formulation of a 3-D incompressible steady flow has been presented on the basis of the N-S equations in a grid-oriented co-ordinate system with contravariant velocity components. A parallelized pressure-based implicit algorithm with discretization on a staggered grid has been developed. A message exchange system with a boundary exchange, developed by the authors, has been described. Exemplary calculations have been carried out for a laminar flow through a curved duct and for an inviscid flow through a stage of the centrifugal pump. A good agreement has been obtained in both the cases. Despite considerable simplification that has been introduced in the flow through the pump stage, the computations have shown nearly the same pressure rise in the stage as the measurements. Further directions of numerical investigations of a flow through turbomachines, including in particular those devoted to pressure losses related to the rotor-stator interaction, have been mentioned.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 1999, 3, 1; 39-52
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Performance evaluation of MapReduce using full virtualisation on a departmental cloud
Autorzy:
González-Vélez, H.
Kontagora, M.
Powiązania:
https://bibliotekanauki.pl/articles/907802.pdf
Data publikacji:
2011
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
przetwarzanie w chmurze
przetwarzanie równoległe
szkielet algorytmiczny
MapReduce
server virtualization
cloud computing
algorithmic skeletons
structured parallelism
parallel computing
Opis:
This work analyses the performance of Hadoop, an implementation of the MapReduce programming model for distributed parallel computing, executing on a virtualisation environment comprised of 1+16 nodes running the VMWare workstation software. A set of experiments using the standard Hadoop benchmarks has been designed in order to determine whether or not significant reductions in the execution time of computations are experienced when using Hadoop on this virtualisation platform on a departmental cloud. Our findings indicate that a significant decrease in computing times is observed under these conditions. They also highlight how overheads and virtualisation in a distributed environment hinder the possibility of achieving the maximum (peak) performance.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2011, 21, 2; 275-284
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Programming synchronization-free parallelism using Intel Threading Building Blocks
Programowanie równoległości wolnej od synchronizacji przy użyciu Intel TBB
Autorzy:
Bielecki, W.
Palkowski, M.
Powiązania:
https://bibliotekanauki.pl/articles/153729.pdf
Data publikacji:
2011
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
fragmenty kodu pozbawione synchronizacji
równoległość
zadaniowość
Intel Threading Building Blocks
synchronization-free slices
parallel computing
tasking
Opis:
Extracting synchronization-free parallelism by means of the Iteration Space Slicing Framework results in parallel pseudo-code that is independent on a parallel computer architecture and API/library, hence it cannot be directly compiled. For producing parallel programs for shared memory multiprocessors, Threading Building Blocks (TBB) can be applied that is a library supporting scalable parallel programming based on the standard C++ language. In this paper, we present how to benefit from TBB in practice on the basis of pseudo-code representing synchronization-free slices produced by a tool using the Omega Library. Results of experiments with the NAS benchmarks suite are presented.
Zastosowanie techniki opartej na ekstrakcji równoległości pozbawionej synchronizacji w pętlach programowych pozwala na wygenerowanie pseudokodu, który jest niezależny od architektury komputera oraz języka lub biblioteki programowania. Taki kod nie może być wprost kompilowany. Jest wymagane przekształcenie takiego pseudokodu na rzeczywisty kod równoległy. W tym celu może być zastosowane narzędzie Intel Threading Building Blocks, które jest biblioteką wspierająca skalowalne programowanie równoległe w standardzie C++. Nie wymaga specjalnego języka programowania i specjalnych kompilatorów. Zaletą biblioteki Threading Building Blocks jest możliwość uruchomienia w dowolnym środowisku programowo-sprzętowym i systemie operacyjnym. W artykule przedstawiono korzyści wynikające z tworzenia aplikacji równoległych za pomocą TBB. Wyjaśniono sposób poszukiwania instancji instrukcji fragmentów kodu przy użyciu biblioteki Omega i tworzenie najpierw równoległego pseudo-kodu, a dalej transformacja pseudokodu na kod równoległy z wykorzystaniem TBB. Proponowane podejście zostało zweryfikowane za pomocą zbioru pętli testowych z benchmarku NAS. Zbadano przyspieszenie i efektywność kodu równoległego oraz skalowalność w aspekcie do zmiennego rozmiaru obliczeń badanych pętli.
Źródło:
Pomiary Automatyka Kontrola; 2011, R. 57, nr 11, 11; 1380-1383
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Implementation and parallel cryptanalysis of MASH hash function family
Implementacja i równoległa kryptoanaliza funkcji skrótu z rodziny MASH
Autorzy:
Grądzki, M.
Powiązania:
https://bibliotekanauki.pl/articles/209748.pdf
Data publikacji:
2011
Wydawca:
Wojskowa Akademia Techniczna im. Jarosława Dąbrowskiego
Tematy:
funkcje skrótu
poszukiwanie kolizji
arytmetyka modularna
obliczenia równoległe
hash functions
collision search
modular arithmetic
parallel computing
Opis:
In the article, two Java implementations of the MASH hash function family are presented. The first uses standard classes, the second custom class with optimized execution time and memory consumption. Fast and low memory implementations of MASH hash functions allowed to utilize full power of 368-core Azul Compute Appliance to perform parallel collision search using distinguished points method.
W artykule przedstawiono dwie implementacje funkcji skrótu z rodziny MASH wykonane w języku Java. Pierwsza z nich wykorzystuje standardowe klasy, druga klasę zoptymalizowaną pod względem szybkości działania i zużycia pamięci. Szybkie i oszczędne pamięciowo implementacje funkcji skrótu z rodziny MASH pozwoliły wykorzystać pełne możliwości 368-rdzeniowego Urządzenia Przetwarzającego Azul do równoległego znajdowania kolizji metodą punktów rozróżnialnych.
Źródło:
Biuletyn Wojskowej Akademii Technicznej; 2011, 60, 3; 365-377
1234-5865
Pojawia się w:
Biuletyn Wojskowej Akademii Technicznej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Robust simulation method of complex technical transport systems
Autorzy:
Szpytko, Janusz
Salgado Duarte, Yorlandys
Powiązania:
https://bibliotekanauki.pl/articles/2098142.pdf
Data publikacji:
2021
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
overhead cranes
Monte Carlo simulation
variance reduction
parallel computing
suwnice
symulacja Monte Carlo
redukcja wariancji
obliczenia równoległe
Opis:
In the optimization of technical systems focused on a specific functional purpose (reliability, safety, and availability) with the use of simulation methods, an important parameter is the digital simulation time of the research subject. With the complexity of the issue, the digital simulation time increases. The aim of the article is to present a method (combination of parallel computing and variance reduction techniques) of reducing the computer simulation time of the research technical object. An example of the application of the developed method was presented as a result of an experiment conducted for decision making and control processes aimed at optimizing the process of operating overhead cranes in critical conditions. In this paper, selecting parallel batch jobs computation and stratified sampling, we exponentially decreased the simulation time, finding fast and practical solutions and eliminating the time constraint in the search of solutions.
Źródło:
Transport Problems; 2021, 16, 2; 101--112
1896-0596
2300-861X
Pojawia się w:
Transport Problems
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Zastosowanie obliczeń równoległych do klasyfikacji punktów overlap
Application of parallel computing for classification of overlapping points
Autorzy:
Bratuś, R.
Musialik, P.
Pióro, P.
Prochaska, M.
Rzonca, A.
Powiązania:
https://bibliotekanauki.pl/articles/131194.pdf
Data publikacji:
2017
Wydawca:
Stowarzyszenie Geodetów Polskich
Tematy:
punkty typu overlap
przetwarzanie równoległe
klasyfikacja punktów
kąt skanowania
overlapping points
parallel computing
points classification
scan angle
Opis:
Publikacja omawia nowatorskie metody rozwiązania ważnego technologicznie zagadnienia, jakim jest klasyfikacji punktów overlap, czyli punktów w pasie podwójnego pokrycia pomiędzy sąsiednimi szeregami skanowania. Prezentowane podejście oparte jest na wydajnej metodzie obliczeń równoległych na procesorach graficznych GPU, pozwalającej na zastosowanie bardziej zaawansowanego algorytmu podczas analizy i przetwarzania danych. Celem sprawdzenia wydajności przeprowadzono testy badanego narzędzia do klasyfikacji punktów overlap, a wyniki odniesiono do możliwości powszechnie stosowanego programu Terrascan firmy Terrasolid. Proponowane innowacje obliczeniowe mają na celu poprawę jakości danych skaningowych pozyskiwanych przy pomocy latających platform takich jak lekkie samoloty czy wiatrakowce. Podniesienie jakości procesu klasyfikacji punktów typu overlap, wymaga dwóch wstępnych etapów przetwarzania. Pierwszy polega na obcięciu brzegów szeregu ściśle według zadanego kąta od pionu. Zastosowane podejście daje bardziej regularne wyniki niż inne metody. Z kolei drugi, oparty o algorytm rozgęszczenia punktów, prowadzi do usuwania nadmiarowych profili skanowania. Proponowane rozwiązanie to klasyfikacja punktów overlap według kąta padania promienia skanera na teren i obiekty terenowe. Reasumując, w ramach opisanych badań dotychczas stosowane metody klasyfikacji punktów overlap zostały poddane rewizji. Korzystając z praktycznych uwag oraz sugestii ze strony wykonawców, wprowadzono szereg udoskonaleń, których prezentacja i dyskusja jest przedmiotem niniejszej publikacji.
The paper presents innovative methods of solving important technological problem: the classification of LiDAR points located in the overlapping area between two parallel scan strips. The presented approach is based on an efficient method of parallel computation using graphic processors, allowing to apply more sophisticated algorithms for data analysis and processing. The tests of the algorithms were executed in order to verify correctness of the assumption that the innovative solutions presented in the paper might increase the efficiency and correctness of the data, referred to well known and popular technological solutions. The suggested computational innovations are applied to increase the quality of the LiDAR data acquired by light airplanes and gyrocopters. Two approaches to increase the quality of classification of overlapping points have bee, proposed. The first process is cutting-off the points of the strip borders strictly according to defined angle measured from vertical direction. The second process is dissolving of the points to get the regular density of the result point cloud. The title issue is the classification of overlapping points according to the angle of incidence to the terrain and other objects. The normal vectors calculation for each of the scan points is necessary for the analysis. Such solution increases the quality of overlaps classification and guarantees its high efficiency thanks to the parallel computation. In conclusion, during the research three innovative approaches were tested and reviewed against commonly used methods. Parallel computation can improve quality and reduce time of processing for overlap classification problem was confirmed.
Źródło:
Archiwum Fotogrametrii, Kartografii i Teledetekcji; 2017, 29; 11-26
2083-2214
2391-9477
Pojawia się w:
Archiwum Fotogrametrii, Kartografii i Teledetekcji
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analysis of parallelisation of 3D-CEMBS model using technologies like OpenACC and OpenMP
Analiza możliwości zrównoleglenia modelu 3D-CEMBS z wykorzystaniem technologii typu OpenACC i OpenMP
Autorzy:
Piotrowski, P.
Powiązania:
https://bibliotekanauki.pl/articles/111546.pdf
Data publikacji:
2015
Wydawca:
Instytut Morski w Gdańsku
Tematy:
3D-CEMBS
parallel computing
MPI
OpenMP
OpenACC
distributed memory
shared memory
przetwarzanie równoległe
pamięć rozproszona
pamięć dzielona
Opis:
Oceanographic models utilise parallel computing techniques to increase their performance. Computer hardware constantly evolves and software should follow to better utilise modern hardware potential. The number of CPU cores with access to shared memory increases with hardware evolution. To fully utilise the possibilities new hardware presents, parallelisation techniques employed in oceanographic models, which were designed with distributed memory systems in mind, have to be revised. This research focuses on analysing the 3D-CEMBS model to assess the feasibility of using OpenMP and OpenACC technologies to increase performance. This was done through static code analysis and profiling. The findings show that the main performance problems are attributed to task decomposition that was designed with distributed memory systems in mind. To fully utilise modern shared memory systems, other task decomposition strategies need to be employed. The presented 3D-CEMBS model analysis is a first stage in wider research of oceanographic models as a specific class of parallel applications. In the long term the research will result in proposing design patterns tailored for oceanographic models that would exploit their characteristics to achieve better hardware utilisation on evolving hardware architectures.
Modele oceanograficzne wykorzystują przetwarzanie równoległe dla zwiększenia wydajności. Sprzęt komputerowy ciągle ewoluuje, więc oprogramowanie powinno zmieniać się razem z nim, aby w pełni wykorzystać potencjał współczesnego sprzętu. Wraz z rozwojem sprzętu komputerowego zwiększa się liczba rdzeni procesorów, które mają dostęp do pamięci współdzielonej. Aby w pełni wykorzystać możliwości nowego sprzętu, techniki zrównoleglania wykorzystywane w modelach oceanograficznych muszą zostać zrewidowane. Modele oceanograficzne były często projektowane z myślą o systemach z pamięcią rozproszoną. Niniejsze badania skupiają się na analizie modelu 3D-CEMBS pod kątem możliwości wykorzystania technologii OpenMP i OpenACC w celu podniesienia wydajności modelu. W tym celu została przeprowadzona statyczna analiza kodu modelu oraz profilowanie. Wyniki badań pokazują, że główny problem wydajnościowy modelu jest wynikiem zastosowania dekompozycji zadań przewidzianej dla systemów z pamięcią rozproszoną. Aby w pełni wykorzystać współczesne komputery z pamięcią współdzieloną należy wprowadzić inne strategie dekompozycji zadań.
Źródło:
Biuletyn Instytutu Morskiego w Gdańsku; 2015, 30, 1; 10-15
1230-7424
2450-5536
Pojawia się w:
Biuletyn Instytutu Morskiego w Gdańsku
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Parallel and distributed implementation of optimization algorithms in fe analyses
Implementacja optymalizacyjnych algorytmów równoległych i rozproszonych w analizie MES
Autorzy:
Handrik, M.
Vasko, M.
Kopas, P.
Powiązania:
https://bibliotekanauki.pl/articles/196393.pdf
Data publikacji:
2012
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
FEM analysis
optimization
parallel computing
distributed computing
BOINC
grid computing
evolutionary algorithms
analiza MES
optymalizacja
obliczenia równoległe
obliczenia rozproszone
rozproszony model obliczeniowy
algorytm ewolucyjny
Opis:
The aim of this paper is analysis of optimization algorithms in terms of their possible solutions in parallelization and distributed computing systems. Main goal is using of evolutionary algorithms and implementation of parallel algorithms. As the software platform for application of distributed optimization algorithms is using software package BOINC. For evaluation of the objective function is used FEM program ADINA.
Artykuł analizuje algorytmy optymalizacyjne pod kątem ich możliwości obliczeń równoległych oraz rozproszonych systemów obliczeniowych. Ukierunkowany jest przede wszystkim na algorytmy ewolucyjne oraz ich implementację równoległą. Jako platforma softwarowa do zastosowania rozproszonego systemu obliczeniowego algorytmu zostało zastosowane oprogramowanie pośredniczące BOINC. W celu oceny funkcji docelowej został zastosowany w MES program ADINA.
Źródło:
Zeszyty Naukowe. Transport / Politechnika Śląska; 2012, 76; 67-74
0209-3324
2450-1549
Pojawia się w:
Zeszyty Naukowe. Transport / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Interpretable decision-tree induction in a big data parallel framework
Autorzy:
Weinberg, A. I.
Last, M.
Powiązania:
https://bibliotekanauki.pl/articles/330635.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
big data
parallel computing
mapreduce
decision trees
editing distance
tree similarity
zbiór danych
obliczenia równoległe
drzewa decyzyjne
odległość edycji
Opis:
When running data-mining algorithms on big data platforms, a parallel, distributed framework, such as MAPREDUCE, may be used. However, in a parallel framework, each individual model fits the data allocated to its own computing node without necessarily fitting the entire dataset. In order to induce a single consistent model, ensemble algorithms such as majority voting, aggregate the local models, rather than analyzing the entire dataset directly. Our goal is to develop an efficient algorithm for choosing one representative model from multiple, locally induced decision-tree models. The proposed SySM (syntactic similarity method) algorithm computes the similarity between the models produced by parallel nodes and chooses the model which is most similar to others as the best representative of the entire dataset. In 18.75% of 48 experiments on four big datasets, SySM accuracy is significantly higher than that of the ensemble; in about 43.75% of the experiments, SySM accuracy is significantly lower; in one case, the results are identical; and in the remaining 35.41% of cases the difference is not statistically significant. Compared with ensemble methods, the representative tree models selected by the proposed methodology are more compact and interpretable, their induction consumes less memory, and, as confirmed by the empirical results, they allow faster classification of new records.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2017, 27, 4; 737-748
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
An efficient approach for view selection for data warehouse using tree mining and evolutionary computation
Autorzy:
Thakare, A.
Deshpande, P.
Powiązania:
https://bibliotekanauki.pl/articles/305413.pdf
Data publikacji:
2018
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
database management systems
data warehousing and data mining
query optimization
graph mining
algorithms for parallel computing
evolutionary computations
genetic algorithms
Opis:
The selection of a proper set of views to materialize plays an important role in database performance. There are many methods of view selection that use different techniques and frameworks to select an efficient set of views for materialization. In this paper, we present a new efficient scalable method for view selection under the given storage constraints using a tree mining approach and evolutionary optimization. The tree mining algorithm is designed to determine the exact frequency of (sub)queries in the historical SQL dataset. The Query Cost model achieves the objective of maximizing the performance benefits from the final view set that is derived from the frequent view set given by the tree mining algorithm. The performance benefit of a query is defined as a function of query frequency, query creation cost, and query maintenance cost. The experimental results show that the proposed method is successful in recommending a solution that is fairly close to an optimal solution.
Źródło:
Computer Science; 2018, 19 (4); 431-455
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Creating semantic maps from laser terrestrial data
Tworzenie map semantycznych na podstawie danych z naziemnego skaningu laserowego
Autorzy:
Będkowski, J.
Majek, K.
Musialik, P.
Masłowski, A.
Adamek, A.
Powiązania:
https://bibliotekanauki.pl/articles/130718.pdf
Data publikacji:
2013
Wydawca:
Stowarzyszenie Geodetów Polskich
Tematy:
semantic map
terrestrial scanning
mobile robot navigation
path planning
parallel computing
mapa semantyczna
skaning naziemny
nawigacja robota mobilnego
planowanie trasy
obliczenia równoległe
Opis:
In this paper creating semantic maps based on laser terrestrial data is shown. Semantic map is based on transformed geometric data (3D laser range finder) into the data with assigned labels. This labels can help in several applications such as navigation of mobile robot by finding traversable and not traversable regions. Computation of large 3D data sets requires high computational power, therefore we proposed the GPU based (Graphic Processing Unit) implementation to decrease the computational time. As a result we demonstrate the computed semantic map for mobile robot navigation.
W niniejszej pracy zostało przedstawione tworzenie map semantycznych na podstawie danych z naziemnego skaningu laserowego. Mapa semantyczna bazuje na danych pomiarowych z przypisanymi etykietami. Te etykiety mogą zostać wykorzystane w wielu aplikacjach, jak nawigacja robota mobilnego z wykorzystaniem podziału na regiony przejezdne i nieprzejezdne. Obliczenia dużych trójwymiarowych zbiorów danych wymaga zastosowania duże mocy obliczeniowej, dlatego zaproponowaliśmy implementację wykorzystującą GPU (Graphic Processing Unit), by zmniejszyć czas obliczeń. W rezultacie prezentujemy mapę semantyczną do nawigacji robota mobilnego.
Źródło:
Archiwum Fotogrametrii, Kartografii i Teledetekcji; 2013, Spec.; 23-33
2083-2214
2391-9477
Pojawia się w:
Archiwum Fotogrametrii, Kartografii i Teledetekcji
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Mobile sensor routing for parameter estimation of distributed systems using the parallel tunneling method
Autorzy:
Zięba, T.
Uciński, D.
Powiązania:
https://bibliotekanauki.pl/articles/907911.pdf
Data publikacji:
2008
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
sieć sensorowa
układ o parametrach rozłożonych
projekt optymalny
obliczanie równoległe
sensor network
distributed parameter system
optimum experimental design
tunneling algorithm
parallel computing
Opis:
The paper deals with the problem of optimal path planning for a sensor network with mutliple mobile nodes, whose measurements are supposed to be primarily used to estimate unknown parameters of a system modelled by a partial differential equation. The adopted framework permits to consider two- or three-dimensional spatial domains and correlated observations. Since the aim is to maximize the accuracy of the estimates, a general functional defined on the relevant Fisher information matrix is used as the design criterion. Central to the approach is the parameterization of the sensor trajectories based on cubic B-splines. The resulting finite-dimensional global optimization problem is then solved using a parallel version of the tunneling algorithm. A numerical example is included to clearly demonstrate the idea presented in the paper.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2008, 18, 3; 307-318
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Mobilny system tworzenia przestrzennej dokumentacji semantycznej
Mobile system for the creation of the spatial semantic documentation
Autorzy:
Ostrowski, I.
Majek, K.
Adamek, A.
Musialik, P.
Będkowski, J.
Masłowski, A.
Powiązania:
https://bibliotekanauki.pl/articles/155846.pdf
Data publikacji:
2012
Wydawca:
Stowarzyszenie Inżynierów i Techników Mechaników Polskich
Tematy:
mapa semantyczna
przestrzenna dokumentacja semantyczna
skanowanie laserowe
chmura punktów
wizualizacja
semantic map
semantic map documentation
laser scanning
cloud of points
parallel computing
visualization
Opis:
W artykule przedstawiono mobilny system tworzenia przestrzennej dokumentacji semantycznej. Zaproponowano nową metodę filtracji oraz rejestracji danych wykorzystującą obliczenia równoległe (NVIDIA FERMI). Opracowany system informatyczny umożliwia gromadzenie danych przestrzennych z wykorzystaniem geodezyjnego systemu pomiarowego 3D oraz pozwala na etykietowanie obiektów. Tworzona mapa semantyczna jest dostępna z poziomu dowolnego urządzenia mobilnego (laptop, smartphone, tablet).
In this paper a new system for creating spatial semantic documentation is shown. We define semantic documentation as a result of integrating semantic mapping with a mobile 3D geodetic scanning system and a cloud computer system. This approach is possible by using semantic mapping State of the Art [2], modern scanning techniques [3] and parallel computing [4]. The main task of the system is representing the environment with concepts of objects highlighted in it. The results are distributed in a cloud. The phases of system operation are shown in Fig. 1. Each phase is described in detail in consecutive sections of the paper. Section 1 describes the thought process behind the system and data acquisition with a ZF 5010 laser scanner. In Section 2 a CUDA(NVIDIA FERMI) enhanced scan filtration method is shown. The next step of data preparation, merging of 3D point clouds, is described in Section 3. Section 4 concentrates on manual environment conceptualization (map with object concepts is shown in Fig. 4). Semantic documentation distribution and sharing are described in Section 5. The results can be shown on any PC, tablet, smartphone or smartTV device, by using SaaS(Software as a Service) approach and Citrix system. The paper finalizes with conclusions and plans for further system development. The system is a new approach to sharing information about the environment and it may be applied i.e. in Crisis Management for coordinating complicated rescue operations, in interior design and cataloguing etc.
Źródło:
Pomiary Automatyka Kontrola; 2012, R. 58, nr 12, 12; 1117-1120
0032-4140
Pojawia się w:
Pomiary Automatyka Kontrola
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
PaX-DBSCAN: a proposed algorithm for improved clustering
PaX-DBSCAN: propozycja algorytmu dla doskonalonego grupowania
Autorzy:
Samson, Grace L.
Lu, Joan
Powiązania:
https://bibliotekanauki.pl/articles/592926.pdf
Data publikacji:
2016
Wydawca:
Uniwersytet Ekonomiczny w Katowicach
Tematy:
Bulk-loading
Clustering
Parallel computing
Partition
Spatial database
Spatial index
X-tree
Algorytm bulk loading
Grupowanie
Indeks przestrzenny
Przestrzenne bazy danych
Przetwarzanie równoległe
Rozdzielanie
Struktura drzewiasta X-tree
Opis:
We focused on applying parallel computing technique to the bulk loading of X-tree in other to improve the performance of DBSCAN clustering algorithm. We have given a full description of how the system can be archived. We proposed a new parallel algorithm for DBSCAN and another algorithm to extend the X-tree spatial indexing structure. Spatial database systems incorporate space in database systems, they support nontraditional data types and more complex queries, therefore in order to optimise such systems for efficient information processing and retrieval, appropriate techniques must be adopted to facilitate the construction of suitable index structures.
W artykule autorzy skupiają swoją uwagę na zastosowaniu techniki przetwarzania równoległego przy wykorzystaniu struktur drzewiastych X-tree i algorytmu bulk loading. Zaproponowano nowy algorytm przetwarzania równoległego DBSCAN i drugi algorytm dla rozszerzania struktur indeksowania przestrzennego. Algorytm grupowania DBSCAN jest efektywnym algorytmem grupowania dla Systemów Przestrzennych Baz Danych, który ma możliwość wykrywania zakłóceń i nie wymaga znacznej liczby skupień wcześniej ustalonych, jednakże działanie algorytmu zmienia się, gdy rozmiar danych jest duży. Ten algorytm może nie działać optymalnie, jeśli niewłaściwe wartości są wybrane dla minpts i eps. Dlatego nowy zaproponowany algorytm powinien eliminować te ograniczenia.
Źródło:
Studia Ekonomiczne; 2016, 296; 86-121
2083-8611
Pojawia się w:
Studia Ekonomiczne
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Comcutejs:a Web browser based platform for large-scale computations
Autorzy:
Dębski, R.
Krupa, T.
Majewski, P
Powiązania:
https://bibliotekanauki.pl/articles/305741.pdf
Data publikacji:
2013
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
volunteer computing
parallel computations
large-scale computations
augmented cloud computing
Opis:
The paper presents a new, cost effective,volunteer computing based platform. It utilizes volunteers’web browsers as computational nodes. The computational tasks are delegated to the browsers and executed in the background (independently of any user interface scripts) making use of the HTML5 web workers technology. The capabilities of the platform hale been proved by experiments performer in a wide range of numbers of computational nodes (1–400).
Źródło:
Computer Science; 2013, 14 (1); 143-152
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Parallel patterns for agent-based evolutionary computing
Autorzy:
Stypka, J.
Anielski, P.
Mentel, S.
Krzywicki, D.
Turek, W.
Byrski, A.
Kisiel-Dorohinicki, M.
Powiązania:
https://bibliotekanauki.pl/articles/305684.pdf
Data publikacji:
2016
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
agent-based computing
functional programming
parallel pattern
Opis:
Computing applications such as metaheuristics-based optimization can greatly benefit from multi-core architectures available on modern supercomputers. In this paper, we describe an easy and efficient way to implement certain population-based algorithms (in the discussed case, multi-agent computing system) on such runtime environments. Our solution is based on an Erlang software library which implements dedicated parallel patterns. We provide technological details on our approach and discuss experimental results.
Źródło:
Computer Science; 2016, 17 (1); 83-98
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Fuzzy method and neural network model parallel implementation of multi-layer neural network based on cloud computing for real time data transmission in large offshore platform
Autorzy:
Zhang, H..
Qin, W.
Powiązania:
https://bibliotekanauki.pl/articles/259083.pdf
Data publikacji:
2017
Wydawca:
Politechnika Gdańska. Wydział Inżynierii Mechanicznej i Okrętownictwa
Tematy:
parallel implementation
multi-layer neural network
cloud computing
Opis:
With the rapid development of electronic technology, network technology and cloud computing technology, the current data is increasing in the way of mass, has entered the era of big data. Based on cloud computing clusters, this paper proposes a novel method of parallel implementation of multilayered neural networks based on Map-Reduce. Namely in order to meet the requirements of big data processing, this paper presents an efficient mapping scheme for a fully connected multi-layered neural network, which is trained by using error back propagation (BP) algorithm based on Map-Reduce on cloud computing clusters (MRBP). The batch-training (or epoch-training) regimes are used by effective segmentation of samples on the clusters, and are adopted in the separated training method, weight summary to achieve convergence by iterating. For a parallel BP algorithm on the clusters and a serial BP algorithm on uniprocessor, the required time for implementing the algorithms is derived. The performance parameters, such as speed-up, optimal number and minimum of data nodes are evaluated for the parallel BP algorithm on the clusters. Experiment results demonstrate that the proposed parallel BP algorithm in this paper has better speed-up, faster convergence rate, less iterations than that of the existed algorithms.
Źródło:
Polish Maritime Research; 2017, S 2; 39-44
1233-2585
Pojawia się w:
Polish Maritime Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The Analysis of OpenStack Cloud Computing Platform: Features and Performance
Autorzy:
Grzonka, D.
Powiązania:
https://bibliotekanauki.pl/articles/307878.pdf
Data publikacji:
2015
Wydawca:
Instytut Łączności - Państwowy Instytut Badawczy
Tematy:
cloud computing
high performance computing
OpenStack
parallel environments
resource utilization analysis
virtualization
Opis:
Over the decades the rapid development of broadly defined computer technologies, both software and hardware is observed. Unfortunately, software solutions are regularly behind in comparison to the hardware. On the other hand, the modern systems are characterized by a high demand for computing resources and the need for customization for the end users. As a result, the traditional way of system construction is too expensive, inflexible and it doesn’t have high resources utilization. Present article focuses on the problem of effective use of available physical and virtual resources based on the OpenStack cloud computing platform. A number of conducted experiments allowed to evaluate computing resources utility and to analyze performance depending on the allocated resources. Additionally, the paper includes structural and functional analysis of the OpenStack cloud platform.
Źródło:
Journal of Telecommunications and Information Technology; 2015, 3; 52-57
1509-4553
1899-8852
Pojawia się w:
Journal of Telecommunications and Information Technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Novel GPU-Enabled Simulator for Large Scale Spiking Neural Networks
Autorzy:
Szynkiewicz, P.
Powiązania:
https://bibliotekanauki.pl/articles/307680.pdf
Data publikacji:
2016
Wydawca:
Instytut Łączności - Państwowy Instytut Badawczy
Tematy:
GPU computing
OpenCL programming technology
parallel simulation
spiking neural networks
Opis:
The understanding of the structural and dynamic complexity of neural networks is greatly facilitated by computer simulations. An ongoing challenge for simulating realistic models is, however, computational speed. In this paper a framework for modeling and parallel simulation of biological-inspired large scale spiking neural networks on high-performance graphics processors is described. This tool is implemented in the OpenCL programming technology. It enables simulation study with three models: Integrate-andfire, Hodgkin-Huxley and Izhikevich neuron model. The results of extensive simulations are provided to illustrate the operation and performance of the presented software framework. The particular attention is focused on the computational speed-up factor.
Źródło:
Journal of Telecommunications and Information Technology; 2016, 2; 34-42
1509-4553
1899-8852
Pojawia się w:
Journal of Telecommunications and Information Technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A parallel genetic algorithm for creating virtual portraits of historical figures
Autorzy:
Krawczyk, H.
Proficz, J.
Ziółkowski, T.
Powiązania:
https://bibliotekanauki.pl/articles/1933983.pdf
Data publikacji:
2012
Wydawca:
Politechnika Gdańska
Tematy:
genetic algorithms
fitness function
KASKADA platform
parallel processing
high performance computing
Opis:
In this paper we present a genetic algorithm (GA) for creating hypothetical virtual portraits of historical figures and other individuals whose facial appearance is unknown. Our algorithm uses existing portraits of random people from a specific historical period and social background to evolve a set of face images potentially resembling the person whose image is to be found. We then use portraits of the person’s relatives to judge which of the evolved images are most likely to resemble his/her actual appearance. Unlike typical GAs, our algorithm uses a new supervised form of fitness function which itself is affected by the evolution process. Additional description of requested facial features can be provided to further influence the final solution (i.e. the virtual portrait). We present an example of a virtual portrait created by our algorithm. Finally, the performance of a parallel implementation developed for the KASKADA platform is presented and evaluated.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2012, 16, 1-2; 145-162
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
GPU-based tuning of quantum-inspired genetic algorithm for a combinatorial optimization problem
Autorzy:
Nowotniak, R.
Kucharski, J.
Powiązania:
https://bibliotekanauki.pl/articles/201268.pdf
Data publikacji:
2012
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
quantum-inspired genetic algorithm
evolutionary computing
meta-optimization
parallel algorithms
GPGPU
Opis:
This paper concerns efficient parameters tuning (meta-optimization) of a state-of-the-art metaheuristic, Quantum-Inspired Genetic Algorithm (QIGA), in a GPU-based massively parallel computing environment (NVidia CUDATMtechnology). A novel approach to parallel implementation of the algorithm has been presented. In a block of threads, each thread transforms a separate quantum individual or different quantum gene; In each block, a separate experiment with different population is conducted. The computations have been distributed to eight GPU devices, and over 400× speedup has been gained in comparison to Intel Core i7 2.93GHz CPU. This approach allows efficient meta-optimization of the algorithm parameters. Two criteria for the meta-optimization of the rotation angles in quantum genes state space have been considered. Performance comparison has been performed on combinatorial optimization (knapsack problem), and it has been presented that the tuned algorithm is superior to Simple Genetic Algorithm and to original QIGA algorithm.
Źródło:
Bulletin of the Polish Academy of Sciences. Technical Sciences; 2012, 60, 2; 323-330
0239-7528
Pojawia się w:
Bulletin of the Polish Academy of Sciences. Technical Sciences
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
A Hybrid CPU/GPU Cluster for Encryption and Decryption of Large Amounts of Data
Autorzy:
Niewiadomska-Szynkiewicz, E.
Marks, M.
Jantura, J.
Podbielski, M.
Powiązania:
https://bibliotekanauki.pl/articles/309363.pdf
Data publikacji:
2012
Wydawca:
Instytut Łączności - Państwowy Instytut Badawczy
Tematy:
AES
computer clusters
cryptography
DES
GPU computing
parallel calculation
software systems
Opis:
The main advantage of a distributed computing system over standalone computer is an ability to share the workload between cores, processors and computers. In our paper we present a hybrid cluster system - a novel computing architecture with multi-core CPUs working together with many-core GPUs. It integrates two types of CPU, i.e., Intel and AMD processor with advanced graphics processing units, adequately, Nvidia Tesla and AMD FirePro (formerly ATI). Our CPU/GPU cluster is dedicated to perform massive parallel computations which is a common approach in cryptanalysis and cryptography. The efficiency of parallel implementations of selected data encryption and decryption algorithms are presented to illustrate the performance of our system.
Źródło:
Journal of Telecommunications and Information Technology; 2012, 3; 32-39
1509-4553
1899-8852
Pojawia się w:
Journal of Telecommunications and Information Technology
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Very Fast Non-Dominated Sorting
Autorzy:
Smutnicki, C.
Rudy, J.
Żelazny, D.
Powiązania:
https://bibliotekanauki.pl/articles/375948.pdf
Data publikacji:
2014
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
parallel algorithms
Pareto sorting
computational complexity
GPU computing
multiple criteria decision analysis
NSGA-II
Opis:
A new and very efficient parallel algorithm for the Fast Non-dominated Sorting of Pareto fronts is proposed. By decreasing its computational complexity, the application of the proposed method allows us to increase the speedup of the best up to now Fast and Elitist Multi-Objective Genetic Algorithm (NSGA-II) more than two orders of magnitude. Formal proofs of time complexities of basic as well as improved versions of the procedure are presented. The provided experimental results fully confirm theoretical findings.
Źródło:
Decision Making in Manufacturing and Services; 2014, 8, 1-2; 13-23
1896-8325
2300-7087
Pojawia się w:
Decision Making in Manufacturing and Services
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Load balancing in parallel implementation of vascular network modeling
Mechanizm zrównoważenia obciążenia w równoległej implementacji rozwoju sieci naczyń krwionośnych
Autorzy:
Jurczuk, K.
Krętowski, M.
Bézy-Wendling, J.
Powiązania:
https://bibliotekanauki.pl/articles/341065.pdf
Data publikacji:
2010
Wydawca:
Politechnika Białostocka. Oficyna Wydawnicza Politechniki Białostockiej
Tematy:
algorytm równoległy
klaster obliczeniowy
modelowanie komputerowe
system krwionośny
parallel algorithms
load balancing
cluster computing
computational modeling
vascular network
Opis:
In this paper, load balancing mechanisms in a parallel algorithm of vascular network development are investigated. The main attention is focused on the perfusion process (connection of new cells to vascular trees) as it is the most time demanding part of the vascular algorithm. We propose several techniques that aim at balancing load among processors, decreasing their idle time and reducing the communication overhead. The core solution is based on the centralized dynamic load balancing approach. The model behaviors are analyzed and a tradeoff between the different mechanisms is found. The proposed mechanisms are implemented on a computing cluster with the use of the message passing interface (MPI) standard. The experimental results show that the introduced improvements provide a more efficient solution and consequently further accelerate the simulation process.
W artykule rozważane są mechanizmy zrównoważające obciążenie w równoległym algorytmie rozwoju sieci naczyń krwionośnych. Główną uwagę zwrócono na proces perfuzji (podłączanie nowych komórek do drzew krwionośnych) jako, że proces ten jest najbardziej czasochłonnym fragmentem rozpatrywanego algorytmu. Zaproponowane przez autorów rozwiązania mają na celu zrównoważenie obciążenia pomiędzy procesorami, skrócenie ich czasu bezczynności oraz zredukowanie narzutu komunikacyjnego. Jądro rozwiązania jest oparte na scentralizowanym dynamicznym podejściu równoważenia obciążenia. Zachowania modelu zostały przeanalizowane i kompromis pomiędzy różnymi technikami został zaproponowany. Przedstawione mechanizmy zostały zaimplementowane na klastrze obliczeniowym przy wykorzystaniu standardu MPI. Otrzymane rezultaty jednoznacznie pokazuja˛ iż wprowadzone usprawnienia zapewniają bardziej efektywne rozwiązanie co w konsekwencji pozwala na jeszcze większe przyśpieszenie procesu symulacji.
Źródło:
Zeszyty Naukowe Politechniki Białostockiej. Informatyka; 2010, 6; 41-61
1644-0331
Pojawia się w:
Zeszyty Naukowe Politechniki Białostockiej. Informatyka
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Równoległa realizacja przykładowego algorytmu genetycznego z wykorzystaniem akceleratorów GPU
Autorzy:
Ratuszniak, P.
Stasiak, A.
Łańcucki, R.
Powiązania:
https://bibliotekanauki.pl/articles/118416.pdf
Data publikacji:
2018
Wydawca:
Politechnika Koszalińska. Wydawnictwo Uczelniane
Tematy:
algorytm genetyczny
programowanie równoległe
akceleracja obliczeń
akceleratory GPU
CUDA
problem komiwojażera
genetic algorithm
parallel programming
computing acceleration
GPU
travelling salesman problem
Opis:
W artykule zaprezentowano praktyczną implementację aplikacji rozwiązującej przykładowy algorytm genetyczny z wykorzystaniem akceleratorów GPU. W tym przypadku zdecydowano się na rozwiązanie za pomocą algorytmu genetycznego typowego problemu optymalizacyjnego, jakim jest problem komiwojażera. Dodatkowo w celu wykorzystania mocy karty graficznej w tworzonej aplikacji wykorzystano technologię programowania na karcie graficznej – technologię Nvidia CUDA.
The paper presents a practical implementation of a local desktop application that solves exemplary genetic algorithm with the use of GPU accelerators. In this case decided with the use of genetic algorithm to solve typical optimization problem which is travelling salesman problem. Additionally used Nvidia CUDA programming technology in order to use power of GPU in created application.
Źródło:
Zeszyty Naukowe Wydziału Elektroniki i Informatyki Politechniki Koszalińskiej; 2018, 13; 63-78
1897-7421
Pojawia się w:
Zeszyty Naukowe Wydziału Elektroniki i Informatyki Politechniki Koszalińskiej
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The modular principles of parallel pipeline information processing
Modularne zasady równoległe potokowego przetwarzania informacji
Autorzy:
Selianinau, M.
Powiązania:
https://bibliotekanauki.pl/articles/103613.pdf
Data publikacji:
2017
Wydawca:
Uniwersytet Humanistyczno-Przyrodniczy im. Jana Długosza w Częstochowie. Wydawnictwo Uczelniane
Tematy:
modular number system
modular arithmetic
modular computing structures
parallel data processing
pipeline mode
modularne systemy liczbowe
arytmetyka modularna
modularne struktury obliczeniowe
równoległe przetwarzanie informacji
tryb potokowy
Opis:
In the present paper, we deal with the methodology of implementation of the modular arithmetic algorithms using the parallel-pipeline residues summation blocks with respect to the bases of modular number system. These summation blocks are the main structural elements of high-speed modular operating devices, they provide high throughput performance of input data sets and are oriented to the wide application of VLSI chips.
W niniejszym artykule omówiono metodologię implementacji algorytmów arytmetyki modularnej przy wykorzystaniu równolegle potokowych bloków sumowania reszt w odniesieniu do podstaw modularnego systemu liczbowego. Te bloki sumujące są głównymi elementami strukturalnymi wysokowydajnych modularnych urządzeń obliczeniowych, one również zapewniają wysoką wydajność przepustowości zestawów danych wejściowych i są zorientowane na szerokie zastosowanie układów scalonych VLSI.
Źródło:
Prace Naukowe Akademii im. Jana Długosza w Częstochowie. Technika, Informatyka, Inżynieria Bezpieczeństwa; 2017, T. 5; 147-153
2300-5343
Pojawia się w:
Prace Naukowe Akademii im. Jana Długosza w Częstochowie. Technika, Informatyka, Inżynieria Bezpieczeństwa
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Model Order Reduction of Large-Scale Finite Element Systems in an MPI Parallelized Environment for Usage in Multibody Simulation
Redukcja rzędu modelu w układach elementów skończonych wielkiej skali, w środowisku równoległym z intefejsem (MPI), w zastosowaniu do symulacji układów wieloczłonowych
Autorzy:
Volzer, T.
Eberhard, P.
Powiązania:
https://bibliotekanauki.pl/articles/950696.pdf
Data publikacji:
2016
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
model order reduction
elastic multibody system
high performance computing
parallel reduction
Trilinos
Anasazi
iterative solvers
redukcja rzędu modelu
elastyczny system wieloczłonowy
wydajne systemy obliczeniowe
redukcja równoległa
solwery iteracyjne
Opis:
The use of elastic bodies within a multibody simulation became more and more important within the last years. To include the elastic bodies, described as a finite element model in multibody simulations, the dimension of the system of ordinary differential equations must be reduced by projection. For this purpose, in this work, the modal reduction method, a component mode synthesis based method and a moment-matching method are used. Due to the always increasing size of the non-reduced systems, the calculation of the projection matrix leads to a large demand of computational resources and cannot be done on usual serial computers with available memory. In this paper, the model reduction software Morembs++ is presented using a parallelization concept based on the message passing interface to satisfy the need of memory and reduce the runtime of the model reduction process. Additionally, the behaviour of the Block-Krylov-Schur eigensolver, implemented in the Anasazi package of the Trilinos project, is analysed with regard to the choice of the size of the Krylov base, the blocksize and the number of blocks. Besides, an iterative solver is considered within the CMS-based method.
W ostatnich latach w symulacji układów wieloczłonowych coraz ważniejsze staje się uwzględnianie odkształcalności członów. By w symulacji układu wieloczłonowego można było wykorzystać człony odkształcalne, modelowane metodą elementów skończonych, rozmiar układu równań różniczkowych zwyczajnych musi być zredukowany drogą projekcji.W tym celu w prezentowanej pracy zastosowano metodę redukcji modalnej, metodę opartą na syntezie składowych postaciowych (CMS) oraz metodę dopasowania momentów. Wobec wciąż rosnącego rozmiaru układów niezredukowanych, obliczanie macierzy projekcji prowadzi do wielkiego zapotrzebowania na moce obliczeniowe i nie może być wykonane na zwykłych, szeregowych komputerach. W pracy zaprezentowano oprogramowanie do redukcji modelu Morembs++, w którym wykorzystuje się obliczenia równoległe z interfejsem transmisji wiadomości (MPI), co zaspokaja zapotrzebowanie na pamięć i zmniejsza czas wykonania niezbędnych obliczeń. Ponadto działanie blokowego solvera wartości własnych Kryłowa-Schura, zaimplementowanego w pakiecie oprogramowania Anasazi z projektu Trilinos, zostało przeanalizowane pod kątem wyboru rozmiaru bazy Kryłowa, rozmiaru bloku i liczby bloków. Rozważono także użycie solvera iteracyjnego w ramach metody opartej na syntezie składowych postaciowych (CMS).
Źródło:
Archive of Mechanical Engineering; 2016, LXIII, 4; 475-494
0004-0738
Pojawia się w:
Archive of Mechanical Engineering
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-66 z 66

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies