Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "ETL" wg kryterium: Temat


Wyświetlanie 1-8 z 8
Tytuł:
Parallelizing user-defined functions in the ETL workflow using orchestration style sheets
Autorzy:
Ali, Syed Muhammad Fawad
Mey, Johannes
Thiele, Maik
Powiązania:
https://bibliotekanauki.pl/articles/331096.pdf
Data publikacji:
2019
Wydawca:
Uniwersytet Zielonogórski. Oficyna Wydawnicza
Tematy:
ETL workflow
parallel ETL operator
parallel algorithmic skeleton
user defined function
workflow ETL
równoległy szkielet algorytmiczny
funkcja zdefiniowana przez użytkownika
Opis:
Today’s ETL tools provide capabilities to develop custom code as user-defined functions (UDFs) to extend the expressiveness of the standard ETL operators. However, while this allows us to easily add new functionalities, it also comes with the risk that the custom code is not intended to be optimized, e.g., by parallelism, and for this reason, it performs poorly for data-intensive ETL workflows. In this paper we present a novel framework, which allows the ETL developer to choose a design pattern in order to write parallelizable code and generates a configuration for the UDFs to be executed in a distributed environment. This enables ETL developers with minimum expertise in distributed and parallel computing to develop UDFs without taking care of parallelization configurations and complexities. We perform experiments on large-scale datasets based on TPC-DS and BigBench. The results show that our approach significantly reduces the effort of ETL developers and at the same time generates efficient parallel configurations to support complex and data-intensive ETL tasks.
Źródło:
International Journal of Applied Mathematics and Computer Science; 2019, 29, 1; 69-79
1641-876X
2083-8492
Pojawia się w:
International Journal of Applied Mathematics and Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Analiza porównawcza współczesnych narzędzi ETL
The comparative analysis of modern ETL tools
Autorzy:
Mayuk, Vitalii
Falchuk, Ivan
Muryjas, Piotr
Powiązania:
https://bibliotekanauki.pl/articles/2055120.pdf
Data publikacji:
2021
Wydawca:
Politechnika Lubelska. Instytut Informatyki
Tematy:
Azure Synapse
Azure Data Factory
ETL tools
Opis:
Każda hurtownia danych wymaga ładowania odpowiednio przetworzonych danych transakcyjnych. Procesy realizujące to zadanie określane są jako ekstrakcja-transformacja-ładowanie (ETL). Od efektywności ich wykonania zależy jak szybko użytkownik będzie miał dostęp do bieżących danych analitycznych. W artykule przedstawiono istotę procesu ETL oraz wyniki badań efektywności realizacji jego etapów z użyciem Azure Synapse (AS) oraz Azure Data Factory (ADF). Badania obejmowały selekcję, sortowanie i agregację danych, złączenie tabel oraz zapis danych do tabel docelowych. Do oceny efektywności tych operacji zastosowano kryterium czasu ich wykonania. Uzyskane wyniki wskazują, iż narzędzie ADF zapewnia znacznie wyższą efektywność czasową ładowania danych transakcyjnych do hurtowni danych w porównaniu do AS.
Each data warehouse requires loading properly processed transactional data. The process that performs this task is known as extract-transform-load (ETL). The efficiency of its implementation affects how quickly the user will have the access to the current analytical data. The paper presents the results of research efficiency of ETL performance of its stage with the use of Azure Synapse (AS) and Azure Data Factory (ADF). The research included selection, sorting and aggregating data, joining tables, and loading data into target tables. To evaluate the efficiency of these operations, the criterion of their execution time has been used. The obtained results indicate that the ADF tool provides a much higher time efficiency of loading transactional data into the data warehouse comparing to AS.
Źródło:
Journal of Computer Sciences Institute; 2021, 19; 126--131
2544-0764
Pojawia się w:
Journal of Computer Sciences Institute
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Data warehouses - models, techniques and applications
Autorzy:
Goczyła, K.
Powiązania:
https://bibliotekanauki.pl/articles/1934010.pdf
Data publikacji:
2011
Wydawca:
Politechnika Gdańska
Tematy:
data warehousing
business intelligence
star schema
ETL process
Opis:
This paper discusses the basic concepts of modern data warehouses. It presents the multidimensional data model (logical model) and the physical model of a data warehouse, as well as selected design and implementation issues. The focus is on the practical aspects of the application of data warehousing in business enterprises and organizations.
Źródło:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk; 2011, 15, 2; 219-226
1428-6394
Pojawia się w:
TASK Quarterly. Scientific Bulletin of Academic Computer Centre in Gdansk
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Zarządzanie i eksploatacja farm wiatrowych - nowoczesne metody wsparcia informatycznego
Management and operation of wind farms - modern computer support methods
Autorzy:
Wancerz, P.
Powiązania:
https://bibliotekanauki.pl/articles/408800.pdf
Data publikacji:
2012
Wydawca:
Politechnika Lubelska. Wydawnictwo Politechniki Lubelskiej
Tematy:
Business Intelligence
ETL
farmy wiatrowe
BI
Business Intelligence (BI)
wind farms
Opis:
Artykuł opisuje system służący do zarządzania siecią farm wiatrowych. Projektowany system opierać się będzie na założeniach technologii Business Intelligence. Obejmuje zebranie danych źródłowych i przy pomocą procesu ETL załadowanie ich do hurtowni danych będącej docelowym miejscem przechowywanie kluczowych danych. Następnie aplikacja Business Intelligence będzie odpowiedzialna za wyświetlanie danych, ich analizę oraz wszelkiego rodzaju powiadomienia - mailowe i sms. System będzie tworzył integralną całość i współpracował z wieloma typami danych źródłowych.
The article describes a system for managing wind farms. The proposed system will be based on assumptions of Business Intelligence technology. This includes gathering source data and the use of the ETL process to transform it and load to the target - data warehouse. Then the Business Intelligence application will be responsible for data display, analysis and all kinds of alerts - email and sms. The system will be fully integrated and able to read multisource data.
Źródło:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska; 2012, 1; 28-31
2083-0157
2391-6761
Pojawia się w:
Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Integration of data from heterogeneous sources using ETL technology
Autorzy:
Macura, M.
Powiązania:
https://bibliotekanauki.pl/articles/305533.pdf
Data publikacji:
2014
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
data integration
integration approaches
ETL technology
knowledge discovery from data
business intelligence
Opis:
Data integration is a crucial issue in the environments of heterogeneous data sources. At present, the afore-mentioned heterogeneity is becoming widespread. Based on various data sources, if we want to gain useful information and knowledge, we must solve data integration problems in order to apply appropriate analytical methods to comprehensive and uniform data. Such activity is known as knowledge discovery from the data process. Therefore, approaches to the data integration problem are very interesting and bring us closer to the “age of information”. This paper presents an architecture which implements knowledge discovery from the data process. The solution combines ETL technology and a wrapper layer known from mediated systems. It also provides semantic integration through connection mechanism between data elements. The solution allows for integration of any data sources and implementation of analytical methods in one environment. The proposed environment is verified by applying it to data sources in the foundry industry.
Źródło:
Computer Science; 2014, 15 (2); 109-132
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Computer-Assisted Integration of Knowledge in the Context of Identification of the Causes of Defects in Castings
Wspomagana komputerowo integracja wiedzy, w kontekście identyfikacji przyczyn powstawania wad odlewów
Autorzy:
Kluska-Nawarecka, S.
Wilk-Kolodziejczyk, D.
Dajda, J.
Macura, M.
Regulski, K.
Powiązania:
https://bibliotekanauki.pl/articles/356329.pdf
Data publikacji:
2014
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
casting defects diagnostics
data integration
ETL
Extract-Transform-Load
diagnostyka wad odlewów
integracja danych
Opis:
The paper outlines the rules of creating diagnostic tasks scenarios in determining the causes of defects in castings. The paper presents as well the rules of operation of the computer system for data integration based on Extract-Trasform-Load technology, and a description of prototype implementation of this system, also examples of the tests that was carried out.
W pracy naszkicowano zasady tworzenia scenariuszy działań diagnostycznych przy określeniu przyczyn powstawania wad odlewów. Przedstawiono zasady działania informatycznego systemu integracji danych opartego na zastosowaniu technologii Extract-Trasform-Load, oraz opis prototypowej realizacji tego systemu, a także przykłady przeprowadzonych testów.
Źródło:
Archives of Metallurgy and Materials; 2014, 59, 2; 743-746
1733-3490
Pojawia się w:
Archives of Metallurgy and Materials
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Heterogeneous Data Integration Architecture-Challenging Integration Issues
Autorzy:
Chromiak, M.
Grabowiecki, M.
Powiązania:
https://bibliotekanauki.pl/articles/106210.pdf
Data publikacji:
2015
Wydawca:
Uniwersytet Marii Curie-Skłodowskiej. Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej
Tematy:
grid integration model
heterogeneous integration
distributed architecture
data integration
big data
distributed transaction
warehouse
ETL
OLAP
Opis:
As of today, most of the data processing systems have to deal with a large amount of data originated from numerous sources. Data sources almost always differ regarding its purpose of existence. Thus model, data processing engine and technology differ intensely. Due to current trend for systems fusion there is a growing demand for data to be present in a common way regardless of its legacy. Many systems have been devised as a response to such integration needs. However, the present data integration systems mostly are dedicated solutions that bring constraints and issues when considered in general. In this paper we will focus on the present solutions for data integration, their flaws originating from their architecture or design concepts and present an abstract and general approach that could be introduced as an response to existing issues. The system integration is considered out of scope for this paper, we will focus particularly on efficient data integration.
Źródło:
Annales Universitatis Mariae Curie-Skłodowska. Sectio AI, Informatica; 2015, 15, 1; 7-11
1732-1360
2083-3628
Pojawia się w:
Annales Universitatis Mariae Curie-Skłodowska. Sectio AI, Informatica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Systemy wspomagające podejmowanie decyzji w przedsiębiorstwie
Business intelligence systems
Autorzy:
Rączka, K.
Kowalski, M.
Gąsiorek, S.
Powiązania:
https://bibliotekanauki.pl/articles/287559.pdf
Data publikacji:
2007
Wydawca:
Polskie Towarzystwo Inżynierii Rolniczej
Tematy:
wspomaganie
podejmowanie decyzji
hurtownia danych
integracja systemów
ETL
przetwarzanie informacji
analiza informacji
business intelligence
data warehouse
system integration
data processing
Opis:
Dokument stanowi przegląd współczesnych technologii informatycznych, architektur systemowych oraz zagadnień projektowo - implementacyjnych związanych z tematyką wspomagania podejmowania decyzji w przedsiębiorstwie (ang. business intelligence). Przedstawione są warstwy logiczne tego typu systemów, wraz z omówieniem typowych wyzwań i problemów napotykanych w każdej z nich podczas realizacji projektów integracyjnych dedykowanych do zebrania całości niezbędnych informacji. Omówiony jest również przepływ informacji, pokazana jest rola systemów wspierających integrację oraz znaczenie towarzyszących procesów biznesowych z naciskiem na zarządzania jakością danych dotyczących krytycznych aspektów funkcjonowania przedsiębiorstwa.
The document presents review of up to date information technologies, system architectures and issues related to design and development of business intelligence systems. It pictures logical layers of such systems, together with explanation of typical challenges and problems related to every of the layers meet during implementation of systems of such class. It also presents data flows, the role of integration supporting systems and importance of associated business processes, especially data quality management.
Źródło:
Inżynieria Rolnicza; 2007, R. 11, nr 6 (94), 6 (94); 205-212
1429-7264
Pojawia się w:
Inżynieria Rolnicza
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-8 z 8

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies