Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "data set" wg kryterium: Temat


Tytuł:
Performance evaluation of deep neural networks applied to speech recognition : RNN, LSTM and GRU
Autorzy:
Shewalkar, Apeksha
Powiązania:
https://bibliotekanauki.pl/articles/91735.pdf
Data publikacji:
2019
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
spectrogram
connectionist temporal classification
TED-LIUM data set
Opis:
Deep Neural Networks (DNN) are nothing but neural networks with many hidden layers. DNNs are becoming popular in automatic speech recognition tasks which combines a good acoustic with a language model. Standard feedforward neural networks cannot handle speech data well since they do not have a way to feed information from a later layer back to an earlier layer. Thus, Recurrent Neural Networks (RNNs) have been introduced to take temporal dependencies into account. However, the shortcoming of RNNs is that long-term dependencies due to the vanishing/exploding gradient problem cannot be handled. Therefore, Long Short-Term Memory (LSTM) networks were introduced, which are a special case of RNNs, that takes long-term dependencies in a speech in addition to shortterm dependencies into account. Similarily, GRU (Gated Recurrent Unit) networks are an improvement of LSTM networks also taking long-term dependencies into consideration. Thus, in this paper, we evaluate RNN, LSTM, and GRU to compare their performances on a reduced TED-LIUM speech data set. The results show that LSTM achieves the best word error rates, however, the GRU optimization is faster while achieving word error rates close to LSTM.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2019, 9, 4; 235-245
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Applying a neural network ensemble to intrusion detection
Autorzy:
Ludwig, Simone A.
Powiązania:
https://bibliotekanauki.pl/articles/91620.pdf
Data publikacji:
2019
Wydawca:
Społeczna Akademia Nauk w Łodzi. Polskie Towarzystwo Sieci Neuronowych
Tematy:
ensemble learning
Deep Neural Networks
NSL-KDD data set
Opis:
An intrusion detection system (IDS) is an important feature to employ in order to protect a system against network attacks. An IDS monitors the activity within a network of connected computers as to analyze the activity of intrusive patterns. In the event of an ‘attack’, the system has to respond appropriately. Different machine learning techniques have been applied in the past. These techniques fall either into the clustering or the classification category. In this paper, the classification method is used whereby a neural network ensemble method is employed to classify the different types of attacks. The neural network ensemble method consists of an autoencoder, a deep belief neural network, a deep neural network, and an extreme learning machine. The data used for the investigation is the NSL-KDD data set. In particular, the detection rate and false alarm rate among other measures (confusion matrix, classification accuracy, and AUC) of the implemented neural network ensemble are evaluated.
Źródło:
Journal of Artificial Intelligence and Soft Computing Research; 2019, 9, 3; 177-178
2083-2567
2449-6499
Pojawia się w:
Journal of Artificial Intelligence and Soft Computing Research
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
The analysis of properties of insertion sort algorithm for large data sets
Analiza własności algorytmu sortowania przez wstawianie dla dużych zbiorów danych
Autorzy:
Woźniak, M.
Marszałek, Z.
Gabryel, M.
Powiązania:
https://bibliotekanauki.pl/articles/1203410.pdf
Data publikacji:
2012
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
algorytm sortowania przez wstawianie
zbiór danych
insertion sort algorithm
data set
Opis:
Insertion sort algorithm is one of the sorting algorithms. It is characterized by the computational complexity and time complexity, which represent the possibility of using it for large data sets. The present work is to describe this algorithm and describe it’s performance when sorting large scale data sets.
Algorytm sortowania przez wstawianie jest jednym z algorytmów opisywanych w literaturze. Omawiana metoda została scharakteryzowana poprzez złożoność czasową i obliczeniową algorytmu, która opisuje możliwość stosowania tego algorytmu do sortowania dużych zbiorów danych. Praca ta ma na celu opisanie zachowania algorytmu i jego wydajności dla dużych zbiorów danych.
Źródło:
Zeszyty Naukowe. Matematyka Stosowana / Politechnika Śląska; 2012, 2; 45-55
2084-073X
Pojawia się w:
Zeszyty Naukowe. Matematyka Stosowana / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Comparison and combination of interpolation methods for daily precipitation in Poland: evaluation using the correlation coefficient and correspondence ratio
Autorzy:
Konca-Kędzierska, Krystyna
Wibig, Joanna
Gruszczyńska, Marta
Powiązania:
https://bibliotekanauki.pl/articles/24085172.pdf
Data publikacji:
2023
Wydawca:
Instytut Meteorologii i Gospodarki Wodnej - Państwowy Instytut Badawczy
Tematy:
precipitation
interpolation methods
daily gridded data
validation of precipitation gridded data set
observational data
Opis:
Interpolation of precipitation data is a common practice for generating continuous, spatially-distributed fields that can be used for a range of applications, including climate modeling, water resource management, and agricultural planning. To obtain the reference field, daily observation data from the measurement network of the Institute of Meteorology and Water Management – National Research Institute was used. In this study, we compared and combined six different interpolation methods for daily precipitation in Poland, including bilinear and bicubic interpolation, inverse distance weighting, distance-weighted average, nearest neighbor remapping, and thin plate spline regression. Implementations of these methods available in the R programming language (e.g., from packages akima, gstat, fields) and the Climate Data Operators (CDO) were applied. The performance of each method was evaluated using multiple metrics, including the Pearson correlation coefficient (RO) and the correspondence ratio (CR), but there was no clear optimal method. As an interpolated resulting field, a field consisting of the best interpolations for individual days was proposed. The assessment of daily fields was based on the CR and RO parameters. Our results showed that the combined approach outperformed individual methods with higher accuracy and reliability and allowed for generating more accurate and reliable precipitation fields. On a group of selected stations (data quality and no missing data), the precipitation result fields were compared with the fields obtained in other projects-CPLFD-GDPT5 (Berezowski et al. 2016) and G2DC-PLC (Piniewski et al. 2021). The variance inflation factor (VIF) was bigger for the resulting fields (~5), while for the compared fields, it was below 3. However, for the mean absolute error (MAE), the relationship was reversed - the MAE was approximately half as low for the fields obtained in this work.
Źródło:
Meteorology Hydrology and Water Management. Research and Operational Applications; 2023, 11, 2; 1--27
2299-3835
2353-5652
Pojawia się w:
Meteorology Hydrology and Water Management. Research and Operational Applications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On classic bubble sort performance for large data sets
O wydajności klasycznej wersji sortowania bąbelkowego dla dużych zbiorów danych
Autorzy:
Marszałek, Z.
Połap, D.
Woźniak, M.
Powiązania:
https://bibliotekanauki.pl/articles/87286.pdf
Data publikacji:
2014
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
NoSQL
algorytm komputerowy
duży zbiór danych
computer algorithm
large data set
Opis:
In the paper we discuss performance of classic bubble sort algorithm for large data sets. Research results discussed and described in this article help to evaluate computer methods used in NoSQL database systems for large amounts of the input data. Therefore we try to analyze one of the most common sorting algorithms and its properties for large data sets.
Artykuł ma na celu przedstawienie analizy wydajności algorytmu sortowania bąbelkowego w postaci klasycznej dla dużych zbiorów danych. Podjęty temat ma duże znaczenie dla rozwoju współczesnej informatyki ze względu na to, że komputery muszą pracować na coraz większych ilościach danych.
Źródło:
Zeszyty Naukowe. Matematyka Stosowana / Politechnika Śląska; 2014, 4; 103-112
2084-073X
Pojawia się w:
Zeszyty Naukowe. Matematyka Stosowana / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On bubble sort performance for large data sets and NoSQL database systems
O wydajności sortowania bąbelkowego dla dużych zbiorów danych i systemów bazodanowych typu NoSQL
Autorzy:
Marszałek, Z.
Połap, D.
Woźniak, M.
Powiązania:
https://bibliotekanauki.pl/articles/87339.pdf
Data publikacji:
2014
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
NoSQL
algorytm komputerowy
duży zbiór danych
computer algorithm
large data set
Opis:
In the paper we discuss performance of bubble sort algorithm. Research results discussed and described in this article help to evaluate this method when used in NoSQL database systems for large amounts of the input data. In the article is analyzed bubble sort algorithm for large scale data sets in two versions: classic version and modified version with logic control of order.
Sortowanie jest jednym z ważniejszych problemów współczesnej informatyki. Obecnie komputery muszą pracować na coraz większych ilościach danych, dlatego w niniejszym artykule przedstawiamy analizę algorytmu sortowania bąbelkowego pod względem jego własności dla dużych zbiorów danych i baz tybu NoSQL. W analizie zbadaliśmy wersję klasyczną i zmodyfikowaną z funkcją kontroli ułożenia elementów.
Źródło:
Zeszyty Naukowe. Matematyka Stosowana / Politechnika Śląska; 2014, 4; 113-122
2084-073X
Pojawia się w:
Zeszyty Naukowe. Matematyka Stosowana / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
On some properties of bubble sort with logic control of order for large scale data sets
O własnościach algorytmu sortowania bąbelkowego z funkcją kontroli ułożenia elementów dla dużych zbiorów danych
Autorzy:
Woźniak, M.
Marszałek, Z.
Powiązania:
https://bibliotekanauki.pl/articles/87292.pdf
Data publikacji:
2013
Wydawca:
Politechnika Śląska. Wydawnictwo Politechniki Śląskiej
Tematy:
sortowanie danych
algorytm bąbelkowy
duży zbiór danych
data sorting
bubble algorithm
large data set
Opis:
Sorting is a one of very important topics for computer science. In the modern computing, computers must operate on bigger and bigger amounts of data. Therefore we try to analyze modified version of bubble sort algorithm and its properties for large data sets. Article aims to show and analyze the possible behavior of bubble sort with logic control of order for large scale data sets.
Sortowanie jest jednym z bardzo ważnych tematów współczesnej informatyki. We współczesnej informatyce komputery muszą pracować na coraz większej liczbie danych, dlatego staramy się analizować jeden z podstawowych algorytmów sortowania i jego właściwości dla dużych zbiorów danych. Artykuł ma na celu przeanalizowanie możliwego zachowania badanej wersji algorytmu z funkcją logicznej kontroli ułożenia dla dużych zbiorów danych.
Źródło:
Zeszyty Naukowe. Matematyka Stosowana / Politechnika Śląska; 2013, 3; 47-58
2084-073X
Pojawia się w:
Zeszyty Naukowe. Matematyka Stosowana / Politechnika Śląska
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Set representation for rule-generation algorithms
Autorzy:
Kharkongor, Carynthia
Nath, Bhabesh
Powiązania:
https://bibliotekanauki.pl/articles/27312912.pdf
Data publikacji:
2022
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
item set
item set representation
apriori algorithm
rule-generation algorithm
data set
set representation
bitmap
memory
time
Opis:
The task of mining association rules has become one of the most widely used discovery pattern methods in knowledge discovery in databases (KDD). One such task is to represent an item set in the memory. The representation of the item set largely depends on the type of data structure that is used for storing them. Computing the process of mining an association rule impacts the memory and time requirements of the item set. With the constant increase of the dimensionality of data and data sets, mining such a large volume of data sets will be difficult since all of these item sets cannot be placed in the main memory. As the representation of an item set greatly affects the efficiency of the rule-mining association, a compact and compressed representation of the item set is needed. In this paper, a set representation is introduced that is more memory- and cost-efficient. Bitmap representation takes 1 byte for an element, but a set representation uses 1 bit. The set representation is being incorporated in the Apriori algorithm. Set representation is also being tested for different rule-generation algorithms. The complexities of these different rule-generation algorithms that use set representation are being compared in terms of memory and time of execution.
Źródło:
Computer Science; 2022, 23 (2); 205--225
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Optimal Ensemble Learning Based on Distinctive Feature Selection by Univariate ANOVA-F Statistics for IDS
Autorzy:
Shakeela, Shaikh
Sai Shankar, N.
Mohan Reddy, P.
Kavya Tulasi, T.
Mahesh Koneru, M.
Powiązania:
https://bibliotekanauki.pl/articles/1844624.pdf
Data publikacji:
2021
Wydawca:
Polska Akademia Nauk. Czytelnia Czasopism PAN
Tematy:
ANOVA-F test
cross validation
decision trees
features
NSL-KDD
data set
Opis:
Cyber-attacks are increasing day by day. The generation of data by the population of the world is immensely escalated. The advancements in technology, are intern leading to more chances of vulnerabilities to individual’s personal data. Across the world it became a very big challenge to bring down the threats to data security. These threats are not only targeting the user data and also destroying the whole network infrastructure in the local or global level, the attacks could be hardware or software. Central objective of this paper is to design an intrusion detection system using ensemble learning specifically Decision Trees with distinctive feature selection univariate ANOVA-F test. Decision Trees has been the most popular among ensemble learning methods and it also outperforms among the other classification algorithm in various aspects. With the essence of different feature selection techniques, the performance found to be increased more, and the detection outcome will be less prone to false classification. Analysis of Variance (ANOVA) with F-statistics computations could be a reasonable criterion to choose distinctives features in the given network traffic data. The mentioned technique is applied and tested on NSL KDD network dataset. Various performance measures like accuracy, precision, F-score and Cross Validation curve have drawn to justify the ability of the method.
Źródło:
International Journal of Electronics and Telecommunications; 2021, 67, 2; 267-275
2300-1933
Pojawia się w:
International Journal of Electronics and Telecommunications
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
ArNLI: Arabic Natural Language Inference entailment and contradiction detection
Autorzy:
Al Jallad, Khloud
Ghneim, Nada
Powiązania:
https://bibliotekanauki.pl/articles/27312864.pdf
Data publikacji:
2023
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
textual entailment
Arabic NLP
contradiction detection
contradiction Arabic data set
textual inference
Opis:
Natural Language Inference (NLI) is a hot topic research in natural language processing, contradiction detection between sentences is a special case of NLI. This is considered a difficult NLP task which has a significant influence when added as a component in many NLP applications (such as question answering systems and text summarization). The Arabic language is one of the most challenging low-resources languages for detecting contradictions due to its rich lexical semantics ambiguity. We have created a data set of more than 12k sentences and named it ArNLI; it will be publicly available. Moreover, we have applied a new model that was inspired by Stanford's proposed contradiction-detection solutions for the English language. We proposed an approach for detecting contradictions between pairs of sentences in the Arabic language using a contradiction vector combined with a language model vector as an input to a machine-learning model. We analyzed the results of different traditional machine-learning classifiers and compared their results on our created data set (ArNLI) and on the automatic translation of both the PHEME and SICK English data sets. The best results were achieved by using the random forest classifier, with accuracies of 0.99, 0.60 and 0.75 on PHEME, SICK, and ArNLI respectively.
Źródło:
Computer Science; 2023, 24 (2); 183--204
1508-2806
2300-7036
Pojawia się w:
Computer Science
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies