Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "dane niekompletne" wg kryterium: Temat


Wyświetlanie 1-3 z 3
Tytuł:
Instance based kNN modification for classification of medical data
Autorzy:
Orczyk, T.
Porwik, P.
Lewandowski, M.
Cholewa, M.
Powiązania:
https://bibliotekanauki.pl/articles/333353.pdf
Data publikacji:
2015
Wydawca:
Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:
k Nearest Neighbors
kNN
unbalanced data
incomplete data
algorytm najbliższych sąsiadów
dane niesymetryczne
dane niekompletne
Opis:
Paper describes a novel modification to a well known kNN algorithm, which enables using it for medical data, which often is a class-imbalanced data with randomly missing values. Paper presents the modified algorithm details, experiment setup, results obtained on a cross validated classification of a benchmark database with randomly removed values (missing data) and records (class imbalance), and their comparison with results of the state of the art classification algorithms.
Źródło:
Journal of Medical Informatics & Technologies; 2015, 24; 99-106
1642-6037
Pojawia się w:
Journal of Medical Informatics & Technologies
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Comparison of Selected Multiple Imputation Methods for Continuous Variables – Preliminary Simulation Study Results
Porównanie wybranych metod imputacji wielokrotnej dla zmiennych ilościowych – wstępne wyniki badań symulacyjnych
Autorzy:
Misztal, Małgorzata Aleksandra
Powiązania:
https://bibliotekanauki.pl/articles/656755.pdf
Data publikacji:
2018
Wydawca:
Uniwersytet Łódzki. Wydawnictwo Uniwersytetu Łódzkiego
Tematy:
dane niekompletne
imputacja wielokrotna
analiza głównych składowych
missForest
incomplete data
multiple imputation
principal component analysis
Opis:
Problem występowania danych niekompletnych i ich wpływu na wyniki analiz statystycznych nie jest związany z żadną konkretną dziedziną nauki – pojawia się w ekonomii, socjologii, edukacji, naukach behawioralnych czy medycynie. W przypadku większości klasycznych metod statystycznych wymagana jest kompletna informacja o zmiennych charakteryzujących badane obiekty, a typowym podejściem do brakujących danych jest po prostu ich usunięcie. Prowadzi to jednak do niewiarygodnych i obciążonych wyników analiz i nie jest zalecane w literaturze przedmiotu. Rekomendowaną metodą postępowania z brakującymi danymi jest imputacja wielokrotna. W artykule rozważono kilka wybranych jej metod. Szczególną uwagę zwrócono na wykorzystanie analizy głównych składowych (PCA) jako metody imputacji. Celem pracy była ocena jakości imputacji opartej na PCA na tle dwóch innych technik uzupełniania braków danych: imputacji wielokrotnej za pomocą równań łańcuchowych (MICE) i metody missForest. Porównania metod imputacji dokonano, wykorzystując podejście symulacyjne i generując braki danych w 10 kompletnych zbiorach danych z repozytorium baz danych Uniwersytetu Kalifornijskiego w Irvine, z uwzględnieniem różnych mechanizmów generowania braków danych oraz różnych proporcji (10–50%) brakujących wartości. Do imputacji brakujących wartości zastosowano metodę równań łańcuchowych, metodę missForest oraz metodę opartą na głównych składowych (MIPCA). Znormalizowany pierwiastek kwadratowy błędu średniokwadratowego (NRMSE) wykorzystano jako miarę dokładności imputacji. Na podstawie przeprowadzonych analiz metoda missForest może być rekomendowana jako ta metoda wielokrotnej imputacji, która zapewnia najwyższą dokładność imputacji braków danych. Imputacja oparta na analizie głównych składowych (PCA) nie prowadzi do zadowalających wyników.
The problem of incomplete data and its implications for drawing valid conclusions from statistical analyses is not related to any particular scientific domain, it arises in economics, sociology, education, behavioural sciences or medicine. Almost all standard statistical methods presume that every object has information on every variable to be included in the analysis and the typical approach to missing data is simply to delete them. However, this leads to ineffective and biased analysis results and is not recommended in the literature. The state of the art technique for handling missing data is multiple imputation. In the paper, some selected multiple imputation methods were taken into account. Special attention was paid to using principal components analysis (PCA) as an imputation method. The goal of the study was to assess the quality of PCA‑based imputations as compared to two other multiple imputation techniques: multivariate imputation by chained equations (MICE) and missForest. The comparison was made by artificially simulating different proportions (10–50%) and mechanisms of missing data using 10 complete data sets from the UCI repository of machine learning databases. Then, missing values were imputed with the use of MICE, missForest and the PCA‑based method (MIPCA). The normalised root mean square error (NRMSE) was calculated as a measure of imputation accuracy. On the basis of the conducted analyses, missForest can be recommended as a multiple imputation method providing the lowest rates of imputation errors for all types of missingness. PCA‑based imputation does not perform well in terms of accuracy.
Źródło:
Acta Universitatis Lodziensis. Folia Oeconomica; 2018, 6, 339; 73-98
0208-6018
2353-7663
Pojawia się w:
Acta Universitatis Lodziensis. Folia Oeconomica
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Interpretacja ilościowa profilowań geofizyki otworowej w przypadku niskiej jakości profilowań i ograniczonego zakresu metodycznego pomiarów
Quantitative interpretation of well logs for cases of low quality logs and limited measurement methods
Autorzy:
Czopek, B.
Nowak, J.
Powiązania:
https://bibliotekanauki.pl/articles/184101.pdf
Data publikacji:
2011
Wydawca:
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydawnictwo AGH
Tematy:
geofizyka otworowa
niekompletne dane
kalibracja profilowań radiometrycznych
korekta profilowań
petrofizyczna analiza ilościowa
profilowania syntetyczne
well logging
incomlete data
calibration of radiometric logs
well log correction
petrophysical quantitive analysis
synthetic logs
Opis:
W artykule przedstawiono analizę przyczyn najczęściej spotykanych błędów podczas rejestracji i wstępnego opracowania profilowań geofizyki otworowej, zarówno danych archiwalnych uzyskanych przy użyciu sprzętu starszego typu, jak i współczesnych, rejestrowanych sondami firmy Halliburton. Autorzy omawiają sposoby identyfikacji tych błędów oraz możliwości korekty dostosowane do określonych warunków. Prezentują graficzne przykłady błędnych zapisów oraz efekty ich eliminacji. Podają przykłady zastosowania skorygowanych i ujednoliconych profilowań do petrofizycznej analizy ilościowej, obejmującej określenie składu mineralnego, porowatości i zawodnienia. Zdaniem autorów rezultaty tak prowadzonej analizy umożliwiają generację wiarygodnych, syntetycznych (teoretycznych) profilowań gęstości i czasu interwałowego, stanowiących pożądane dane wejściowe przy rozwiązywaniu różnych problemów geologicznych z zakresu poszukiwań, eksploatacji i magazynowania węglowodorów, pozyskiwania źródeł energii geotermalnej i w wielu innych dziedzinach.
This paper presents a causal analysis of the most common errors occurring during recording and preliminary processing of well logs on both archival as well as current data obtained with Halliburton tools. The authors discuss the ways to identify and to correct these errors, under specific conditions. They present graphic examples of recording errors and the effects of their elimination. Examples of applying corrected standardized logs in petrophysical quantitative analysis involving determination of mineral composition, porosity and water saturation are provided by the authors. It is their opinion that the results of such analysis make it possible to generate reliable synthetic (theoretical) logs of density and interval transit time, which are useful input data in solving various geological problems related to hydrocarbon exploration, production and storage, to geothermal energy sources and many other issues.
Źródło:
Geologia / Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie; 2011, 37, 4; 517-535
0138-0974
Pojawia się w:
Geologia / Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie
Dostawca treści:
Biblioteka Nauki
Artykuł
    Wyświetlanie 1-3 z 3

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies