Temat: unbalanced data - Katalog OPAC zbiorów

Skocz do pozycji: 1.

Tytuł:: Instance based kNN modification for classification of medical data
Autorzy:: Orczyk, T.
Porwik, P.
Lewandowski, M.
Cholewa, M.
Powiązania:: https://bibliotekanauki.pl/articles/333353.pdf
Data publikacji:: 2015
Wydawca:: Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach. Instytut Informatyki. Zakład Systemów Komputerowych
Tematy:: k Nearest Neighbors
kNN
unbalanced data
incomplete data
algorytm najbliższych sąsiadów
dane niesymetryczne
dane niekompletne
Opis:: Paper describes a novel modification to a well known kNN algorithm, which enables using it for medical data, which often is a class-imbalanced data with randomly missing values. Paper presents the modified algorithm details, experiment setup, results obtained on a cross validated classification of a benchmark database with randomly removed values (missing data) and records (class imbalance), and their comparison with results of the state of the art classification algorithms.
Źródło:: Journal of Medical Informatics & Technologies; 2015, 24; 99-106
1642-6037
Pojawia się w:: Journal of Medical Informatics & Technologies
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 2.

Tytuł:: Reliability analysis of the products subject to competing failure processes with unbalanced data
Oparta na niezbilansowanych danych analiza niezawodności produktów podlegających procesom powstawania uszkodzeń konkurujących
Autorzy:: Li, J.
Zhang, Y.
Wang, Z.
Fu, H.
Xiao, L.
Powiązania:: https://bibliotekanauki.pl/articles/1365849.pdf
Data publikacji:: 2016
Wydawca:: Polska Akademia Nauk. Polskie Naukowo-Techniczne Towarzystwo Eksploatacyjne PAN
Tematy:: reliability evaluation
competing failure model
unbalanced data
interval statistics
ocena niezawodności
model uszkodzeń konkurujących
dane niezbilansowane
statystyki przedziałowe
Opis:: Considering the degradation and catastrophic failure modes simultaneously, a general reliability analysis model was presented for the competing failure processes with unbalanced data. For the degradation process with highly unbalanced data, we developed a linear random-effects degradation model. The model parameters can be estimated based on a simple least square method. Furthermore, to fully utilize the degradation information, we considered the last measured times of the degradation units that had only one or two measured time points as zero-failure data or right-censored data of the catastrophic failure mode. Then the incomplete data set was composed of zero-failure data and catastrophic failure data. To analyze the incomplete data, the definition of the interval statistics was firstly given. The best linear unbiased parameter estimators of catastrophic failure were obtained based on the Gauss-Markov theorem. Then, the reliability function of the competing failure processes was given. The corresponding two-sided confidence intervals of the reliability were obtained based on a bootstrap procedure. Finally, a practical application case was examined by applying the proposed method and the results demonstrated its validity and reasonability.
W pracy przedstawiono ogólny model analizy niezawodności procesów związanych z powstawaniem uszkodzeń konkurujących, który pozwala na wykorzystanie danych niezbilansowanych oraz umożliwia jednoczesne uwzględnienie uszkodzeń wynikających z obniżenia charakterystyk i uszkodzeń katastroficznych. Opracowano liniowy model efektów losowych dla procesu degradacji o wysoce niezbilansowanych danych. Parametry tego modelu można określić na podstawie prostej metody najmniejszych kwadratów. Ponadto, aby w pełni wykorzystać informacje dotyczące obniżenia charakterystyk, dane pochodzące z ostatniego pomiaru jednostek podlegających degradacji, dla których przeprowadzono tylko jeden lub dwa pomiary, rozpatrywano jako dane o zerowym uszkodzeniu lub jako ucięte prawostronnie dane dotyczące uszkodzenia katastroficznego. W ten sposób otrzymano zbiór niepełnych danych składający się z danych o uszkodzeniach zerowych oraz danych o uszkodzeniach katastroficznych. Aby móc przeanalizować uzyskane niepełne dane, podano definicję statystyki przedziałowej. Najefektywniejszy nieobciążony estymator liniowy (BLUE) parametrów uszkodzeń katastroficznych uzyskano na podstawie twierdzenia Gaussa-Markowa. Następnie, podano wzór funkcji niezawodności procesów związanych z powstawaniem uszkodzeń konkurujących. Odpowiednie dwustronne przedziały ufności dla oszacowanej niezawodności uzyskano metodą bootstrapową. Na koniec, przedstawiono przypadek praktycznego zastosowania proponowanej metody, którego wyniki wykazały jej trafność i zasadność.
Źródło:: Eksploatacja i Niezawodność; 2016, 18, 1; 98-109
1507-2711
Pojawia się w:: Eksploatacja i Niezawodność
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Skocz do pozycji: 3.

Tytuł:: Wydzielanie grup miejscowości na podstawie serii doświadczeń wielokrotnych ze zmiennym składem odmian w latach przy użyciu pakietu SEQRET. Część II. Przykład dla plonu ziarna z doświadczeń przedrejestrowych z pszenicą ozimą
The clustering of locations based on multi-environment trials with different cultivars across years using the SEQRET package. Part II. An example for grain yield from winter wheat pre-registration trials
Autorzy:: Rajfura, Anna
Mądry, Wiesław
Drzazga, Tadeusz
Iwańska, Marzena
Powiązania:: https://bibliotekanauki.pl/articles/41515584.pdf
Data publikacji:: 2008
Wydawca:: Instytut Hodowli i Aklimatyzacji Roślin
Tematy:: pakiet SEQRET
retrospektywna sekwencyjna analiza wzorca
niekompletne historyczne bazy danych
uśrednione zredukowane macierze odległości
SEQRET package
retrospective sequential pattern analysis
unbalanced historical data sets
averaged reduced proximity matrices
Opis:: W pracy przedstawiono zastosowanie metod analizy wzorca do wydzielenia grup miejscowości dla niekompletnych danych z doświadczeń przedrejestrowych z pszenicą ozimą. Przy użyciu pakietu SEQRET wydzielono grupy miejscowości o podobnie różnicującym wpływie na odmiany oraz wyz-naczono współczynniki opisujące dopasowanie modelu. Praca prezentuje praktyczne zastosowanie metodyki, której teoretyczny opis zamieszczono w Części I.
This work presents the example of using pattern analysis methods, which are appropriate to cluster locations for unbalanced historical data sets from multienvironmental series of experiments with winter wheat carried out for many years. The SEQRET package was used for clustering locations in the way by which they discriminate among genotypes, and for calculating determination coefficients for years. The paper presents the use of procedures described in a theoretical Part I in practice.
Źródło:: Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin; 2008, 250; 145-153
0373-7837
2657-8913
Pojawia się w:: Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin
Dostawca treści:: Biblioteka Nauki

Artykuł

Zmień widok

na półce

Informacja

Wyszukujesz frazę "unbalanced data" wg kryterium: Temat

Źródło danych

Dostawca treści

Kolekcja

Rok wydania

Wydawca

Temat

Autor

Typ dokumentu

Język