Notice: Undefined index: linkPowrot in C:\wwwroot\wwwroot\publikacje\publikacje.php on line 1275
[80590] Artykuł: Możliwości diagnozowania i poprawy jakości danych – synteza(Possibilities of diagnosing and improving data quality – a synthesis)Czasopismo: Studia i Materiały. Miscellanea Oeconomicae Zeszyt: 2/2018, Strony: 439-451 ISSN: 2081-2345 Opublikowano: 2018 Liczba arkuszy wydawniczych: 0.50 Autorzy / Redaktorzy / Twórcy Grupa MNiSW: Publikacja w recenzowanym czasopiśmie wymienionym w wykazie ministra MNiSzW (część B) Punkty MNiSW: 9 Spis treści YADDA/CEON Słowa kluczowe: nieprawidłowości w danych  dane brakujące  czyszczenie danych  Keywords: irregularities in data  missing data  data cleaning  |
Aktywność zawodowa człowieka wiąże się z koniecznością pozyskiwania, składowania i przetwarzana danych. Pomiędzy procesami tworzenia zasobów cyfrowych i ich wykorzystania pojawia się etap pośredni – przygotowanie danych do analiz. Fundamentalną jego częścią jest ocena jakości danych a następnie implementacja procedur naprawy danych zanieczyszczonych. Ponieważ zagadnienie jest ważne, a jego aktualność stale rośnie, w pracy podjęto zadanie zaprezentowania całości problemu w sposób syntetyczny. Omówiono klasyfikację błędów w danych i mechanizmy generowania tych błędów. Dyskusję zilustrowano na przykładach – wskazano zabrudzenia w danych oraz sposoby ich czyszczenia.
All human professional activities often involve the need to acquire, store and process data. Between the processes of creating digital resources and their use, there is an intermediate stage – preparation of data for analyzes. The fundamental part of the stage is the evaluation of data quality and then implementation of procedures for the data cleaning. Because the issue is important and its validity is constantly growing, the whole problem is presented in a synthetic way in the study. The classification of errors in data as well as the mechanisms of generating those errors were considered. The discussion was illustrated by dirty data examples together with some data cleaning solutions.