Masalah kosong dalam Ilmu Data dan Pembelajaran Mesin

Definisi Null dalam Ilmu Data saat ini sangat terbatas. Dengan sedikit usaha? kami akan secara signifikan meningkatkan pemrosesan data yang sebelumnya ditemukan di Null.


Masalah lama adalah masalah "Null" . Itu dirumuskan dalam sebuah artikel oleh Codd tentang semantik basis data.


Pemrogram harus bekerja keras untuk menangani nilai nol. Mungkin itu sebabnya mereka tidak menyukai Null dan bahkan mempromosikan ide yang dapat Anda lakukan tanpa Null. Pepatah populer adalah bahwa memasukkan Null dalam SQL adalah kesalahan .


Definisi nol berikut tersedia:


  • Tidak tersedia
  • Tak dapat diterapkan
  • terjawab
  • tidak diketahui

Definisi terakhir adalah yang paling umum digunakan dalam database.


Ilmu Data mendefinisikan Null sebagai nilai yang terlewatkan.
Di sini Jake VanderPlas membahas penggunaan dan interpretasi nilai Null, NaN, NA, None di python, Pandas, numpy.


Di bawah ini saya akan menunjukkan bahwa pendekatan yang ada hanya mencerminkan sebagian realitas dan dalam banyak kasus dapat diperluas khusus untuk digunakan dalam Ilmu Data.


missed data ( AlkanSte !)


, (sample), , .



: , , . . .



  • : . , Null.
  • : , . .
  • : . , , . , .


  • outlier: " " 1000 . 1000 Null.

, .


Null . , Null " ", . Null " ", , . " " ( ).


ML , Null , .


Null


. — . . :


  1. , , . .
  2. , . .
  3. . , . , , . , . .
  4. , , : , , .. .
  5. . .

Null. , ^ , : " ", " ", " ", "", " ". Null . , . , , .


- .


Ada juga yang minus dalam menggantikan Null dengan beberapa kelas yang lebih detail. Null adalah abstraksi pada tingkat tipe data, pada tingkat bahasa, yang memberi kita banyak fungsi dan metode bawaan dalam pemrosesan data.


Kami, pada kenyataannya, menambahkan kelas baru ke sistem klasifikasi kami, yang tidak terlalu menyulitkan pemrosesan.


Dan, minimal, kita perlu memahami dengan jelas apa yang dimaksud dengan nilai-nilai Null dalam data kita. Pemahaman yang lebih baik tentang data akan selalu menghasilkan hasil yang lebih baik, bukan?


All Articles