Video: VIVA Top3: China dan WHO Bohong Soal Corona, Organ Pasien Hilang & Pelita Air Tergelincir (November 2024)
Meme yang baru muncul "data besar" tidak pernah ditakrifkan dengan cara yang bermakna dan pasti. Ia adalah istilah buzz yang paling amorf yang pernah saya lihat selama satu dekad. Ia adalah salah satu daripada istilah "mata penonton" yang digunakan untuk menghidupkan seminar dan akhirnya merendam pelabur.
Mari kita mulakan dengan menanyakan apakah data besar bermakna? Banyak data? Lebih banyak data daripada yang anda boleh kendalikan? Data amorfus? Daripada data kawalan? Data berguna untuk analisis? Data tidak berguna? Kelebihan maklumat?
Jika anda membaca cukup tentang data besar, semuanya adalah di atas dan banyak lagi. Kunci bukanlah data, tetapi cabaran bagaimana mengendalikan data dan apa yang perlu dilakukan dengan data itu sendiri.
Dalam erti kata lain, bagaimana kita boleh membuat tumpukan data yang besar ini, yang telah kami kumpulkan, berguna dalam cara yang baru dan menguntungkan? Kolam data boleh datang dari mana saja melalui pelbagai mekanisme pengkomputeran seperti jawatan Facebook, log NSA, mailing list, pelanggan, dll.
Saya akan berhujah bahawa kebanyakan pembaca dalam lajur ini sendiri adalah repositori data besar. Saya baru membeli 3 Terabyte drive untuk sandaran. Saya mempunyai banyak data untuk membuat sandaran! Data besar!
Alat yang berguna yang saya bayangkan akan menjadi alat analisis data yang besar yang dapat digunakan oleh polis untuk mendapati anda bersalah atas beberapa jenayah rawak dengan melalui fail anda. Atau sekurang-kurangnya mencari sesuatu yang akan memalukan anda. Data besar!
Ini semua mengulangi komen yang dibuat oleh bekas Ketua Pegawai Eksekutif American Express, yang memberitahu penonton bahawa jika syarikat itu mahu (dan ini terpakai kepada semua syarikat kad kredit), ia boleh menggunakan tabiat dan kecenderungan membeli peribadi anda untuk disusun lengkap dossier dan pasti memberitahu jika anda mempunyai hubungan sulit atau tidak. Data besar!
Daripada apa yang saya boleh katakan, inilah data besar yang terbaik, perisik pada individu.
Komen yang popular oleh industri adalah entah bagaimana pangkalan data besar yang mengandungi maklumat tentang anda akan digunakan untuk manfaat anda. Yeah, anda tahu, jadi anda akan mendapat untuk perkara-perkara yang anda benar-benar berminat. Pengiklanan yang disasarkan. Ini memberi manfaat kepada semua orang!
Berikut adalah cara ini berfungsi. Saya berminat membeli kamera baru dan mendengar tentang Bogus One yang baru. Saya membaca artikel mengenai PCMag.com tentang kamera, kemudian saya pergi ke Amazon dan menyemak harga dan ulasan pengguna. Ia seolah-olah tiada siapa yang suka kamera itu. Ia adalah crap yang jelas. Penyemak semua menghalang kamera. Pembeli membenci kamera. Ini bukan kamera yang saya mahukan. Tetapi perisian analisis data besar memutuskan untuk memberi saya beratus-ratus iklan, pada setiap laman web yang saya lawati, semuanya menunjukkan kamera Bogus One. Data besar!
Lebih buruk daripada itu. Sekiranya perkara itu pergi ke arah yang lain dan saya memutuskan saya suka dan mahu kamera dan sebenarnya membeli kamera saya masih akan mendapat iklan yang menggalakkan saya membeli kamera. Data besar!
Pengiklanan "data besar" yang ditargetkan adalah beban terbesar baloney, pernah.
OK, jadi jangan lupa bahawa kemelut dan bergerak menggunakan data besar untuk trend. Data besar mungkin menemui pelbagai jarum dalam pelbagai jerami. Jadi anda akan mendapat sesuatu seperti ini: Empat puluh peratus daripada semua pembeli Subaru adalah vegetarian / vegan dan 80 peratus daripada mereka adalah Demokrat. Tetapi jumlah itu meningkat kepada 60 peratus dan 90 peratus, jika kita bercakap tentang Subaru Outback. Tambahan pula, ia meningkat kepada 99 peratus vegetarian / vegan dan 99 peratus Demokrat jika kereta dicat hijau.
Ahli teori data yang besar akan mempunyai hari lapangan di seminar dengan maklumat ini. Tetapi ia mengabaikan semua pembolehubah yang boleh mengubah pengiraan dan trend, yang tidak berkesudahan. Berapa lamakah mana-mana data besar tertentu ini akan dikekalkan jika Ketua Pegawai Eksekutif Subaru memacu pengumpulan dalam Outback hijau dan mengisytiharkan bahawa "Semua ikan paus mestilah dihapuskan!"?
Ia tidak mengambil begitu banyak untuk mengubah dinamik kesimpulan data besar. Walaupun apa yang dikatakan lelaki Amerika Express, data sebenarnya buta. Itulah sebabnya anda mendapat iklan untuk produk yang telah anda beli.
Data besar akan membawa anda ke kesimpulan.
Sekiranya seseorang membeli sepuluh buku tentang cara membuat bom, apakah maksudnya mahu meletupkan Bangunan Persekutuan? Bagaimana jika dia seorang ahli pelupusan bom dan yang tidak termasuk dalam jawatannya sebagai perunding polis? Data besar tidak dapat mengetahui semuanya. Ia tidak boleh tahu apa yang anda fikirkan. Saya berfikir, contohnya, kamera Bogus One menyebalkan. Data besar tidak boleh diketahui kecuali saya diinterogasi. Dan saya mungkin berbohong mengenainya.
Tidak satu pun dari ini kelihatan baik atau sihat untuk masyarakat. Melompat ke kesimpulan, membuat andaian, bertindak atas anggapan palsu. Mengadukan orang ramai dengan sia-sia.
Data besar sebagai konsep yang tinggi tidak akan menentukan sepenuhnya dan mati kematian yang menyedihkan. Saya harap.