Video: Digital Transformation Trends 2020: Big Data, IoT, Proses Bisnis, Enterprise Architecture & SDM (November 2024)
Perniagaan tidak mendapat apa-apa mata untuk betapa efisiennya infrastruktur mereka atau berapa tinggi mereka boleh menyusun semua Data Big yang mereka kumpulkan. Apa yang dikira adalah kualiti analitik dan kecerdasan yang menghasilkan data.
Sepanjang beberapa tahun yang lalu, Hadoop adalah perkataan yang menjadi paling sinonim dengan meminum, memproses, dan mengubah data. Rangka kerja sumber terbuka untuk penyimpanan dan pemprosesan data yang diedarkan telah menanam ruang perusahaan sendiri dan mengintegrasikannya ke semua platform awan utama. Hadoop jauh dari satu-satunya teknologi Data Big yang perlu dibicarakan, tetapi ia menjadi satu yang banyak dibina.
Masalah untuk perniagaan adalah ruang Hadoop penuh dengan pengedaran dan pilihan alat, dan sebagai Pengarah Penyelidik Gartner Nick Heudecker menjelaskan, banyak dari mereka kelihatan sama. Heudecker, yang penyelidikannya meliputi pengurusan maklumat termasuk ruang Big Data dan NoSQL, berkata jika anda melihat pilihan pemprosesan data umum, banyak vendor menawarkan ciri yang sangat serupa.
Memecahkan Pasaran
Terdapat tiga main-main Hadoop start-up-Cloudera, Hortonworks, dan MapR-dan mereka semua berkembang dengan pesat pada tahun 2015. Menurut Gartner, masing-masing mempunyai kira-kira 700 pelanggan, memberi atau mengambil 10 peratus, meletakkan pasaran global antara 2, 100-2, 400 pelanggan Hadoop di seluruh dunia. Ketiga menawarkan kedua-dua peringkat bebas dan tier perniagaan distribusi Hadoop mereka, dan masing-masing membuat sumbangan sumber terbuka yang besar kepada projek di bawah spanduk Yayasan Perisian Apache (ASF).
"Data kami menunjukkan bahawa 44 peratus penggunaan Hadoop kini tidak dibayar, " kata Heudecker. "Adakah pemimpin yang jelas, saya tidak fikir begitu, mereka semua meraih bahagian pasaran kerana ia adalah ruang yang sangat baru."
Dalam beberapa bulan kebelakangan ini, banyak persaingan antara ketiga-tiga mereka telah datang ke persaingan ke atas keupayaan analisis data dan cara kreatif untuk mengintegrasikan Apache Spark, enjin pemprosesan Big Data sumber terbuka dengan kes penggunaan dari aliran data masa nyata ke pembelajaran mesin. MapR baru-baru ini mengumumkan MapR Streams sebagai sebahagian daripada "platform data yang bersatu" yang menyepadukan Hadoop, pemprosesan aliran berasaskan Spark, dan analisis. Hortonworks melancarkan kemas kini kepada Platform Data Hortonworks (HDP) dengan analitik Spark dalam memori, dan Cloudera menawarkan pelbagai integrasi Spark sumber terbuka melalui One Platform Initiative, bersama dengan menawarkan kelas latihan Spark.
"Terdapat banyak perkara dalam pengurusan maklumat dan ruang infrastruktur maklumat, dan bukan semua Hadoop, " jelas Heudecker. "Terdapat momentum yang luar biasa di sebalik model kelajuan dan pemikiran data yang memusatkan memori, walaupun perkembangan Spark masih dalam tahap awal. Spark akan menjadi satu lagi bahasa pengantar dalam pemprosesan data, seperti SQL hari ini, dan sudah pasti menunjukkan tanda-tanda bahawa ia mempunyai beberapa kaki seperti semakin banyak syarikat melabur di dalamnya."
Heudecker juga menekankan kepentingan pemain awan dalam Big Data; gergasi teknologi yang telah mengintegrasikan teknologi Hadoop dan Big Data lain ke dalam persembahan Infrastruktur-sebagai-Perkhidmatan (IaaS) yang sedia ada.
Perkhidmatan Web Amazon (AWS) menggunakan perkhidmatan Amazon Elastic MapReduce (EMR) untuk orchestration Hadoop berasaskan awan. Microsoft menawarkan pelbagai perkhidmatan Big Data dalam platform awan Azure, berikutan dengan Hortonworks pada perkhidmatan HDInsightnya untuk mengurus Apache Hadoop, Spark, HBase, dan Storm, bersama-sama dengan Azure Data Lake Azure Data dan Azure Data Analytics yang berasaskan SQL. IBM mempunyai kedua-dua tawaran Platform Terbuka IBM di premis untuk Hadoop dan IBM BigInsights, satu pakej analitik yang akan dijalankan di atasnya, bersama-sama dengan Hadoop dan Apache Spark-sebagai-perkhidmatan yang diuruskan dalam awan Bluemix. Senarai ini diteruskan, dan perniagaan mencari kes penggunaan yang lebih sesuai di awan.
"Kami menganggarkan bahawa AWS sahaja mempunyai kira-kira 5, 000 pelanggan, sehingga lebih daripada dua kali ganda jumlah pelanggan yang dimainkan secara tulen, " kata Heudecker. "Salah satu kelebihan bergerak ke awan ialah anda mendapat ekosistem.. Anda boleh mendapatkan distribusi Hadoop murni pada mana-mana tawaran IaaS. MapR boleh didapati di semua awan yang anda boleh fikirkan, selain dari IBM, sama untuk Cloudera dan Hortonworks. Kami tidak melihat ketersediaan awan menjadi terlalu banyak faktor ketika memilih antara satu vendor dan yang lain."
Memilih Strategi Data Perusahaan
Bagi perniagaan kecil dan menengah (SMB) dan perniagaan perusahaan yang semakin meningkat, ketika melabur dalam penyelesaian pemprosesan dan analisis data, Heudecker berkata faktor penentu adalah platform mana yang dapat memberikan perkhidmatan tertinggi. Cabaran terbesar untuk perniagaan, menurut Gartner, adalah kemahiran yang memikirkan siapa yang akan mengurus platform sebaik sahaja ia dipasang dan digunakan.
"Jika syarikat mencari rakan kongsi data data, siapa yang akan membantu mereka dengan data ingest? Siapa yang akan membantu mereka membina aplikasi analitis? Sejauh mana tiga pemain Hadoop yang murni, kriteria penilaian cenderung berada di sekeliling kematangan alat pengurusan dan konsol, alat tadbir urus data, dan prestasi."
Aspek menarik lain memilih platform Hadoop adalah kekurangan kesetiaan. Syarikat menilai semula platform Hadoop mereka sekerap setiap 6-12 bulan untuk melihat jika komponen pemprosesan data masih sesuai, kerana dengan cepat ruang berubah dan berapa sedikit pemain besar telah membezakan diri mereka sendiri. Heudecker berkata 20 peratus daripada syarikat-syarikat yang dia bercakap mempunyai pelbagai distribusi Hadoop yang berjalan di pusat data atau awan, sama ada membiarkan pasukan yang berbeza memilih platform mereka pilihan atau mempelbagaikan dengan sengaja untuk mengelakkan terjebak dengan hanya satu distribusi Hadoop.
Kepelbagaian portfolio platform jenis ini ke dalam apa yang Frank Buytendijk, Naib Presiden Penyelidikan Gartner dan Analis Distinguished yang memberi tumpuan kepada strategi digital, memanggil "maklumat sebagai aset." Sama seperti anda tidak boleh menjalankan perniagaan tanpa modal, tenaga kerja, bahan, dan kemudahan fizikal atau maya, Buytendijk berkata anda tidak boleh menjalankan perniagaan tanpa maklumat.
"Kami biasa melihat perniagaan dari segi tiga aliran: aliran utama adalah barang, aliran kedua adalah wang, dan aliran tersier adalah maklumat untuk memastikan barang dan uang sejajar. Sekarang dalam kebanyakan perniagaan itu adalah sebaliknya Aliran utama ialah maklumat, dari pengenalpastian dan konfigurasi ke pemasaran kandungan, dan lain-lain. Sama ada anda memanggil Big Data atau tidak benar-benar penting."
"Data Besar" Adakah Ketinggalan zaman
Buytendjik berkata beliau tidak melihat Big Data sebagai teknologi yang berasingan untuk perniagaan, tetapi sebagai satu tema atau minda dalam strategi digital keseluruhan anda.
"Saya tidak percaya mempunyai strategi Big Data, " kata Buytendjik. "Tidak ada strategi perniagaan lagi tanpa komponen digital, jadi saya percaya mempunyai strategi digital di mana semua jenis teknologi menyampaikan keupayaan kritikal termasuk mobile, social, cloud, IOT, mesin pintar, dan Big Data."
Heudecker percaya kami akan mula membicarakan "Data Besar" kurang dan kurang, kerana kini hanya data. Ini cara perniagaan dilakukan. Jumlah besar dan halaju data yang tinggi tidak lagi menakutkan.
"Data Big menjadi lebih rendah lagi oleh maklumat dan analisis, " kata Heudecker. "Data Big Data tidak semestinya tidak membezakan, kami selalu mendapat ukuran saiz data Big Data, tapi apa maksudnya? Data Big tidak benar-benar pasaran, itu adalah konsep. Untuk perniagaan, memikirkan Big Data sebagai sesuatu yang unik dan istimewa yang sangat berbeza daripada apa yang telah anda lakukan sebelum ini adalah kesilapan. Pada ketika ini, data hanya normal."