Isi kandungan:
Video: BigQuery ML: Machine Learning with Standard SQL (November 2024)
Google kini telah menambah keupayaan pembelajaran komputer (ML) ke Google BigQuery, menawarkan pangkalan data awan petabyte (PB) peringkat awan. Kini digelar BigQuery ML, versi baru membolehkan anda menggunakan pernyataan Bahasa Permintaan Terstruktur (SQL) sederhana untuk membina dan menyebarkan model ML untuk analisis ramalan.
Itu bukan sekadar berita baik untuk saintis data yang menggunakan Google. Ia juga baik untuk pengendali perniagaan yang berminat untuk memajukan keupayaan analisis data mereka kerana ia menambah satu pesaing yang lebih berkesan kepada senarai vendor yang agak kecil yang mampu menyampaikan kecanggihan tahap ini melalui awan. Dua lagi nama yang paling terkenal ialah Perkhidmatan Pangkalan Data Relasi Amazon dan Azure SQL Microsoft, dan anda boleh mencari lebih banyak lagi dalam pengedaran perkhidmatan pangkalan data awan baru-baru ini.
Penawar semua vendor produk data dan pembeli sentiasa jurang kemahiran. Itu benar terutama bagi mereka yang berminat dalam ML dan analisis ramalan, kerana disiplin ini sering memerlukan pengetahuan tentang teknologi baru dan bahasa pertanyaan.
"Bagi setiap saintis data, terdapat ratusan penganalisis yang bekerja dengan data, dan kebanyakan menggunakan SQL, " Sudhir Hasbe, Pengarah Pengurusan Produk di Google Cloud, memberitahu PCMag. Sesuatu yang perlu diberi jika kuasa tentera penganalisis data terpaksa dipecahkan daripada kesesakan yang dicipta oleh terlalu sedikit dan terlalu banyak kerja saintis data.
Jawapan Google untuk dilema ini tidaklah begitu ketara. Walaupun ML adalah trend panas dan muncul dalam pelbagai jenis produk di mana-mana, ia masih kukuh wilayah saintis data. Banyak vendor telah membuat kemajuan dalam memudahkan teknologi, tetapi kebenaran hodoh adalah, anda boleh menyederhanakannya dengan banyak dan masih terlalu sukar untuk lebih daripada 99 peratus populasi manusia digunakan. Walau bagaimanapun, kita perlu dapat menggunakannya kerana ML boleh berbuat lebih banyak, dan melakukannya lebih cepat daripada sekumpulan manusia yang super pintar.
Google menanamkan ML di dalam Google BigQuery supaya ia tinggal lebih dekat dengan data. Aplikasi ini akan membawa keupayaan ML lebih cepat daripada model ML tradisional sebahagiannya kerana analisis data boleh dilakukan di sumbernya. Sekarang dalam beta, BigQuery ML membolehkan penganalisis (dan saintis data) menjalankan analisis ramalan seperti jualan ramalan dan membuat segmen pelanggan di atas data di mana ia disimpan. Itu saja adalah kenaikan dan kenaikan yang ketara.
Walau bagaimanapun, Google pergi lebih jauh daripada itu dengan menambah keupayaan yang membolehkan penganalisis data menggunakan pernyataan SQL mudah untuk membina dan menggunakan model ML. Pada masa ini, opsyen adalah regresi linear dan model regresi logistik untuk analisis ramalan kerana kedua-dua model yang paling biasa digunakan.
Berikut adalah ilustrasi Google yang disediakan untuk menunjukkan bagaimana penganalisis data akan menggunakan keupayaan ini:
Google merancang untuk menambah lebih banyak pilihan ML ke kemampuan ini dari masa ke masa, menurut Hasbe. "Kami perlu mendengar daripada para pelanggan kami mengenai model mana yang mereka mahu kami tambah supaya kami menyediakan yang paling berguna terlebih dahulu, " katanya.
Peningkatan Google BigQuery Tambahan
Mengatasi senarai naik taraf yang besar setelah ML adalah keupayaan pengelompokan, BigQuery Geographic Information Systems (BigQuery GIS), penyambung data Google Sheets baru, dan penyambung data Google Sheets yang baru.
Clustering juga dalam beta, dan membolehkan penciptaan jadual berkumpulan dalam langkah pengoptimuman data yang tandan baris dengan kekunci cluster yang sama bersama-sama. Ini mengurangkan kos kerana ia meningkatkan prestasi dan membolehkan Google BigQuery mengenakan bayaran kepada pengguna hanya untuk data yang diimbas daripada keseluruhan jadual atau partition.
BigQuery GIS kini dalam alfa, dan digunakan untuk analisis data geospatial. Semasa pasukan Google Cloud bekerjasama dengan Google Earth Engine untuk membina BigQuery GIS, anda perlu membawa data geospatial anda sendiri ke meja. Itu bukan masalah di dalam dan di beberapa industri, termasuk sistem kereta yang berkaitan, Internet Perkara (IoT), pembuatan, runcit, bandar pintar, dan telematik. Belum lagi agensi-agensi kerajaan dari Agensi Perlindungan Alam Sekitar (EPA) dan Agensi Perisikan Geospatial Negara kepada Pentadbiran Oseanik dan Atmosfera Negara (NOAA) dan semua cabang ketenteraan, sudah tentu.
BigQuery GIS menggunakan perpustakaan S2, yang kini mempunyai lebih daripada satu bilion pengguna melalui pelbagai produk seperti Google Earth Engine dan Google Maps. Sekiranya anda memerlukan lebih banyak data geospatial, maka kerajaan persekutuan berkongsi jumlah yang besar di GeoPlatform.
Penyambung data Google Sheets yang baharu mungkin menggembirakan banyak penganalisis data semata-mata kerana ia amat praktikal untuk kegunaan harian. Anda boleh mengakses Google BigQuery dari Google Sheets (program spreadsheet) dan menggunakan alat Google Sheets seperti Explore, yang merupakan kolaborasi gabungan, visualisasi data, dan alat pertanyaan bahasa semula jadi.
Google BigQuery kini mempunyai antara muka pengguna baru (UI) dalam beta juga. Salah satu unsur yang lebih menarik ialah fungsi visualisasi satu klik, yang menyokong Google Data Studio. Semua memberitahu, ia adalah satu peningkatan besar untuk perkhidmatan yang sudah elegan. Peningkatan ini akan diuji dalam pusingan seterusnya ulasan penyelesaian pangkalan data Base-as-a-Service (DBaaS) PCMag, selepas pepijat dilaksanakan, dan produk telah bergerak melebihi status alfa dan beta masing-masing.
PCMag EIC Dan Costa membincangkan masa depan data: