Rumah Perniagaan 7 Tips untuk kejayaan pembelajaran mesin

7 Tips untuk kejayaan pembelajaran mesin

Isi kandungan:

Video: Tips Sukses Usaha Sablon Digital Pak Iwan Redi Print - Growing Together With Rhino (November 2024)

Video: Tips Sukses Usaha Sablon Digital Pak Iwan Redi Print - Growing Together With Rhino (November 2024)
Anonim

Bahagian pertama Panduan Perniagaan kami untuk Pembelajaran Mesin (ML) meruntuhkan bagaimana konsep payung ML jauh lebih nuanced dalam persekitaran perniagaan. Strategi yang paling berkesan melihat ML dalam erti kata yang praktikal, menggunakan pembelajaran mendalam yang kompleks dan teknik "pembelajaran murah" yang kurang intensif untuk mengoptimumkan proses perusahaan dan mendapatkan maklumat intelek perniagaan ketara (BI).

Matlamat penyebaran ML dalam aplikasi perniagaan anda adalah untuk meningkatkan keuntungan anda atau tekan kelebihan daya saing syarikat anda. Tetapi dalam skema yang lebih besar dalam organisasi anda, membuat kebanyakan masa dan sumber yang anda melabur dalam proses ini jauh melebihi algoritma. Para pengambil keputusan IT dalam perniagaan anda perlu memastikan semuanya mengalihkan pemikiran ML anda-dari data dan logistik kepada bagaimana anda terlibat dengan pengguna-berfungsi bersama-sama untuk memaksimumkan keberkesanan.

Ted Dunning, Ph.D., adalah Ketua Aplikasi Arkitek di MapR, sebuah syarikat perisian perusahaan yang menawarkan pelbagai agihan Data Besar dan alat pengurusan data. Dunning juga telah menulis dua buku tentang apa yang dia sebut sebagai "Pembelajaran Mesin Praktikal" dan mengembangkan teknologi ML untuk beberapa syarikat selama ini, termasuk sistem pengesanan penipuan ID Analytics (dibeli oleh LifeLock) dan perisian Musicmatch Jukebox, yang kemudian menjadi Yahoo Music. Beliau juga kini berkhidmat sebagai Naib Presiden Inkubasi untuk Yayasan Perisian Apache.

Dunning telah menyaksikan ruang ML berkembang selama beberapa dekad, dan belajar banyak tentang apa yang berfungsi dan apa yang tidak dalam persekitaran perniagaan praktikal. Di bawah, Dunning meletakkan tujuh amalan terbaik untuk diikuti apabila membangunkan penyelesaian perniagaan yang berakar di ML.

1. Jangan Lupakan Logistik

ML yang berjaya bukan sahaja memilih alat atau algoritma yang betul. Dunning berkata anda juga perlu mengetahui cara pendekatan yang sesuai dan reka bentuknya untuk situasi tertentu yang anda hadapi. Sebagai contoh, Dunning bercakap tentang ML dalam kempen pemasaran dalam talian berbanding senario yang jauh lebih rumit seperti algoritma yang memandu kereta autonomi. Membelanjakan sumber anda untuk penambahbaikan algoritma tambahan adalah masalah untuk kereta, tetapi dalam senario pemasaran, anda akan melihat pulangan yang jauh lebih baik daripada mengoptimumkan semua logistik di sekelilingnya.

"Sering kali, untuk perniagaan, ia adalah logistik, bukan pembelajaran, yang memberikan nilai kepada anda. Itulah bahagian yang perlu anda menghabiskan masa dan sumber, " kata Dunning. "Melaraskan algoritma itu akan memberi anda peningkatan yang lebih kecil.Tetapi menyesuaikan data itu, GUI, dan bagaimana anda mendengar dan terlibat dengan pengguna anda dengan mudah dapat memberi anda peningkatan 100 peratus. Mengekalkan masa tweaking algoritma bernilai fraksi sebagai banyak kepada perniagaan seperti yang mendengar pengguna anda."

Untuk menggambarkan perkara ini, Dunning menjelaskan bagaimana beliau pernah membina model untuk mengenal pasti penipuan aplikasi (membuka akaun palsu dengan identiti yang dicuri) dalam pangkalan data pelanggan syarikat. Model yang dibinanya mendapat hasil yang sangat baik, tetapi Dunning melihatnya membimbangkan jantina pemohon sangat berat.

Ternyata logistik telah dimatikan. Cara proses permohonan bekerja, pemohon hanya mengisi jantina mereka selepas mereka telah menjadi pelanggan dan telah meluluskan beberapa langkah penyaringan untuk menyaring penipu. Oleh itu, dengan menggunakan bidang jantina, model ML menipu logistik keseluruhan proses penipuan. Itu tidak ada kaitan dengan algoritma, dan segala-galanya berkaitan dengan bagaimana syarikat memperoleh datanya di tempat pertama.

2. Minda Data Anda

Dunning penuh dengan kebijaksanaan yang menarik. Selepas bermula dengan "ia adalah logistik, bukan pembelajaran, " katanya separuh lagi idea itu ialah "itu data, bukan algoritma." Sebahagian besar daripada memastikan algoritma ML anda memberikan wawasan yang berharga adalah memastikan anda memberikan mereka data yang tepat. Dunning berkata, jika anda tidak mendapat keputusan yang anda cari, maka lebih kerap daripada tidak kerana anda tidak menggunakan data yang betul.

"Orang ramai mendapat semua algoritma tertentu, tetapi pada masa kini, kerana alat di luar sana, semua orang dan ibu mereka boleh dan akan datang dengan pelbagai algoritma baru, " kata Dunning. "Data itu jauh lebih penting, dan akan memberi anda lebih jauh daripada tweak algoritma tanpa henti. Jika anda bekerja keras seperti pengiktirafan ucapan atau penglihatan komputer, itu satu perkara, tetapi ini adalah medan yang didorong data. Dalam majoriti senario, anda akan mendapat manfaat lebih jauh daripada menyesuaikan data yang anda dapatkan dan mengubah soalan."

Itulah yang dilakukan oleh Dunning pada pertengahan 2000 ketika membina enjin cadangan video di sebuah syarikat yang dipanggil Veoh Networks. Pasukan sedang berusaha untuk mengenal pasti pasang video yang dihasilkan oleh pengguna yang diklik pada orang yang lebih banyak daripada yang dijangkakan, tetapi algoritma tidak berfungsi. Mereka berfikir dari segi muzik, di mana pengguna mengetahui artis dan lagu kegemaran mereka dengan nama. Jadi mereka menukar soalan dengan tweaking antara muka pengguna tanpa menyentuh algoritma itu sendiri.

"Dalam video yang dijana oleh pengguna, tidak ada yang tahu artis dan banyak video mempunyai tajuk spammy untuk mendapatkan lebih banyak pandangan. Berbasikal pada tweak algoritma tidak akan memberikan kami hasil yang baik, " kata Dunning. "Apa yang kami lakukan telah mengubah antara muka pengguna untuk memancarkan isyarat suar setiap 10 saat.Kami mendapati bahawa jika kami menggunakan suar bukannya klik untuk data mentah pengesyorkan, kami mendapat hasil yang luar biasa. peningkatan seratus peratus dalam penglibatan kerana cadangan, tanpa perubahan algoritma."

3. Algoritma Tidak Peluru Magic

Pelaksanaan ML berkembang pesat pada percubaan dan kesilapan yang berterusan. Tidak peduli seberapa baik algoritma anda, jika sistem anda berinteraksi dengan manusia, maka perlu disesuaikan dari waktu ke waktu. Dunning menegaskan bahawa perniagaan harus sentiasa mengukur keberkesanan keseluruhan pelaksanaannya, dan mengenal pasti perubahan dan pemboleh ubah yang menjadikannya lebih baik dan menjadikannya lebih buruk. Ini mungkin kedengaran seperti platitud, tetapi Dunning berkata, walaupun begitu jelasnya bunyi, sangat sedikit orang yang melakukan ini atau melakukannya dengan baik.

"Ramai orang mahu menggunakan sistem atau mengambil tindakan, dan mereka mahu algoritma mereka berjalan dengan sempurna selama-lamanya, " kata Dunning. "Tidak ada algoritma yang akan menjadi peluru ajaib Tiada reka bentuk antara muka pengguna akan kekal selama-lamanya Tidak ada kaedah pengumpulan data yang tidak akan digantikan.Semua ini boleh dan akan berlaku, dan perniagaan perlu mengukur, menilai, dan mengevaluasi semula bagaimana kerja sistem."

4. Gunakan Alat Seluruh Pelbagai

Terdapat banyak alat ML yang tersedia, banyak yang boleh anda gunakan secara percuma. Anda mempunyai perpustakaan rangka kerja sumber terbuka yang popular seperti Caffe, H20, Shogun, TensorFlow, dan Torch, dan perpustakaan ML di beberapa projek Yayasan Perisian Apache (ASF) termasuk Mahout, Singa, dan Spark. Kemudian ada pilihan berasaskan langganan termasuk Amazon Machine Learning, BigML, dan Microsoft Azure Machine Learning Studio. Microsoft juga mempunyai Toolkit Kognitif percuma.

Terdapat banyak sumber yang ada. Dunning telah bercakap dengan banyak perniagaan, saintis data, dan pengamal ML, dan selalu bertanya kepada mereka berapa kerangka dan alat yang mereka gunakan. Rata-rata, kata Dunning yang paling berkata mereka menggunakan minimum 5-7 alat dan seringkali jauh lebih banyak.

"Anda tidak boleh terpaku pada satu alat. Anda perlu menggunakan beberapa, dan dengan itu, anda lebih baik membina sistem anda dengan cara yang agnostik, " kata Dunning. "Sesiapa sahaja yang cuba meyakinkan anda bahawa alat ini adalah satu-satunya yang anda perlukan adalah menjual anda satu bil barangan.

"Sesuatu mungkin berlaku pada minggu depan yang mengganggu keranjang epal, dan pada kadar inovasi yang kita lihat, ia akan terus berlaku selama lima hingga 10 tahun lagi, " kata Dunning. "Lihat contoh pembelajaran yang murah di mana mungkin anda menggunakan semula pengelas imej yang ada untuk menganalisis gambar dalam katalog. Itu pembelajaran yang mendalam dengan penglihatan komputer yang dibuang. Tetapi ada alat di luar sana yang telah mengemas semuanya. untuk mengukur, menilai, dan mengosongkan antara alat yang berbeza, dan infrastruktur anda perlu mengalu-alukannya."

5. Eksperimen Dengan Pembelajaran Hibrid

Dunning berkata anda juga boleh menggabungkan pembelajaran yang murah dan mendalam bersama-sama ke dalam sesuatu hibrid. Sebagai contoh, jika anda mengambil model visi komputer yang sedia ada dan membina semula beberapa lapisan teratas di mana keputusan dibuat, maka anda boleh memilih rangka kerja yang sedia ada untuk kes penggunaan sepenuhnya baru. Dunning menunjuk kepada persaingan Kaggle di mana para peserta hanya melakukannya; mereka mengambil set data dan menulis algoritma baru di atas untuk membantu komputer membezakan kucing dari anjing.

"Membezakan kucing dan anjing adalah satu perkara yang sangat halus untuk algoritma ML.Melihat tentang logik: Kucing mempunyai telinga yang tajam tetapi begitu juga Shepherds Jerman. Anjing tidak mempunyai tempat, kecuali orang Dalmatians, dan lain-lain. dalam dan dari dirinya sendiri, "kata Dunning. "Lelaki yang memenangi membangunkan satu sistem yang melakukan ini dengan ketepatan 99 peratus, tetapi saya lebih tertarik dengan orang yang berada di tempat ketiga, bukannya membina dari awal, dia mengambil program pengenalan imej yang sedia ada dari tugas yang berbeza, lapisan atas, dan meletakkan pengelas mudah di sana, dia memberikan beberapa contoh, dan tidak lama lagi, ia adalah 98 peratus tepat dalam membezakan kucing dari anjing.

6. Murah Tidak Bermaksud Buruk

Walaupun konotasi yang terang-terangan, Dunning berkata pembelajaran murah tidak bermakna pembelajaran yang buruk. Jumlah masa yang anda belanjakan pada pelaksanaan ML tidak berkaitan secara langsung dengan nilai perniagaannya. Kualiti yang lebih penting, katanya, adalah memastikan prosesnya dapat diulang dan boleh dipercayai. Sekiranya perniagaan dapat mencapai itu tanpa melabur sumber yang tidak wajar, maka itu adalah lebih baik.

"Murah tidak bermakna buruk, jika ia berfungsi, ia berfungsi, jika ia murah dan ia berfungsi, itu hebat, tetapi usaha yang anda masukkan ke dalam bangunan itu tidak menentukan nilai itu, " kata Dunning.. "Apa yang mentakrifkan nilai adalah bagaimana ia meningkatkan perniagaan, jika keuntungan atau keuntungannya bertambah baik atau memperbaiki keadaan persaingan anda, itu adalah kesan, bukan usaha."

7. Jangan Panggil Ia AI

Dunning menegaskan bahawa, apabila bercakap tentang teknik ini, perniagaan harus menggunakan istilah yang tepat: ML, penglihatan komputer, atau pembelajaran mendalam. Semua ini cenderung jatuh di bawah istilah payung "kecerdasan buatan" tetapi, kepada Dunning, definisi AI hanyalah "perkara yang tidak berfungsi lagi."

"Takrifan terbaik yang pernah saya dengar untuk AI ialah perkara-perkara yang tidak dapat kami jelaskan. Perkara yang kami tidak tahu, " kata Dunning. "Setiap kali kita mendapatkan sesuatu untuk bekerja, orang berkata 'Oh, itu bukan AI, itu hanya perisian. Ia hanya satu enjin peraturan. Itu benar-benar hanya regresi logistik.' Sebelum kita memikirkan sesuatu, kita panggil ia AI Selepas itu, kita selalu menyebutnya sesuatu yang lain Dalam banyak cara, AI lebih baik digunakan sebagai kata untuk perbatasan seterusnya, dan dalam AI, akan ada perbatasan seterusnya. di mana kita pergi, bukan di mana kita sudah sampai."

7 Tips untuk kejayaan pembelajaran mesin