Rumah Berita & Analisis Apakah pembelajaran mesin?

Apakah pembelajaran mesin?

Isi kandungan:

Video: [Pembelajaran Mesin 01] Pengenalan Pembelajaran Mesin (1-A) (November 2024)

Video: [Pembelajaran Mesin 01] Pengenalan Pembelajaran Mesin (1-A) (November 2024)
Anonim

Pada Disember 2017, DeepMind, makmal penyelidikan yang diperoleh oleh Google pada tahun 2014, memperkenalkan AlphaZero, sebuah program kecerdasan buatan yang boleh mengalahkan juara dunia di beberapa permainan papan.

Menariknya, AlphaZero menerima arahan sifar dari manusia tentang cara bermain permainan (oleh itu namanya). Sebaliknya, ia menggunakan pembelajaran mesin, cawangan AI yang membangunkan tingkah lakunya melalui pengalaman dan bukannya arahan yang eksplisit.

Dalam masa 24 jam, AlphaZero mencapai prestasi super dalam catur dan mengalahkan program catur juara dunia sebelum ini. Tidak lama selepas itu, algoritma pembelajaran alfaero juga menguasai Shogi (catur Jepun) dan permainan papan Cina Go, dan ia mengalahkan pendahulunya, AlphaGo, 100 hingga sifar.

Pembelajaran mesin telah menjadi popular dalam beberapa tahun kebelakangan dan membantu komputer menyelesaikan masalah yang sebelum ini dianggap sebagai domain kecerdasan manusia yang eksklusif. Dan walaupun ia masih jauh dari wawasan asal kecerdasan buatan, pembelajaran mesin telah memberi kita lebih dekat kepada matlamat utama untuk mencipta mesin pemikiran.

Apakah Perbezaan Antara Kecerdasan Buatan dan Pembelajaran Mesin?

Pendekatan tradisional untuk mengembangkan kecerdasan buatan melibatkan teliti pengekodan semua peraturan dan pengetahuan yang menentukan perilaku agen AI. Apabila membuat AI berdasarkan peraturan, pemaju perlu menulis arahan yang menentukan bagaimana AI harus bertindak sebagai tindak balas kepada setiap keadaan yang mungkin. Pendekatan berasaskan peraturan ini, yang juga dikenali sebagai AI kuno (GOFAI) atau simbolik AI yang baik, cuba meniru fungsi penalaran minda dan pengetahuan manusia.

Contoh sempurna simbolik AI adalah Stockfish, enjin catur sumber terbuka, lebih daripada 10 tahun dalam pembuatan. Beratus-ratus pemrogram dan pemain catur telah menyumbang kepada Stockfish dan membantu mengembangkan logiknya dengan cara mengodkan peraturannya-contohnya, apa yang perlu dilakukan AI apabila pihak lawan memindahkan kesatrianya dari B1 ke C3.

Tetapi AI berasaskan peraturan sering kali pecah apabila berhadapan dengan situasi di mana peraturan terlalu rumit dan tersirat. Menyedari pertuturan dan objek dalam imej, sebagai contoh, adalah operasi lanjutan yang tidak boleh dinyatakan dalam peraturan logik.

Berbanding simbol AI, model pembelajaran AI mesin dibangunkan bukan dengan menulis peraturan tetapi dengan mengumpulkan contoh. Sebagai contoh, untuk membuat mesin catur berasaskan mesin pembelajaran, pemaju membuat algoritma asas dan kemudian "melatih" dengan data dari beribu-ribu permainan catur yang dimainkan sebelumnya. Dengan menganalisis data, AI mendapati corak umum yang menentukan strategi pemenang, yang boleh digunakan untuk mengalahkan lawan sebenar.

Lebih banyak permainan AI meninjau, semakin baik ia menjadi meramalkan memenangi bergerak semasa bermain. Inilah sebab mengapa pembelajaran mesin ditakrifkan sebagai satu program yang prestasinya bertambah dengan pengalaman.

Pembelajaran mesin boleh digunakan untuk banyak tugas dunia nyata, termasuk klasifikasi imej, pengenalan suara, cadangan kandungan, pengesanan penipuan, dan pemprosesan bahasa semula jadi.

Pembelajaran yang Diurus dan Tidak Ditugaskan

Bergantung kepada masalah yang mereka mahu selesaikan, pemaju menyediakan data yang relevan untuk membina model pembelajaran mesin mereka. Sebagai contoh, jika mereka mahu menggunakan pembelajaran mesin untuk mengesan transaksi bank palsu, pemaju akan menyusun senarai transaksi sedia ada dan labelkannya dengan hasilnya (penipuan atau sah). Apabila mereka memberi suapan data kepada algoritma, ia memisahkan transaksi penipuan dan sah dan mendapati ciri-ciri umum dalam setiap kelas. Proses model latihan dengan data beranotasi disebut "pembelajaran diselia" dan kini merupakan bentuk pembelajaran mesin yang dominan.

Banyak repositori dalam talian data berlabel untuk tugas yang berbeza sudah wujud. Contoh-contoh popular adalah ImageNet, kumpulan dataset sumber lebih daripada 14 juta label berlabel, dan MNIST, satu set data 60, 000 berlabel bertulis tangan. Pembangun mesin pembelajaran juga menggunakan platform seperti Amazon Mechanical Turk, sebuah pusat pengambilan atas talian atas permintaan untuk melaksanakan tugas kognitif seperti imej pelabelan dan sampel audio. Dan sektor startup yang semakin berkembang menjadi pakar dalam anotasi data.

Tetapi tidak semua masalah memerlukan data berlabel. Sesetengah masalah pembelajaran mesin boleh diselesaikan melalui "pembelajaran tanpa pengawasan, " di mana anda memberikan model AI dengan data mentah dan biarkannya memikirkan sendiri coraknya yang relevan.

Penggunaan umum pembelajaran tanpa pengawasan adalah pengesanan anomali. Contohnya, algoritma pembelajaran mesin boleh melatih data lalu lintas rangkaian mentah peranti yang berkaitan dengan internet-kata, peti sejuk pintar. Selepas latihan, AI menetapkan garis asas untuk peranti dan boleh membenderakan kelakuan luar biasa. Sekiranya peranti itu dijangkiti dengan malware dan mula berkomunikasi dengan pelayan yang berniat jahat, model pembelajaran mesin akan dapat mengesannya, kerana trafik rangkaian adalah berbeza dari tingkah laku normal yang diperhatikan semasa latihan.

Pembelajaran Peneguhan

Sekarang, anda mungkin tahu bahawa data latihan berkualiti memainkan peranan yang besar dalam kecekapan model pembelajaran mesin. Tetapi pembelajaran penguatkuasaan adalah jenis pembelajaran mesin khusus di mana AI mengembangkan tingkah lakunya tanpa menggunakan data sebelumnya.

Model pembelajaran pengukuhan bermula dengan slate yang bersih. Mereka hanya diarahkan pada peraturan asas persekitaran mereka dan tugas di tangan. Melalui percubaan dan kesilapan, mereka belajar mengoptimumkan tindakan mereka untuk tujuan mereka.

AlphaZero's DeepMind adalah contoh pembelajaran peneguhan yang menarik. Berbeza dengan model pembelajaran mesin yang lain, yang mesti melihat bagaimana manusia bermain catur dan belajar dari mereka, AlphaZero mula hanya mengetahui pergerakan potongan dan keadaan menang permainan. Selepas itu, ia memainkan berjuta-juta perlawanan menentang dirinya sendiri, bermula dengan tindakan rawak dan secara perlahan membangun corak tingkah laku.

Pembelajaran penguatan adalah kawasan penyelidikan yang panas. Ia adalah teknologi utama yang digunakan untuk membangunkan model AI yang boleh menguasai permainan kompleks seperti Dota 2 dan StarCraft 2 dan juga digunakan untuk menyelesaikan masalah kehidupan sebenar seperti menguruskan sumber pusat data dan mewujudkan tangan robot yang boleh mengendalikan objek dengan ketangkasan manusia.

Pembelajaran Deep

Pembelajaran yang mendalam adalah satu lagi subset pembelajaran pembelajaran yang popular. Ia menggunakan rangkaian saraf tiruan, pembinaan perisian yang secara kasar diilhamkan oleh struktur biologi otak manusia.

Rangkaian saraf unggul dalam memproses data yang tidak berstruktur seperti imej, video, audio, dan petikan panjang teks seperti artikel dan kertas penyelidikan. Sebelum pengajaran yang mendalam, pakar-pakar pembelajaran mesin terpaksa meletakkan banyak usaha untuk mengekstrak ciri dari imej dan video dan akan menjalankan algoritma mereka di atasnya. Rangkaian saraf secara automatik mengesan ciri-ciri tersebut tanpa memerlukan banyak usaha daripada jurutera manusia.

Pembelajaran yang mendalam adalah di belakang banyak teknologi AI moden seperti kereta tanpa pemandu, sistem terjemahan lanjutan, dan teknologi pengenalan wajah di iPhone X anda.

Had Pembelajaran Mesin

Orang sering mengelirukan pembelajaran mesin dengan kecerdasan buatan manusia peringkat, dan jabatan pemasaran sesetengah syarikat sengaja menggunakan istilah secara bergantian. Tetapi ketika pembelajaran mesin telah mengambil langkah besar untuk menyelesaikan masalah kompleks, masih jauh dari penciptaan mesin pemikiran yang dibayangkan oleh perintis AI.

Di samping pembelajaran dari pengalaman, kepintaran sebenar memerlukan pemikiran, akal, dan pemikiran abstrak-bidang di mana model pembelajaran mesin berfungsi dengan sangat buruk.

Sebagai contoh, semasa pembelajaran mesin adalah baik pada tugas pengiktirafan pola rumit seperti meramalkan kanser payudara lima tahun lebih awal, ia bergelut dengan tugas logik dan penalaran yang mudah seperti menyelesaikan masalah matematik sekolah tinggi.

Kekurangan daya saing pembelajaran mesin menjadikannya kurang baik pada pengetahuan umum. Sebagai contoh, ejen pembelajaran komputer yang boleh bermain Super Mario 3 seperti pro tidak akan menguasai permainan platform lain, seperti Mega Man, atau versi lain Super Mario. Ia perlu dilatih dari awal.

Tanpa kuasa untuk mengekstrak pengetahuan konseptual dari pengalaman, model pembelajaran mesin memerlukan banyak data latihan untuk dilaksanakan. Malangnya, banyak domain tidak mempunyai data latihan yang mencukupi atau tidak mempunyai dana untuk memperoleh lebih banyak. Pembelajaran yang mendalam, yang kini merupakan bentuk pembelajaran mesin yang lazim, juga menderita dari masalah dijelaskan: Jaringan saraf bekerja dengan cara yang rumit, dan bahkan pencipta mereka berjuang untuk mengikuti proses membuat keputusan mereka. Ini menjadikannya sukar untuk menggunakan kuasa rangkaian saraf dalam tetapan di mana terdapat keperluan undang-undang untuk menerangkan keputusan AI.

Nasib baik, usaha sedang dilakukan untuk mengatasi had pembelajaran mesin. Salah satu contoh penting ialah inisiatif yang meluas oleh DARPA, cabang penyelidikan Jabatan Pertahanan, untuk mencipta model AI yang dijelaskan.

  • Apakah Perisikan Buatan (AI)? Apakah Perisikan Buatan (AI)?
  • Kebanyakan Dolar AI Pergi ke Pembelajaran Mesin Kebanyakan Dolar AI Pergi ke Pembelajaran Mesin
  • Bagaimana Anda Mahu Lihat AI Digunakan? Bagaimana Anda Mahu Lihat AI Digunakan?

Projek-projek lain bertujuan untuk mengurangkan pergantungan pembelajaran mesin ke atas data beranotasi dan menjadikan teknologi dapat diakses dengan domain dengan data latihan yang terhad. Penyelidik di IBM dan MIT baru-baru ini telah membuat kemajuan dalam bidang dengan menggabungkan AI simbolik dengan rangkaian saraf. Model AI Hybrid memerlukan kurang data untuk latihan dan dapat memberikan penjelasan langkah demi langkah keputusan mereka.

Sama ada evolusi pembelajaran mesin akhirnya akan membantu kita mencapai matlamat yang sentiasa sukar difahami untuk mencipta tahap AI manusia kekal untuk dilihat. Tetapi apa yang kami tahu pasti adalah kerana terima kasih kepada kemajuan dalam pembelajaran mesin, peranti yang duduk di meja kami dan berehat di dalam poket kami semakin pintar setiap hari.

Apakah pembelajaran mesin?