Algoritme pembelajaran mendalam MIT menemukan tanda peringatan tersembunyi dalam pengukuran yang dikumpulkan dari waktu ke waktu.

Peneliti MIT telah mengembangkan algoritma berbasis pembelajaran yang mendalam untuk mendeteksi anomali dalam data deret waktu. Kredit: MIT News

Algoritme pembelajaran mendalam yang baru dapat memberikan peringatan lanjutan ketika sistem – dari satelit hingga pusat data – tiba-tiba berantakan.

Saat Anda bertanggung jawab atas satelit bernilai jutaan dolar yang melintasi ruang angkasa dengan kecepatan ribuan mil per jam, Anda ingin memastikannya berfungsi dengan lancar. Dan deret waktu dapat membantu.

Deret waktu hanyalah rekaman ukuran yang diambil berulang kali dari waktu ke waktu. Itu dapat melacak tren jangka panjang dari sistem dan hit jangka pendek. Contohnya termasuk kurva Covid-19 yang terkenal dari sembilan kasus sehari-hari dan kurva Keeling yang telah melacak konsentrasi karbon dioksida di atmosfer sejak 1958. Di era data besar, “deret waktu dikumpulkan di semua tempat, dari satelit ke turbin, ”kata Kalyan Veeramachaneni. “Semua mesin itu memiliki sensor yang menangkap rangkaian waktu ini dalam operasinya.”

Namun analisis deret waktu tersebut, dan penandaan titik data yang anomali di dalamnya, bisa jadi rumit. Datanya bisa berisik. Jika operator satelit melihat serangkaian pembacaan pada suhu tinggi, bagaimana Anda tahu jika itu adalah fluktuasi yang tidak berbahaya atau tanda bahwa satelit berada di ambang panas berlebih?

Ini adalah masalah Veeramachaneni, yang mengarahkan grup Data-ke-AI DenganLaboratorium Sistem Informasi dan Keputusan, berharap bisa menyelesaikannya. Kelompok tersebut mengembangkan metode baru berdasarkan pembelajaran mendalam untuk menandai anomali dalam data deret waktu. Pendekatannya, yang disebut TadGAN, mengungguli metode pesaing dan dapat membantu operator mendeteksi dan menanggapi perubahan besar dalam berbagai sistem bernilai tinggi, dari satelit yang terbang di luar angkasa hingga pengoperasian server komputer yang berdengung di ruang bawah tanah.

Riset tersebut akan dipresentasikan pada konferensi IEEE BigData bulan ini. Penulis makalah ini termasuk anggota grup Data-to-AI Veeramachaneni, postdoc Dongyu Liu, mahasiswa peneliti tamu Alexander Geiger, dan mahasiswa master Sarah Alnegheimish, serta Alfredo Cuesta-Infante dari Universitas Rey Juan Carlos dari Spanyol.

Taruhan tinggi

Untuk sistem yang serumit satelit, analisis deret waktu harus otomatis. Perusahaan satelit SES, yang bekerja sama dengan Veeramachaneni, menerima rentang waktu penuh dari satelit komunikasinya – sekitar 30.000 parameter unik per pesawat ruang angkasa. Operator manusia di ruang kontrol SES hanya dapat melacak sebagian kecil dari rangkaian waktu tersebut saat berkedip di layar. Selebihnya, mereka mengandalkan sistem alarm untuk menandai nilai di luar jangkauan. “Jadi mereka berkata, ‘Bisakah kamu lebih baik? “Kata Veeramachaneni. Perusahaan ingin timnya menggunakan pembelajaran mendalam untuk menganalisis semua deret waktu tersebut dan menandai perilaku yang tidak biasa.”

Taruhannya tinggi untuk pertanyaan ini: Jika algoritme pembelajaran mendalam gagal mendeteksi anomali, tim dapat kehilangan kesempatan untuk menyelesaikan berbagai hal. Tetapi jika Anda membunyikan alarm setiap kali ada titik data yang berisik, pengulas manusia akan membuang-buang waktu mereka terus-menerus untuk memeriksa algoritme yang meneriakkan serigala. “Jadi kami memiliki dua tantangan ini,” kata Liu. “Dan kita perlu menyeimbangkannya.”

Alih-alih menemukan keseimbangan tersebut hanya untuk sistem satelit, tim tersebut berusaha untuk membuat kerangka kerja yang lebih umum untuk deteksi anomali – yang dapat diterapkan di semua industri. Mereka ditujukan untuk sistem pembelajaran mendalam yang disebut jaringan adversarial generatif (GAN), yang sering digunakan untuk analisis gambar.

GAN terdiri dari sepasang jaringan saraf. Satu jaringan, “generator”, membuat gambar palsu, sedangkan jaringan kedua, “diskriminator”, memproses gambar dan mencoba menentukan apakah gambar itu benar atau palsu yang dihasilkan oleh generator. Melalui beberapa siklus proses ini, generator belajar dari umpan balik diskriminator dan menjadi ahli dalam membuat pemalsuan hiper-realistis. Teknik ini dianggap belajar “tanpa pengawasan,” karena tidak memerlukan kumpulan data yang telah diberi label sebelumnya di mana gambar diberi tag dengan subjeknya. (Kumpulan besar data berlabel sulit ditemukan).

Tim mengadaptasi pendekatan GAN ini ke data deret waktu. “Dari strategi pelatihan ini, model kami dapat mengetahui titik data mana yang normal dan mana yang tidak normal,” kata Liu. Ini dilakukan dengan memeriksa ketidaksesuaian – kemungkinan anomali – antara deret waktu nyata dan deret waktu palsu yang dihasilkan oleh GAN. Tetapi tim menemukan bahwa GAN saja tidak cukup untuk mendeteksi anomali deret waktu, jadi mereka mungkin gagal mengidentifikasi segmen deret waktu nyata yang menjadi pembanding palsu. Akibatnya, “jika Anda menggunakan GAN saja, Anda akan menciptakan banyak kesalahan positif,” kata Veeramachaneni.

Untuk mencegah kesalahan positif, tim melengkapi GAN mereka dengan algoritme yang disebut autocoder – teknik lain untuk pembelajaran mendalam tanpa pengawasan. Berbeda dengan kecenderungan GAN menangis seperti serigala, autoencoder lebih cenderung melewatkan anomali yang sebenarnya. Itulah mengapa autoencoder cenderung menangkap terlalu banyak pola dalam deret waktu, terkadang menafsirkan anomali sebenarnya sebagai fluktuasi yang tidak berbahaya – masalah yang disebut “overfitting”. Dengan menggabungkan GAN dengan autocoder, para peneliti membuat sistem deteksi anomali yang melakukan keseimbangan sempurna: TadGAN waspada, tetapi tidak menimbulkan terlalu banyak alarm palsu.

Teruji deret waktu

Selain itu, TadGAN menjadi juara kompetisi. Pendekatan tradisional untuk memprediksi deret waktu, yang disebut ARIMA, dikembangkan pada tahun 1970-an. “Kami ingin melihat sejauh mana kemajuan kami, dan apakah model pembelajaran mendalam benar-benar dapat meningkatkan metode klasik ini,” kata Alnegheimish.

Tim melakukan tes deteksi anomali pada 11 set data, mengadu ARIMA dengan TadGAN dan tujuh metode lainnya, termasuk beberapa yang dikembangkan oleh perusahaan seperti Amazon dan Microsoft. TadGAN mengungguli ARIMA dalam deteksi anomali untuk delapan dari 11 kumpulan data. Algoritma terbaik kedua, yang dikembangkan oleh Amazon, hanya mengalahkan ARIMA untuk enam kumpulan data.

Alnegheimish menekankan bahwa tujuannya tidak hanya untuk mengembangkan algoritme deteksi anomali kelas satu, tetapi juga membuatnya dapat digunakan secara luas. “Kita semua tahu bahwa AI menderita masalah reproduktifitas,” katanya. Tim telah membuat kode TadGAN tersedia secara gratis, dan menerbitkan pembaruan berkala. Selain itu, mereka telah mengembangkan sistem pembandingan bagi pengguna untuk membandingkan kinerja berbagai model deteksi anomali.

“Tolok ukur ini adalah open source, jadi siapa pun dapat pergi dan mengujinya. Mereka dapat menambahkan model mereka sendiri jika mereka mau,” kata Alnegheimish. “Kami ingin mengurangi stigma seputar AI yang tidak dapat direproduksi. Kami ingin memastikan semuanya sehat. ”

Veeramachaneni berharap TadGAN suatu hari nanti akan melayani berbagai industri, tidak hanya perusahaan satelit. Misalnya, dapat digunakan untuk memantau kinerja aplikasi komputer yang telah menjadi pusat perekonomian modern. “Untuk menjalankan laboratorium, saya punya 30 aplikasi. Zoom, Slack, Github – nama, saya memilikinya, “katanya.” Dan saya mengandalkan semua orang untuk bekerja dengan sempurna dan selamanya. “Hal yang sama berlaku untuk jutaan pengguna di seluruh dunia.

TadGAN dapat membantu perusahaan seperti Zoom memantau sinyal serial sementara di pusat datanya – seperti penggunaan CPU atau suhu – untuk membantu mencegah pemadaman layanan, yang dapat mengancam pangsa pasar. perusahaan. Di masa mendatang, tim berencana untuk mengemas TadGAN dalam antarmuka pengguna, untuk membantu menghadirkan analisis deret waktu tingkat lanjut kepada siapa pun yang membutuhkannya.

Referensi: “TadGAN: Deteksi Anomali Rangkaian Waktu Menggunakan Jaringan Merugikan Umum” oleh Alexander Geiger, Dongyu Liu, Sarah Alnegheimish, Alfredo Cuesta-Infante dan Kalyan Veeramachaneni, 14 November 2020, Ilmu Komputer> Pembelajaran Mesin.
arXiv: 2009.07769

Penelitian ini didanai dan diselesaikan bekerja sama dengan SES.

Related articles

Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Share article

Latest articles

Topan Super Surigae menyulut Pasifik

19 April 2021 Topan super mencapai intensitas ekstrem setahun lebih banyak daripada badai era satelit mana pun. Surigae tidak akan mendarat, tetapi topan yang muncul di...

Mekanisme fotoenzim kunci yang diuraikan

Kesan artis tentang katalisis enzimatik yang diusulkan dalam mekanisme fotodekarboksilase asam lemak (Sains 2021). Kredit: Damien Sorigué Pengoperasian enzim FAP, yang berguna untuk memproduksi...

DOE Mendorong Investasi A.S. yang Agresif dalam Energy Fusion

Sinar laser energi tinggi NIF berkumpul di target di tengah kamera target. Keberhasilan mendapatkan penyalaan fusi akan menjadi langkah maju yang besar dalam...

Fisikawan menciptakan bit kuantum yang dapat mencari materi gelap

Sebuah qubit (persegi panjang kecil) dipasang pada tingkat kebiruan, yang berada di atas jari untuk menunjukkan skala. Ilmuwan di Farmland Universitas Chicago menggunakan...

Ahli paleontologi memperkirakan bahwa 2,5 miliar T. rex menjelajahi Bumi selama periode Kapur

Untuk semua mereka yang terlambatKapur Menurut sebuah studi baru, jumlah total tyrannosaurus yang pernah hidup di Bumi adalah sekitar 2,5 miliar individu, di mana...

Newsletter

Subscribe to stay updated.