Apa Yang Membuat Sebuah Game

From Discord Security Advisory
Jump to navigation Jump to search


Masalah ini diucapkan untuk MCTS, yang lebih cocok untuk game menang-kalah daripada game dengan output berkelanjutan. Perubahan utama adalah bahwa utilitas akhir secara seragam lebih rendah. Fakta bahwa metode perkiraan menghasilkan biaya komputasi yang lebih rendah secara seragam daripada metode eksak tidak mengejutkan, namun penting untuk ditekankan bahwa seiring dengan meningkatnya ukuran pohon permainan, perbedaan antara metode Dominan Nash eksak kami dan MCTS berkurang dengan cepat, meskipun MCTS hanya mengunjungi kurang dari 20%persen2020%20 % dari simpul daun. Kami berhipotesis bahwa memperluas permainan ke satu di mana tindakan pada satu titik keputusan mempengaruhi ruang tindakan yang tersedia pada titik keputusan berikutnya akan menyebabkan pemecah rabun untuk di bawah kinerja relatif terhadap MCTS. POSTSUBSCRIPT → 1 yang lebih menguntungkan bagi pemain Biru, relatif terhadap posisi sekitarnya di ruang parameter. POSTSUBSCRIPT ) ruang di mana Biru meningkat pada posisi awal mereka (relatif terhadap Merah) telah menurun di kedua area dan magnitudo puncak.

Berdasarkan hasil ini untuk pohon permainan yang lebih kecil, keunggulan kinerja dari pemecah perkiraan tidak cukup kuat untuk membenarkan penggunaannya relatif terhadap pemecah Dominan Nash yang tepat, karena biaya perkiraan. Selain itu, kami mengembangkan pemecah eksak baru, dan menguji beberapa skema numerik perkiraan yang mapan. Kontribusi pekerjaan kami adalah tiga kali lipat. Kami meringkas di bagian ini gambaran umum yang berkembang dari pekerjaan terkait. Model operasional MLG, termasuk model baru untuk beban kerja khusus MLG (Bagian II). Untuk memperluas pekerjaan yang ada, kinerja pemecah Bagian 4 diuji untuk berbagai ukuran pohon permainan, dengan pohon ditentukan untuk kedalaman antara 2222 dan 4444, dan ruang aksi untuk setiap pemain antara 3333 dan 6666. Hasil pengujian ini—seperti terlihat pada Gambar 6—menunjukkan perubahan laju pertumbuhan biaya komputasi sebagai fungsi dari ukuran pohon. Dengan pengecualian PaperMC di AWS (gelembung merah di baris atas), variabilitas kinerja game juga lebih tinggi daripada beban kerja Pemain, yang memberikan bukti bahwa beban kerja lingkungan dapat menyebabkan lebih banyak variabilitas kinerja daripada beban kerja pemain.

POSTSUBSCRIPT menghasilkan penurunan yang mencolok dalam kinerja konsep solusi MCTS yang lebih mahal secara komputasi. POSTSUBSCRIPT ) domain di mana Merah disukai, perubahan yang diamati pada hasil keseimbangan tidak seragam. Ruang keadaan adalah himpunan yang dapat didenumerisasi, ruang tindakan adalah ruang Borel dan fungsi biaya mungkin tidak terbatas. Selanjutnya, dalam Proposisi 10, kami menunjukkan bahwa dengan menggunakan strategi prediksi yang lebih kompleks yang dimotivasi oleh algoritme optimasi linier online di ruang Hilbert yang diusulkan oleh extciteorabona2016coin, kami dapat memastikan peluruhan eksponensial dari kesalahan tipe-II. Untuk singkatnya, kami tidak menunjukkan plot kasus ini. Selanjutnya, untuk kasus dengan aproksimasi fungsi linier, kami membuktikan bahwa algoritme kami mencapai penyesalan sublinier dan suboptimalitas masing-masing di bawah pengaturan online dan offline. Selain itu, dua algoritme solusi, termasuk dinamika permainan mandiri (misalnya, dinamika respons terbaik) dan optimalisasi fungsi potensial, dikembangkan untuk setiap game. Selain itu, pemain hanya dapat menerima realisasi dari hasil mereka tetapi bukan fungsi sebenarnya, mereka juga tidak dapat mengamati keadaan/tindakan satu sama lain. 0,5. Di bawah profil yang berkorelasi ini, para pemain berbagi koin yang adil dan keduanya memilih tindakan pertama mereka jika koinnya adalah kepala dan tindakan kedua mereka sebaliknya.

Kami merumuskan model teori permainan pertama untuk pembelajaran yang bergantung pada keputusan di hadapan persaingan, yang kami sebut prediksi performatif multi-pemain. Bahwa ini mungkin adalah produk dari struktur permainan BKL itu sendiri. Awal dari analisis semacam itu adalah produk dari jenis permainan yang sedang dipelajari, yang cukup kecil sehingga pertimbangan akurasi mendominasi masalah biaya komputasi (yang diukur dalam hal waktu perhitungan); atau bahwa game menjadi begitu besar sehingga metodologi solusi yang dikembangkan sangat dioptimalkan untuk konsep game tertentu, menghasilkan hasil penskalaan yang tidak dapat diperluas. Di seluruh ruang uji pemecah Dominan Nash menghasilkan hasil yang cocok dengan solusi Pohon Penuh yang tepat, memvalidasi statusnya sebagai pemecah yang tepat. Korespondensi antara solusi Nash Dominant dan Myopic adalah karena posisi yang diuji di ruang parameter sangat didominasi oleh keputusan sebelumnya di ruang parameter. Berbeda dengan perilaku pemecah perkiraan yang sudah mapan, daftar slot bank jago pemecah numerik Nash Dominant baru kami mampu secara efisien membangun solusi numerik yang tepat untuk permainan ini dengan cara yang efisien secara numerik. 47, 100 ), Gambar 7 mengeksplorasi ruang solusi yang dibangun sesuai dengan solver Nash Dominant, Myopic dan MCTS.