2.4 pix2pix DCGAN (B) X Generator G : Z X Discriminator D : X [0, 1] CNN Convolutional Neural Network 3 4 Generator, Discriminator.

Līdzīgi dokumenti
Informatīvo spektra joslu izvēle hiperspektrālo attēlu klasifikācijai

BANKROTU DATU ANALĪZES VEIKŠANAS IESPĒJAS AR LAIKRINDU KLASTERIZĀCIJAS PALĪDZĪBU POSSIBILITIES OF PERFORMING BANKRUPTCY DATA ANALYSIS USING TIME SERIE

A/S Transporta un sakaru institūts (turpmāk tekstā - TSI) NOLIKUMS par ārvalstu akadēmiskā personāla atlasi 2018./2019., /2020. akadēmiskajam ga

Microsoft Word - L.A.T., 2015.

Microsoft PowerPoint - LZA_INFROM_seminar_ _lektauers - Final.pptx

RĪGAS TEHNISKĀ UNIVERSITĀTE Datorzinātnes un informācijas tehnoloģijas fakultāte (DITF) Elektronikas un telekomunikāciju fakultāte (ETF) E-studiju teh

(Microsoft Word - Retransl\342cijas%20at\357aujas%20Nr_6%20IZZI%20FAO[1].doc)

CURRICULUM VITAE (CV)

Dimensionālā pieeja Latvijas klīniskā personības testa izstrādē

Microsoft PowerPoint - DS.AM.01.ppt

Microsoft PowerPoint - Rauhvargers_Stocktaking_RP_2009.ppt [Compatibility Mode]

series_155

ISSN COMPUTER SCIENCE DATORZINĀTNE TECHNOLOGIES OF COMPUTER CONTROL DATORVADĪBAS TEHNOLOĂIJAS DESEASE DIAGNOSTICS BASED ON COMPUTE

Riski: identificēšana un mērīšana

Europass Curriculum Vitae Personas dati Uzvārds / Vārds RŪDOLFS KALVĀNS Tālrunis Tālrunis: E-pasts Pilsonība Latvijas

Microsoft Word - Stankevica_kops_LV

PowerPoint Presentation

SolidCAM Solution Presentation

Datu lapa: Wilo-Stratos PICO 25/1-4 Raksturlīknes Δp-c (konstants) v 3 4 Rp ½ 0,4 0,8 1,2 Rp 1 m/s 0 0,2 0,4 0,6 0,8 1,0 Rp 1¼ H/m Wilo-Strato

(Microsoft Word - Retransl\347jamo programmu izv\347les koncepcija Elektrons&K 2015, febru\342ris)

GDPR - risinājumi

Sērijas apraksts: Wilo-Yonos PICO Līdzīgs attēlā redzamajam piemēram Modelis Aprīkojums / funkcija Slapjā rotora cirkulācijas sūknis ar skrūvsavienoju

Īsu laika rindu un to raksturojošo parametru apstrādes sistēmu izstrādāšana prognozēšanas uzdevumiem

Informācijas tehnoloģiju integrēšana mācību priekšmetos J.Joksts J.Brakšs

A_Laizans_CV_2016

RĪGAS TEHNISKĀ UNIVERSITĀTE Datorzinātnes un informācijas tehnoloģijas fakultāte Lietišķo datorsistēmu institūts Artūrs BARTUSEVIČS Doktora studiju pr

Microsoft Word - Udalcovs_kops_lv

(Microsoft Word - Koncepcija_ElektronsS,%20preciz\347jumi%202014[1].doc)

KURSA KODS

SOCIETY. INTEGRATION. EDUCATION Proceedings of the International Scientific Conference. Volume III, May 27 th - 28 th, KUSTĪBU KOORDINĀCIJ

MMS kamera 1

Tirgus dal bnieka nosaukums: Ieguld jumu p rvaldes akciju sabiedr ba "Finasta Asset Management" Kods: 100 Invalda konservativais ieguldijumu plans 1.

February 21, LU Rakstu sērijas «Zinātņu vēsture un muzejniecība» publikāciju atpazīstamība ( ) Interneta vidē (ieskats) LU 76. konferen

Pamatelementi statistikā un Hipotēžu pārbaude

3D_modeli_atskaite.pages

LATVIJAS UNIVERSITĀTE AGNESE RUSAKOVA Promocijas darbs Recognition of Prior Learning within Higher Education in the Context of Lifelong Learning Iepri

Microsoft Word - KOPSAVILKUMS_2012_07_06.doc

Tirgus dalībnieka nosaukums: "Parex Asset Management" Ieguldījumu pārvaldes akciju sabiedrība Kods: 098 Parex Universalais pensiju plans 1. pielikums

Profesionālās tālākizglītības un pilnveides izglītības iestāde «Japāņu valodas un kultūras studija» Apstiprinu Japāņu valodas un kultūras studijas vad

Packet Core Network 2018

Tirgus dalībnieka nosaukums: "Parex Asset Management" Ieguldījumu pārvaldes akciju sabiedrība Kods: 098 Parex Universalais pensiju plans 1. pielikums

PowerPoint prezentācija

Microsoft Word - CV G.Berzins Rekt ora vēlēšanām.docx

(Microsoft Word - Retransl\347jamo%20programmu%20saraksts,%202014[1].doc)

Liepājas Universitāte TATJANA SMIRNOVA Fonoloģiskais ikoniskums ekspresīvajos un operatīvajos tekstos sastatāmajā skatījumā Phonological Iconicity in

PowerPoint Presentation

Microsoft PowerPoint - p.pptx

Tehniska_specifikacija_seminara_lig_2015_1_pielik

Disertacija

Ekonomikas un kultūras augstskolas zinātniskās darbības 2017./2018. gada pārskats

Apstiprināts ar rīkojumu Nr /35 A/S Transporta un sakaru institūts (turpmāk tekstā - TSI) NOLIKUMS par doktorantu/zinātniskā grāda p

Environment. Technology. Resources ELEKTROLĪNIJU BALSTU STIPRĪBAS APRĒĶINU OPTIMIZĀCIJAS IESPĒJAS ELEKTROLĪNIJU PROJEKTĒŠANĀ The Lasting Calcula

Frequently Asked Questions

Taisnes nogriežņu telpiskas tīklveida konfigurācijas algoritmiska atpazīšana no stereopāra Paulis Ķikusts Rīga, 2017 Anotācija. Mācību rakstura mēģinā

Lielākie izaicinājumi ikvienam grāmatvedim

PowerPoint Presentation

suzuki vitara izpardošana-2

Slide 1

Latvia - EFPIA Disclosure Report 2018

Tirgus dalībnieka nosaukums: DNB Asset Management Kods: 241 DNB Sabalansetais ieguldijumu plans 1. pielikums Finanšu un kapitāla tirgus komisijas 14.0

Drošības datu lapa atbilstoši 1907/2006/EK, 31. pants Lpp.: 16 Iespiešanas datums: Versijas numurs 3 Labojums: * 1. IEDAĻ

LV L 274/38 Eiropas Savienības Oficiālais Vēstnesis EIROPAS CENTRĀLĀ BANKA EIROPAS CENTRĀLĀS BANKAS LĒMUMS (2009. gada 6. oktobris), ar ko

K 5 ( )

Ekonomikas un kultūras augstskolas zinātniskās darbības 2016./2017. gada pārskats

SOCIETY, INTEGRATION, EDUCATION. May 25 th -26 th, ISSN GARĪGĀS ATTĪSTĪBAS TRAUCĒJUMU UN MĀCĪŠANĀS TRAUCĒJUMU STARPSTADIJAS ĪPATNĪBU R

Zinātniskais pārskats par valsts pētījumu programmas 1. posma izpildes gaitu 1. SADAĻA INFORMĀCIJA PAR PROGRAMMAS IZPILDI 1.1. Programmas nosaukums En

Microsoft Word - Inese Polaka_kopsavilkums

2015 Finanšu pārskats

KURSA KODS

Transkripts:

人工知能学会研究会資料 SIG-KST-035-06(2018-11 Generation of Mechanical Sound Using Generative Adversarial Networks 1,2 1 1,3 4 1 2 3 4 Abstract:. DCGAN pix2pix pix2pix 1 [16] [13, 14, 15] (variational autoencoder; VAE) [2] (generative adversarial network; GAN) [1] GAN [8, 9, 10, 11] [12] GAN deep convolutional GAN (DCGAN) [3] pix2pix [4] 2 GAN DCGAN pix2pix 3 4 2 GAN 2.1 GAN GAN 1 Generator Discriminator 2 1 Generator G Discriminator D Generator 1 * 本資料の著作権は著者に帰属します

1: GAN (A) D (B) G GAN (1) z Z P Z X Generator G : Z X Discriminator D : X [0, 1] min G max V (D, G) = E x p data (x)[log D(x)] D + E z pz(z)[log(1 D(G(x)))] (1) Generator Discriminator GAN DCGAN pix2pix 2 2.2 10 512 32 pixel 2 10 2.3 DCGAN DCGAN [3] Radford GAN Generator, Discriminator 2: CNN Convolutional Neural Network 3 4 Generator, Discriminator. ReLU Generator Sigmoid 512 8 pixel 5 2.4 pix2pix pix2pix[4] Isola pix2pix Generator U-Net[6] U-Net 6 7, pix2pix Generator, Discriminator LeaklyReLU 512 8 pixel 8 8 pixel 8 8 pixel 5 5 5 pix2pix 1 1000 10 10000

3: DCGAN Generator 4: DCGAN Discriminator 5: pix2pix 3 pix2pix DCGAN pix2pix 8 9 DCGAN 10 pix2pix 11 DCGAN pix2pix 512 8 1000 10000. 10 10000 dynamic time warping (DTW) [7] DCGAN pix2pix 1 DCGAN pix2pix pix2pix 1: 1 2,, 1 2 DCGAN pix2pix 0.016 0.068 0.016 0.006 0.067 0.004 0.011 0.067 0.005

6: pix2pix Encoder-Decoder(Generator) 9: 11: pix2pix 10: DCGAN pix2pix 8 8pixcel 2 4 8 16 32. 10 10000. pix2pix dynamic time warping (DTW) [7] 8 8 12)

7: pix2pix Discriminator (a) DCGAN (b) pix2pix 12: DTW 8: 4 GAN DCGAN pix2pix 2. DCGAN pix2pix [1] Goodfellow, I., Pouget-Abadie, J., Mirza, M., et al.: Generative adversarial nets., In Advances in neural information processing systems, pp. 2672-2680 (2014) [2] Kingma, D. P., Welling, M.: Auto-encoding variational bayes., arxiv preprint, arxiv:1312.6114 (2013) [3] Radford, A., Metz, L., and Chintala, S.:.Unsupervised representation learning with deep convolutional generative adversarial networks., arxiv preprint arxiv:1511.06434. (2015)

[4] Isola, P., Zhu, J. Y., Zhou, T., et al.: Imageto-image translation with conditional adversarial networks., arxiv preprint (2017) [5] Xi, X., Keogh, E., Shelton, C.: Fast time series classification using numerosity reduction., In Proceedings of the 23rd international conference on Machine learning, pp. 1033-1040 (2006) [6] Ronneberger, O., Fischer, P., and Brox, T.: U-net: Convolutional networks for biomedical image segmentation., In International Conference on Medical image computing and computerassisted intervention, pp. 234-241 (2015) [15] Simard. P, Steinkraus. D, Platt. J; Best Practices forconvolutional Neural Networks Applied to- Visual Docment Analysis In International Conference on Document Analysis and Recognition pp.958-962 (2003) [16] Feng.X, Zhang.Y, and Glass.J: Speech feature dinoising and dereverberation via deep autoencoders for noisy reverberant speech recognition In International Conference on Acoustics, Speech and Signal Processing pp.1759-1763(2014) [7] Bellman, R., Kalaba, R.: On adaptive control processes, In IRE Transactions on Automatic Control, pp. 1-9(1959) [8] Denton. E, Chintala. S, Szlam. A, and Fergus. R; Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks, arxiv preprint (2015) [9] Ledig. C, Theis. L, Huszar. F, Caballero. J, Cunningham. A, Acosta. A, Aitken. A, Tejini. A, Totz. J, Wang. Z, and Shi. W; Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network, arxiv preprint (2016) [10] Zhang. H, Xu. T, Li. H, Zhang. S, Wang. X, Huang. X, and Metaxas. D; StackGan: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks, arxiv preptint [11] Karras. T, Aila. T, Laine. S, Lethinen. J; Progressive Growing of GANs for Improved Quality, Stability, and Variation, arxiv prepring [12] Donahue. C, McAuley. J, and Puckette. M; Synthesizing Audio with Generative Adversarial Networks, arxiv preprint (2018) [13] Salamon. J, Bello. J; Deep Convolutional Neural Networks and Data Augmentation for Environmental Sound, In IEEE Single Processing Letters, pp. 279-283(2017) [14] McFee. B, Humphrey. E, Bello. J; A Software Frameworkfor Musical DataAugmentation In The International Society for Music Information Retrieval pp. 248-254(2015)